[논문] 연산자 체인을 활용한 인‑컨텍스트 연산자 학습

발행: 3일 전 (2026년 6월 11일 AM 01:53 GMT+9)

3 분 소요

원문: arXiv

출처: arXiv - 2606.12318v1

개요

신경 연산자는 함수 공간 사이의 매핑을 근사하지만, 다른 연산자에 대해 일반화가 잘 되지 않으며 보통 미세 조정이나 재학습이 필요합니다. In-Context Operator Networks (ICON)는 모델에 수치적 컨텍스트를 프롬프트로 제공하여 모델이 프롬프트에서 특정 연산자를 학습하고 미세 조정 없이도 다양한 연산자에 적응하도록 함으로써 이 문제를 해결합니다. 그러나 ICON은 여전히 분포 외(OOD) 연산자 작업에 일반화하지 못할 수 있습니다. 대형 언어 모델(LLM)의 프롬프트 엔지니어링 성공에 영감을 받아, 우리는 파라미터를 업데이트하지 않고도 OOD 연산자 작업에 활용할 수 있는 고정된 ICON을 이용하는 프레임워크인 Chain of Operators (CHOP) 를 제안합니다. 구체적으로, CHOP은 명시적인 기본 변환과 고정된 ICON으로 구성된 연산자 체인을 구축합니다. 스칼라 보존 법칙과 평균장 제어 문제에 대한 실험 결과, CHOP은 직접 ICON을 평가했을 때보다 상대적인 추론 오류를 감소시키며, 체인에 포함된 각 연산자는 해석 가능하고 닫힌 형태를 유지합니다. 하나의 PDE 계열에서 구성된 체인은 다른 계열에도 일반화되어, 다양한 시스템 간에 공유 메커니즘이 존재함을 시사합니다.

주요 기여

이 논문은 다음 분야의 연구를 다룹니다:

cs.LG
cs.AI

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

본 연구는 cs.LG 분야의 발전에 기여합니다.

저자

Minghui Yang
Ling Guo
Liu Yang

논문 정보

arXiv ID: 2606.12318v1
분류: cs.LG, cs.AI
발표일: 2026년 6월 10일
PDF: PDF 다운로드

[논문] 연산자 체인을 활용한 인‑컨텍스트 연산자 학습

개요

주요 기여

방법론

실용적 함의

저자

논문 정보

관련 글

[논문] UniIntervene: 효율적인 실세계 강화학습을 위한 에이전트 기반 개입

[논문] Ambient Diffusion Policy: 로봇 분야 비최적 데이터로부터 모방 학습

[논문] 서브쿼드러틱 아키텍처: 응용에서 원리까지

[논문] 결손 모달리티가 있는 다중모달 학습을 위한 잠재 세계 복원