[논문] 연산자 체인을 활용한 인‑컨텍스트 연산자 학습
개요
신경 연산자는 함수 공간 사이의 매핑을 근사하지만, 다른 연산자에 대해 일반화가 잘 되지 않으며 보통 미세 조정이나 재학습이 필요합니다. In-Context Operator Networks (ICON)는 모델에 수치적 컨텍스트를 프롬프트로 제공하여 모델이 프롬프트에서 특정 연산자를 학습하고 미세 조정 없이도 다양한 연산자에 적응하도록 함으로써 이 문제를 해결합니다. 그러나 ICON은 여전히 분포 외(OOD) 연산자 작업에 일반화하지 못할 수 있습니다. 대형 언어 모델(LLM)의 프롬프트 엔지니어링 성공에 영감을 받아, 우리는 파라미터를 업데이트하지 않고도 OOD 연산자 작업에 활용할 수 있는 고정된 ICON을 이용하는 프레임워크인 Chain of Operators (CHOP) 를 제안합니다. 구체적으로, CHOP은 명시적인 기본 변환과 고정된 ICON으로 구성된 연산자 체인을 구축합니다. 스칼라 보존 법칙과 평균장 제어 문제에 대한 실험 결과, CHOP은 직접 ICON을 평가했을 때보다 상대적인 추론 오류를 감소시키며, 체인에 포함된 각 연산자는 해석 가능하고 닫힌 형태를 유지합니다. 하나의 PDE 계열에서 구성된 체인은 다른 계열에도 일반화되어, 다양한 시스템 간에 공유 메커니즘이 존재함을 시사합니다.
주요 기여
이 논문은 다음 분야의 연구를 다룹니다:
- cs.LG
- cs.AI
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 함의
본 연구는 cs.LG 분야의 발전에 기여합니다.
저자
- Minghui Yang
- Ling Guo
- Liu Yang
논문 정보
- arXiv ID: 2606.12318v1
- 분류: cs.LG, cs.AI
- 발표일: 2026년 6월 10일
- PDF: PDF 다운로드