[논문] SIGA: 과학 시뮬레이션을 위한 자체 진화 코딩 에이전트 어댑터
개요
첨단 과학 시뮬레이터는 시뮬레이션 목표를 실행 가능한 구성으로 변환하는 특수 입력 언어를 제공하지만, 이를 배우는 데는 분야 과학자들이 몇 시간에서 며칠까지 소요될 수 있습니다. 우리는 시뮬레이터 설정을 에이전트‑툴 인터페이스 그라운딩 문제로 접근합니다: 일반적인 코딩 에이전트가 실제 과학 소프트웨어를 작동시키기 위해 필요한 최소한의 시뮬레이터‑특화 적응은 무엇인가? 우리의 직관은 코딩 에이전트가 파일 탐색, 코드 편집, 명령 실행, 출력 복구 등은 이미 알고 있지만, 시뮬레이터의 실행 계약—즉 어휘, 구조적 제약, 검증 규칙, 종료 조건—이 부족하다는 것입니다. 우리는 SIGA(Simulator‑Interface Grounding Adapter)를 도입합니다. SIGA는 검색, 절차적 메모리, 경로 중 검증, 검증 기반 종료를 통해 이 계약을 제공합니다. 우리는 주로 지하 과학에 사용되는 오픈소스 다중물리 시뮬레이터 GEOS를 대상으로 SIGA를 평가했습니다. SIGA는 약 5분 만에 완전한 GEOS 데크를 생성하고 TreeSim 점수 0.90 이상을 달성했으며, 약 3시간이 걸린 고예산 인간 전문가와 동등한 성능을 보이며 약 36배의 실시간 속도 향상을 이루었습니다. 더 어려운 보류 테스트 세트에서는 그라운딩을 적용해 TreeSim 점수를 0.720에서 0.789로 끌어올려, 순수 에이전트 대비 약 10%의 상대적 향상을 보였고, 시드 간 표준 편차를 16배 감소시켰습니다. 자체 진화 메커니즘을 통해 이전 경로에서 어댑터 내용을 재작성함으로써 SIGA를 추가 개선했으며, 이는 보류된 GEOS 평균 점수를 최고 수준으로 만들고 가장 강력한 수작업 설계 구성과 동등하거나 능가하는 결과를 얻었습니다. OpenFOAM 및 LAMMPS로의 전이 실험에서는 인터페이스에 따라 지배 메커니즘이 달라짐을 확인했습니다: 구조적 완전성이 병목일 때는 검증이 가장 중요하고, 도메인 정확성이 병목일 때는 메모리와 검색이 가장 큰 영향을 미칩니다. 이러한 결과는 가볍고 자체 개선 가능한 그라운딩 레이어가 일반 코딩 에이전트를 실용적인 과학 소프트웨어 운영자로 전환시킬 수 있음을 시사합니다.
주요 기여
이 논문은 다음 분야의 연구를 제시합니다:
- cs.AI
- cs.CL
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 함의
본 연구는 cs.AI 분야의 발전에 기여합니다.
저자
- Matthew Ho
- Brian Liu
- Jixuan Chen
- Audrey Wang
- Lianhui Qin
논문 정보
- arXiv ID: 2606.09774v1
- 분류: cs.AI, cs.CL
- 발표일: 2026년 6월 8일
- PDF: PDF 다운로드