[논문] SearchSwarm: 장기 심층 연구를 위한 에이전트형 LLM의 위임 지능
개요
대형 언어 모델은 점점 더 복잡하고 장기적인 현실 세계 과제를 처리하도록 기대되고 있지만, 이러한 과제의 맥락 요구는 무한히 커질 수 있는 반면 모델의 컨텍스트 윈도우는 본질적으로 유한합니다. 최근 연구에서는 메인 에이전트가 작업을 분해하고 서브에이전트에게 하위 작업을 할당한 뒤, 서브에이전트는 실행 결과를 요약해서 반환함으로써 메인 에이전트의 컨텍스트 예산을 절약하는 패러다임을 탐구하고 있습니다. 그러나 이를 잘 수행하려면 위임 지능이 필요합니다: 복잡한 작업을 분해하고, 언제·무엇을 위임할지 판단하며, 반환된 결과를 현재 워크플로에 통합하는 능력 말입니다. 이러한 능력을 위한 학습 데이터는 자연 텍스트에서 거의 존재하지 않으며, 현재까지 오픈소스 커뮤니티에서 이러한 데이터를 어떻게 합성하고 모델을 훈련시켜 위임 지능을 습득시킬지에 대한 연구는 거의 이루어지지 않았습니다. 이 격차를 메우기 위해 우리는 대표적인 장기 과제인 깊이 연구(long‑horizon) 에이전트 작업을 대상으로 예비 탐색을 진행합니다. 구체적으로, 모델이 고품질의 작업 분해와 위임을 수행하도록 유도하는 하네스(harness) 를 설계하고, 서브에이전트가 메인 에이전트의 워크플로를 지원하도록 결과를 적절히 반환하도록 제한합니다. 하네스가 안내하는 궤적은 자연스럽게 올바른 위임 결정을 인코딩하고, 이를 감독 학습(fine‑tuning) 데이터로 활용해 위임 지능을 모델 가중치에 내재화합니다. 우리의 최종 모델 SearchSwarm-30B-A3B는 BrowseComp에서 68.1점, BrowseComp‑ZH에서 73.3점을 기록했으며, 동등 규모 모델 중 최고의 성능을 보였습니다. 향후 연구를 촉진하기 위해 하네스, 모델 가중치, 학습 데이터를 공개할 예정입니다.
핵심 기여
이 논문은 다음 분야의 연구를 제시합니다.
- cs.AI
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 함의
본 연구는 cs.AI 분야의 발전에 기여합니다.
저자
- Pu Ning
- Quan Chen
- Kun Tao
- Xinyu Tang
- Tianshu Wang
- Qianggang Cao
- Xinyu Kong
- Zujie Wen
- Zhiqiang Zhang
- Jun Zhou
논문 정보
- arXiv ID: 2606.09730v1
- 분류: cs.AI
- 발표일: 2026년 6월 8일
- PDF: PDF 다운로드