[논문] CollabSim: CSCW 기반, 제어된 다중 에이전트 실험으로 LLM 에이전트 협업 능력 조사
개요
대형 언어 모델을 기반으로 한 다중 에이전트 시스템(MAS)은 점점 더 큰 가능성을 보여주고 있으며, 그 효율성은 인간 팀이 텍스트 기반 채널을 통해 협업하는 방식과 마찬가지로 에이전트들이 텍스트 기반 채널을 통해 조정할 수 있는 능력에 달려 있습니다. 그러나 최근 연구에 따르면 MAS가 자주 실패하는 이유는 에이전트가 개별적인 과제 해결 능력이 부족해서가 아니라 협업 역량이 부족하기 때문이라고 합니다. 협업 역량이란 공동의 기반을 마련하고, 공유된 과제 이해를 유지하며, 개인과 집단의 인센티브를 균형 있게 조정하고, 상호작용이 진행되는 동안 발생하는 불일치를 복구하는 능력을 말합니다. 컴퓨터 지원 협업 작업(CSCW) 분야에서 수십 년에 걸친 연구는 제한된 커뮤니케이션 환경에서 인간 팀이 협업하기 위해 필요한 이러한 요구사항들을 규정해 왔지만, 기존 MAS 평가에서는 주로 과제 결과나 단일 에이전트의 추론·계획·도구 사용 능력에 초점을 맞추고 있습니다. MAS에서 에이전트들의 협업 역량을 체계적으로 분석할 수 있도록, 우리는 CollabSim이라는 구성 가능한 시뮬레이션 프레임워크를 도입합니다. CollabSim은 이론에 기반한 협업 능력 정의, 상호작용 조건의 통제된 조작, 그리고 행동 수준에서 에이전트 내부 상태를 탐색하는 기능을 결합합니다. 네 가지 LLM에 대한 실험 결과, CollabSim은 조건 효과를 포착하고 모델 성능 패턴을 구분하며, 에이전트 설계가 과제에 따라 미치는 영향을 드러낼 수 있음을 보여줍니다.
주요 기여
이 논문은 다음 분야의 연구를 제시합니다:
- cs.CL
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 시사점
이 연구는 cs.CL 분야의 발전에 기여합니다.
저자
- Jiaju Chen
- Bo Sun
- Yuxuan Lu
- Yun Wang
- Dakuo Wang
- Bingsheng Yao
논문 정보
- arXiv ID: 2606.06399v1
- Categories: cs.CL
- Published: June 4, 2026
- PDF: Download PDF