[논문] CHORUS: 하나의 VLA 정책으로 구현된 분산 다중 구현 협업
개요
다중 로봇 협업은 로봇이 소파를 문을 통과시키는 것부터 건설 현장에서 구조물을 조립하는 것까지 다양한 작업을 효율적으로 수행하도록 합니다. 그러나 이동형 다중 로봇 환경에서 이러한 협조를 구현하는 것은 여전히 어려운 과제입니다. 팀 전체의 관측을 기반으로 하는 중앙집중식 방법은 팀 규모가 커질수록 성능이 급격히 떨어지고, 로봇당 하나의 정책을 학습하는 분산 방식은 추론 시 부분 관측 문제를 해결하기 위해 명시적인 정렬 절차나 정보 공유가 필요합니다. 우리의 핵심 통찰은 사전 학습된 비전‑언어‑행동(VLA) 모델의 시각‑운동 사전 지식이 각 로봇의 로컬 관측만으로도 반응형, 분산 협업을 가능하게 할 수 있다는 점입니다. 이를 위해 우리는 단일 VLA 백본을 다양한 다중 로봇 팀을 제어하도록 적응시키는 프레임워크 CHORUS를 제안합니다. 추론 단계에서 각 로봇은 자신의 관측과 로봇을 식별하는 프롬프트만을 조건으로 하는 CHORUS의 독립적인 복제본을 실행합니다. 이동식 테이프 측정, 도서관 책 전달, 세탁 바구니 들어올리기 등 실제 환경 실험에서 CHORUS는 기존 분산, 처음부터 학습한 모델 대비 64%p 향상을 달성했으며, 팀원 행동에 대한 반응성도 40%p 개선했고, 중앙집중식 기준 모델보다 우수한 성능을 보였습니다. 이러한 결과는 공유된 VLA 백본이 로봇별 정책이나 로봇 간 통신 없이도 분산 다중 로봇 협업을 구현할 수 있음을 입증합니다.
주요 기여
이 논문은 다음 분야의 연구를 다룹니다.
- cs.RO
- cs.AI
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 함의
본 연구는 로봇공학(cs.RO) 분야의 발전에 기여합니다.
저자
- Ria Doshi
- Tian Gao
- Annie Chen
- Chelsea Finn
- Jeannette Bohg
논문 정보
- arXiv ID: 2606.12352v1
- 분류: cs.RO, cs.AI
- 발표일: 2026년 6월 10일
- PDF: PDF 다운로드