에이전트 간 페어 프로그래밍
Source: Hacker News
개요
클로드와 코덱스를 페어 프로그래머처럼 직접 대화하게 할 수 있다면 어떨까요? 한 명은 메인 작업자를, 다른 한 명은 리뷰어 역할을 합니다.
Cursor 연구원들은 가장 효과적인 에이전트 기반 워크플로우가 인간 협업과 유사하다는 것을 발견했습니다. 장기 실행 코딩 에이전트에 대한 그들의 연구는 작업자를 할당하는 메인 오케스트레이터가 있는 다중 에이전트 워크플로우를 만들었으며, 이는 일반적인 인간 팀과 매우 비슷합니다. 클로드의 “Agent teams”와 코덱스의 “Multi‑agent” 기능도 유사하게 동작하며, 서브 에이전트가 메인 에이전트에 보고합니다. 앞으로는 서브 에이전트들이 서로 상호작용할 수도 있는데, 이는 인간이 서로 소통하는 방식과 같습니다.
클로드와 코덱스를 나란히 사용해 코드 리뷰 에이전트를 구축하면서, 두 모델이 때때로 다른 피드백을 제공한다는 것을 알게 되었습니다. 설령 의견이 일치하더라도, 그 합의는 매우 강력한 신호가 됩니다. 우리 팀은 두 리뷰어가 동의할 때 피드백의 100 %를 반영합니다. 코드 리뷰는 인간과 에이전트가 협업하는 멀티플레이어 앱에서 이루어지기 때문에 가치가 있지만, 피드백 루프를 늦추고 잡음이 될 수 있습니다.
구현
피드백 루프를 더 빠르고 자연스럽게 만들기 위해 loop 라는 초간단 CLI를 만들었습니다. 이 도구는 claude와 codex를 tmux 안에서 나란히 실행하고, 서로 대화할 수 있는 브리지를 제공합니다.
- 에이전트들이 더 능동적으로 행동할 수 있게 되며, 상호작용이 자연스럽게 느껴집니다.
- 모델이 개선될수록 협업 효율도 더욱 높아질 것입니다.
loop가 인터랙티브 TUI를 실행하므로 사용자는 루프 안에 머무르면서 대화를 조정하고, 질문에 답변하며, 필요할 때 후속 작업을 진행할 수 있습니다.
열린 질문
- 작업을 여러 개의 PR로 나눠야 할까요?
PLAN.md를 Git에 두어야 할지, PR 설명에 포함시켜야 할지?- 작업 증명을 위해 스크린샷이나 동영상 녹화를 포함해야 할까요?
에이전트가 루프를 돌게 하면 예상보다 많은 변경이 발생할 수 있습니다—대개는 환영받는 부수 효과이지만, 인간 리뷰를 더 어렵게 만들 수도 있습니다.
결론
많은 사람들이 벤더 락인 방지를 위해, 오픈소스 프로젝트에 기여하기 위해, 구독을 최적화하기 위해, 혹은 다양한 관점·강점·결과를 얻기 위해 다중 에이전트 활용을 사용합니다. 다중 에이전트 활용 애플리케이션은 에이전트‑대‑에이전트 통신을 일급 기능으로 다루어야 합니다. 더 많은 도구가 이 접근 방식을 채택하길 기대합니다.
시도해 보기:
초안 검토에 도움을 주신 Léna Deloizy Delafosse, Will Horn, Tian Wang, 그리고 Ferruccio Balestreri에게 감사드립니다.