Agent 对 Agent 结对编程
Source: Hacker News
概览
如果可以让 Claude 和 Codex 直接相互对话,作为配对程序员一起工作会怎样?一个充当主要工作者,另一个则担任审阅者。
Cursor 的研究人员发现,最有效的代理工作流往往类似于人类协作。他们在长期运行的编码代理上的工作产生了一种多代理工作流,其中主协调者向工作者分配任务——就像典型的人类团队一样。Claude 的 “Agent teams” 与 Codex 的 “Multi‑agent” 功能运作方式相似,子代理向主代理报告。未来,子代理甚至可以相互交互,就像人类一样。
在使用 Claude 与 Codex 并排构建代码审阅代理的过程中,我注意到它们有时会给出不同的反馈。即使它们达成一致,这种共识也提供了非常强的信号。当两个审阅者意见相同,我们的团队会处理 100 % 的反馈。代码审阅之所以有价值,是因为它发生在一个多人应用中,人类和代理共同协作,但审阅过程可能会拖慢反馈循环并产生噪声。
实现
为了让反馈循环更快、更自然,我构建了 loop,一个极简的 CLI,能够在 tmux 中并排启动 claude 和 codex,并提供一个桥梁让它们相互交流。
- 由于交互感觉自然,代理可以更主动。
- 随着模型的改进,协作效果应会进一步提升。
- 由于
loop运行交互式 TUI,你始终保持在循环中,可以引导对话、回答问题并在需要时进行跟进。
未解之问
- 我们是否应该将工作拆分到多个 PR 中?
- 我们是把
PLAN.md放在 Git 里还是放在 PR 描述中? - 是否需要提供截图或视频录制作为工作证明?
让代理循环可能会产生超出预期的更改——通常是受欢迎的副作用——但也可能让人工审阅变得更困难。
结论
许多人使用多个代理套件来避免供应商锁定、为开源项目做贡献、最大化订阅价值,或获得多样的视角、优势和结果。多代理套件应用应将代理间通信视为 一等公民特性。我期待看到更多工具采用这种方式。
试一试吧:
感谢 Léna Deloizy Delafosse、Will Horn、Tian Wang 和 Ferruccio Balestreri 阅读本文草稿。