Agent 对 Agent 结对编程

发布: 1个月前 (2026年3月27日 GMT+8 09:47)

4 分钟阅读

Source: Hacker News

概览

如果可以让 Claude 和 Codex 直接相互对话，作为配对程序员一起工作会怎样？一个充当主要工作者，另一个则担任审阅者。

Cursor 的研究人员发现，最有效的代理工作流往往类似于人类协作。他们在长期运行的编码代理上的工作产生了一种多代理工作流，其中主协调者向工作者分配任务——就像典型的人类团队一样。Claude 的 “Agent teams” 与 Codex 的 “Multi‑agent” 功能运作方式相似，子代理向主代理报告。未来，子代理甚至可以相互交互，就像人类一样。

在使用 Claude 与 Codex 并排构建代码审阅代理的过程中，我注意到它们有时会给出不同的反馈。即使它们达成一致，这种共识也提供了非常强的信号。当两个审阅者意见相同，我们的团队会处理 100 % 的反馈。代码审阅之所以有价值，是因为它发生在一个多人应用中，人类和代理共同协作，但审阅过程可能会拖慢反馈循环并产生噪声。

实现

为了让反馈循环更快、更自然，我构建了 loop，一个极简的 CLI，能够在 tmux 中并排启动 claude 和 codex，并提供一个桥梁让它们相互交流。

由于交互感觉自然，代理可以更主动。
随着模型的改进，协作效果应会进一步提升。
由于 loop 运行交互式 TUI，你始终保持在循环中，可以引导对话、回答问题并在需要时进行跟进。

未解之问

我们是否应该将工作拆分到多个 PR 中？
我们是把 PLAN.md 放在 Git 里还是放在 PR 描述中？
是否需要提供截图或视频录制作为工作证明？

让代理循环可能会产生超出预期的更改——通常是受欢迎的副作用——但也可能让人工审阅变得更困难。

结论

许多人使用多个代理套件来避免供应商锁定、为开源项目做贡献、最大化订阅价值，或获得多样的视角、优势和结果。多代理套件应用应将代理间通信视为 一等公民特性。我期待看到更多工具采用这种方式。

试一试吧：

感谢 Léna Deloizy Delafosse、Will Horn、Tian Wang 和 Ferruccio Balestreri 阅读本文草稿。

Agent 对 Agent 结对编程

概览

实现

未解之问

结论

相关文章

你的 AI 代理正在盲目探索。教你如何为它们提供地图。

为什么你的 AI Agent 需要记忆

安全 AI Agent 架构

AI Agent记忆系统：如何为你的AI提供持久记忆