Agent 对 Agent 结对编程

发布: (2026年3月27日 GMT+8 09:47)
4 分钟阅读
原文: Hacker News

Source: Hacker News

概览

如果可以让 Claude 和 Codex 直接相互对话,作为配对程序员一起工作会怎样?一个充当主要工作者,另一个则担任审阅者。

Cursor 的研究人员发现,最有效的代理工作流往往类似于人类协作。他们在长期运行的编码代理上的工作产生了一种多代理工作流,其中主协调者向工作者分配任务——就像典型的人类团队一样。Claude 的 “Agent teams” 与 Codex 的 “Multi‑agent” 功能运作方式相似,子代理向主代理报告。未来,子代理甚至可以相互交互,就像人类一样。

在使用 Claude 与 Codex 并排构建代码审阅代理的过程中,我注意到它们有时会给出不同的反馈。即使它们达成一致,这种共识也提供了非常强的信号。当两个审阅者意见相同,我们的团队会处理 100 % 的反馈。代码审阅之所以有价值,是因为它发生在一个多人应用中,人类和代理共同协作,但审阅过程可能会拖慢反馈循环并产生噪声。

实现

为了让反馈循环更快、更自然,我构建了 loop,一个极简的 CLI,能够在 tmux 中并排启动 claudecodex,并提供一个桥梁让它们相互交流。

  • 由于交互感觉自然,代理可以更主动。
  • 随着模型的改进,协作效果应会进一步提升。
  • 由于 loop 运行交互式 TUI,你始终保持在循环中,可以引导对话、回答问题并在需要时进行跟进。

未解之问

  • 我们是否应该将工作拆分到多个 PR 中?
  • 我们是把 PLAN.md 放在 Git 里还是放在 PR 描述中?
  • 是否需要提供截图或视频录制作为工作证明?

让代理循环可能会产生超出预期的更改——通常是受欢迎的副作用——但也可能让人工审阅变得更困难。

结论

许多人使用多个代理套件来避免供应商锁定、为开源项目做贡献、最大化订阅价值,或获得多样的视角、优势和结果。多代理套件应用应将代理间通信视为 一等公民特性。我期待看到更多工具采用这种方式。

试一试吧:


感谢 Léna Deloizy Delafosse、Will Horn、Tian Wang 和 Ferruccio Balestreri 阅读本文草稿。

0 浏览
Back to Blog

相关文章

阅读更多 »

为什么你的 AI Agent 需要记忆

核心问题:大多数 agent 框架把 memory 视为事后考虑。它们为你的 agent 提供 tools、prompts 和 orchestration patterns——但当你重新启动时……

安全 AI Agent 架构

引言 我已经开始撰写一本关于安全 AI 代理架构的开放书籍。目标是构建一本实用的工程参考——而不是一个集合……