我们实际上如何使用 AI Agents 发布复杂系统

发布: (2025年12月18日 GMT+8 17:00)
6 min read
原文: Dev.to

Source: Dev.to

《我们如何实际使用 AI 代理交付复杂系统》封面图

第1部分:为什么旧的操作手册不再适用

我认识的每位创始人都有同样的故事。你估算两周,结果六周才交付。那本来“简单”的支付集成,最终变成了三周的边缘案例追踪——这些问题没人提前告诉你。

经历过,做过,太多次了。

多年来,我们只能接受:复杂性 = 时间。想要构建稳固的东西?放慢脚步。需要快速迭代?偷工减料并祈祷生产环境不出问题。

但大约在 2025 年,一切都变了。这也是我写这篇文章的原因。

AI 代理已经不再是花哨的自动补全。如果你把它们设置得当(而且我指的是要真正严格约束它们),它们可以构建真正可运行的系统。不是代码片段,也不是模板代码,而是带有通过测试的真实业务逻辑。

关键不在于仅仅使用 AI,而是以一种在面对复杂需求时也不会崩溃的方式使用它。我把这称为 contract‑first 开发:在写任何代码之前,先锁定你要构建的内容。

为什么仅仅与 AI 聊天无法扩展

我见过团队在这上面浪费了数周时间。

他们打开 ChatGPT 或 Claude,输入 “写一个处理支付的函数”,复制粘贴返回的代码,然后继续。看起来还行。接着再要另一段代码。再来一段。

三周后,结账流程在任何真实负载下都崩溃。业务逻辑散落在十几份文件中。里面有一半没有测试。而那个 “简单函数”已经伸出触手,牵扯到所有地方。

看,不能只和 AI 聊天就指望得到生产质量的代码。事情不是这么运作的。

What does work: 先把所有内容全部定义清楚——系统能做什么,不能做什么,错误如何处理,数据是什么样子。先把这些锁定下来。然后让 AI 在这些边界内部填充实现。

人类设定边界,AI 在其中完成工作。

把它看作一个团队,而不是单个人

大多数人把“使用 AI 编码”想象成一次对话、一个代理、一个输出。这很快就会限制你的发挥。实际上可行的方式更像是拥有多个专家,只是它们以机器速度工作。

各部分如何协同

四阶段 AI 代理流水线:Planner → Implementer → Reviewer → Tester,每个阶段将具体产物传递给下一个。

  1. Planner – 确定要构建的内容。
  2. Implementer – 编写代码。
  3. Reviewer – 捕捉问题。
  4. Tester – 证明其有效。

每个阶段将具体产物交给下一个阶段,对之前的内容不作任何假设。

什么时候真的需要它?

如果你只是在一个文件里编写一个函数,一个代理就足够了。一旦你在构建包含多个活动部件的系统,就需要不同的代理来处理不同的任务。否则,你会得到一个试图做太多事情却都做不好的代理。


快速示例

构建订单服务:

  1. Planner 说:“把它拆分为 API 规范、领域模型、数据库层、事务处理器、测试套件。”
  2. Agent A 生成 OpenAPI 规范。
  3. Reviewer 根据你的安全规则进行检查。
  4. Agent B 实现实际代码。
  5. Tester 根据规范编写测试。
  6. Final review 合并前的最终审查。

每一步都会产生具体的产出。没有任何代理需要猜测前一步的工作内容。

首先锁定合同

那么实际有效的做法是什么?

  1. 在任何实现之前生成严格的 API 规范——REST 使用 OpenAPI,gRPC 使用 Protobuf。这些将成为代理必须遵循的规则。
  2. 架构师的职责:审查领域模型,确保关系(例如 UserSubscription)合理并能解决业务问题。
  3. 代理的职责:根据模型填充繁琐的细节——错误响应、边缘情况、数据类型——这些对人类来说枯燥,却容易出错。

从第一天起就设计系统以应对复杂性,而不是等到出现问题时再后期补丁。

要点

先锁定合约。然后让代理填充代码。


接下来

  • 第 2 部分: 设置上下文、验证层以及处理失败。
  • 第 3 部分: 何时介入、常见错误以及有效工具。

这是“使用 AI 代理构建复杂系统”系列的第 1 部分。

Back to Blog

相关文章

阅读更多 »