我如何在 Rocket.new 构建 AI Agent Systems（内部视角）

发布: 1个月前 (2026年3月14日 GMT+8 01:29)

5 分钟阅读

原文: Dev.to

Source: Dev.to

我已经从事开发者工具的构建五年。

在 DhiWise 的前三年里，我们只做了一件事的自动化：把 Figma 设计转换为可投产的代码。选择一个框架（Flutter、Kotlin、React），上传你的设计，即可得到干净的代码。这就是整个产品。

随后，一切都改变了。

改变我构建方式的转折点

2023 年我们推出了 WiseGPT——一个上下文感知的 AI 编码助手，能够接入 VS Code 并理解你的本地代码库。无需提示工程，只需描述你想要的内容，它就会生成符合实际项目结构的代码。

这也是我第一次在生产环境中真正接触 AI 代理系统。不是演示，也不是原型，而是为真实开发者服务、可规模化的真实代理。

到 2025 年，公司更名为 Rocket.new，产品也变得更大：一个 AI‑first 的应用构建器，能够根据纯英文提示生成完整、全栈、可投产的应用。我是负责背后代理系统的工程师之一。

很多教程只展示一次 LLM 调用：发送提示，得到响应。这不是代理系统，而是自动补全。

在 Rocket.new，像“帮我构建一个带等待名单表单的 SaaS 落地页”这样的单一用户提示会触发一条由多个专用代理协同工作的流水线：

这些代理并非严格顺序执行，而是在可能的情况下并行运行，通过共享的上下文层进行决策协同，并以异步方式将状态交接给彼此。

最大的技术挑战不是 LLM 调用本身，而是 上下文工程——决定每个代理完成任务所需的信息，并确保这些信息在正确的时间以正确的格式可用。

关键在于构建能够在每一步向每个代理路由恰当上下文的流水线。这也是我在 Rocket.new 大部分时间所做的工作。

混合架构胜过纯 LLM 系统
将基于工具的决策（确定性规则）与基于 LLM 的推理相结合，能够得到既可靠又灵活的系统。纯 LLM 系统容易漂移；混合系统则可控。
错误级联是最大的敌人
当一个代理出现小错误时，后续代理会继承并在此基础上继续构建。等到第三个代理时，输出可能已经完全错误。解决方案是设置代理之间的验证关卡，而不是仅在最后进行验证。
延迟比准确性更重要（起步阶段）
更快、稍逊完美的答案胜过慢速、完美的答案。用户等待时会失去信任。先为速度构建，然后逐步提升准确性。

平台目前已服务 40 万+ 开发者，覆盖 180 多个国家，并生成了 50 万+ 可投产的应用。

如果你也在构建 AI 代理系统并想交流经验，我随时欢迎。

Find my other technical writing at .