我在笔记本电脑上创建了一个小型 AI 公司(multi-agent application)

发布: (2026年4月28日 GMT+8 08:18)
3 分钟阅读
原文: Dev.to

Source: Dev.to

介绍

最近,我一直在思考在 AI 代理的世界里,“工作”可能是什么样子。我和妻子讨论过——也许将来,不是一个一个地取代人,而是一个人管理一支小型 AI 工作团队。像 Claude Code 或 OpenClaw 之类的工具对她来说太技术化了,于是我开始想:如果这真的像和一个团队合作呢?不是写代码、不是连线工作流,而是招聘、管理和协作。

Holons

我构建了 Holons,一个桌面优先的系统(Tauri + Flask + React),其特点:

  • 代理拥有角色和身份
  • “领头”代理分配任务并构建工作流
  • 多个代理可以在群聊中协作
  • 所有内容本地运行(或自行托管)

你可以这样说:

“Create a pitch for a B2B AI accountant”

然后 Holons 将会:

  1. 提出工作流方案
  2. 将任务分配给不同的代理
  3. 估算成本
  4. 让你运行整个流程

让我惊讶的地方

可视性

最难的不是代理本身,而是可视性。当多个代理在运行时,你需要了解:

  • 它们在做什么
  • 成本多少
  • 随时间的行为表现

统一账本

我在早期做了一个设计决定:每一次 LLM 调用都会写入统一账本。每次调用会记录:

  • 模型 + 提供商
  • 令牌(提示 / 完成)
  • 成本
  • 延迟
  • 代理 + 用户

这张单表驱动:

  • 成本仪表盘
  • 使用配额
  • 报告
  • 审计日志

关键特性

  • 多提供商支持:Bedrock、OpenAI、Anthropic、Gemini、MiniMax
  • 每个代理的模型绑定(不同代理可使用不同模型)
  • 基于 pgvector 的 RAG + 外部知识集成
  • MCP 风格的工具集成
  • 即时通讯渠道(Telegram / Slack / LINE)

仍在早期

这仍然是一个实验。我还不确定这是否是多代理系统的“正确”抽象——更像是管理一个团队,而不是调用一个 API。

我很好奇其他人是如何看待多代理系统的。人们真的在实际工作流中使用它们吗,还是我们仍在摸索合适的模型?

0 浏览
Back to Blog

相关文章

阅读更多 »