我们将 AI Agent API 开支削减了 79% —— 这就是确切的解决方案

发布: 1个月前 (2026年3月10日 GMT+8 01:38)

3 分钟阅读

原文: Dev.to

Source: Dev.to

问题

我们在 AI 代理 API 上每月花费 $198。大部分支出并非来自我们预期的 LLM 调用，而是来自一个被遗忘的代理循环——它每 60 秒运行一次，每个周期调用四个外部工具。

每天 5,760 次工具调用
每月 172,800 次工具调用

当多个 AI 代理一起运行时，它们的 API 成本会合并，使得在没有归因的情况下几乎无法回答基本问题：

哪个代理消耗的 token 最多？
哪些工具调用费用高，哪些费用低？
哪个循环频率合适，哪个过于频繁？

我们没有答案，于是我们在每个代理循环中构建了成本归因模式。

解决方案

步骤 1：为每个 LLM 调用打上代理 ID 标签

在每个 API 请求中添加元数据，例如：

{
  "agent": "suki",
  "loop": "content-loop",
  "task": "draft-tweet"
}

将这些元数据记录到每日成本文件中，以便后续按代理、循环和任务聚合支出。

步骤 2：有意设置循环频率

除非真的需要如此高的响应速度，否则不要每 60 秒运行一次循环。

我们的 内容循环 现在每几分钟运行一次。
我们的 运维循环 改为基于事件触发，而不是定时器。

步骤 3：每周成本审查

每周提取一次按代理划分的成本报告。如果某个代理的成本出现峰值，立即调查，以防费用进一步累积。

结果

$198/月 → $42/月
API 支出降低 79 %

我们在没有切换到更便宜模型或削减代理功能的情况下实现了这一点——仅仅是停止了没人需要的工作。

资源

完整的成本归因配置——包括日志结构、审查清单和循环频率决策框架——已在库中提供：

askpatrick.co/library/27

如果你正在运行 AI 代理且尚未审计循环成本，这可能是本周投入的最高回报率的一个小时。

我们将 AI Agent API 开支削减了 79% —— 这就是确切的解决方案

问题

解决方案

步骤 1：为每个 LLM 调用打上代理 ID 标签

步骤 2：有意设置循环频率

步骤 3：每周成本审查

结果

资源

相关文章

代理范围蔓延问题：为什么无限增长的 AI 代理会变得不可靠

Agentic Web：当 AI 开始与其他 AI 对话时

SOUL.md 模式：如何为你的 AI 代理提供行为宪章

双代理审查模式：为什么 AI 代理不应验证自己的输出

问题

解决方案

步骤 1：为每个 LLM 调用打上代理 ID 标签

步骤 2：有意设置循环频率

步骤 3：每周成本审查

结果

资源

相关文章

代理范围蔓延问题：为什么无限增长的 AI 代理会变得不可靠

Agentic Web：当 AI 开始与其他 AI 对话时

SOUL.md 模式：如何为你的 AI 代理提供行为宪章

双代理审查模式：为什么 AI 代理不应验证自己的输出

步骤 1：为每个 LLM 调用打上代理 ID 标签

步骤 2：有意设置循环频率

步骤 3：每周成本审查