发布 AgentCost

发布: (2026年2月15日 GMT+8 12:56)
2 分钟阅读
原文: Dev.to

Source: Dev.to

问题

上个月,我的 LangChain 代理在 OpenAI 费用上花了 $800
我根本不知道是哪一个代理很贵,也不知道该从哪里进行优化——我完全是盲目操作。

解决方案

我构建了 AgentCost,一个开源工具,用来跟踪你的代理所发出的每一次 LLM 调用。

AgentCost screenshot

工作原理

AgentCost 通过 Python 的猴子补丁(monkey‑patching)拦截 LangChain 的 LLM 调用。

架构

三个组件:

  • Python SDK – 拦截调用
  • FastAPI 后端 – 存储数据
  • React 仪表盘 – 可视化费用

成果

使用 AgentCost 两周后:

  • 发现我的 Router Agent 被调用的次数是实际需求的 10 倍
  • 将简单查询从 GPT‑4 切换到 GPT‑3.5
  • 将费用从 $800/月 降至 $450/月(节省 44 %)

技术挑战

在不破坏用户代码的情况下进行猴子补丁

我的解决方案:

精确的 token 计数

挑战所在: 不同模型使用不同的 tokenizer …

为提升性能进行批处理

解决方案: 混合批处理(基于大小 + 时间) …

亲自尝试

AgentCost 是开源且免费使用的:

  • GitHub:
  • Docs:
pip install agentcost

下一步计划

  • 成本警报(当达到阈值时通过 Slack/邮件通知)
  • 自动优化建议
  • 支持 OpenAI 和 Anthropic SDK

欢迎反馈

如果你尝试了 AgentCost,期待听到你的想法!

0 浏览
Back to Blog

相关文章

阅读更多 »