AI模型定价一团糟——以下是我们的追踪方式

发布: 3周前 (2026年4月10日 GMT+8 22:47)

5 分钟阅读

原文: Dev.to

Source: Dev.to

目前已有超过 100 种 LLM 模型可通过商业 API 使用。它们的定价不断变化——有时每周多次。新模型上线，旧模型被淘汰，提供商会悄悄调整费率。

如果你在使用 LLM 开发，可能已经遇到这种情况：你选定一个模型，硬编码进去，发布后，三个月后才发现你为相同质量的输出支付了新模型的 10 倍 费用。

我们构建了 WhichModel 来解决这个问题。

问题的规模

大多数团队的做法是 不处理。他们挑选一两个模型，偶尔（如果有的话）每季度重新评估一次。

WhichModel 每 4 小时 抓取、标准化并交叉验证所有主要 LLM 提供商的定价数据。

我们不依赖单一来源。定价数据会在提供商 API、文档页面以及第三方聚合器之间进行交叉检查。若来源不一致，我们会标记出来。

对每个模型我们记录：

数据以 MCP 服务器的形式提供——意味着任何 AI 代理都可以原生查询。无需学习 REST API，也无需安装 SDK：

你的代理随后可以询问：

价格与大多数任务的质量并不相关。
每 token $0.60 的模型可以处理约 80 % 的生产任务，表现不逊于每 token $15 的模型。剩余 20 % 的任务差距才是关键。
定价变化比你想象的更频繁。
整个生态系统每周会出现多次重要的定价更新。上个月的定价今天可能已经不适用。
“直接使用最好的模型”在规模化时成本高昂。
在每日 10 K 次调用的情况下，使用每 token $15 的模型与每 token $0.60 的模型的差价为 $216/天——每月超过 $6 000。
代理需要实时数据，而不是电子表格。
自主代理必须在无人干预的情况下做出决策——包括选择使用哪个模型。

WhichModel 开源且免费使用。

为代理而建。每 4 小时更新一次。MIT 许可证。