tokens 现在比 juniors 更贵，而且更不可预测

发布: 3天前 (2026年5月1日 GMT+8 17:05)

6 分钟阅读

Source: Dev.to

请提供您希望翻译的具体文本内容（除代码块和 URL 之外），我将按照要求保持原有的 Markdown 格式和技术术语，将其翻译成简体中文。

公共定价（截至 2024 年）

提供商 / 模型	输入价格（每 1 M 令牌）	输出价格（每 1 M 令牌）
OpenAI GPT‑5.4	$2.50	$15
Anthropic Claude Sonnet 4.6	$3.00	$15
Google Gemini 2.5 Pro	$1.25 (≤ 200 k 令牌) $2.50 (> 200 k 令牌)	$10 (≤ 200 k 令牌) $15 (> 200 k 令牌)

如果你只在 Playground 中运行少量提示，这些数字看起来很便宜。

10 人团队的粗略成本概览

每个席位每日工作假设

5 百万输入 token
2 百万输出 token

22 个工作日 ≈ 1 个月。

提供商 / 模型	约每月成本（10个席位）
OpenAI GPT‑5.4	$9,350
Anthropic Claude Sonnet 4.6	$9,900
Google Gemini 2.5 Pro	$7,150 – $9,350 (范围反映两档定价)

Gemini 的范围显示，同一模型的成本可因 token 使用模式的不同而在“便宜”和“昂贵”之间波动。

与薪资的对比

角色 (2024 中位数)	年薪	月薪
行政助理（秘书）	$47,460	$3,955
软件开发者（中位数）	$133,080	$11,090
软件开发者（第10百分位）	$79,850	$6,654

要点： 单个工程师随意使用模型的成本仍然低于初级开发者，但 全公司范围的 AI 工作流可以非常快速地超过初级人工成本。五个重度 AI 位置的费用已经可以超过一名中位数行政助理的月成本。

为什么代币消耗可能是隐藏成本

输出往往是昂贵的一半 – OpenAI GPT‑5.4 对输出的计费是 输入的 6 倍。只关注“发送大量上下文”的团队会错过账单的大头。
分词器的变化很重要 – Anthropic 指出 Claude Opus 4.7 的新分词器在相同文本下可能 多消耗最高 35 % 的代币，导致在工作负载不变的情况下成本骤升。
分层定价会带来惊喜 – Gemini 2.5 Pro 在 20 万代币后切换费率。更长的提示、较低的缓存命中率或新增功能（例如 grounding、search）都可能显著改变账单。
代理会放大费用项目 – 使用 AI 代理时，你需要为以下内容付费：
- 原始提示
- 工具模式与结果
- 思考链推理预算（取决于平台）
- 重试、文件上下文、前轮摘要、审查回合、自我纠正循环等
“代理在 8 分钟内完成任务”往往隐藏了一个 比仪表盘显示的更模糊的边际成本。

建议（先做枯燥的事）

Action	Why
不要只在单个可爱演示上进行基准测试	一次性测试会掩盖长期成本模式。
让模型能力匹配任务	并非所有任务都需要最前沿的模型。
避免将昂贵模型作为管理的替代品	人工监督仍然有价值。
标记并监控令牌使用	将令牌支出视为其他预算项目之一。
谨慎使用“AI vs human”框架	有助于更好的架构设计和诚实的经济学。
使用 AI 来放大优秀人才，而不是取代他们	人类仍然是正确性、成本和后果的所有者。

结论

令牌仍然有用，但它们 不再是可爱的四舍五入误差。
对于许多团队来说，令牌开支正成为一个 真正与劳动力相关的预算类别。
不要假装令牌比人力神奇地更便宜——它们伴随一种可能在你不注意时改变的计费模型，一种随使用模式可能爆炸的成本特性，以及一种恼人的习惯——看起来很便宜，直到不再如此。

我的默认立场：

积极使用 AI，但绝不能让令牌预算在没有成人监督的情况下自行运行。

References

OpenAI，API 定价 – https://openai.com/pricing
Anthropic，Claude 定价 – https://www.anthropic.com/pricing
Google，Gemini 开发者 API 定价 – https://cloud.google.com/vertex-ai/generative-ai/pricing
美国劳工统计局，软件开发人员、质量保证分析师和测试人员 – https://www.bls.gov/oes/current/oes151132.htm
美国劳工统计局，秘书和行政助理 – https://www.bls.gov/oes/current/oes43-3000.htm

tokens 现在比 juniors 更贵，而且更不可预测

公共定价（截至 2024 年）

10 人团队的粗略成本概览

与薪资的对比

为什么代币消耗可能是隐藏成本

建议（先做枯燥的事）

结论

References

相关文章

模型越智能，节省越多。

LLM386：借用 1990 年代的想法来管理 LLM 上下文

令牌消耗焦虑以及我为解决它而构建的开源应用

我让 3 个 AI 一起发布工具。以下是实际发布的内容。

公共定价（截至 2024 年）

10 人团队的粗略成本概览

与薪资的对比

为什么代币消耗可能是隐藏成本

建议（先做枯燥的事）

结论

References

相关文章

模型越智能，节省越多。

LLM386：借用 1990 年代的想法来管理 LLM 上下文

令牌消耗焦虑以及我为解决它而构建的开源应用

我让 3 个 AI 一起发布工具。以下是实际发布的内容。

10 人团队的粗略成本概览