tokens 现在比 juniors 更贵,而且更不可预测

发布: (2026年5月1日 GMT+8 17:05)
6 分钟阅读
原文: Dev.to

Source: Dev.to

请提供您希望翻译的具体文本内容(除代码块和 URL 之外),我将按照要求保持原有的 Markdown 格式和技术术语,将其翻译成简体中文。

公共定价(截至 2024 年)

提供商 / 模型输入价格(每 1 M 令牌)输出价格(每 1 M 令牌)
OpenAI GPT‑5.4$2.50$15
Anthropic Claude Sonnet 4.6$3.00$15
Google Gemini 2.5 Pro$1.25 (≤ 200 k 令牌)
$2.50 (> 200 k 令牌)
$10 (≤ 200 k 令牌)
$15 (> 200 k 令牌)

如果你只在 Playground 中运行少量提示,这些数字看起来很便宜。

10 人团队的粗略成本概览

每个席位每日工作假设

  • 5 百万 输入 token
  • 2 百万 输出 token

22 个工作日 ≈ 1 个月。

提供商 / 模型约每月成本(10个席位)
OpenAI GPT‑5.4$9,350
Anthropic Claude Sonnet 4.6$9,900
Google Gemini 2.5 Pro$7,150 – $9,350 (范围反映两档定价)

Gemini 的范围显示,同一模型的成本可因 token 使用模式的不同而在“便宜”和“昂贵”之间波动。

与薪资的对比

角色 (2024 中位数)年薪月薪
行政助理(秘书)$47,460$3,955
软件开发者(中位数)$133,080$11,090
软件开发者(第10百分位)$79,850$6,654

要点: 单个工程师随意使用模型的成本仍然低于初级开发者,但 全公司范围的 AI 工作流可以非常快速地超过初级人工成本。五个重度 AI 位置的费用已经可以超过一名中位数行政助理的月成本。

为什么代币消耗可能是隐藏成本

  1. 输出往往是昂贵的一半 – OpenAI GPT‑5.4 对输出的计费是 输入的 6 倍。只关注“发送大量上下文”的团队会错过账单的大头。

  2. 分词器的变化很重要 – Anthropic 指出 Claude Opus 4.7 的新分词器在相同文本下可能 多消耗最高 35 % 的代币,导致在工作负载不变的情况下成本骤升。

  3. 分层定价会带来惊喜 – Gemini 2.5 Pro 在 20 万代币后切换费率。更长的提示、较低的缓存命中率或新增功能(例如 grounding、search)都可能显著改变账单。

  4. 代理会放大费用项目 – 使用 AI 代理时,你需要为以下内容付费:

    • 原始提示
    • 工具模式与结果
    • 思考链推理预算(取决于平台)
    • 重试、文件上下文、前轮摘要、审查回合、自我纠正循环等

    “代理在 8 分钟内完成任务”往往隐藏了一个 比仪表盘显示的更模糊的边际成本

建议(先做枯燥的事)

ActionWhy
不要只在单个可爱演示上进行基准测试一次性测试会掩盖长期成本模式。
让模型能力匹配任务并非所有任务都需要最前沿的模型。
避免将昂贵模型作为管理的替代品人工监督仍然有价值。
标记并监控令牌使用将令牌支出视为其他预算项目之一。
谨慎使用“AI vs human”框架有助于更好的架构设计和诚实的经济学。
使用 AI 来放大优秀人才,而不是取代他们人类仍然是正确性、成本和后果的所有者。

结论

  • 令牌仍然有用,但它们 不再是可爱的四舍五入误差
  • 对于许多团队来说,令牌开支正成为一个 真正与劳动力相关的预算类别
  • 不要假装令牌比人力神奇地更便宜——它们伴随一种可能在你不注意时改变的计费模型,一种随使用模式可能爆炸的成本特性,以及一种恼人的习惯——看起来很便宜,直到不再如此。

我的默认立场:

积极使用 AI,但绝不能让令牌预算在没有成人监督的情况下自行运行。

References

0 浏览
Back to Blog

相关文章

阅读更多 »

模型越智能,节省越多。

神话:更智能的模型会让插件变得多余。自从 WOZCODE 推出以来,许多 Claude Code 高级用户低声说插件的优势将会消失。