中国AI模型在全球令牌使用量上首次超越美国……MiniMax·Moonshot AI夺得1~2位
Source: Platum

全球代币使用量中中国模型的崛起
根据全球 AI 模型 API 集成平台 OpenRouter 的 2 月数据,MiniMax、Moonshot AI、DeepSeek 等中国开源模型在代币使用量上首次超过美国模型。在前 10 名模型的总代币消耗约 8.7 万亿(8.7 兆)中,中国模型占 5.3 万亿(61%)。
OpenRouter 将 Google、Anthropic 等 60 多家供应商的约 400 种模型整合为一个 API 提供。该平台的每周总代币消耗约为 12.1 万亿,较去年增长了 12.7 倍,显示 AI 模型市场整体正快速膨胀。
3 周内增长 127%,每周趋势
逆转始于 2 月第二周。2 月 9~15 日这一周,中国模型的调用量为 4.12 万亿代币,首次超过美国模型(2.94 万亿代币)。一周后差距进一步拉大,中国模型的周使用量达到 5.16 万亿代币,三周内增长率为 127%。
在 2 月 24 日公布的周数据中,前 3 名模型全部由中国企业占据。
- MiniMax M2.5 – 周 2.45 万亿代币,同比上升 197%(排名第 1)
- Moonshot AI Kimi K2.5 – 1.21 万亿代币(第 2)
- Zhipu AI GLM‑5 – 7,800 亿代币,同比上升 158%(第 3)
DeepSeek V3.2 位列第 5。按 2 月累计月度数据,MiniMax M2.5(4.55 万亿代币)和 Kimi K2.5(4.02 万亿代币)仍保持第 1、2 位,前 5 名流量约有 三分之二 被这三家中国企业占据。
编程·代理工作流驱动的结构性转变
逆转的背后是 AI 使用模式本身的变化。OpenRouter 上与编程相关的代币比例从 2025 年初的 11% 上升至超过 50%。模型自主执行多阶段任务的 代理工作流也占据了整体输出代币的多数。前 3 名中国模型均专注于编码和代理自动化,正好契合了这一趋势。
OpenRouter COO Chris Clark 解释说:“中国开源模型在美国企业的代理工作流中占据了不成比例的高比重”。

性能属顶级,价格仅为其数十分之一
加速采纳的关键动力是价格。
- MiniMax M2.5:每输入 100 万代币 $0.30,输出 $1.10
- Anthropic Claude Opus 4.6:输入 $5,输出 $25(单价差距 10~20 倍)
- Zhipu AI GLM‑5:输入 $0.30,输出 $2.55
不仅价格低,性能也很出色。MiniMax M2.5 在软件工程基准 SWE‑Bench Verified 中取得 80.2%,与 Claude Opus 4.6(80.8%)的差距仅为 0.6 分点。由于在总参数 2,300 亿中,生成代币时仅激活 100 亿的 专家混合(MoE) 结构,使其在保持大型模型级别推理能力的同时,实现了速度和成本效率的双重提升。
Andreessen Horowitz 合伙人 Martin Casado 估计约 80% 使用开源 AI 堆栈的初创公司在运行中国模型。
但 MiniMax M2.5 使用量的激增也掺杂了促销因素。AI 编码工具 Kilo Code 从 2 月 12 日起提供为期一周的免费访问,Cline 也开展了类似活动。促销结束后使用量是否能保持仍有待观察。
中国内需市场,日代币消费 180 万亿 时代
海外平台的快速增长与中国内需市场的爆发式增长同步。海通国际证券数据显示,字节跳动旗下 Volcano Engine 的大型模型日代币使用量从 2024 年末的 2 万亿增长至 2025 年末的 63 万亿。Alibaba Cloud 的外部客户日调用量也预计从 2025 年约 5 万亿扩大到 2026 年的 15~20 万亿。整体来看,中国 AI 产业中主要大型模型的日代币消费总量从 2024 年初的 1,000 亿增长至截至 2026 年 2 月的约 180 万亿。
创长证券预测,随着编程专用模型和多模态模型进入成熟阶段,下半年后高质量代币需求将大幅增长。海外 AI 产业中,资本支出投资与代币需求激增之间约有两年的时滞。考虑到中国大型科技公司从 2024 年下半年开始加大 AI 资本支出,2026 年将成为需求爆发的真正起点。
剩余变量
这些数据表明,中国 AI 企业在编码和代理这两个增长最快的领域同时具备价格优势和技术实力,正在扩大其全球影响力。然而,促销效果的可持续性、基准成绩与实际生产环境之间的差距以及美国可能加强 AI 出口管制,仍是影响未来走势的关键变量。