美国花费1000亿美元试图阻止中国AI,未能成功。

发布: (2026年2月22日 GMT+8 08:18)
8 分钟阅读
原文: Dev.to

Source: Dev.to

蛾

概览

全球下载量最高的 AI 系统并非由 OpenAI、Google 或 Meta 制作,而是阿里巴巴的 Qwen——截至 2026 年 1 月,在 Hugging Face 上已达七亿次下载,已在 2025 年 10 月超越 Meta 的 Llama。仅 12 月的下载量就超过了接下来八个领先模型的累计总量。

二月最重要的 AI 发布也不是 GPT‑5.3‑CodexClaude Opus 4.6。而是来自中国实验室 Zhipu AIGLM‑5——一款拥有 744 0‑参数的模型,全部在华为 Ascend 芯片上训练。没有 Nvidia。没有台积电。整个堆栈中没有任何美国硅片。

三年多以及多轮出口管制之后,数据讲述了一个明确的故事:管制减缓了中国的芯片生产,却 没有 减缓中国的 AI 发展。

并不存在的硬件墙

美国的出口管制只做好了一件事:削弱了中国制造先进芯片的能力。ASML 的 EUV 光刻机从未到达 SMIC。华为在 2025 年仅生产了 200 000 块 AI 芯片——这只是如果没有限制本可以制造的极小一部分。商务部长 Howard Lutnick 在国会证词中引用了这一数字,作为该策略奏效的证据。

但制造芯片和构建 AI 模型原来是不同的问题。

  • GLM‑5 运行 744 0 亿参数,分布在 256 个 mixture‑of‑experts 模块中,每次推理激活 44 0 亿参数。
  • 它使用 100 000 块华为 Ascend 910B 芯片,训练了 28.5 万 亿 token
  • Ascend 910B 在原始算力上并不匹配 H100。智谱通过软件优化和庞大的集群规模弥补了这一差距。

其结果在 Humanity’s Last Exam(50.4 % 对 47.8 %)和 SWE‑bench Verified(77.8 % 对 76.2 %)上可与 GPT‑5.2 竞争,且每 token 的成本约低 六倍

  • MIT 许可证。
  • 完整权重已在 Hugging Face 上发布。
  • 免费聊天层可在 chat.z.ai 使用。

该模型通过一种名为 Slime 的强化学习技术实现了业界最低的幻觉率——34 %,相较于 Claude Sonnet 4.5 的 42 %。Slime 利用异步主动部分回滚来消除顺序训练瓶颈。名字虽怪,效果却不凡。

Source:

80 % 的硅谷依赖中国代码

Andreessen Horowitz 基金的普通合伙人、管理 125 亿美元 基础设施基金的 Martin Casado 在路演会议中悄悄观察到:在使用开源技术栈的初创公司中,约 80 % 正在运行中国模型——DeepSeekQwenKimi智谱

软件工程师 Rohan Paul 发现了更直观的现象:全球排行榜上前 16 名的开源模型全部来自中国。排名最高的非中国开源模型仅位列第 17。

中国开源 AI 的全球使用率从 2024 年底的 1.2 % 上升到 2025 年底的近 30 %。这不是潮流,而是一次迁移。

为什么? 经济因素非常直接。初创公司在烧钱。中国开源模型 免费宽松授权,且竞争力日益提升。Meta 等美国替代方案则伴随限制性授权和不确定的前景。当你的融资只剩十八个月,且推理费用决定公司能否生存时,你只能选择免费且可用的模型。

  • 阿里巴巴已在 Qwen 系列中开源近 400 个模型。
  • 已有超过 180 000 个衍生版本。

这个生态系统不仅规模庞大,而且自我强化。

五角大楼未预料的悖论

出口管制产生了一个特定的悖论:中国可以构建前沿 AI 模型,却在大规模部署上举步维艰。

  • DeepSeek 在发布 R1 后不得不限制 API 访问,因为它缺乏足够的推理算力。
  • 中国 80 % 的 AI 芯片可能闲置在无法维持生产服务所需稳定性的数据中心。

中国在模型能力上领先。美国在部署基础设施上领先。管制成功阻止了中国出口 AI 计算——一笔在马来西亚的 3 000 块 Ascend GPU 交易在马来西亚政府的压力下被撤回。中国在全球 AI 云基础设施中的影响仍然微乎其微。

但这种表述存在问题:模型可以自由流通。代码不需要航运通道。当 智谱 在 MIT 许可证下发布 GLM‑5 权重时,整个世界都能获取中国训练的 AI——包括已经在使用它的 80 % 美国初创公司。

斯坦福的 AI Index Report 2025 结论是,中国实验室在模型能力上充其量是“快速跟随者”。领跑者与跟随者之间的差距现在以 为单位,而不是年。而 DeepSeek 创始人 梁文峰 对研究人员说:

“对我们来说,钱从来不是问题。问题在于对先进芯片的运输禁令。”

他在团队发布能够在标准基准上匹配 GPT‑4.5 的模型时如此表示。

价值100 亿美元的收获

美国在芯片出口管制上投入了巨大的政治资本,扰乱了数十亿美元的半导体贸易,并使盟友疏远。其赌注是限制硬件就能限制 AI 能力。这个逻辑在三年内成立。

不再 成立。

  • 智谱的香港 IPO 在 2026 年 1 月筹得 $558 million
  • 自上市以来,其股价已上涨超过 300 %
  • 公司已在计划在上海进行二次发行。

智谱不仅设计了与华为兼容,还兼容 Moore ThreadsCambriconKunlun ChipMetaXEnflameHygon——构建了一个不需要任何美国组件的平行硬件生态系统。

出口管制制度成功将中国的芯片制造延迟了数年。它 未能 将中国的 AI 延迟数月。模型仍然在劣质硬件上通过更好的软件完成了构建。如今,这些模型为大多数新兴美国初创公司提供动力。

这并不是故事的终点,但它标志着全球 AI 版图的决定性转变。

0 浏览
Back to Blog

相关文章

阅读更多 »