美国花费1000亿美元试图阻止中国AI，未能成功。

发布: 3天前 (2026年2月22日 GMT+8 08:18)

8 分钟阅读

Source: Dev.to

概览

全球下载量最高的 AI 系统并非由 OpenAI、Google 或 Meta 制作，而是阿里巴巴的 Qwen——截至 2026 年 1 月，在 Hugging Face 上已达七亿次下载，已在 2025 年 10 月超越 Meta 的 Llama。仅 12 月的下载量就超过了接下来八个领先模型的累计总量。

二月最重要的 AI 发布也不是 GPT‑5.3‑Codex 或 Claude Opus 4.6。而是来自中国实验室 Zhipu AI 的 GLM‑5——一款拥有 744 0‑参数的模型，全部在华为 Ascend 芯片上训练。没有 Nvidia。没有台积电。整个堆栈中没有任何美国硅片。

三年多以及多轮出口管制之后，数据讲述了一个明确的故事：管制减缓了中国的芯片生产，却没有减缓中国的 AI 发展。

并不存在的硬件墙

美国的出口管制只做好了一件事：削弱了中国制造先进芯片的能力。ASML 的 EUV 光刻机从未到达 SMIC。华为在 2025 年仅生产了 200 000 块 AI 芯片——这只是如果没有限制本可以制造的极小一部分。商务部长 Howard Lutnick 在国会证词中引用了这一数字，作为该策略奏效的证据。

但制造芯片和构建 AI 模型原来是不同的问题。

GLM‑5 运行 744 0 亿参数，分布在 256 个 mixture‑of‑experts 模块中，每次推理激活 44 0 亿参数。
它使用 100 000 块华为 Ascend 910B 芯片，训练了 28.5 万 亿 token。
Ascend 910B 在原始算力上并不匹配 H100。智谱通过软件优化和庞大的集群规模弥补了这一差距。

其结果在 Humanity’s Last Exam（50.4 % 对 47.8 %）和 SWE‑bench Verified（77.8 % 对 76.2 %）上可与 GPT‑5.2 竞争，且每 token 的成本约低六倍。

MIT 许可证。
完整权重已在 Hugging Face 上发布。
免费聊天层可在 chat.z.ai 使用。

该模型通过一种名为 Slime 的强化学习技术实现了业界最低的幻觉率——34 %，相较于 Claude Sonnet 4.5 的 42 %。Slime 利用异步主动部分回滚来消除顺序训练瓶颈。名字虽怪，效果却不凡。

Source: …

80 % 的硅谷依赖中国代码

Andreessen Horowitz 基金的普通合伙人、管理 125 亿美元 基础设施基金的 Martin Casado 在路演会议中悄悄观察到：在使用开源技术栈的初创公司中，约 80 % 正在运行中国模型——DeepSeek、Qwen、Kimi、智谱。

软件工程师 Rohan Paul 发现了更直观的现象：全球排行榜上前 16 名的开源模型全部来自中国。排名最高的非中国开源模型仅位列第 17。

中国开源 AI 的全球使用率从 2024 年底的 1.2 % 上升到 2025 年底的近 30 %。这不是潮流，而是一次迁移。

为什么？ 经济因素非常直接。初创公司在烧钱。中国开源模型免费、宽松授权，且竞争力日益提升。Meta 等美国替代方案则伴随限制性授权和不确定的前景。当你的融资只剩十八个月，且推理费用决定公司能否生存时，你只能选择免费且可用的模型。

阿里巴巴已在 Qwen 系列中开源近 400 个模型。
已有超过 180 000 个衍生版本。

这个生态系统不仅规模庞大，而且自我强化。

五角大楼未预料的悖论

出口管制产生了一个特定的悖论：中国可以构建前沿 AI 模型，却在大规模部署上举步维艰。

DeepSeek 在发布 R1 后不得不限制 API 访问，因为它缺乏足够的推理算力。
中国 80 % 的 AI 芯片可能闲置在无法维持生产服务所需稳定性的数据中心。

中国在模型能力上领先。美国在部署基础设施上领先。管制成功阻止了中国出口 AI 计算——一笔在马来西亚的 3 000 块 Ascend GPU 交易在马来西亚政府的压力下被撤回。中国在全球 AI 云基础设施中的影响仍然微乎其微。

但这种表述存在问题：模型可以自由流通。代码不需要航运通道。当智谱在 MIT 许可证下发布 GLM‑5 权重时，整个世界都能获取中国训练的 AI——包括已经在使用它的 80 % 美国初创公司。

斯坦福的 AI Index Report 2025 结论是，中国实验室在模型能力上充其量是“快速跟随者”。领跑者与跟随者之间的差距现在以周为单位，而不是年。而 DeepSeek 创始人 梁文峰 对研究人员说：

“对我们来说，钱从来不是问题。问题在于对先进芯片的运输禁令。”

他在团队发布能够在标准基准上匹配 GPT‑4.5 的模型时如此表示。

价值100 亿美元的收获

美国在芯片出口管制上投入了巨大的政治资本，扰乱了数十亿美元的半导体贸易，并使盟友疏远。其赌注是限制硬件就能限制 AI 能力。这个逻辑在三年内成立。

它不再成立。

智谱的香港 IPO 在 2026 年 1 月筹得 $558 million。
自上市以来，其股价已上涨超过 300 %。
公司已在计划在上海进行二次发行。

智谱不仅设计了与华为兼容，还兼容 Moore Threads、Cambricon、Kunlun Chip、MetaX、Enflame 和 Hygon——构建了一个不需要任何美国组件的平行硬件生态系统。

出口管制制度成功将中国的芯片制造延迟了数年。它未能将中国的 AI 延迟数月。模型仍然在劣质硬件上通过更好的软件完成了构建。如今，这些模型为大多数新兴美国初创公司提供动力。

这并不是故事的终点，但它标志着全球 AI 版图的决定性转变。

美国花费1000亿美元试图阻止中国AI，未能成功。

概览

并不存在的硬件墙

80 % 的硅谷依赖中国代码

五角大楼未预料的悖论

价值100 亿美元的收获

相关文章

回收 LoRAs 与自适应合并的吸引力与现实

通过技术和政策提升海事网络安全

[Paper] 测试时训练结合 KV 绑定实际上是线性注意力

[Paper] Squint：用于Sim-to-Real机器人的快速视觉强化学习

概览

并不存在的硬件墙

80 % 的硅谷依赖中国代码

五角大楼未预料的悖论

价值100 亿美元的收获

相关文章

回收 LoRAs 与自适应合并的吸引力与现实

通过技术和政策提升海事网络安全

[Paper] 测试时训练结合 KV 绑定 实际上是线性注意力

[Paper] Squint：用于Sim-to-Real机器人的快速视觉强化学习

80 % 的硅谷依赖中国代码

价值100 亿美元的收获

[Paper] 测试时训练结合 KV 绑定实际上是线性注意力