当公告取代创新：OpenAI的 Code Red 🚨

发布: 5天前 (2025年12月20日 GMT+8 02:42)

7 min read

原文: Dev.to

Source: Dev.to

Cover image for When Announcements Replace Innovation: OpenAI’s Code Red 🚨

营销戏码与工程混乱并行。这是技术史上老生常谈的故事，但很少出现如此规模。

我一直在密切关注 OpenAI 的 2025 年发展轨迹。模式不言自明：公告更多，实质更少。合作伙伴增多，实际交付的产品却更少。炒作更多，市场地位却更弱。

对我们工程师来说不舒服的真相是？OpenAI 正在变成一家恰好从事 AI 研究的营销公司。 数据也证明了这一点。

🎄 “12天 Shipmas” 定调

还记得 2024 年 12 月吗？OpenAI 宣布了 “12 天 Shipmas”。每日直播。Sam Altman 主持。承诺 “大礼和袜子里的小礼”。

现实检查？在 12 天的公告中，只有 4 天交付了重大产品发布。

第 1 天： o1 正式发布 + ChatGPT Pro（$200/月级别）
第 3 天： Sora 视频模型
第 9 天： o1 API 为开发者提供
第 12 天： o3 模型预览 — 已宣布，未交付

其余的呢？功能扩展、可访问性增强、合作伙伴公告、电话热线以及 WhatsApp 集成。

MIT Technology Review 把氛围说得很到位：

“军备竞赛已经开始。虽然 12 天 Shipmas 看起来很欢乐，但我敢打赌内部更像是 12 月 23 日的圣诞老人工作坊。”

公告 ≠ 发货。 OpenAI 选择了前者。Google 和 Anthropic 等竞争对手则选择了后者。

Source: …

📉 GPT‑5 上线。用户大闹。

快进到 2025 年 8 月 7 日。GPT‑5 面世。Altman 称它为“在任何领域都是合法的博士专家”。纸面上，指标看起来很棒：每周 7 亿用户，每周 180 亿条消息。

随后我们真的去用它构建产品。

几天之内，DevTwitter 和 Reddit 被类似“平淡”“缺乏创意”“被阉割”的评论刷屏。一篇病毒式帖子这样概括：

“GPT‑5 听起来像是被迫在枪口下进行对话。”

Altman 对 The Verge 的回应是 “我们彻底搞砸了。”

他们在 24 小时内为 Plus 用户恢复了 GPT‑4o 的访问权限。想想看——用户更喜欢旧模型。这次“升级”实际上是开发者体验（DX）和用户体验（UX）的降级。

随后是一阵被动的抢救：

8 月 7 日： GPT‑5 发布
11 月 24 日： GPT‑5.1 发布（“更温暖”的人格）
12 月 11 日： GPT‑5.2 紧急发布（在 Gemini 3 之后快速推进）

四个月内推出三个主要版本，这不是敏捷创新，而是危机处理。

💸 财务现实（令人害怕）

这里是工程现实冲击商业壁垒的地方。根据汇丰分析，OpenAI 已承诺在 2033 年前进行约 ~$1.4 trillion 的基础设施交易。

$300 B 与 Oracle
$11.9 B 与 CoreWeave
$30 B/year 用于数据中心容量
Stargate 项目： 目标总额 $500 B

面对这些承诺？2025 年现金消耗 $8–9 B，约占收入的 70 %。公司每产生 $1 收入就花费 $1.69。

汇丰评估认为 OpenAI 到 2030 年仍难实现盈利，并面临 $207 B 的资金缺口。

与此相比，Anthropic 预计在 2028 年实现盈亏平衡，且烧钱倍率更紧凑。

“你不能下载更多电力。”
— Oracle 已因电力/劳动力短缺将数据中心项目从 2027 年推迟到 2028 年。

🪦 The Product Graveyard

Shipped vs. reality (2025)：

GPT‑5： 本应是变革性技术。现实：仅有边际基准提升，可用性倒退。
Sora： 本应在视频领域称霸。现实：质量受限严重，数周内被竞争对手超越。
o1 Reasoning： 基准表现令人印象深刻，但每 token 成本约为 7×，对大多数生产应用来说经济上不可行。
Voice Mode： 只是功能对等的尝试，并非革命。

与此同时：

Google： Gemini 3 给人一种真正的多模态飞跃感。
Anthropic： Claude 3.5 明显降低了幻觉现象。
Meta： 开源的 Llama 3.1 正在抢占开发者的关注度。

🚨 十二月红色警报

内部而言，2025年12月是红色代码。泄露的 Slack 信息描绘了以下情况：

基础设施延迟
模型性能停滞
收入增速放缓
士气下降

叙事已经从“交付放大人类的工具”转变为“投资长期基础设施”。

Translation: 我们没有赚钱，所以把整个公司押在可能不会实现的物理突破上。

对我们（开发者）的意义

“规模即一切”的时代可能正进入收益递减阶段。

如果该领域资金最充裕的玩家也无法让单元经济模型奏效，那么我们就必须严肃地质疑仅仅依赖庞大的专有大语言模型（LLM）进行构建的可持续性。

对工程领袖的关键要点：

不要锁定单一供应商： 如果你仅仅使用 OpenAI 的 API，就会受到其波动性的影响。
关注成本： 在如此高的烧钱率下，API 价格上涨是不可避免的。
评估开源方案： Llama 3.1 以及其他模型正逐渐成为不仅“更便宜”，而且在长期更“安全”的选择。

营销秀场。工程危机。这场表演不会持续太久。

当公告取代创新：OpenAI的 Code Red 🚨

🎄 “12天 Shipmas” 定调

📉 GPT‑5 上线。用户大闹。

💸 财务现实（令人害怕）

🪦 The Product Graveyard

🚨 十二月红色警报

对我们（开发者）的意义

相关文章

用构建真实项目取代手机成瘾

仓库利用的权威指南

CinemaSins：18分钟内揭露《Red One》的一切错误

摄取1亿次心跳：在不破产的情况下扩展可穿戴技术