当公告取代创新:OpenAI的 Code Red 🚨

发布: (2025年12月20日 GMT+8 02:42)
7 min read
原文: Dev.to

Source: Dev.to

Cover image for When Announcements Replace Innovation: OpenAI’s Code Red 🚨

营销戏码与工程混乱并行。这是技术史上老生常谈的故事,但很少出现如此规模。

我一直在密切关注 OpenAI 的 2025 年发展轨迹。模式不言自明:公告更多,实质更少。合作伙伴增多,实际交付的产品却更少。炒作更多,市场地位却更弱。

对我们工程师来说不舒服的真相是?OpenAI 正在变成一家恰好从事 AI 研究的营销公司。 数据也证明了这一点。

🎄 “12天 Shipmas” 定调

还记得 2024 年 12 月吗?OpenAI 宣布了 “12 天 Shipmas”。每日直播。Sam Altman 主持。承诺 “大礼和袜子里的小礼”。

现实检查?在 12 天的公告中,只有 4 天交付了重大产品发布。

  • 第 1 天: o1 正式发布 + ChatGPT Pro($200/月 级别)
  • 第 3 天: Sora 视频模型
  • 第 9 天: o1 API 为开发者提供
  • 第 12 天: o3 模型预览 — 已宣布,未交付

其余的呢?功能扩展、可访问性增强、合作伙伴公告、电话热线以及 WhatsApp 集成。

MIT Technology Review 把氛围说得很到位:

“军备竞赛已经开始。虽然 12 天 Shipmas 看起来很欢乐,但我敢打赌内部更像是 12 月 23 日的圣诞老人工作坊。”

公告 ≠ 发货。 OpenAI 选择了前者。Google 和 Anthropic 等竞争对手则选择了后者。

Source:

📉 GPT‑5 上线。用户大闹。

快进到 2025 年 8 月 7 日。GPT‑5 面世。Altman 称它为“在任何领域都是合法的博士专家”。纸面上,指标看起来很棒:每周 7 亿用户,每周 180 亿条消息。

随后我们真的去用它构建产品。

几天之内,DevTwitter 和 Reddit 被类似“平淡”“缺乏创意”“被阉割”的评论刷屏。一篇病毒式帖子这样概括:

“GPT‑5 听起来像是被迫在枪口下进行对话。”

Altman 对 The Verge 的回应是 “我们彻底搞砸了。”

他们在 24 小时内为 Plus 用户恢复了 GPT‑4o 的访问权限。想想看——用户更喜欢旧模型。这次“升级”实际上是开发者体验(DX)和用户体验(UX)的降级。

随后是一阵被动的抢救:

  • 8 月 7 日: GPT‑5 发布
  • 11 月 24 日: GPT‑5.1 发布(“更温暖”的人格)
  • 12 月 11 日: GPT‑5.2 紧急发布(在 Gemini 3 之后快速推进)

四个月内推出三个主要版本,这不是敏捷创新,而是危机处理。

💸 财务现实(令人害怕)

这里是工程现实冲击商业壁垒的地方。根据汇丰分析,OpenAI 已承诺在 2033 年前进行约 ~$1.4 trillion 的基础设施交易。

  • $300 B 与 Oracle
  • $11.9 B 与 CoreWeave
  • $30 B/year 用于数据中心容量
  • Stargate 项目: 目标总额 $500 B

面对这些承诺?2025 年现金消耗 $8–9 B,约占收入的 70 %。公司每产生 $1 收入就花费 $1.69

汇丰评估认为 OpenAI 到 2030 年仍难实现盈利,并面临 $207 B 的资金缺口。

与此相比,Anthropic 预计在 2028 年实现盈亏平衡,且烧钱倍率更紧凑。

“你不能下载更多电力。”
Oracle 已因电力/劳动力短缺将数据中心项目从 2027 年推迟到 2028 年。

🪦 The Product Graveyard

Shipped vs. reality (2025):

  • GPT‑5: 本应是变革性技术。现实:仅有边际基准提升,可用性倒退。
  • Sora: 本应在视频领域称霸。现实:质量受限严重,数周内被竞争对手超越。
  • o1 Reasoning: 基准表现令人印象深刻,但每 token 成本约为 ,对大多数生产应用来说经济上不可行。
  • Voice Mode: 只是功能对等的尝试,并非革命。

与此同时:

  • Google: Gemini 3 给人一种真正的多模态飞跃感。
  • Anthropic: Claude 3.5 明显降低了幻觉现象。
  • Meta: 开源的 Llama 3.1 正在抢占开发者的关注度。

🚨 十二月红色警报

内部而言,2025年12月是红色代码。泄露的 Slack 信息描绘了以下情况:

  • 基础设施延迟
  • 模型性能停滞
  • 收入增速放缓
  • 士气下降

叙事已经从“交付放大人类的工具”转变为“投资长期基础设施”。

Translation: 我们没有赚钱,所以把整个公司押在可能不会实现的物理突破上。

对我们(开发者)的意义

“规模即一切”的时代可能正进入收益递减阶段。

如果该领域资金最充裕的玩家也无法让单元经济模型奏效,那么我们就必须严肃地质疑仅仅依赖庞大的专有大语言模型(LLM)进行构建的可持续性。

对工程领袖的关键要点:

  • 不要锁定单一供应商: 如果你仅仅使用 OpenAI 的 API,就会受到其波动性的影响。
  • 关注成本: 在如此高的烧钱率下,API 价格上涨是不可避免的。
  • 评估开源方案: Llama 3.1 以及其他模型正逐渐成为不仅“更便宜”,而且在长期更“安全”的选择。

营销秀场。工程危机。这场表演不会持续太久。

Back to Blog

相关文章

阅读更多 »

仓库利用的权威指南

引言 仓库本质上只是一个 3‑D 盒子。利用率只是衡量你实际使用了该盒子多少的指标。虽然物流 c...