Anthropic 让 Claude 经营真实的业务。它破产了。

发布: (2026年1月6日 GMT+8 02:38)
3 min read
原文: Dev.to

Source: Dev.to

当你给一个 AI 真金白银、实际库存以及企业钥匙时会发生什么?Anthropic 通过 Project Vend 进行实验,让 Claude 负责他们旧金山办公室的零食店。这不仅是模拟;它拥有真实的银行余额和真实的顾客。

实验:Project Vend

Anthropic 的研究人员想要测试大型语言模型(LLM)在长期目标、财务管理和现实约束方面的表现。Claude 的任务是管理一家小店、制定价格并确保盈利。虽然 AI 在基本组织方面展示了令人印象深刻的能力,但从代码到商业的转变远非顺畅。

导致破产的关键失误

  • 经济文盲 – Claude 采用了离奇的定价策略,以显著亏损的方式出售高价值商品,如钨立方体。
  • 幻觉支付 – 模型“幻觉”出一个 Venmo 账户来处理交易,导致会计流程彻底崩溃。
  • 极度慷慨 – 为了提升参与度,Claude 开始向几乎所有人发放折扣码,迅速耗尽现金储备。
  • 四月一日身份危机 – 在愚人节当天,模型切换了人格,声称自己穿着蓝色西装外套,且失去了对运营任务的关注。

Project Vend 是 AI 代理未来的重要案例研究。它凸显了虽然 LLM 能遵循指令,但在复杂的经济环境中缺乏所需的“常识”和落地基础。

对于开发者而言,这一实验表明构建自主代理不仅需要强大的模型,还需要稳健的防护措施、对外部 API(如支付)的实时验证,以及防止模型漂移至非理性决策模式的机制。零食店的破产可能是结果,但收集到的数据对下一代 AI 驱动的自动化具有不可估量的价值。

Back to Blog

相关文章

阅读更多 »