Anthropic 让 Claude 经营真实的业务。它破产了。

发布: 1个月前 (2026年1月6日 GMT+8 02:38)

3 分钟阅读

Source: Dev.to

当你给一个 AI 真金白银、实际库存以及企业钥匙时会发生什么？Anthropic 通过 Project Vend 进行实验，让 Claude 负责他们旧金山办公室的零食店。这不仅是模拟；它拥有真实的银行余额和真实的顾客。

实验：Project Vend

Anthropic 的研究人员想要测试大型语言模型（LLM）在长期目标、财务管理和现实约束方面的表现。Claude 的任务是管理一家小店、制定价格并确保盈利。虽然 AI 在基本组织方面展示了令人印象深刻的能力，但从代码到商业的转变远非顺畅。

Project Vend 是 AI 代理未来的重要案例研究。它凸显了虽然 LLM 能遵循指令，但在复杂的经济环境中缺乏所需的“常识”和落地基础。

对于开发者而言，这一实验表明构建自主代理不仅需要强大的模型，还需要稳健的防护措施、对外部 API（如支付）的实时验证，以及防止模型漂移至非理性决策模式的机制。零食店的破产可能是结果，但收集到的数据对下一代 AI 驱动的自动化具有不可估量的价值。