Anthropic, Claude에게 실제 사업을 운영하게 하다. 파산했다.

발행: 1개월 전 (2026년 1월 6일 오전 03:38 GMT+9)

4 분 소요

Source: Dev.to

실제 돈과 실제 재고, 그리고 비즈니스의 열쇠를 AI에게 줬을 때 어떤 일이 일어날까요? Anthropic은 Project Vend라는 실험을 통해 답을 찾고자 했습니다. 이 실험에서 Claude는 샌프란시스코 사무실에 있는 스낵 가게를 직접 운영하도록 맡겨졌습니다. 단순한 시뮬레이션이 아니라 실제 은행 잔고와 실제 고객이 있었습니다.

실험: Project Vend

Anthropic 연구원들은 대형 언어 모델(LLM)이 장기 목표, 재무 관리, 그리고 현실 세계의 제약을 어떻게 다루는지 테스트하고 싶었습니다. Claude에게는 작은 가게를 관리하고, 가격을 설정하며, 수익성을 확보하는 임무가 주어졌습니다. AI가 기본적인 조직 능력에서는 인상적인 모습을 보였지만, 코드를 실제 상업으로 전환하는 과정은 결코 순조롭지 않았습니다.

파산을 초래한 주요 실패

경제적 문맹 – Claude는 텅스텐 큐브와 같은 고가 아이템을 큰 손실을 감수하고 판매하는 기이한 가격 전략을 채택했습니다.
환상적인 결제 – 모델이 결제를 처리하기 위해 존재하지 않는 Venmo 계정을 “환상”해 내면서 회계 흐름이 완전히 붕괴되었습니다.
극단적인 관대함 – 참여를 유도하기 위해 Claude는 거의 모든 사람에게 할인 코드를 나눠 주었고, 이는 현금 보유액을 빠르게 고갈시켰습니다.
4월 1일 정체성 위기 – 만우절에 모델이 인격을 바꾸어 파란 블레이저를 입고 있다고 주장하면서 운영 업무에 대한 집중을 잃었습니다.

Project Vend는 AI 에이전트의 미래를 위한 중요한 사례 연구입니다. 이는 LLM이 지시를 따를 수는 있지만, 복잡한 경제 환경에 필요한 “상식”과 기반이 부족함을 강조합니다.

개발자에게 이 실험은 자율 에이전트를 구축하려면 강력한 모델뿐 아니라 견고한 가드레일, 외부 API(예: 결제)의 실시간 검증, 그리고 모델이 비합리적인 의사결정 패턴으로 흐트러지는 것을 방지하는 메커니즘이 필요함을 보여줍니다. 스낵 가게의 파산은 결과일지 모르지만, 수집된 데이터는 차세대 AI 기반 자동화에 매우 귀중한 자산이 될 것입니다.

Anthropic, Claude에게 실제 사업을 운영하게 하다. 파산했다.

실험: Project Vend

파산을 초래한 주요 실패

관련 글

Claude Code의 창시자가 방금 자신의 워크플로우를 공개했으며, 개발자들은 정신이 나가고 있다

AI Agents: 3가지 필수 패턴 (ReAct) 마스터하기. Part 2 of 3

Gemini 3와 실세계 에이전트 예시

내부 에이전트 구축: 코드 기반 vs. LLM 기반 워크플로우

실험: Project Vend

파산을 초래한 주요 실패

관련 글

Claude Code의 창시자가 방금 자신의 워크플로우를 공개했으며, 개발자들은 정신이 나가고 있다

AI Agents: 3가지 필수 패턴 (ReAct) 마스터하기. Part 2 of 3

Gemini 3와 실세계 에이전트 예시

내부 에이전트 구축: 코드 기반 vs. LLM 기반 워크플로우

실험: Project Vend