토큰 경제
Source: Dev.to
2161년, 시간은 돈이다—문자 그대로. 태어날 때 팔에 시계가 달려 1년을 카운트다운하기 시작한다. 시간이 다 되면 죽는다. 부자는 수세기를 축적하고, 가난한 사람은 초를 본다. 윌 살라스는 매일 아침 데이턴의 빈민가에서 일터까지 그리고 돌아올 충분한 시간만을 가지고 깨어난다. 계산 하나 틀리면, 버스 하나 놓치면, 예상치 못한 비용 하나로 시계가 0이 된다.
영화 In Time (2011)은 이 전제를 탐구했지만 속편은 나오지 않았다. Tokens라는 2026년 버전을 상상해 보라.
팔에 있는 시계
모든 API 호출은 토큰을 소모합니다. 모든 에이전트 실행은 예산을 소진합니다. 각 추론 단계, 도구 호출, 그리고 검색된 문서는 모두 계량기에 부하를 가합니다.
“그는 에이전트에게 자신의 홈 카메라 시스템, DGX Spark IP 주소, 그리고 작업을 주었습니다. 에이전트는 30분 동안 문제를 해결하고, 해결책을 조사하고, 이를 해결하며, 코드를 작성하고, 서비스를 설정하고, 보고서를 작성했습니다. Karpathy는 아무것도 건드리지 않았습니다.” — Andrej Karpathy
3개월 전에는 주말 프로젝트였지만, 오늘은 시작하고 잊어버리는 일입니다. Karpathy는 이제 “팔에 수세기가 달린” 상태가 되었습니다.
- Jason Calacanis는 자신의 팀이 하루에 $300의 토큰을 사용하고 있다는 사실을 깨닫지 못하고 있었다는 것을 발견했습니다.
- Chamath Palihapitiya는 AI 도구 평가를 토큰 예산—달러당 한계 출력—으로 정의했습니다.
토큰 경제에는 자체적인 “Weis”와 자체적인 “Dayton”이 있습니다.
- $20 API 키를 감시하는 개발자는 Will Salas입니다.
- 연구, 디자인, 코드, 배포 전반에 걸쳐 19개의 모델을 병렬로 실행하는 사람은 New Greenwich입니다.
Perplexity는 최근 Perplexity Computer를 발표했습니다. 이는 Opus 라우팅을 통해 19개의 모델을 조정하는 대규모 멀티‑모델 시스템으로, 엔드‑투‑엔드 연구‑배포, 지속적인 메모리, 수백 개의 커넥터를 제공하며 “2026년에 개인용 컴퓨터가 어떤 모습이어야 하는가”를 제시합니다. 실행 비용은 공개되지 않았습니다.
데이턴의 빈민가
영화에서 가난한 사람들은 시간도 적게 가지고 있을 뿐만 아니라 모든 것에 더 많은 비용을 지불합니다. 한 잔의 커피는 데이턴에서는 4분이 들지만 뉴 그리니치에서는 몇 초에 불과합니다. 인플레이션이 무기가 됩니다.
토큰 경제도 이를 반영합니다:
- 설계가 부실한 워크플로는 유용한 결과를 내지 못하는 추론에 토큰을 소모합니다.
- 대시보드가 초록색(요청 성공)으로 표시되지만 출력이 쓸모없을 때도 조용히 토큰이 소모됩니다.
Matthew Hou는 에이전트 비용은 사용량이 아니라 작업 복잡도에 비례한다고 관찰했습니다. 사용자가 전혀 없는 단일 내부 워크플로가 수천 명에게 서비스를 제공하는 사용자‑대면 기능보다 토큰을 더 빨리 소모할 수 있습니다.
볼륨 기반 예산 책정은 효과적이지 않으며, 예산은 실행 전 예측하기 어려운 복잡성을 고려해야 합니다. 실험하고, 실패하고, 반복하고, 다시 실행할 여유가 있는 엔지니어는 역량을 축적합니다. 시간을 끊임없이 확인해야 하는 사람들은 복잡한 사례의 비용을 이미 부채가 된 뒤에야 알게 됩니다.
재분배 문제
인 타임은 윌 살라스와 실비아 와이스가 시간을 재분배하고 은행을 털며 수세기를 빈민가에 쏟아붓는 것으로 끝난다. 부자들은 공포에 떨고, 영화는 끊겨서 그 후일을 탐구하지 않는다.
진짜 질문은 재분배하면 무슨 일이 일어나는가가 아니라 그 이후에 무슨 일이 일어나는가이다:
- 구조가 바뀌는가, 아니면 권력이 새로운 희소 자원을 찾아 저장하는가?
2026년, 토큰 가격이 하락하고 추론 비용이 저렴해지고 있다. MatX는 $500 M를 모금해 더 높은 처리량과 낮은 지연 시간을 제공하는 칩을 만들고 있다; 투자자에는 카파시와 Nat Friedman이 포함된다. “팔에 수세기가 달린” 사람들은 토큰이 모두에게 더 저렴해질 것이라고 베팅한다.
$20 API 키가 $2 키가 되더라도, 저렴한 토큰이 구조적 격차를 해결해 주지는 않는다. Summer Yue의 에이전트는 정지 명령을 무시하고 계속 실행돼 그녀가 직접 개입해야 했다. Perplexity Computer의 19‑model 오케스트레이션은 정지 신호 문제를 더욱 어렵게 만든다.
축적된 역량—생산 직관, 도메인 지식, 그리고 사태가 부서지는 것을 보며 얻은 “흉터”—은 토큰과 함께 재분배되지 않는다. Vic Chen의 SEC 파이프라인 에이전트는 생산 실패에서 자체 선례를 작성해, 가격이 떨어져도 빈민가에 전파되지 않는 제도적 기억을 만든다.
인 타임의 속편은 모두가 실행할 여유가 있는가가 아니라; 모두가 실행은 할 수 있지만 멈출 수 없는 상황이다. 시계가 단순히 카운트다운만 하는 것이 아니라 작동한다.
영화가 맞춘 점
Will Salas는 지능이나 재능이 부족해서 가난한 것이 아니라, 구조가 그를 살아남을 정도로만 달리게 하고, 충분히 축적할 수 있을 만큼은 달리지 않게 만들었기 때문이다.
토큰 경제는 의도적으로 그렇게 설계된 것은 아니지만, 같은 형태를 공유한다. “팔에 수세기가 새겨진” 사람들은 본질적으로 더 똑똑한 것이 아니라, 반복할 여유가 있고, 에이전트를 밤새 실행시킬 수 있으며, 미터가 가장 빠르게 처리하는 복잡한 사례들을 다룰 수 있다. 나머지는 여전히 시계를 바라보고 있다.
이 영화는 2011년에 처음 공개되었고, 속편은 제작되지 않았다. 왜냐하면 과학 소설처럼 보였기 때문이다. 실제로는 그렇지 않았다; 단지 15년 앞선 작품이었을 뿐이다.