커서, ‘토크노믹스’ 재평가 속 가격 인하·기업 지출 통제 기능 추가
Source: The New Stack
이번 주 AI 코딩 분야에서 한 가지 큰 교훈이 있다면, 정액제, 무제한 코딩 요금제 시대가 끝나가고 있다는 점이다 — 그리고 청구서가 예상보다 빠르게 도착하고 있다.
가장 명확한 사례는 GitHub가 Copilot의 고정 구독 모델을 토큰 기반 청구로 전환하면서 비용을 사용량에 직접 연결한 것이다. 4월에 발표된 이후 이미 불만이 고조되고 있었던(발표 기사) 반발은 실감났다. 일부 구독자는 월 예상 청구액이 하룻밤 사이에 10배로 급증했다고 보고했으며, 다른 이들은 이번 변화를 ‘미끼와 전환(bait‑and‑switch)’이라 표현했다.
그리고 수요일, 리눅스 재단은 Tokenomics Foundation 설립 계획을 발표했다(보도자료). 구글, 마이크로소프트, 세일즈포스, JPMorgan Chase 등 다수 기업이 지원하는 이 새로운 산업 단체는 AI 토큰 생산·소비·수익화에 대한 개방형 표준과 프레임워크를 구축하는 것을 사명으로 삼는다. 이는 현재 기업들이 비용을 측정하거나 통제할 일관된, 공급업체 중립적인 방법이 없다는 점을 인정하는 것이다.
기업에 가시성과 통제권 제공
Cursor 역시 상황을 예의주시해 왔다. 월요일에 AI 코딩 에이전트 기업은 Teams 플랜의 가격을 재구성했다(블로그). 연간 좌석 비용을 20% 인하해 월 $32로 낮추는 한편, 프리미엄 티어를 월 $120에 새로 출시했다. 프리미엄은 표준 좌석 대비 5배 사용량을 3배 가격에 제공한다는 약속을 내걸며, 사용량 예측이 어려워진 파워 유저를 직접 겨냥한 것이다.
이와 동시에 Cursor는 자체 1인치 Composer 모델을 위한 전용 사용 풀을 추가했다(블로그). 이는 Anthropic, OpenAI 등 타사 모델에 할당된 사용량과는 별도로 관리된다.
업데이트에는 재구성된 지출 알림 기능도 포함됐다. 관리자는 달러 기준(개별 사용자 또는 팀 전체)으로 알림 임계값을 설정할 수 있으며, Slack이나 이메일을 통해 예상치 못한 청구가 발생하기 전에 통보받는다.
Spend alert
수요일이 되자 Cursor는 기업 거버넌스 레이어를 출시했다(블로그). 이제 IT·재무 팀이 AI 지출을 관리할 수 있도록 설계된 것이다.
새로운 “organizations” 구조를 통해 대기업은 하나의 대시보드에서 여러 Cursor 배포를 관리한다. 예산, 모델 접근 권한, 에이전트 권한을 부서 수준에서 모두 설정할 수 있다.
다양한 부서는 서로 다른 위험 프로필과 비용 허용 범위를 갖는다. 예를 들어, 제품·엔지니어링 팀은 전체 모델 라인업과 넉넉한 지출 한도를 가질 수 있지만, 마케팅·재무 팀은 저렴한 모델만 사용하도록 제한하고, 상한선을 낮추며, 명령 실행 전 인간의 승인을 받아야 할 수도 있다.
조직 차원의 대시보드는 모든 팀의 지출 및 토큰 소비를 집계한다. 사용자·팀·클라우드 에이전트별로 필터링이 가능해 재무팀이 사업부별 청구를 손쉽게 수행할 수 있다.
Usage analytics by team
이러한 기능들은 기업 환경에 가시성과 통제권을 제공하도록 설계되었다. 이제 AI 가격 구조가 복잡해짐에 따라 CFO들의 주요 관심사가 되고 있다.
왜 그런지 이해하려면 Cursor와 같은 도구의 경제학을 살펴볼 필요가 있다.
래퍼 압박
Anthropic이나 OpenAI처럼 토큰당 직접 청구하는 모델과 달리, Cursor는 ‘래퍼’이다. 최첨단 모델 제공업체로부터 API 요금으로 추론 비용을 구매하고, 이를 개발자에게 월정액 형태로 재판매한다. 사용량이 적을 때는 이 모델이 잘 맞았지만, 에이전트 기반 코딩 세션이 길어지고 무거워지면서 토큰 소모가 급증하자 더 이상 통하지 않게 되었다.
그 압박에 대한 Cursor의 가장 명확한 대응이 바로 제한된 Composer 풀이다. 자체 코딩 모델인 Composer 2.5는 입력 토큰당 $0.50, 출력 토큰당 $2.50을 청구한다(가격표). 반면 Claude Opus 4.7·4.8은 입력 $5.00, 출력 $25.00으로 토큰당 비용이 10배 차이 난다.
Composer에 별도 할당량을 부여하고, 사용자가 타사 API 할당량을 소진하면 자동으로 Composer로 전환하도록 함으로써, Cursor는 자체가 통제하는 저렴한 추론으로 사용자를 유도하고 동시에 마진을 보호한다.
이와 같은 흐름은 업계 전반에 퍼져 있다. 월요일에 JetBrains가 Mellum2를 오픈소스로 공개했다. Mellum2는 120억 파라미터 규모의 코딩 모델로, 에이전트 시스템의 인프라 계층(라우팅, 검색 파이프라인, 서브 에이전트 작업)을 위해 설계됐으며, Cursor·Claude Code와 같은 클라우드 서비스가 동작하지 못하는 온프레미스 환경에서도 배포 가능하다. 전작 Mellum이 코드 완성만 담당했다면, Mellum2는 엔지니어링 팀이 AI를 활용해 협업을 조정하는 전반적인 작업을 지원한다.
방법은 다르다—Mellum2는 자체 호스팅이 가능해 추론 비용을 전적으로 팀이 부담한다—하지만 근본적인 동기는 동일하다: 비싼 타사 API 호출 의존도를 낮추는 것이다.
가격 상처
GitHub가 Copilot 개편으로 사용자들의 분노를 사고 있는 지금, Cursor도 과거에 가격 정책을 두고 난관을 겪은 바 있다.
2025년 6월, Cursor는 다년간의 대량 계약(Anthropic, OpenAI, Google, xAI)으로 가능해진 $200/월 Ultra 플랜을 출시했다(블로그). 동시에 Pro 플랜을 요청 기반에서 컴퓨팅 기반 청구로 전환했는데, 이 변화는 많은 사용자를 당황하게 만들었고 예상치 못한 비용이 발생했다.
그 변환 과정이 난처했기에 Cursor는 공개 사과(블로그)와 환불을 진행해야 했다.
이번 주 조치는 같은 근본적 압력에 대한 다른 형태의 대응이다. 2025년 변화가 Cursor의 청구 구조 자체를 재편한 반면, 이번 업데이트는 조직에 이미 지출하고 있는 비용을 가시화하고 제어할 수 있는 수단을 제공한다.
성공 여부는 투명성에 달려 있다. Cursor는 포함된 사용 풀의 실제 규모를 공개하지 않고 ‘관대함(generous)’이라고만 설명한다. 이는 Tokenomics Foundation이 설립된 이유와도 맞닿아 있다.
FinOps Foundation의 전무 이사인 J.R. Storment는 The New Stack에 “현재 기업들은 공급업체 간 비용을 일관되게 비교하거나 AI 도입에 대한 정보에 입각한 결정을 내릴 방법이 없다”고 말했다.
“각 하이퍼스케일러·모델 제공업체·하드웨어 제공업체마다 자체 접근 방식·데이터·가치 지표가 있다. 우리는 이전에 해왔던 것처럼 이들 사이에 일관된 모델을 맞추는 것이 목표다.”
그때까지 모든 플랫폼 사용자는 어두운 곳에서 새로운 토큰 경제를 헤쳐 나가야 한다. 그래서 Cursor의 지출 알림, 사용 대시보드, 모델 접근 제어가 비록 소규모라도 올바른 방향으로 나아가는 한 걸음이다.