중국 AI 모델, 글로벌 토큰 사용량에서 미국 첫 추월… 미니맥스·문샷AI 1~2위 석권
Source: Platum

글로벌 토큰 사용량에서 중국 모델의 부상
글로벌 AI 모델 API 통합 플랫폼 OpenRouter의 2월 데이터에 따르면, MiniMax·Moonshot AI·DeepSeek 등 중국 오픈소스 모델이 토큰 사용량에서 미국 모델을 처음으로 앞질렀다. 상위 10개 모델의 전체 토큰 소비량 약 8.7조 개 가운데 중국 모델이 5.3조 개(61%)를 차지했다.
OpenRouter는 Google, Anthropic 등 60개 이상 제공업체의 400여 개 모델을 하나의 API로 묶어 제공한다. 이 플랫폼의 주간 총 토큰 소비량 자체가 약 12.1조 개로 전년 대비 12.7배 늘었을 만큼, AI 모델 시장 전체가 급격히 팽창하고 있다.
3주 만에 127% 급증, 주간 추이
역전은 2월 둘째 주에 시작됐다. 2월 9 ~ 15일 주간 중국 모델 호출량은 4.12조 토큰으로 미국 모델(2.94조 토큰)을 처음 넘어섰다. 1주 뒤 격차는 더 벌어져 중국 모델의 주간 사용량이 5.16조 토큰에 도달했고, 3주 사이 증가율은 127%를 기록했다.
2월 24일 발표된 주간 데이터에서는 상위 3개 모델을 모두 중국 기업이 차지했다.
- MiniMax M2.5 – 주간 2.45조 토큰, 전주 대비 197% 급증 (1위)
- Moonshot AI Kimi K2.5 – 1.21조 토큰 (2위)
- Zhipu AI GLM‑5 – 7,800억 토큰, 전주 대비 158% 증가 (3위)
DeepSeek V3.2는 5위를 차지했다. 2월 월간 누적 기준으로도 MiniMax M2.5(4.55조 토큰)와 Kimi K2.5(4.02조 토큰)가 1·2위를 유지했으며, 상위 5위 트래픽의 약 3분의 2를 중국 기업 세 곳이 점유했다.
프로그래밍·에이전트 워크플로우가 이끈 구조적 전환
역전의 배경에는 AI 사용 패턴 자체의 변화가 있다. OpenRouter에서 프로그래밍 관련 토큰 비중은 2025년 초 11%에서 50%를 넘어섰다. 모델이 다단계 작업을 자율 수행하는 에이전트 워크플로우도 전체 출력 토큰의 과반을 차지하게 됐다. 상위 3개 중국 모델이 모두 코딩과 에이전트 자동화에 특화돼 있어, 이 흐름과 정확히 맞물린 셈이다.
OpenRouter COO Chris Clark는 “중국 오픈소스 모델이 미국 기업들의 에이전트 워크플로우에서 불균형적으로 높은 비중을 차지하고 있다”고 설명했다.

성능은 최상위급, 가격은 수십 분의 1
채택을 가속하는 핵심 동력은 가격이다.
- MiniMax M2.5: 입력 100만 토큰당 $0.30, 출력 $1.10
- Anthropic Claude Opus 4.6: 입력 $5, 출력 $25 (단가 차이 10~20배)
- Zhipu AI GLM‑5: 입력 $0.30, 출력 $2.55
가격뿐 아니라 성능도 뛰어나다. MiniMax M2.5는 소프트웨어 엔지니어링 벤치마크 SWE‑Bench Verified에서 80.2%를 기록해 Claude Opus 4.6(80.8%)와 0.6 포인트 차이까지 좁혔다. 전체 파라미터 2,300억 개 가운데 토큰 생성 시 100억 개만 선택 활성화하는 전문가 혼합(MoE) 구조 덕분에 대형 모델급 추론 능력을 유지하면서도 속도와 비용 효율을 동시에 확보했다는 평가다.
Andreessen Horowitz 파트너 Martin Casado는 오픈소스 AI 스택을 사용하는 스타트업의 약 80%가 중국산 모델을 운영하고 있다고 추정했다.
다만 MiniMax M2.5 사용량 급등에는 프로모션 효과가 섞여 있다. AI 코딩 도구 Kilo Code가 2월 12일부터 1주일간 무료 접근을 제공했고, Cline도 유사한 캠페인을 진행했다. 프로모션 종료 후에도 사용량이 유지될지는 지켜볼 대목이다.
중국 내수 시장, 일일 토큰 소비 180조 개 시대
해외 플랫폼에서의 약진은 중국 내수 시장의 폭발적 성장과 맥을 같이한다. 하이퉁국제증권에 따르면 ByteDance 산하 Volcano Engine의 대형 모델 일일 토큰 사용량은 2024년 말 2조 개에서 2025년 말 63조 개로 급증했다. Alibaba Cloud의 외부 고객 일일 호출량도 2025년 약 5조 개에서 2026년 15~20조 개로 확대될 전망이다. 중국 AI 산업 전체로 보면, 주요 대형 모델 합산 일일 토큰 소비량이 2024년 초 1,000억 개에서 2026년 2월 기준 180조 개 수준에 도달한 것으로 추산된다.
창장증권은 프로그래밍 특화 모델과 멀티모달 모델이 성숙 단계에 진입하면서 하반기 이후 고품질 토큰 수요가 크게 늘어날 것으로 내다봤다. 해외 AI 산업에서는 자본 지출 투자 후 토큰 수요 급증까지 약 2년의 시차가 관찰된다. 중국 빅테크의 AI 자본 지출이 2024년 하반기부터 본격화된 점을 감안하면, 2026년이 수요 폭발의 본격적인 시작점이 된다는 분석이다.
남은 변수
이번 데이터는 중국 AI 기업들이 코딩과 에이전트라는 가장 빠르게 성장하는 영역에서 가격과 기술력을 동시에 갖추며 글로벌 입지를 넓히고 있음을 보여준다. 그러나 프로모션 효과의 지속 가능성, 벤치마크 성적과 실제 프로덕션 환경 간의 괴리, 미국의 AI 수출 규제 강화 가능성은 앞으로의 추이를 가늠할 변수로 남아 있다.