중국 AI 모델, 글로벌 토큰 사용량에서 미국 첫 추월… 미니맥스·문샷AI 1~2위 석권

Published: (February 28, 2026 at 12:53 AM EST)
8 min read
Source: Platum

Source: Platum

Global token usage chart

글로벌 토큰 사용량에서 중국 모델의 부상

글로벌 AI 모델 API 통합 플랫폼 OpenRouter의 2월 데이터에 따르면, MiniMax·Moonshot AI·DeepSeek 등 중국 오픈소스 모델이 토큰 사용량에서 미국 모델을 처음으로 앞질렀다. 상위 10개 모델의 전체 토큰 소비량 약 8.7조 개 가운데 중국 모델이 5.3조 개(61%)를 차지했다.

OpenRouter는 Google, Anthropic 등 60개 이상 제공업체의 400여 개 모델을 하나의 API로 묶어 제공한다. 이 플랫폼의 주간 총 토큰 소비량 자체가 약 12.1조 개로 전년 대비 12.7배 늘었을 만큼, AI 모델 시장 전체가 급격히 팽창하고 있다.

3주 만에 127% 급증, 주간 추이

역전은 2월 둘째 주에 시작됐다. 2월 9 ~ 15일 주간 중국 모델 호출량은 4.12조 토큰으로 미국 모델(2.94조 토큰)을 처음 넘어섰다. 1주 뒤 격차는 더 벌어져 중국 모델의 주간 사용량이 5.16조 토큰에 도달했고, 3주 사이 증가율은 127%를 기록했다.

2월 24일 발표된 주간 데이터에서는 상위 3개 모델을 모두 중국 기업이 차지했다.

  • MiniMax M2.5 – 주간 2.45조 토큰, 전주 대비 197% 급증 (1위)
  • Moonshot AI Kimi K2.5 – 1.21조 토큰 (2위)
  • Zhipu AI GLM‑5 – 7,800억 토큰, 전주 대비 158% 증가 (3위)

DeepSeek V3.2는 5위를 차지했다. 2월 월간 누적 기준으로도 MiniMax M2.5(4.55조 토큰)와 Kimi K2.5(4.02조 토큰)가 1·2위를 유지했으며, 상위 5위 트래픽의 약 3분의 2를 중국 기업 세 곳이 점유했다.

프로그래밍·에이전트 워크플로우가 이끈 구조적 전환

역전의 배경에는 AI 사용 패턴 자체의 변화가 있다. OpenRouter에서 프로그래밍 관련 토큰 비중은 2025년 초 11%에서 50%를 넘어섰다. 모델이 다단계 작업을 자율 수행하는 에이전트 워크플로우도 전체 출력 토큰의 과반을 차지하게 됐다. 상위 3개 중국 모델이 모두 코딩과 에이전트 자동화에 특화돼 있어, 이 흐름과 정확히 맞물린 셈이다.

OpenRouter COO Chris Clark는 “중국 오픈소스 모델이 미국 기업들의 에이전트 워크플로우에서 불균형적으로 높은 비중을 차지하고 있다”고 설명했다.

Agent workflow illustration

성능은 최상위급, 가격은 수십 분의 1

채택을 가속하는 핵심 동력은 가격이다.

  • MiniMax M2.5: 입력 100만 토큰당 $0.30, 출력 $1.10
  • Anthropic Claude Opus 4.6: 입력 $5, 출력 $25 (단가 차이 10~20배)
  • Zhipu AI GLM‑5: 입력 $0.30, 출력 $2.55

가격뿐 아니라 성능도 뛰어나다. MiniMax M2.5는 소프트웨어 엔지니어링 벤치마크 SWE‑Bench Verified에서 80.2%를 기록해 Claude Opus 4.6(80.8%)와 0.6 포인트 차이까지 좁혔다. 전체 파라미터 2,300억 개 가운데 토큰 생성 시 100억 개만 선택 활성화하는 전문가 혼합(MoE) 구조 덕분에 대형 모델급 추론 능력을 유지하면서도 속도와 비용 효율을 동시에 확보했다는 평가다.

Andreessen Horowitz 파트너 Martin Casado는 오픈소스 AI 스택을 사용하는 스타트업의 약 80%가 중국산 모델을 운영하고 있다고 추정했다.

다만 MiniMax M2.5 사용량 급등에는 프로모션 효과가 섞여 있다. AI 코딩 도구 Kilo Code가 2월 12일부터 1주일간 무료 접근을 제공했고, Cline도 유사한 캠페인을 진행했다. 프로모션 종료 후에도 사용량이 유지될지는 지켜볼 대목이다.

중국 내수 시장, 일일 토큰 소비 180조 개 시대

해외 플랫폼에서의 약진은 중국 내수 시장의 폭발적 성장과 맥을 같이한다. 하이퉁국제증권에 따르면 ByteDance 산하 Volcano Engine의 대형 모델 일일 토큰 사용량은 2024년 말 2조 개에서 2025년 말 63조 개로 급증했다. Alibaba Cloud의 외부 고객 일일 호출량도 2025년 약 5조 개에서 2026년 15~20조 개로 확대될 전망이다. 중국 AI 산업 전체로 보면, 주요 대형 모델 합산 일일 토큰 소비량이 2024년 초 1,000억 개에서 2026년 2월 기준 180조 개 수준에 도달한 것으로 추산된다.

창장증권은 프로그래밍 특화 모델과 멀티모달 모델이 성숙 단계에 진입하면서 하반기 이후 고품질 토큰 수요가 크게 늘어날 것으로 내다봤다. 해외 AI 산업에서는 자본 지출 투자 후 토큰 수요 급증까지 약 2년의 시차가 관찰된다. 중국 빅테크의 AI 자본 지출이 2024년 하반기부터 본격화된 점을 감안하면, 2026년이 수요 폭발의 본격적인 시작점이 된다는 분석이다.

남은 변수

이번 데이터는 중국 AI 기업들이 코딩과 에이전트라는 가장 빠르게 성장하는 영역에서 가격과 기술력을 동시에 갖추며 글로벌 입지를 넓히고 있음을 보여준다. 그러나 프로모션 효과의 지속 가능성, 벤치마크 성적과 실제 프로덕션 환경 간의 괴리, 미국의 AI 수출 규제 강화 가능성은 앞으로의 추이를 가늠할 변수로 남아 있다.

0 views
Back to Blog

Related posts

Read more »

AI의 커리어 사다리 걷어차기, 신입이 사라진다

AI가 노동시장에서 신입직원의 일자리를 빼앗는 동시에 경력직의 생산성을 높인다는 분석이 나왔다. 노동자의 경험이 AI 시대 생존의 갈림길이 될 전망이다. 미국 달라스 연방준비은행달라스 연준은 지난 2월 24일 발표한 보고서에서 AI가 노동시장에 미치는 영향이 근로자의 경험 수준에 따라...

회생기한 2달 연장된 홈플러스, 과제는?

관련 행사 - 컨퍼런스 2026 이커머스 비즈니스 인사이트 장소: 서울 강남구 테헤란로7길 22 ST Center 대회의실2 일시: 3월 12일 12:30 ~ 17:00 - 웨비나 AI‑Ready DATA 전략 일시: 3월 5일 14:00 ~ 16:00 회생기한 연장 배경 서울회생법원...

[플레이BN] 서브컬처 팬 정조준 NHN ‘어비스디아’

플레이 바이라인네트워크BN는 주목할 만한, 직접 해볼 만한 게임을 선별해 리뷰하는 코너입니다. 잘한 점은 분명히 짚고, 아쉬운 부분도 숨기지 않습니다. 과장 없이 담백하게 전합니다. 애니메이션풍 그래픽을 앞세운 서브컬처 게임이 부쩍 늘었습니다. 이를 선호하는 이용자층이 그만큼 두텁다는...