Xiaomi MiMo-v2.5 Series API 최대 99% 영구 가격 인하

발행: (2026년 5월 27일 AM 02:24 GMT+9)
6 분 소요

Source: Hacker News

MiMo-V2.5 시리즈 가격 조정 안내 | 100조 토큰 크리에이터 인센티브 플랜 종료

발효 시간: 2026년 5월 27일 0:00, 베이징 시간

이번 공지 핵심 요약

  • MiMo-V2.5 시리즈 API 영구 가격 인하
  • TokenPlan 청구 시스템 최적화, 사용량이 기존 대비 5–8배 증가
  • 100조 토큰 크리에이터 인센티브 프로그램 성공적으로 종료
  • 현재 적용 중인 TokenPlan 사용자 할당량 전면 초기화

MiMo-V2.5 시리즈 API 영구 가격 인하

Compared to the original API pricing, the new pricing can have a maximum reduction of up to 99 %, and no longer differentiates based on the input length.

MiMo-V2.5 API price reduction chart

이 가격 조정은 베이징 시간 기준 5월 27일 0시부터 전 세계 동기화되어 공식 적용됩니다. 모든 개발자 여러분께 통합하고 직접 경험해 보시길 진심으로 초대합니다.

TokenPlan 청구 시스템 최적화

  • 가격을 올리지 않고 수량을 늘리기 – 사용량이 원래 대비 5–8배 증가하여 생산성이 크게 향상됩니다.
  • 청구 규칙이 더 명확하고 이해하기 쉽도록 조정되었으며, “보는 대로 받는다”는 원칙을 적용했습니다.

TokenPlan billing system optimization chart

Quadrillion 토큰을 위한 크리에이터 인센티브 프로그램 성공적으로 종료

2023년 4월 28일에 시작된 “Trillion 토큰 크리에이터 인센티브 프로그램”은 전 세계 사용자들의 열렬한 참여와 관심을 받았습니다. 베이징 시간 기준 5월 26일 16:08 현재, 100 T Tokens 전량이 일정보다 앞서 완전히 배포되었으며, 행사는 성공적으로 마무리되었습니다.

참고: Apache Software Foundation 회원들을 위한 독점 복지 활동은 장기적으로 유효하며, 이번 종료에 따라 영향을 받지 않습니다.

Creator incentive program summary

서프라이즈: 기존 TokenPlan 사용자 할당량이 모두 초기화되었습니다

패키지의 현재 사용량과 관계없이, Credits quota가 남아 있는 유효 기간 내에 있는 Token Plan 구독자(Quadrillion Token Creator Incentive Program 참여자 및 Apache Software Foundation 전용 혜택을 받은 사용자 포함)의 모든 할당량은 베이징 시간 기준 5월 27일 0시부터 완전히 0으로 초기화되며, 새로운 청구 규정에 따라 적용됩니다.

One More Thing: 토큰 플랜이 만료된 기존 유료 사용자들을 위해 서프라이즈 선물을 준비했으며, 다음 주 내에 발표될 예정입니다. 계속 지켜봐 주세요.

추론 기술 최적화 지침

이번 가격 조정의 배경에는 Xiaomi 기술팀이 지속적으로 수행해 온 추론 시스템 최적화가 있습니다.

  • 우리는 SWA (Sliding Window Attention)SGLang HiCache 기반으로 완전히 지원하며, 멀티 레벨 스토리지(GPU 메모리, CPU 메모리, SSD) 간 KV 캐시 데이터 전송량을 사전 최적화 수준의 1/7 수준으로 감소시키고, 캐시 가능한 토큰 수를 이전 대비 거의 5 times 로 늘려 캐시 적중률과 추론 효율을 크게 향상시켰습니다.
  • 또한 전문가 병렬화 스킴, 입력‑length 버킷팅 전략 등을 최적화하여 클러스터의 입력 처리량을 강화함으로써 서비스 품질을 유지하면서 토큰당 서비스 비용을 지속적으로 낮추고 있습니다.

Conclusion

기술의 가치는 궁극적으로 그 활용 범위에 달려 있습니다. 지속적인 기술 혁신에 의존하여, 저비용과 최고 수준의 역량을 결합한 모델 서비스를 제공함으로써 실제적이고 지속 가능하며 대규모 추론 수요를 활용하고, 완전한 AI 인프라 체인의 구축을 촉진하고자 합니다.

더 많은 사람들이 더 나은 모델을 사용할 수 있게 하는 것— 이것이 MiMo의 변함없는 사명입니다.

0 조회
Back to Blog

관련 글

더 보기 »

AI 시대의 프로토타이핑 속도

The Speed of Prototyping in the Age of AI Sunday 31 May 2026 · 7 minutes Note: These are personal reflections on how my workflow has shifted over the past year,...