Xiaomi MiMo-v2.5 Series API 최대 99% 영구 가격 인하
Source: Hacker News
MiMo-V2.5 시리즈 가격 조정 안내 | 100조 토큰 크리에이터 인센티브 플랜 종료
발효 시간: 2026년 5월 27일 0:00, 베이징 시간
이번 공지 핵심 요약
- MiMo-V2.5 시리즈 API 영구 가격 인하
- TokenPlan 청구 시스템 최적화, 사용량이 기존 대비 5–8배 증가
- 100조 토큰 크리에이터 인센티브 프로그램 성공적으로 종료
- 현재 적용 중인 TokenPlan 사용자 할당량 전면 초기화
MiMo-V2.5 시리즈 API 영구 가격 인하
Compared to the original API pricing, the new pricing can have a maximum reduction of up to 99 %, and no longer differentiates based on the input length.

이 가격 조정은 베이징 시간 기준 5월 27일 0시부터 전 세계 동기화되어 공식 적용됩니다. 모든 개발자 여러분께 통합하고 직접 경험해 보시길 진심으로 초대합니다.
TokenPlan 청구 시스템 최적화
- 가격을 올리지 않고 수량을 늘리기 – 사용량이 원래 대비 5–8배 증가하여 생산성이 크게 향상됩니다.
- 청구 규칙이 더 명확하고 이해하기 쉽도록 조정되었으며, “보는 대로 받는다”는 원칙을 적용했습니다.

Quadrillion 토큰을 위한 크리에이터 인센티브 프로그램 성공적으로 종료
2023년 4월 28일에 시작된 “Trillion 토큰 크리에이터 인센티브 프로그램”은 전 세계 사용자들의 열렬한 참여와 관심을 받았습니다. 베이징 시간 기준 5월 26일 16:08 현재, 100 T Tokens 전량이 일정보다 앞서 완전히 배포되었으며, 행사는 성공적으로 마무리되었습니다.
참고: Apache Software Foundation 회원들을 위한 독점 복지 활동은 장기적으로 유효하며, 이번 종료에 따라 영향을 받지 않습니다.

서프라이즈: 기존 TokenPlan 사용자 할당량이 모두 초기화되었습니다
패키지의 현재 사용량과 관계없이, Credits quota가 남아 있는 유효 기간 내에 있는 Token Plan 구독자(Quadrillion Token Creator Incentive Program 참여자 및 Apache Software Foundation 전용 혜택을 받은 사용자 포함)의 모든 할당량은 베이징 시간 기준 5월 27일 0시부터 완전히 0으로 초기화되며, 새로운 청구 규정에 따라 적용됩니다.
One More Thing: 토큰 플랜이 만료된 기존 유료 사용자들을 위해 서프라이즈 선물을 준비했으며, 다음 주 내에 발표될 예정입니다. 계속 지켜봐 주세요.
추론 기술 최적화 지침
이번 가격 조정의 배경에는 Xiaomi 기술팀이 지속적으로 수행해 온 추론 시스템 최적화가 있습니다.
- 우리는 SWA (Sliding Window Attention) 를 SGLang HiCache 기반으로 완전히 지원하며, 멀티 레벨 스토리지(GPU 메모리, CPU 메모리, SSD) 간 KV 캐시 데이터 전송량을 사전 최적화 수준의 1/7 수준으로 감소시키고, 캐시 가능한 토큰 수를 이전 대비 거의 5 times 로 늘려 캐시 적중률과 추론 효율을 크게 향상시켰습니다.
- 또한 전문가 병렬화 스킴, 입력‑length 버킷팅 전략 등을 최적화하여 클러스터의 입력 처리량을 강화함으로써 서비스 품질을 유지하면서 토큰당 서비스 비용을 지속적으로 낮추고 있습니다.
Conclusion
기술의 가치는 궁극적으로 그 활용 범위에 달려 있습니다. 지속적인 기술 혁신에 의존하여, 저비용과 최고 수준의 역량을 결합한 모델 서비스를 제공함으로써 실제적이고 지속 가능하며 대규모 추론 수요를 활용하고, 완전한 AI 인프라 체인의 구축을 촉진하고자 합니다.
더 많은 사람들이 더 나은 모델을 사용할 수 있게 하는 것— 이것이 MiMo의 변함없는 사명입니다.