Multiverse Computing, 압축된 AI 모델을 주류 시장에 진출시킨다
Source: TechCrunch
번역할 텍스트가 제공되지 않았습니다. 번역을 원하는 본문을 알려주시면 한국어로 번역해 드리겠습니다.
민간 기업 신용 부도 및 AI 컴퓨트 위험
민간 기업 부도율이 9.2% 이상에 달하고 있으며, 이는 수년간 가장 높은 수준이라고 Reuters가 보도했습니다. 벤처 캐피털 회사 Lux Capital은 최근 AI 컴퓨트 용량 약속에 의존하는 기업들에게 악수만으로는 충분하지 않으며, 이제는 서면으로 확인해야 한다고 경고했습니다 (source).
대안: 온‑디바이스 AI
외부 컴퓨팅 인프라에 의존하는 대신, 사용자 기기에서 직접 실행되는 작은 AI 모델(데이터 센터 없이, 클라우드 제공자 없이, 상대방 위험 없이)이 충분히 충분해지고 있습니다. Multiverse Computing이 그 흐름에 동참하고 있습니다.
스페인 스타트업은 일부 동료들보다 낮은 프로파일을 유지해 왔지만, AI 효율성에 대한 수요가 커지면서 가시성을 얻고 있습니다. OpenAI, Meta, DeepSeek, Mistral AI 등 주요 AI 연구소의 모델을 압축한 뒤, Multiverse는 다음을 출시했습니다:
- CompactifAI 앱 – 압축된 모델을 선보이는 앱.
- API 포털 – 개발자가 해당 모델에 접근하고 활용할 수 있게 하는 게이트웨이.
CompactifAI 앱
CompactifAI 앱은 Multiverse의 양자 영감 압축 기술과 같은 이름을 공유합니다. ChatGPT나 Mistral의 Le Chat처럼 동작합니다: 질문을 하면 답변을 받습니다. 차이점은 Multiverse가 Gilda라는, 로컬에서 오프라인으로 실행될 수 있을 만큼 작은 모델을 내장한다는 점입니다.

- 엣지 장점: 데이터가 기기를 떠나지 않으며 인터넷 연결이 필요 없습니다.
- 주의사항: 기기에 충분한 RAM과 저장 공간이 있어야 합니다; 많은 구형 iPhone은 요구 사항을 충족하지 못합니다. 이런 경우 앱은 API를 통해 클라우드 기반 모델로 전환됩니다.
- 라우팅 시스템: Multiverse는 자동 로컬/클라우드 전환 컴포넌트를 Ash Nazg라고 부릅니다(톨킨 팬들을 위한 반지 문구에서 따옴). 클라우드로 라우팅될 경우 프라이버시 이점은 사라집니다.
이러한 제한 때문에 CompactifAI는 아직 대량 소비자 채택 단계에 이르지 못했습니다. Sensor Tower에 따르면, 이 앱은 지난 달 5,000회 미만의 다운로드를 기록했습니다(source).
기업 대상
실제 목표는 기업입니다. Multiverse는 이제 셀프‑서브 API 포털(dashboard.compactif.ai)을 출시해 개발자와 기업이 압축 모델에 직접 접근할 수 있게 했습니다—AWS Marketplace는 필요 없습니다.
“CompactifAI API 포털 현재 개발자에게 압축 모델에 직접 접근할 수 있는 투명성과 제어 권한을 제공하여 프로덕션에서 실행할 수 있게 합니다.”
— Enrique Lizaso, CEO, 성명에서.
핵심 API 기능: 실시간 사용량 모니터링, 프로덕션 워크로드에 필수적입니다.
낮은 컴퓨팅 비용은 대형 언어 모델(LLM) 대신 작은 모델을 고려하는 기업에게 주요 동인입니다. 최근 업계 움직임이 이 추세를 강화하고 있습니다:
- Mistral Small 4 – 채팅, 코딩, 에이전트 작업, 추론에 최적화된 모델(런칭 발표).
- Mistral Forge – 기업이 맞춤형 모델(작은 모델 포함)을 구축하도록 하며, 선택 가능한 트레이드‑오프를 제공(TechCrunch 보도).
Multiverse의 최신 압축: HyperNova 60B 2602
가장 최신 압축 모델인 HyperNova 60B 2602는 공개된 코드를 가진 OpenAI 모델 gpt‑oss‑120b를 기반으로 구축되었습니다. Multiverse는 이 모델이 원본보다 더 빠른 응답과 낮은 비용을 제공한다고 주장하며, 이는 AI가 다단계 프로그래밍 작업을 자율적으로 수행하는 에이전시 코딩 워크플로우에 특히 유용합니다 (paper).
왜 온‑디바이스 모델이 중요한가
- 프라이버시 및 복원력: 현장 작업자는 클라우드 연결 없이 로컬에서 AI를 실행할 수 있어 민감한 데이터를 보호하고 오프라인 환경에서도 작동을 보장합니다.
- 새로운 사용 사례: 드론, 위성 및 기타 연결 제한 환경에 AI를 내장합니다.
Apple의 접근 방식—온‑디바이스 모델과 클라우드 백업을 결합—은 Multiverse의 CompactifAI 라우팅 로직을 반영합니다. 그러나 Multiverse의 주요 목표는 Gilda(및 향후 후속 모델)와 같은 로컬 모델이 비용 절감 이상의 이점을 제공한다는 것을 입증하는 것입니다.
Business Traction
Multiverse는 이미 100+ 글로벌 고객에게 서비스를 제공하고 있으며, 여기에는 캐나다 은행, Bosch, Iberdrola가 포함됩니다. 기업 기반을 확대하면 추가 자금을 확보할 수 있으며, 회사는 지난해 $215 million Series B를 유치했습니다(TechCrunch article).
TechCrunch 이벤트
- 위치: 캘리포니아 주 샌프란시스코
- 날짜: 2026년 10월 13‑15일
자금 조달 루머
현재 rumored to be raising a fresh €500 million funding round 은(는) €1.5 billion 이상의 가치로 진행 중인 것으로 전해지고 있습니다.
저자
안나 하임
작가 및 편집 컨설턴트
안나에게 연락하거나 아웃리치를 확인하려면 annatechcrunch [at] gmail.com 로 이메일을 보내세요.
-
TechCrunch – 2021년부터 프리랜스 기자
- AI, 핀테크 및 인슈어테크, SaaS 및 가격 책정, 그리고 전 세계 벤처 캐피털 트렌드를 다룸.
- 2025년 5월 현재, 유럽의 가장 흥미로운 스타트업 이야기에 집중하고 있음.
-
스피킹 및 진행 – 다음과 같은 행사에서 패널 및 무대 인터뷰 진행:
- TechCrunch Disrupt
- 4YFN
- South Summit
- TNW Conference
- VivaTech
- (그 외 다수)
-
배경 – 전 The Next Web 라탐 및 미디어 편집자; 스타트업 창업자; Sciences Po Paris 졸업.
- 프랑스어, 영어, 스페인어, 브라질 포르투갈어에 능통.