이 스타트업은 tokenmaxxing이 다음 컴퓨트 거인을 만들 것이라고 베팅하고 있다
Source: TechCrunch
“토큰을 주세요. 그냥 토큰을 주세요. 빨리 받고 싶어요. 저렴하게 받고 싶어요. 지금 바로요.”
Parasail은 AI 모델 추론을 실행하는 기업에 클라우드 컴퓨팅 서비스를 제공하며, CEO 마이크 헨리는 TechCrunch와의 인터뷰에서 이 플랫폼이 하루에 5 천억 개의 토큰을 생성한다며—‘tokenmaxxing’의 명확한 사례라고 설명했습니다.
배경
마이크 헨리는 이전에 LLM‑전문 칩 제조업체인 Groq에서 임원으로 일했으며, 그곳에서 회사의 클라우드 서비스를 구축했습니다. AI 모델 기반 소프트웨어를 개발하는 개발자들이 특화된 클라우드 처리 능력이 필요하다는 것을 일찍이 인식하고 Parasail을 설립했습니다. 스텔스 상태에서 벗어난 (TechCrunch 기사, 2025년 4월) 이후 Parasail은 3,200만 달러 규모의 Series A 라운드를 유치해 서비스를 확장했습니다.
비즈니스 모델
- 하이브리드 하드웨어 전략 – Parasail은 일부 GPU를 직접 보유하지만, 주로 15개국 40개 데이터 센터에 걸쳐 처리 시간을 임대하고, 유동성 시장을 통해 용량을 보충합니다.
- 추론 전용 집중 – 플랫폼은 모델 학습을 지원하지 않아 저비용·고처리량 추론에 최적화할 수 있습니다.
- 동적 워크로드 할당 – 워크로드를 지능적으로 분산하고 수요 피크를 완화함으로써 자체 실리콘을 보유하고 기존 고객 계약에 얽매인 기업들과 경쟁합니다.
시장 동인
- 오픈소스 모델 및 에이전트가 최첨단 연구실 밖으로 확산되면서 Anthropic, OpenAI 등 독점 API에 대한 의존도가 낮아지고 있습니다.
- 하이브리드 아키텍처 – Elicit의 CEO 안드레아스 슐뮐러가 “우리는 10만 건 이상의 API 요청을 보내는 것이 꽤 버거워서 오픈 모델 쪽으로 더 많이 이동했습니다.”라고 언급했듯이, 오픈 모델은 초기 스크리닝을 담당해 비용을 낮추고, 최첨단 모델은 최종 답변을 제공합니다.
- 추론 인프라 투자 – Touring Capital의 파트너 사미르 쿠마르는 앞으로 추론이 **소프트웨어 구축 비용의 최소 20 %**를 차지할 것으로 예상하며, 이는 Parasail 같은 서비스에 대한 수요를 촉진할 것이라고 말했습니다.
경쟁 구도
Parasail은 다음을 통해 차별화합니다:
- 장기 계약이 없는 스타트업 고객을 타깃.
- 대형 클라우드 제공업체가 다루는 광범위한 엔터프라이즈 워크로드와 달리 추론에만 집중.
- Fireworks AI와 Baseten 같은 자금력이 더 풍부한 추론 경쟁사와 경쟁.
위험 요소
주요 위험은 Parasail의 고객 기반이 변동성이 큰 AI 분야의 시드 및 Series B 스타트업 위주라는 점이며, 이는 매출 안정성에 영향을 미칠 수 있습니다.
전망
Kindred Ventures 파트너이자 라운드 공동 리더인 스티브 장은 모델 배포 경제성이 점점 더 “Parasail이 제공하는 컴퓨트 브로커리지”를 필요로 할 것이라고 믿습니다. 그는 “모두 AI 버블이 있다고 생각했지만, AI 버블은 없습니다. 추론 수요가 공급을 훨씬 초과하고 있습니다.”라고 덧붙였습니다.