Microsoft, AI 경쟁자를 상대로 세 개의 새로운 기본 모델을 발표

발행: (2026년 4월 3일 AM 01:48 GMT+9)
3 분 소요
원문: TechCrunch

Source: TechCrunch

새로운 기본 모델

  • MAI‑Transcribe‑1 – 25개 언어의 음성을 텍스트로 전사합니다. Azure Fast보다 2.5 × 빠릅니다.
  • MAI‑Voice‑1 – 1초에 60 초 분량의 오디오를 생성할 수 있는 오디오‑생성 모델이며, 맞춤형 음성 생성도 지원합니다.
  • MAI‑Image‑2 – 비디오‑생성 모델(원래는 3월 19일 MAI Playground에 출시).

세 모델 모두 현재 Microsoft Foundry에서 이용 가능하며, 전사 및 음성 모델은 MAI Playground에서도 접근할 수 있습니다.

개발 팀

이 모델들은 Microsoft의 MAI Superintelligence 팀이 개발했으며, 팀장은 Microsoft AI CEO인 Mustafa Suleyman입니다. 팀은 2025년 11월에 결성 및 발표되었습니다.

“Microsoft AI에서는 인간 중심 AI, 즉 Humanist AI를 구축하고 있습니다. 우리는 AI 모델을 만들 때 사람을 중심에 두고, 실제 커뮤니케이션 방식을 최적화하며, 실용적인 사용을 위한 학습에 중점을 둡니다,” 라고 Suleyman은 블로그 게시물에서 밝혔습니다. “곧 Foundry와 Microsoft 제품 및 경험에 직접 적용되는 더 많은 모델을 선보일 예정입니다.”

가격

모델가격
MAI‑Transcribe‑1$0.36 per hour
MAI‑Voice‑1$22 per 1 million characters
MAI‑Image‑2$5 per 1 million tokens (text input)
$33 per 1 million tokens (image output)

OpenAI와의 관계

자체 모델을 출시하면서도 Microsoft는 OpenAI와의 파트너십에 대한 의지를 재확인했습니다. Suleyman은 VentureBeat 인터뷰에서 이 내용을 논의했으며, The Verge와의 대화에서 최근 파트너십 재협상이 Microsoft가 초지능 연구를 보다 자유롭게 진행할 수 있게 해준다고 전했습니다.

투자 및 생태계

Microsoft는 AI 연구소에 130억 달러 이상을 투자했으며, 다년 파트너십을 통해 새로운 모델을 제품 포트폴리오 전반에 걸쳐 제공하고 있습니다. 회사는 외부 공급업체로부터 AI 칩을 계속 구매하면서 자체 하드웨어도 개발하고 있다고 TechCrunch 기사에서 언급했습니다.

0 조회
Back to Blog

관련 글

더 보기 »

RAG 소개 (Retrieval-Augmented Generation)

Generative AI & the Limits of LLMs 대형 언어 모델(LLM)을 조금이라도 사용해 본 적이 있다면, 그들의 가장 큰 문제점들을 겪어봤을 것입니다: - 구식 지식 –...