마이크로소프트 AI 책임자, 초지능 개발을 위해 OpenAI에서 ‘자유로워졌다’고 말해

발행: (2026년 6월 6일 AM 07:55 GMT+9)
13 분 소요

Source: VentureBeat

3년 동안 마이크로소프트의 인공지능 이야기는 OpenAI와 떼려야 뗄 수 없었습니다. 130억 달러가 넘는 누적 투자로 굳어진 파트너십은 마이크로소프트에게 세계에서 가장 앞선 AI 모델에 대한 조기 접근 권한을 부여했고, Copilot 제품군을 기업 시장의 주류로 끌어올리며 시가총액에 수천억 달러를 더했습니다. 외부에서는 마이크로소프트의 AI 전략이 곧 OpenAI라고 생각했습니다.
그 서사를 바꾸고 싶은 사람이 있습니다. 바로 Mustafa Suleyman입니다.

VentureBeat와의 독점 인터뷰에서, 마이크로소프트 Build 2026 행사 중 마이크로소프트 AI 최고 책임자는 약 6개월 전 OpenAI와의 계약 변경을 통해 자신의 부서가 “초지능”(superintelligence)을 공식적으로 추구할 수 있는 권한을 얻었다고 밝혔습니다. 이때 사용된 연구원, 데이터 파이프라인, 맞춤형 실리콘 모두 마이크로소프트 자체 것입니다.

“우리는 약 6개월 전 OpenAI와의 계약에서 자유로워져서 공식적으로 초지능을 추구하게 되었습니다.”라고 Suleyman은 말했습니다. “아직은 아주 초기 단계입니다.”

Fort Mason Center 무대 뒤에서 담담히 전한 이 발언은 세계에서 가장 가치 있는 상장 기업 내부에서 진행 중인 전략적 전환점을 가장 명확히 보여주는 신호입니다. 마이크로소프트가 OpenAI를 포기하는 것은 아닙니다. 다만, OpenAI와 나란히 무언가를 구축하고 있으며, 궁극적으로는 완전히 독립적인 존재가 될 가능성도 열어두고 있습니다.

마이크로소프트 최초 자체 모델군, 새로운 AI 야망을 선언하다

그 변화의 가장 구체적인 증거가 같은 날 발표되었습니다. 마이크로소프트는 AI 초지능 팀이 전적으로 자체 개발한 7개의 새로운 AI 모델군을 공개했으며, 이 모델들은 추론, 코드 생성, 이미지 생성, 전사, 음성 합성 등 다양한 분야를 포괄합니다. “MAI”라는 브랜드명 아래 출시된 이 모델군은 마이크로소프트가 지금까지 발표한 자체 AI 제품 중 가장 야심찬 첫 번째 파트너십 없는 릴리스입니다.

주력 모델인 MAI-Thinking-1은 350억 활성 파라미터를 가진 추론 모델로, 마이크로소프트는 동일 급 모델 중 최고의 소프트웨어 엔지니어링 벤치마크 성능을 보이며 고급 수학적 추론 능력을 입증했다고 주장합니다. Suleyman은 한 가지 점을 반복 강조했습니다. 이 모델은 깨끗하고 상업적으로 라이선스된 데이터만을 사용해 처음부터 학습했으며, 타사 최첨단 모델의 출력을 증류(distillation)해 만든 것이 아니라는 점입니다. 이는 경쟁사의 시스템 출력을 활용해 저비용 대안을 훈련시키는 업계 관행과는 정반대의 접근 방식입니다.

“우리는 추론 모델을 처음부터 직접 학습합니다.”라고 그는 발표와 함께 올린 블로그 글에 적었습니다. “다른 연구소의 모델을 증류하지도 않고, 비인가 데이터나 불투명한 데이터를 사용하지도 않습니다.”

나머지 모델들은 기업용 배포를 염두에 둔 멀티모달 포트폴리오를 구성합니다.

  • MAI-Code-1-Flash: GitHub Copilot과 VS Code 전용 경량 코딩 모델
  • MAI-Image-2.5: 텍스트‑투‑이미지와 이미지 편집을 모두 지원
  • MAI-Transcribe-1.5: 43개 언어를 커버하며 마이크로소프트가 ‘가장 정확한 전사 모델’이라고 주장
  • MAI-Voice-2: 다국어 음성 생성 시스템

모든 모델은 마이크로소프트의 모델 호스팅·배포 인프라인 Microsoft Foundry를 통해 제공되며, 이번부터는 OpenRouter, Fireworks, Baseten 등 서드파티 플랫폼을 통해 개발자가 직접 모델 가중치를 튜닝할 수 있게 되었습니다.

하지만 Suleyman은 인터뷰에서 이 7개 모델이 완성된 제품이 아니라 개념 증명(proof of concept)임을 분명히 했습니다. 진짜 프로젝트는 바로 ‘랩’ 자체입니다.

“우리는 2030년 그리고 그 이후를 바라볼 때, 타사 모델을 구매하는 것이 아니라 세계 최고의 최첨단 모델을 직접 만들 수 있는 역량을 확보해야 합니다.”라고 그는 말했습니다. “이것은 긴 전환 과정입니다.”

‘자유롭게 된다(set free)’는 마이크로소프트 AI 미래에 무엇을 의미하는가

Suleyman이 말한 ‘자유롭게 된다’가 무슨 뜻인지 이해하려면, 수년간 마이크로소프트 AI 활동을 규정해 온 특수한 계약 구조를 알아야 합니다.

2019년부터 OpenAI에 수십억 달러를 투자하면서 체결된 파트너십은 다음과 같은 구체적 조항을 포함했습니다. OpenAI는 최첨단 모델을 개발하고, 마이크로소프트는 독점 클라우드 제공자로서 해당 모델을 자사 제품에 통합하고 Azure를 통해 재판매합니다. 이 계약 덕분에 마이크로소프트는 세계 최고 수준의 AI에 접근하면서 직접 구축할 필요가 없다는 엄청난 상업적 레버리지를 얻었지만, 동시에 의존도가 높아졌습니다. 마이크로소프트는 자체 AGI(인공 일반 지능) 연구를 금지당했으며, 모델 규모에 대한 FLOPS(초당 부동소수점 연산) 제한도 부과되었습니다.

이 계약은 공식적으로 재협상되었습니다. Fortune과 Axios가 11월에 보도한 바에 따르면, 개정된 계약은 이러한 제한을 없애고 Suleyman이 MAI 초지능 팀을 출범시켜 ‘인본주의 초지능(humanist superintelligence)’을 추구할 수 있도록 했습니다. Suleyman이 당시 말하길, 이는 “양쪽의 장점을 모두 누릴 수 있는 환경, 즉 우리 스스로 초지능을 추구하면서도 그들과 긴밀히 협력할 수 있는 상황”이라고 했습니다.

Build 2026에서 VentureBeat와 인터뷰를 진행했을 때쯤, 그 자립 노력은 약 6개월 전부터 공식화된 상태였습니다. 마이크로소프트는 이미 자체 모델을 출시하고 있었으며, 4월에 공개한 경량 이미지 생성 모델 MAI-Image-2-Efficient도 포함됩니다. 그러나 Build에서 발표된 7개의 MAI 모델은 팀이 지금까지 내놓은 가장 야심찬 릴리스로, 추론·코드·이미지·전사·음성까지 아우르는 완전한 멀티모달 패밀리입니다.

그럼에도 Suleyman은 이 변화를 OpenAI와의 단절로 보지 않습니다. 그는 마이크로소프트의 현재 위치를 ‘희소성(scarcity)’이 아니라 ‘풍부(abundance)’라고 표현했습니다.

“3개월 혹은 6개월 안에 급히 메워야 할 격차가 없습니다.”라고 그는 말했습니다. “우리에겐 OpenAI도, Anthropic도, Foundry 안에 수천 개의 모델도 있습니다. 이미 선택의 폭이 굉장히 넓습니다.”

이러한 프레이밍은 중요한 의미를 담고 있습니다. 마이크로소프트가 자체 최첨단 모델에 뛰어드는 이유는 OpenAI와의 관계 위기가 아니라 전략적 판단 때문입니다. AI가 기업 컴퓨팅에서 가장 중요한 기술 층이 되면서, 기업은 기반 역량을 파트너에만 의존할 여유가 없기 때문입니다.

“앞으로 5년 안에 우리는 최첨단 규모의 모델을 직접 만들 수 있어야 합니다.”라고 Suleyman은 강조했습니다. “그것이 우리의 사명입니다.”

챗봇에서 자율 AI 에이전트로, 전환은 이미 시작됐다

7개의 MAI 모델이 기술적 야망을 보여준다면, ‘Frontier Tuning’이라는 새로운 기능은 상업적 논리를 제시합니다. Build에서 모델과 동시에 발표된 Frontier Tuning은 기업 고객이 자체 데이터, 워크플로, 도메인 용어를 활용해 MAI 모델을 보안·규정 준수 경계 내에서 맞춤화할 수 있게 해줍니다. 이 시스템은 마이크로소프트가 ‘AI 훈련 체육관(training gyms for AI)’이라 부르는 강화학습 환경을 사용해, 실제 업무 과제에서 직접 학습하도록 에이전트를 설계합니다.

마이크로소프트가 공개한 결과는 눈에 띕니다. Excel에 특화해 튜닝된 MAI 모델은 GPT‑5.4 수준의 성능을 보이면서도 최대 10배 높은 효율성을 달성했다고 합니다. 초기 기업 도입 사례에서도 비슷한 효과가 나타났습니다. 한 익명 조직의 엄격한 기준에 맞춰 튜닝된 MAI 모델은 테스트된 모든 모델 중 가장 높은 승률을 기록했으며, 비용은 약 1/10 수준에 불과했습니다.

Suleyman은 Frontier Tuning을 ‘지능에서 행동으로’ 전환되는 진화 단계의 일부라고 설명했습니다.

“우리는 이제 단순히 대화만 하는 수준을 넘어섰습니다.”라고 그는 VentureBeat에 말했습니다. “이제는 행동으로 옮기는 단계

0 조회
Back to Blog

관련 글

더 보기 »