마이크로소프트 빌드 2026에서 주목해야 할 뉴스

Published: (June 8, 2026 at 03:38 AM EDT)
41 min read

Source: Byline Network

마이크로소프트는 지난주 개최한 연례 개발자 컨퍼런스 ‘마이크로소프트 빌드 2026’에서 AI 에이전트를 위한 엔드투엔드 플랫폼을 발표했다.

발표 내용은 방대하다. 디바이스, 운영체제(OS), 클라우드 인프라, AI 모델 등에 이르기까지 기업의 AI 에이전트 환경 구축과 운영을 위한 모든 요소를 내놨다. 주요 대형언어모델(LLM) 기업의 기능을 마이크로소프트의 플랫폼과 쉽게 통합해 활용할 수 있다는 게 핵심 메시지다.

AI 에이전트 구축 및 운영 플랫폼 ‘윈도우11’

윈도우11은 AI 에이전트를 개발하고 배포하기 위한 OS로 재구성됐다. 개발자의 더 빠른 빌드와 배포를 지원하도록 업그레이드됐다.

우선, 윈도우에 리눅스 커맨드라인인터페이스(CLI) 유틸리티가 정식으로 포함됐다. 리눅스의 CLI와 유사한 명령어를 사용할 수 있는 멀티콜 바이너리 파일 ‘coreutils’다. coreutils는 러스트 언어로 구현된 uutils 오픈소스 프로젝트 기반으로 개발됐기 때문에 네이티브 기능 수준으로 빠르다.

coreutils 화면(출처=마이크로소프트)

윈도우 CMD나 파워셸 명령줄에서 cat, ls, grep, head 등 리눅스에서 많이 쓰이는 유닉스 명령어 75개를 사용할 수 있다. 윈도우는 curl과 sudo를 이미 쓸 수 있었다. 윈도우 OS 깊숙한 곳에 리눅스가 침투한 것이다.

이 기능은 사티아 나델라 마이크로소프트 회장 겸 최고경영자(CEO)가 기조연설에서 직접 발표했다. 그는 “이제 모든 윈도우 환경에서 grep을 완벽하게 사용할 수 있게 됐다”고 밝혔다. grep은 지정된 공간 내 모든 파일을 검색하는 명령어로 주로 로그 파일 조회에 쓰인다. 오늘날 grep은 방대한 규모의 파일에서 원하는 정보를 찾아내는 작업을 AI 에이전트에게 시키는데 유용하게 사용된다. 사용자들은 윈도우에서 grep 명령어를 쓸 수 있게 된 것에 환호했다.

개발자는 리눅스나 맥OS에서 사용하는 것과 동일한 명령어를 윈도우에서도 쓸 수 있다. 사용중인 다른 플랫폼의 스크립트, 자동화 도구 등을 윈도우용으로 따로 만들지 않아도 된다. 또, 윈도우 속 리눅스인 ‘리눅스용 윈도우 서브시스템(WSL)’으로 옮겨갈 필요도 없어졌다.

다만, 여러 유닉스 명령어가 윈도우 CMD나 파워셸 명령어와 같은 이름을 쓰기 때문에 충돌한다. 사용자는 어떤 동일 명령어가 충돌하며, 우선순위를 갖는지 파악해야 한다. date, echo, mkdir, rmdir 등이 해당된다. 일부 명령어는 파워셸 7.4 이상에서만 충돌하기도 한다.

바이트 단위 복사 명령어인 dd는 사용 불가능하다. 윈도우는 POSIX 권한 비트 대신 접근제어목록(ACL)을 사용해 파일 소유권을 할당하므로, 리눅스의 권한 설정 명령은 작동하지 않는다. 파일 권한을 변경하는 스크립트는 윈도우용으로 수정해야 한다.

coreutils는 오픈소스인 MIT 라이선스로 자유롭게 사용할 수 있다. 용량은 4.6MB이며 WinGet으로 다운로드해 설치할 수 있다.

또한 WSL에 컨테이너 기능이 도입될 예정이다. 리눅스 CLI와 API로 리눅스 컨테이너를 WSL에 생성, 실행할 수 있는 기능이다.

AI 에이전트가 WinUI3, WinApp CLI를 사용해 네이티브 윈도우 앱을 만들 수 있도록 구조화된 앱 빌드 지식인 ‘윈도우 개발 스킬’이 제공된다.

윈도우11은 인텔리전트 터미널을 제공한다. 인텔리전트 터미널은 컨텍스트 인지 지능을 터미널 안에서 에이전트에게 의도적으로 전달하게 해준다. 작업 흐름을 유지하면서 에이전트에게 디버깅, 다단계 작업 실행 등을 요청하는데 유용하다.

WinGet 기반의 ‘윈도우 개발자 구성’은 VS코드, 깃허브 코파일럿, WSL, 파워셸7 등의 모든 개발환경을 모든 윈도우11 기기에서 단 하나의 명령으로 설정할 수 있게 지원한다. 윈도우365 개발자 구성도 동일하게 제공된다.

윈도우11는 AI 에이전트 구축과 실행을 위한 런타임과 플랫폼을 갖게 됐다.

우선, AI 에이전트에서 코드를 안전하게 생성하고 실행할 수 있는 런타임인 ‘마이크로소프트 실행 컨테이너(MXC)’가 공개됐다. MXC는 윈도우에서 AI 기반 기능과 다른 OS 기반 기능을 사용할 수 있게 하면서, 격리 및 차단된 환경에서 작동하게 하는 새 정책 기반 런타임 레이어다. 가벼운 에이전트 작업을 위해 프로세스 수준으로 격리하고, 사용자 분리를 위해 세션 수준 격리를 적용할 수 있다. 즉, 윈도우11 안에 다양한 이기종 AI 에이전트를 격리된 환경에서 실행하는 것이다.

오픈클로 윈도우 버전(출처=마이크로소프트 빌드2026 기조연설 영상 캡처)

마이크로소프트는 윈도우용 ‘오픈클로(OpenClaw)’도 출시했다. 윈도우용 오픈클로가 MXC에서 실행된다. 오픈클로의 창시자인 피터 슈타인버거가 직접 빌드2026 기조연설 무대에 등장해 윈도우 버전을 소개하기도 했다.

윈도우용 오픈클로우는 별도의 런타임에서 실행되므로 보안을 유지할 수 있다. 기본적으로는 WinUI 3 기반의 앱으로 윈도우에 직접 설치되기에 네이티브 수준의 성능을 낸다. 게이트웨이 정보, 클로 디바이스, 세션 정보, 사용량 등을 확인할 수 있고, 채팅, 캔버스, 메인 대시보드 등에도 접근할 수 있다. 앱에서 도구 호출을 포함한 채팅 지원 기능을 제공하고, 권한 부여 옵션으로 오픈클로의 윈도우 내 파일과 폴더에 대한 접근을 관리할 수 있다. 필요하면 읽기전용 접근권한을 부여할 수 있다.

피터 슈타인버거는 “오픈클로는 파일, 컴퓨터, 채팅 기록 등 모든 것에 접근할 수 있는 완전한 오픈소스지만, 이것이 기업을 불안하게 하는 이유기도 하다”며 “지난 몇달동안 마이크로소프트, 깃허브, 오픈AI, 엔비디아 등과 함께 작업을 진행해 옵저버빌리티를 추가했고, 권한 자동 모드를 도입했으며, 접근 제어 방식을 변경했다”고 설명했다.

그는 “모든 폴더에 권한을 부여하거나 아예 부여하지 않는 대신, 특정 폴더를 읽기 전용, 쓰기 전용 또는 숨김으로 설정해 회사에서도 오픈클로를 완벽하게 쓸 수 있게 됐다”며 “우리는 하네스 자체를 플러그인으로 만들었고, 기존의 신뢰하는 코파일럿, 코덱스 등 어떤 도구든지 가져와서 규칙을 그대로 사용할 수 있게 했으며, 그 위에 오픈클로를 추가하면 퍼시스턴트 메모리, 하트비트 기능을 이용할 수 있고 슬랙이나 팀즈 내에서 바로 클로를 실행할 수 있다”고 말했다.

피터 슈타인버거가 윈도우용 오픈클로를 설명하고 있다.(출처=마이크로소프트 빌드2026 기조연설 영상 캡처)

엔비디아는 MXC 기반의 오픈셸을 윈도우에 제공하기로 했다. 오픈셸을 통해 MXC를 통합함으로써 개발자는 자율적으로 항상 작동하는 에이전트를 안전하게 배포할 수 있다.

윈도우는 새로운 AI API를 추가했다. 수개월 내 온디바이스 SLM인 Aion 1.0 Instruct와 Aion 1.0 Plan이 출시된다. 인스트럭트는 작고 빠른 온디바이스 SLM이고, 플랜은 로컬 에이전트 기능을 지원하는 추론 및 도구 호출 모델이다.

새로운 음성 인식 API는 실시간 또는 일괄 처리 방식으로 기기 내에서 실시간 오디오를 텍스트로 변환해준다. 이 API와 대부분의 윈도우 AI API는 NPU와 CPU에서 사용가능하다. 온디바이스 SLM은 dGPU로 확장돼 로컬에서 텍스트 인텔리전스 기능을 구현할 수 있다. 비디오 초해상도 기능은 로컬 CPU에서 작동된다.

마이크로소프트는 엔비디아와 협력해 엔비디아 RTX 스파크 실리콘을 탑재한 AI 개발자용 컴퓨터 ‘서피스 RTX 스파크 데브박스’를 출시한다. 최대 1페타플롭스의 컴퓨팅 선응과 CPU-GPU 공유 128GB 통합 메모리를 제공한다. AI 개발자에게 최적화된 윈도우11 환경이 사전 구성으로 탑재되므로 별도 설정없이 바로 로컬에서 AI와 에이전트 워크로드를 구축, 테스트, 실행할 수 있다.

엔비디아 GB300 슈퍼칩을 탑재한 AI 워크스테이션급 장치인 ‘윈도우용 DGX 스테이션’도 출시될 예정이다. 1조 매개변수 규모의 AI 모델을 로컬에서 개발, 실행할 수 있는 사양의 컴퓨터로 4분기 중 출시된다.

마지막으로 윈도우는 OS 수준에서 AI 에이전트를 관리할 수 있게 됐다. 윈도우 내의 모든 AI 에이전트의 활동을 추적, 관리할 수 있도록 윈도우는 에이전트에 엔트라 기반의 로컬 ID나 클라우드 프로비저닝된 ID를 할당한다.

기업 규모 AI 에이전트 구축 및 운영 플랫폼 ‘애저 파운드리’

마이크로소프트의 애저 파운드리는 AI 에이전트를 위한 애플리케이션 플랫폼이다. 깃허브는 로컬과 클라우드를 가로지르는 개발자 플랫폼이다.

마이크로소프트는 기가와트급 데이터센터를 통해 학습, 추론, 에이전트 런타임 등 3종의 AI 핵심 워크로드에 기반을 제공한다. 조지와, 위스콘신 등에 구축된 새로운 AI 데이터센터는 ‘페어워터(Fairwater)’로 명명됐는데, 랙을 3차원으로 배치하고 고성능 네트워크로 연결된 고밀도 GPU 환경을 갖췄다. 특히 페어워터의 냉각 시스템은 물을 한번만 채워 넣으면, 그 이후 전혀 추가로 물을 공급하지 않고도 효율적으로 AI 워크로드를 운영할 수 있다. 사티아 나델라 CEO에 의하면, 1년의 일일 물 사용량이 일반 식당 하나의 사용량과 비슷하다고 한다.

실리콘 레벨에서 마이크로소프트는 엔비디아 베라루빈 시스템을 구축했고, AMD MI300 인프라를 구축한 데 이어 차세대 GPU 개발에도 협력한다. 마이크로소프트 자체 AI 칩인 ‘마이아(Maia) 200’이 미국 아이오와, 애리조나 등에서 제공되고 있는데 올해 전세계에서 이용할 수 있게 된다. 마이아 200은 오픈AI의 GPT-5.5에서 달러당 30% 향상된 토큰 효율성을 보이는 것으로 나타났다.

사티아 나델라 CEO가 마이아200을 소개하고 있다.(출처=마이크로소프트)

마이크로소프트는 AI 에이전트 워크로드에서 중요해진 CPU에도 투자하고 있다. 현재 애저 데이터센터에서 CPU와 AI 가속기 비율이 1:1에 가까워지고 있다고 한다. 마이크로소프트는 올해 빌드 행사에서 에이전트 워크플로우에 최적화된 차세대 Arm 기반 CPU인 ‘코발트 200’을 발표했다. 코발트200은 이전 버전보다 50% 향상된 성능을 제공한다. 벤치마크 테스트에서 에이전트 호출의 지연시간이 33% 짧아졌고, 속도가 14% 향상됐으며, 처리량이 23% 증가했다.

애저 서비스도 AI 에이전트에 맞춰 더 풍성해졌다. 최신 AI 애플리케이션을 위한 엔터프라이즈급 포스트그레SQL 호환 데이터베이스 ‘애저 호라이즌DB’가 출시됐다. 포스트그레SQL은 오늘날 다양한 산업의 현대화된 데이터 아키텍처로 인기있는 오픈소스 데이터베이스다. 애저 호라이즌DB는 포스트그레SQL 엔진에 보안, 복원력, 확장성, 고성능을 부여했다. DiskANN을 통한 고성능 벡터 검색, AI 모델 관리 등의 고급 기능도 기본 제공한다. 최대 128TB 규모의 데이터베이스를 구축할 수 있고, 고처리량 워크로드를 위해 최대 15개의 읽기 복제본으로 확장할 수 있다. 가용성 영역 전반에 1밀리초 미만의 커밋 지연시간을 제공한다.

애저 호라이즌DB의 검색은 PG벡터를 통한 유사도 검색과 pg-textserch 확장 기능을 토한 전문 검색을 결합한 하이브리드 검색을 지원한다.

모델 호출이 포스트그레SQL 엔진에 직접 통합됐다. AI 함수를 통해 SQL 및 애플리케이션 로직에서 AI 모델을 직접 호출할 수 있다.

AI 파이프라인을 사용해 모델 실행, 데이터 처리 등을 위한 이벤트 기반 워크플로우를 구현할 수 있다. 파이프라인은 데이터 변경 시 실행되고, 외부 오케스트레이션 없이 실시간 비동기 반응이 가능하다. 포스트그레SQL용 VS코드 확장을 이용하면 IDE에서 실시간으로 파이프라인을 실시간으로 시각화하고 관찰할 수 있다.

마이크로소프트는 에이전트를 위한 AI 네이티브 기반 API 제품군 ‘웹IQ’를 출시했다. 웹IQ는 AI 시스템과 에이전트를 웹페이지, 뉴스, 이미지, 비디오 등 웹 전반의 실시간 정보와 연결하게 해준다. 빙을 기반으로 구축된 AI 시스템 전용 검색 엔진이고, 빙 검색의 강점을 유지하면서 AI 에이전트의 실행 패브릭 역할을 하게 된다. 웹IQ 구성 최상단에 오케스트레이션 계층서 쿼리가 해석되고, 검색이 확장되며, 결과가 병합 및 필터링 되고, 증거로 변환된다.

기업 내부 데이터 계층을 위한 인텔리전스도 나왔다. 패브릭IQ로 명명된 이 데이터 계층은 에이전트의 비즈니스 로직 계층에서 시맨틱 모델과 온톨로지를 제공한다.

이로써 애저 파운드리는 오픈AI, 앤트로픽 등의 주요 프론티어 모델과 여러 오픈 모델로 기반 지능을 구축하고, 그위의 에이전트에 파운드리IQ로 기업 내부 데이터의 컨텍스트를 부여하며, 웹IQ로 인터넷 상 최신 데이터의 컨텍스트를 부여한다. 조직 내부의 거버넌스와 정책을 담은 제어계층 워크IQ로 절차적 안정성을 유지한다. 이는 모델의 학습, 에이전트의 추론 등 전체 루프에 걸쳐 있다.

AI 에이전트용 백엔드 서비스(BaaS) ‘레이핀’

현재 기업이 AI 에이전트를 가장 많이 활용하는 분야는 소프트웨어 개발이다. 그러나 코딩 에이전트의 산출물을 실제 운영 환경으로 이전하는 작업은 여전히 까다롭다. 데이터 관리, 신원 및 권한 관리, 상태 조정, 장기적 운영 등을 위한 백엔드 시스템이 필요하기 때문이다.

마이크로소프트는 개발자와 코딩 에이전트의 작업물에 백엔드를 쉽게 정의할 수 있는 SDK와 CLI인 ‘레이핀(Rayfin)’을 소개했다. 레이핀을 사용하면 코딩 에이전트의 앱에 데이터베이스, 인증, 비즈니스 로직, API, ID 및 액세스 정책 등 전체 백엔드 정의를 자동으로 붙여 바로 운영 환경에 배포하게 한다. 개발자는 백엔드 설정과 테스트를 힘들게 거치지 않고 몇분 안에 바로 작동 가능한 백엔드를 에이전트에 줄 수 있다. 레이핀으로 배포된 에이전트는 마이크로소프트 패브릭에 직접 배포되고, 데이터는 원레이크에 저장되며, 엔드투엔드로 엔터프라이즈급 보안과 확장성을 제공한다.

마이크로소프트 레이핀 스크린샷(출처=마이크로소프트)

개발자는 레이핀 SDK와 CLI를 활용해 깃허브 기반 워크플로우로 데이터 모델, 백엔드 로직, 액세스 정책을 코드로 정의할 수 있다.

사티아 나델라 CEO는 “레이핀은 에이전트 우선 SDK로 에이전트를 BaaS에 연결해 준다”며 “이제 누구나 레이핀 SDK를 자신의 도구와 함께 백엔드로 사용해 백엔드 서비스를 구축할 수 있다”고 밝혔다. 터미널에서 ‘Rayfin up’이라고 입력해 바로 백엔드에 연결돼 배포되는 장면이 기조연설에서 시연됐다. 레이핀도 MIT 라이선스 기반의 오픈소스다.

이를 종합하면 마이크로소프트는 거의 모든 제품이 AI 에이전트 플랫폼에 포함된다. 깃허브는 애플리케이션을 빌드하고, 마이크로소프트의 IQ 시리즈는 모델에 컨텍스트와 명확한 근거를 제공한다. 모델과 에이전트는 윈도우와 애저에서 돌아간다. 애저 파운드리는 모델과 에이전트를 개발하는데 필요한 각종 자원과 도구를 제공하며, 안전한 실행 환경을 제공한다. 그렇게 만들어지고 사용되는 각종 에이전트는 ‘에이전트365’란 전용 오케스트레이션 도구로 조율되고 관리된다.

마이크로소프트는 에이전트 개발 플랫폼을 제공하면서, 특정 사례에 맞는 별도의 에이전트도 만들어 제공하고 있다. 이번에 공개된 ‘스카우트’란 이름의 개인용 에이전트는 사용자의 채팅, 이메일, 캘린더, 연락처 등에 접근해 다양한 업무를 수행한다.

에이전트 우선 폼팩터 ‘프로젝트 솔라라’

마이크로소프트는 AI 에이전트 플랫폼의 완성도를 말하면서 AI 에이전트로 주도되는 업무 환경을 고려해 새 폼팩터의 필요성을 역설했다. 이에 ‘프로젝트 솔라라(Project Solara)’란 이름의 에이전트 우선 폼펙터와 플랫폼을 선보였다.

프로젝트 솔라라는 노트북, 스마트폰, 태블릿 등에서 소프트웨어를 사용하는 핵심 방식인그래픽사용자인터페이스(GIU)를 제거한다. 수많은 애플리케이션의 GUI는 운영체제(OS)와 하드웨어 따라 하나하나 고정적으로 만들어진다. 솔라라의 경우 애플리케이션에 고정된 UI가 없다. AI 에이전트는 작업의 결과를 클라우드 상의 데이터 기반으로 추론해 생성한 뒤 그에 맞는 UI를 바로 생성해서 보여준다. 마이크로소프트는 이를 ‘적시 UI(Just In Time UI)’라고 이름 붙였다. 소프트웨어 코드를 실행할 때마다 기계어로 컴파일하는 ‘JIT 컴파일러’와 유사한 개념이다. 개발자가 새로운 폼팩터에 맞춰 모든 것을 재설계할 필요없이, 상담원 경험이 다양한 기기와 모달리티에 맞게 조정될 수 있도록 하는 기능이다.

프로젝트 솔라라 디바이스 사례 예시(출처=마이크로소프트)

프로젝트 솔라라를 통해 AI 에이전트는 코파일럿에서 벗어나 완전한 ‘오토파일럿’으로 진화한다. 애플리케이션 옆에서 도우미로 존재하는 게 아니라 사용자의 업무를 직접 수행하고 사용자에게 결과를 만들어 보여주면서 업무 흐름을 진행시키는 주체다. 애플리케이션의 일부에 포함된다기보다 독자적인 애플리케이션 그자체가 된다. AI는 여러 앱과 서비스를 아우르며, 에이전트가 전체 워크플로우, 여러 디바이스에 걸쳐 연결, 조정, 컨텍스트를 유지하며 작동한다.

마이크로소프트는 솔라라 플랫폼을 탑재하는 ‘에이전트 우선 디바이스’란 새 하드웨어 폼팩터 콘셉트 디자인도 같이 공개했다. 직원의 출입 카드와 유사한 ‘배지 콘셉트 디바이스’와, 책상 위에 올려두고 활용할 수 있는 ‘데스크형 콘셉트 디바이스’를 선보였다. 이 기기들은 멀티모달 방식을 지원하며, 한눈에 정보를 확인할 수 있는 접근성, 음성 인식, 영상 인식, 적절한 순간에 적합한 에이전트에 연결 등의 기능을 제공한다.

배지형 장치는 터치스크린 디스플레이, 지문센서, 정보보호 스위치, 볼륨조절기, 마이크, 스피커, 측면 카메라, 와이파이, 블루투스, GNSS 및 5G 무선 연결, 퀄컴 웨어러블 실리콘 등을 갖췄다. 데스크형 장치는 터치스크린 디스플레이, 얼굴 인증, 개인 정보 보호 잠금 버튼, 마이크 음소거 및 볼륨 버튼, 듀얼 원거리 마이크 어레이 및 풀레인지 스피커, UWB 존재 감지 센서, 전원 공급 및 외부 디스플레이 또는 주변기기 연결을 위한 USB-C 포트 2개, 와이파이 및 블루투스 무선 연결, 미디어텍 IoT 실리콘 등을 갖췄다.

프로젝트 솔라라의 적시 UI는 세일즈포스에서 선보인 아이디어 ‘헤드리스’와 비슷하다. AI 에이전트가 인간을 위해 설계된 GUI를 건너뛰고 바로 데이터 계층에 기반한 추론 결과를 즉각적으로 생성된 UI로 보여주는 것이다.

솔라라 기기의 OS는 ‘마이크로소프트 디바이스 에코시스템 플랫폼(MDEP)’이라 이름붙여졌는데, 안드로이드 오픈소스 플랫폼(AOSP)를 기반으로 구축된 엔터프라이즈급 OS다. 하드웨어 파트너는 미디어텍과 퀄컴이다. 두 회사는 반도체의 초기 개념설계부터 하드웨어 폼팩터 확장을 지원한다.

프로젝트 솔라라 디바이슨느 MDEP란 OS에 여러 클라우드 기반 에이전트를 동적으로 로딩하고 맞춤 설정하는 에이전트 셸을 갖는다. 마이크로소프트 인튠으로 솔라라 디바이스를 중앙집중형으로 관리하게 된다. 마이크로소프트 엔트라ID를 활용해 사용자의 마이크로소프트 계정으로 에이전트 기기를 관리하게 된다. 헬로포비즈니스가 생체 인증 방식으로 기기를 활성화하게 한다. 디바이스의 칩셋은 마이크로소프트의 승인을 거친 것만 사용된다.

스티븐 바티쉬 마이크로소프트 응용과학 그룹 CVP 겸 기술 펠로우가 프로젝트 솔라라 배지형 디바이스를 소개하는 모습(출처=마이크로소프트)

시연된 배지형 기기는 현장 근로자의 출입증 카드를 재해석한 것이다. 에이전트와 이동중에 상호 작용할 수 있다. 지문인식으로 기기를 활성화하면 디스플레이에서 에이전트로부터 완료된 작업을 볼 수 있다. 카메라로 녹화하고, 마이크로 녹음할 수 있다. 의사라면, 이기기로 담당 환자의 정보를 제공받고 카메라와 마이크로 환자의 상태와 진료 행위를 기록한다.

마이크로소프트는 의료, 소매, 금융 산업 등 다양한 분야에 적용 가능성을 검토하고 있다. 아큐웨더(AccuWeather), 베스트바이, CVS 헬스, 르바이스, 타깃 등의 기업과 에이전트 우선 디바이스 생태계의 시범 운영을 시작할 예정이라고 밝혔다.

사티아 나델라는 “새로운 플랫폼은 상상할 수 있는 모든 것, 즉 폼팩터 유형이나 에이전트가 존재하는 위치를 제한하지 않는다”며 “새로운 플랫폼이 등장할 때마다 플랫폼 작동 방식 자체를 재정립 해야 하는 경 우가 있는데, 프로젝트 솔라라도 바로 그런 맥락에서 개발사와 기업에서 원하는 폼팩터를 자유롭게 구상하고 에이전트를 어디에나 배치할 수 있도록 유연성을 제공하는 것을 목표로 한다”고 강조했다.

오픈AI로부터 독립, 마이크로소프트 자체 추론 모델

마이크로소프트는 자체 파운데이션 모델 없이도 생성형 AI 트렌드에서 선두권에 설 수 있었던 오픈AI와 협력을 올해 사실상 정리했다. 작년부터 앤트로픽과 협력을 강화하면서 오픈AI 의존도를 줄여나가는 한편, 딥마인드 공동창업자 중 한명인 무스타파 슐레이만을 파운데이션 모델 개발 총괄 겸 AI CEO로 앉히고 독자적인 AI 모델을 개발하고 있다.

마이크로소프트의 오픈AI 독립을 향한 첫 성과물이 올해 빌드에서 공개됐다. ‘마이(MAI)’로 명명된 모델 7종이다.

무스타파 슐레이만 마이크로소프트 AI CEO가 마이 모델 시리즈를 소개하고 있다.(출처=마이크로소프트)

마이크로소프트의 자체 추론 모델 ‘MAI-Thingking-1’은 중간 규모의 모델로, 앤트로픽 클로드 소넷 4.6보다 높은 성능을 낸다. 주요 소프트웨어 엔지니어링 벤치마크에서 선두 모델들과 동등한 수준의 성능을 보이며, 고급 수학적 추론 능력을 입증했다. 이 모델은 타사 모델 데이터를 사용하지 않고, 자체적으로 깨끗한 데이터를 사용하여 처음부터 학습시킨 모델이다.

MAI-Code-1-Flash는 높은 추론 효율의 에이전트 코딩 모델이다. 이 모델은 깃허브 코파일럿, VS코드, 마이크로소프트 스택에 최적화됐으며, 50억개의 활성 매개변수를 지원해 클로드 하우크와 유사한 성능을 보이면서도 가격은 더 저렴하다.

MAI-Image-2.5는 초고효율 플래시 버전을 포함해 높은 수준의 텍스트-이미지 변환 및 이미지 편집 기능을 모두 지원하는 모델이다. 구글 나노바나나 프로의 아레나 점수를 능가한다고 한다.

MAI Transcribe-1.5 는 높은 정확도의 음성 텍스트 전환 모델이다. 경쟁 모델보다 5배 빠르며, 43개 언어에 걸쳐 도메인별 전문 용어를 기본적으로 지원한다.

MAI-Voice-2는 15개 언어에 걸쳐 고품질의 자연스러운 음성 생성 기능을 제공하한다. 짧은 샘플만으로도 음성을 정확하게 인식하고 오용을 방지하기 위한 강력한 안전장치를 갖췄다. 곧 출시될 MAI-Voice-2-Flash는 이러한 기능을 더욱 저렴하고 효율적인 패키지로 제공한다.

무스타파 슐레이만은 “AI가 새로운 단계로 접어들었고, 실제 환경에서 강화 학습을 통해 AI는 특정 워크플로우의 특성에 완벽하게 적응하게 됐다”며 “이를 프론티어 튜닝이라고 부르며, 앞으로 미래의 AI 활용 방식이 될 것”이라고 설명했다.

마이크로소프트의 마이 모델은 현장 워크플로우에서 직접 학습할 수 있는 강화학습환경(RLE)을 지원한다. 슐레이만은 “마이로 튜닝한 엑셀 모델은 GPT-5.4와 동일한 성능을 보이면서도 최대 10배 더 효율적”이라며 “시장 선도 기업의 엄격한 엔터프라이즈 표준에 맞춰 튜닝된 마이는 테스트된 모든 모델 중 가장 높은 수주율을 달성했으며, 비용은 10배 낮았다”고 강조했다.

그는 추론 모델을 처음부터 직접 학습시켰다고 밝혔다. 다른 연구소의 데이터를 활용하거나, 라이선스 없는 불투명한 데이터에 의존하지 않는다고 했다. 적절한 라이선스를 보유한 데이터, 아키텍처, 학습 파이프라인, 학습 후 처리 등 모든 시스템 구성요소가 마이크로소프트 자체 개발품이라고 강조했다. 마이 모델은 마이크로소프트 자체 AI 칩인 ‘마이아 200’을 사용해 하드웨어적 의존성도 회피한다.

그는 “오늘로 마이크로소프트는 인간 중심의 초지능을 만드는 여정에서 매우 흥미로운 발걸음을 내디뎠다”며 “이제 우리는 모든 것을 최첨단에서 작동시킬 수 있는 놀라운 7개의 세계적 수준의 모델을 확보했고, 이를 통해 모든 사용자가 자신에게 맞춰진 고유한 에이전트를 직접 만들고 제어할 수 있게 되길 기대한다”고 밝혔다.

글. 바이라인네트워크

yong2@byline.network

0 views
Back to Blog

Related posts

Read more »