마이크로소프트, 파운드리로 기업 AI 전쟁은 능력이 아닌 신뢰성에 달렸다고 내기.

발행: 1일 전 (2026년 6월 8일 PM 09:00 GMT+9)

12 분 소요

출처: The New Stack

에이전시 AI 파도가 인상적인 데모를 풍부하게 만들어냈지만, 실제 부하, 실제 데이터, 실제 규정 준수 요구 사항 하에서 생산 환경을 견디는 에이전트는 그만큼 많이 나오지 않았습니다.

최근 열린 Microsoft Build 2026 컨퍼런스에서 마이크로소프트는 그 격차를 직접 메우겠다고 선언했습니다. Microsoft Foundry에 일련의 업데이트를 배포했으며, 이는 개발자 프리뷰라기보다 기업용 런타임에 가까운 수준입니다.

마이크로소프트는 호스팅된 에이전트 인프라, 평가 도구, 개방형 거버넌스 사양, 메모리, 지식 검색, 모델 옵션 확대 등을 포함하는 광범위한 업데이트를 Microsoft Foundry 에 제공했습니다. 각각을 따로 보면 합리적인 제품 업데이트이지만, 이들을 모두 합치면 마이크로소프트가 기업 AI에서 다음 경쟁 포인트를 ‘기능’이 아니라 ‘신뢰성 및 관리 가능성’으로 잡았다는 뜻이 됩니다.

“Build 2026에서 Microsoft Foundry는 런타임, 도구, 메모리, 근거, 모델, 가시성, 거버넌스 등 생산용 에이전트에 필요한 플랫폼 요소들을 추가했습니다.”라고 마이크로소프트 개발자 경험 수석 프로그램 매니저인 Nick Brady가 발표 요약 블로그 글(여기)에서 적었습니다.

재작성 없이 사용할 수 있는 런타임

인프라 스토리의 핵심은 Foundry Agent Service에서 제공되는 호스팅 에이전트이며, 마이크로소프트는 2026년 7월 초에 정식 출시(GA)를 목표로 하고 있습니다. 이 설정은 관리형 런타임으로, 각 세션이 전용 샌드박스 안에서 자체 컴퓨팅, 메모리, 영구 파일 시스템 접근 권한을 가지고 실행됩니다.

주목할 만한 점은 프레임워크 입장입니다. Microsoft Agent Framework, GitHub Copilot SDK, LangGraph 혹은 기타 SDK 기반으로 만든 에이전트는 코드를 다시 작성하지 않아도 배포할 수 있습니다. 두 가지 프로토콜을 지원합니다. 첫 번째는 OpenAI와 호환되는 상태 유지 상호작용을 위한 Responses API이며, 두 번째는 개발자가 요청·응답 형식을 직접 제어하는 패스스루 시나리오용 호출 프로토콜입니다. 이미 자체 오케스트레이션을 구축한 팀에게는 두 번째 옵션이 중요합니다.

호스팅 런타임은 현재 퍼블릭 프리뷰 단계인 루틴도 지원합니다. 이를 통해 에이전트를 타이머나 스케줄에 따라 실행할 수 있어, 야간 이슈 트리아지, 일일 보고 등과 같은 작업을 자동화할 수 있습니다. 장시간 실행되는 자율 에이전트는 영구 상태를 유지합니다.

런타임과 함께 Foundry Toolkit for VS Code도 정식 출시되었습니다. Brady는 이 도구를 “템플릿이나 GitHub Copilot을 이용해 에이전트를 생성하고, 로컬에서 트레이스 시각화로 디버깅하며, Toolboxes에 연결하고, VS Code에서 Foundry Agent Service로 배포할 수 있게 해준다”고 설명했습니다.

Toolboxes와 도구 거버넌스 문제

에이전트가 사용하는 도구 수가 늘어남에 따라, 도구 거버넌스는 자체적인 엔지니어링 과제가 됩니다. 현재 퍼블릭 프리뷰 중인 Foundry의 Toolboxes는 에이전트에게 모든 도구 유형에 대한 단일 관리 엔드포인트를 제공합니다. 한 번만 설정하면 모든 MCP 클라이언트를 하나의 URL로 연결할 수 있고, Foundry가 인증, 수명 주기, 거버넌스를 담당합니다.

프로젝트 범위 카탈로그에 버전 관리되는 스킬은 이제 Toolboxes 모델에서 일급 객체로 취급됩니다. 프리뷰 단계인 도구 검색 기능을 통해 전체 카탈로그를 모델에 일괄 제공하는 대신, 작업에 맞는 적절한 도구만 선택하도록 돕습니다. 이는 품질 향상과 컨텍스트 윈도우가 과도하게 커지는 것을 방지하는 데 모두 중요합니다.

Toolboxes는 또한 Microsoft IQ와 연동됩니다—Work IQ, Fabric IQ(데이터 에이전트 포함), Ontology, 시맨틱 모델 등—덕분에 에이전트가 각 데이터 소스마다 맞춤형 파이프라인을 구축하지 않아도 기업 데이터를 활용할 수 있습니다.

벤치마크가 아닌 정책 기반 평가

두 가지 거버넌스 발표가 눈에 띕니다. 첫 번째는 ASSERT(Adaptive Spec‑driven Scoring for Evaluation and Regression Testing) 로, 마이크로소프트 연구 결과를 기반으로 만든 정책‑구동 에이전트 평가용 오픈소스 프레임워크입니다. 정적 벤치마크 대신, ASSERT는 작성된 정책을 구체적이고 측정 가능한 평가로 변환하고, 안전·품질 결함을 사전에 드러내는 시나리오를 자동 생성합니다. LangChain, CrewAI, LightLLM, OpenAI 등 다양한 프레임워크와 호환됩니다.

두 번째는 ACS(Agent Control Specification) 로, 에이전트 라이프사이클의 다섯 단계(입력, LLM, 상태, 도구 실행, 출력)에서 결정론적 안전·보안 제어를 적용하기 위한 산업 표준 사양입니다. ACS는 포터블 YAML 계약 형태로 제공되며, 버전 관리·감사·프레임워크 독립성을 보장합니다. 초기 파트너로는 Infosys, KPMG, IBM, Aviatrix, BigSpin, CrewAI 등이 참여했습니다.

이 두 사양은 실제 문제를 짚어줍니다. 프로덕션에서 에이전트 오류는 무작위가 아니라, 특정 입력 유형, 도구 오용 패턴, 출력 엣지 케이스 등에 집중되는 경향이 있습니다. ASSERT는 이러한 실패 모드를 테스트 가능하게 만들고, ACS는 제어를 프레임워크 간에 이식 가능하고 조직 차원에서 감사 가능하도록 합니다.

평가 스택을 보완하는 요소로는 Guided Guardrail Setup 이 있습니다. 이는 Foundry Agent Builder 안의 질문지 기반 마법사로, 보안 전문가가 아니더라도 PII 필터, 탈옥 방지, 작업 준수 제어 등을 추천해 줍니다. 또한 에이전트 정의와 사용 사례를 기반으로 가중치가 부여된 품질 기준을 자동 생성하는 Rubric 평가기도 포함됩니다.

메모리와 지식

퍼블릭 프리뷰 중인 Foundry Agent Service의 메모리는 이제 세 가지 유형을 지원합니다. Procedural memory(Build에서 새롭게 소개)는 에이전트가 여러 실행에 걸쳐 작업 수행 방법을 학습하도록 돕습니다—단순히 세션 내 대화 내용을 기억하는 것이 아니라. Brady는 초기 Tau‑bench 결과에서 비용은 거의 변동이 없으면서 성공률이 7~14%p 상승했다고 언급했으며, 이는 독립적인 재현 연구가 필요할 정도로 구체적입니다. User memory는 사용자 선호도와 사실을 세션 간에 유지하고, Session memory는 하나의 스레드 내 컨텍스트를 보존합니다.

지식 측면에서는 Foundry IQ가 서버리스 옵션을 퍼블릭 프리뷰로 제공하며, Work IQ, Fabric IQ, 파일 검색, Azure SQL, MCP 등 다양한 신규 지식 소스를 지원합니다. 또한 SLA 기반 검색이 가능한 지식 베이스가 정식 출시되었습니다. Brady는 이를 “맞춤형 RAG 파이프라인을 대체하는, Foundry 에이전트 뒤에 전용 지식 레이어를 두는 것”이라고 설명했습니다. Web IQ는 실시간 외부 컨텍스트가 필요한 에이전트를 위해 데이터 보관 없이 200 ms 이하의 웹 근거 제공을 추가합니다.

모델과 컴퓨트

마이크로소프트는 네 가지 1차 MAI 모델을 퍼블릭 프리뷰로 발표했습니다.

MAI‑Thinking‑1 – 채팅 및 추론용
MAI‑Image‑2.5 – 이미지 생성·편집용
MAI‑Transcribe‑2 – 화자 구분이 가능한 음성‑텍스트 변환용
MAI‑Voice‑2 – 다국어 텍스트‑음성 변환 및 음성 클로닝용

[Fireworks AI on Foundry](

마이크로소프트, 파운드리로 기업 AI 전쟁은 능력이 아닌 신뢰성에 달렸다고 내기.

재작성 없이 사용할 수 있는 런타임

Toolboxes와 도구 거버넌스 문제

벤치마크가 아닌 정책 기반 평가

메모리와 지식

모델과 컴퓨트

관련 글

“위험한 조합”: AI 에이전트 워크플로를 ‘오염’시킬 두 요인

virtbench로 KubeVirt 성능 벤치마킹

단일 데이터센터 탈피: k0smos 플랫폼을 활용한 실용적인 지리분산 AI 운영

마이크로소프트, 자체 AI에 뒤처진 개발자를 위해 Visual Studio를 열다