AWS 주간 요약: AWS FinOps 에이전트 베타, Gemma 4 Bedrock, Kiro Pro Max 등 (2026년 6월 15일)
Source: AWS News Blog
이번 주, 뉴욕시에서는 AWS Summit가 열려 빌더, 고객, AWS 팀이 Javits Center에서 발표, 데모, 기술 세션을 한_day_동안 만나게 됩니다. 저는 이번 주에 일부 Summit 출시 블로그 포스트를 썼기 때문에 그들이 이번 주에 공개되는 것을 기대하고 있습니다. 다만 저는 Javits Center에서 직접 관람하지 않을 것입니다. 4일간의 음악 페스티벌에 참석하면서 휴대폰으로 발표를 따라가며 tente를 치는 방법을 고민할 거예요. 만약 현장에서 같이 참여하지 못했었다면, 키노트 라이브 스트림은 6월 17일에 Dr. Swami Sivasubramanian(에이전틱 AI 부사장)과 Chet Kapoor(보안 서비스 및 관측성 부사장)가 개발자 도구, AI 인프라, 보안 분야의 새로운 기능을 소개하는 데 사용됩니다.

이번 주에 일어난 일입니다.
Headlines
How frontier teams are reinventing AI-native development — Swami는 이번 주에 Amazon 엔지니어링 팀 수백 곳의 실험 데이터를 바탕으로 상세한 포스트를 발표했습니다. AI 도입을 자체 팀에 어떻게 구조화할지 고민 중이라면 꼭 읽어볼 가치가 있습니다.
6명의 엔지니어가 Amazon Bedrock 추론 엔진을 76일 만에 재구성했으며, 이 프로젝트는 원래 30명의 개발자가 12~18개월 동안 진행하도록 설계되었습니다. Amazon Stores 팀과의 구조화된 파일럿에서 median 생산성 향상은 정규화된 배포 속도 대비 4.5배였으며, 일부 팀은 10배 이상을 초과했습니다. Perfect Order Experience는 2주간 기능 사이클을 오후에 배포로 단축했고, WW Grocery는 디자인 문서 제작 시간을 5일에서 몇 시간으로 줄였습니다.
이 포스트는 이 결과를 5가지 실천법으로 정리합니다. 첫째, 생산 코드를 작성하기 전에 에이전트 컨텍스트를 구축하세요(스티어링 파일, 코딩 표준, 구조화된 저장소). 둘째, 워크플로우가 재구성되는 동안 초기 속도 저하가 발생할 것이라 예상하고 이를 극복하세요. 셋째, 에이전트가 상시 감독 없이 병렬로 실행될 수 있도록 잘 정의된 작업 백로그를 유지하세요. 넷째, 코드 생성이 시작되기 전에는 의도를 명확히 구조화된 사양으로 표현하세요. 다섯째, 테스트를 파이프라인에 도달하기 전에 왼쪽으로 이동시켜 에이전트가 자체 수정하도록 하세요.
포스트는 커밋 속도가 전체 그림의 일부분일 뿐이며, 향후 포스트에서는 릴리스 관리, 운영, 보안 운영, EOL 업그레이드를 다룰 것이라고 마칩니다.
AWS FinOps Agent is now available in preview — AWS FinOps Agent는 FinOps 실무자와 엔지니어링 팀을 위한 새로운 에이전트로, 비용 질문에 답변하고 최적화 기회를 제시하며 비용 이상 현상을 조사하고 정의된 일정에 따라 반복적인 FinOps 워크플로를 실행합니다. 이 에이전트를 사용하면 AWS 비용을 쿼리하고, 재무 및 엔지니어링 팀을 위한 비용 보고서를 생성할 수 있으며, AWS Cost Optimization Hub와 AWS Compute Optimizer에서 규모 조정, 대기 recursos, Savings Plans 권장 사항을 제공받을 수 있습니다. 또한 해당 권장 사항에 기반해 Jira 티켓을 자동으로 열 수 있습니다. 비용 이상 현상이 감지되면 FinOps Agent가 루트 원인을 자동으로 조사하고 Slack 채널에 결과를 게시합니다.
Last week’s launches
I’ll start with one I wrote this week, then cover the other launches that caught my attention:
-
Amazon EC2 M9g and M9gd instances are now generally available — AWS Graviton5 프로세서로 구동되고 sixth‑generation Nitro System 기반으로 제공되는 M9g 인스턴스는 Graviton4 기반 인스턴스 대비 연산 성능이 최대 25% 향상됩니다. 웹 애플리케이션에서는 최대 35%, 머신 러닝 추론에서는 최대 35%, 데이터베이스에서는 최대 30% 빠른 성능을 제공합니다. Graviton5는 AWS 풀에서 PCIe Gen6와 DDR5‑8800 메모리를 지원하는 첫 번째 프로세서이며, 이전 세대 대비 L3 캐시가 5배 더 큡니다. M9g 및 M9gd 인스턴스는 평균적으로 M8g보다 네트워크 대역폭이 최대 15%, Amazon EBS 대역폭도 최대 20% 향상됩니다. 이번 릴리스는 Nitro Isolation Engine을 도입했는데, 이는 Nitro 시스템을 강화해 수학적으로 증명된 가상 머신 간 격리를 제공하는 최초의 formalmente 검증된 클라우드 하이퍼바이저입니다. M9gd 인스턴스는 최대 11.4 TB의 로컬 NVMe SSD 스토리지와 M8gd 대비 30% 높은 IOPS를 지원합니다. 두 인스턴스 유 모두 Instance Bandwidth Configuration(IBC)을 통해 EBS와 VPC 네트워킹 대역폭 할당을 최대 25%까지 조정할 수 있습니다.
-
Anthropic Claude Fable 5 on Amazon Bedrock — Claude Fable 5는 6월 9일에 Amazon Bedrock에 출시되어 비동기 작업 실행 연장, 다이어그램·차트·PDF 등 다양한 시각 자료 처리 기능, 그리고 자율 검증 기능을 제공합니다. 모델을 호출하기 전에 Data Retention API를 통해 데이터 공유에 동의를 해야 하며, Anthropic는 Mythos 클래스 모델의 입력 및 출력을 30일간 보관하도록 요구합니다. 가용성에 대한 중요 안내: 6월 12일에 Anthropic는 US 정부 수출 통제 지침 준수를 위해 모든 사용자에 대해 Claude Fable 5와 Claude Mythos 5의 액세스를 취소해달라고 AWS에 요청했습니다. Opus 4.8을 포함한 기타 모델은 영향을 받지 않습니다. 자세한 내용은 Anthropic 성명을 참고하십시오. AWS는 추가 업데이트가 공개될 때마다 공유할 예정입니다.
-
Gemma 4 models are now available on Amazon Bedrock — Google DeepMind의 Gemma 4 가족이 Amazon Bedrock에서 사용할 수 있게 되었으며, 세 가지 변형으로 제공됩니다. Gemma 4 31B(밀도 높은 모델, 256K 토큰 컨텍스트 창, 추론 및 코딩 작업에 적합), Gemma 4 26B‑A4B(혼합 전문가 아키텍처, 비용 효율성과 지연을 중시하는 워크로드용), Gemma 4 E2B(소형 변형으로 저연.latency 인터랙티브 사용 사례에 최적화). 이 세 가지 모델 모두 네이티브 함수 호출, 구조화된 출력, 추론, 스트리밍 응답, 텍스트·이미지·영상·오디오 멀티모달 입력을 지원하며 35개 이상 언어에 대응합니다.
-
Amazon OpenSearch Service launches MCP Apps for agentic observability — Amazon OpenSearch Service는 MCP Apps를 지원하게 되었으며, Claude Desktop 및 VS Code와 같은 호환 가능한 에이전틱 IDE 내에서 관측성 워크플로를 실행할 수 있게 됩니다. 로컬 환경의 AI 에이전트는 OpenSearch 도메인·컬렉션 및 Amazon Managed Service for Prometheus에 저장된 로그, 트레이스, 메트릭, 알림을 활용해 사고를 조사할 수 있습니다. 각 MCP App 도구 호출은 텍스트 요약(에이전트가 추론용)과 동일한 대화 스레드에서 렌더링되는 인터랙티브 시각화를 동시에 반환합니다. 제공되는 MCP App 도구는 로그·메트릭·추적 조사, 서비스 성능, 토폴로지, 동적 시각화, 에이전트 건강, 클러스터 건강, 계측 점수 등이 포함됩니다.
Other AWS news
다음은 추가 AWS 소식입니다.
