AWS 2025: Agentic AI, Custom Chips, 그리고 Multicloud Bridges

발행: (2026년 1월 3일 오전 08:50 GMT+9)
18 분 소요
원문: Dev.to

Source: Dev.to

2025 AWS 연간 리뷰

나는 1년 내내 AWS 릴리스를 추적해 왔으며, 솔직히 2025년은 느낌이 달랐다. 단순히 “또 다른 관리형 서비스”가 아니라 근본적으로 “우리는 소프트웨어를 구축하는 방식을 바꾸고 있다.” re:Invent와 연중 지속적으로 쏟아진 업데이트 사이에 살펴볼 것이 많다.

이 글은 주요 카테고리별 핵심 발표를 정리하려는 시도다. 모든 내용을 다 다루지는 않을 것이다—AWS는 수백 개의 업데이트를 발표했지만, 대부분의 개발자와 아키텍트에게 실제로 중요한 것들만 골라냈다.

2025년의 세 가지 테마

ThemeWhat it means
Agentic AI everywhereAWS는 사용자를 대신해 행동하는 자율 에이전트에 전면 투자했다.
Custom silicon at scaleGraviton 5, Trainium 3 및 이를 구동할 인프라스트럭처.
Multicloud is real nowAWS‑Google 파트너십은 내 빙고 카드에 없었다.

공통된 흐름: AWS는 단순히 인프라가 아니라 AI 에이전트가 존재하고 작동하는 플랫폼으로 자리매김하고 있다. 이 비전에 동의하든 아니든, 그들이 나아가는 방향은 명확하다.

2025년 글로벌 발자국

신규 출시 지역

  • 멕시코 (중부) – AWS의 멕시코 최초 리전, 2025년 1월에 출시.
    • 약속: 15년 동안 50억 달러 투자.
  • 태국 (아시아 태평양)2025년 1월에 3개의 가용 영역(AZ)과 함께 출시.

2025년 추가 출시

리전출시 날짜가용 영역투자
대만 (아시아 태평양 – 타이베이)2025년 6월350억 달러
뉴질랜드 (아시아 태평양 – ap‑southeast‑6)2025년 9월 2일375억 뉴질랜드 달러

곧 출시 예정

  • 사우디아라비아 – 2026년 예상.
  • AWS 유럽 주권 클라우드2025년 12월에 독일 브란덴부르크에서 78억 유로 투자로 출시.

참고: 2025년 12월 현재, AWS는 38개 지리적 리전에 걸쳐 120개의 가용 영역을 운영하고 있습니다. AWS 계정 자체에 비용을 지불하는 것이 아니라 실행하는 리소스에 대해서만 비용을 지불한다는 점을 기억하세요. 지연 시간 및 데이터 거주 요건을 고려할 때 지역 가용성은 여전히 중요합니다.

Source:

Compute – The Big Wins

Graviton 5 Processors

  • EC2 M9g 인스턴스: 이전 세대 대비 25 % 높은 성능을 제공하면서 에너지 소비는 감소했습니다.
  • 호환 워크로드에 아직 Graviton을 사용하고 있지 않다면, 가격‑성능 격차가 더욱 커졌습니다.

Trainium 3 UltraServers

  • 서버당 최대 144개의 Trainium 3 칩을 탑재할 수 있습니다.
  • 최대 362 MXFP8 PFLOPs의 연산 성능을 제공합니다.
  • 이전 세대 대비 40 % 더 에너지 효율적이라고 주장됩니다.

Lambda Enhancements

FeatureWhat it does
Durable Functions수초에서 1년까지 지속되는 다단계 워크플로를 유휴 컴퓨팅 비용 없이 조정합니다. 인간 승인 루프나 주기적 폴링에 이상적입니다.
Managed InstancesEC2 하드웨어에서 Lambda‑스타일 함수를 실행합니다—서버리스의 간편함과 EC2의 제어 권한을 동시에 제공합니다.

New EC2 Instance Types

  • Memory‑optimised 인스턴스는 5세대 AMD EPYC 프로세서로 구동됩니다.
  • 최대 5 GHz 클럭 속도와 3 TiB 메모리를 제공하며, 무거운 데이터베이스, EDA 도구 및 유사 워크로드에 최적화되었습니다.

Source:

AI 서비스 및 모델

Amazon Nova 2 패밀리

모델초점상태
Nova 2 Lite일상적인 워크로드를 위한 빠르고 비용 효율적인 추론GA
Nova 2 Pro복잡하고 다단계 작업을 위한 가장 강력한 모델Preview
Nova 2 Sonic7개 언어를 지원하는 음성‑대‑음성GA
Nova 2 Omni텍스트, 이미지, 비디오, 음성을 처리하고 텍스트와 이미지를 동시에 생성하는 최초의 추론 모델GA

모든 Nova 2 모델은 조정 가능한 강도 레벨을 지원합니다(필요할 때 추론 깊이를 높이고, 간단한 질의에는 가볍게 유지).

Amazon Nova Forge

  • “자신만의 프론티어 모델을 구축하세요.”
  • Nova 체크포인트에서 시작해 자체 데이터와 Nova 훈련 데이터를 결합해 도메인 지식을 포함한 맞춤형 모델을 얻을 수 있습니다.
  • Reddit이 Forge를 사용해 자체 모델을 만든 것으로 알려졌습니다.

Nova Act

  • 맞춤형 Nova 2 Lite 모델로 구동되는 브라우저 자동화 에이전트.
  • 브라우저 기반 작업에 대해 ≈ 90 % 신뢰도를 제공한다고 주장합니다—웹 스크래퍼 및 자동화 도구에 유용합니다.

Amazon Bedrock 업데이트

  • > 100개의 기본 모델, 12월에 추가된 18개의 새로운 오픈‑웨이트 모델 포함.
  • 강화 학습 미세조정: 대규모 라벨링 데이터 없이도 ≈ 66 % 정확도 향상을 제공하는 피드백 기반 훈련.

Amazon Bedrock AgentCore

마일스톤날짜
Preview2025년 7월
GA2025년 10월
기능 풍부 릴리스2025년 12월
  • SDK 다운로드: 첫 5개월 동안 > 2 M 회.

핵심 구성 요소

  • Runtime – 세션 격리, 음성 에이전트를 위한 양방향 스트리밍.
  • Memory – 경험을 통해 학습하는 에이전트를 위한 에피소드 메모리 포함.
  • Gateway – 기존 API를 MCP‑호환 도구로 변환.
  • Identity – OAuth 통합 및 보안 토큰 저장.
  • Observability – 에이전트 모니터링을 위한 CloudWatch 대시보드.
  • PolicyCedar 정책을 이용한 실시간 도구 호출 차단.
  • Evaluations – 자동 테스트를 위한 13개의 내장 평가 도구.

Bottom Line

2025년은 AWS에 변혁의 해였습니다:

  • AI 에이전트가 이제 플랫폼에서 일류 구성원으로 자리 잡았습니다.
  • 맞춤형 실리콘(Graviton 5, Trainium 3)이 성능과 효율성을 새로운 수준으로 끌어올렸습니다.
  • 멀티클라우드 기능이 핵심 제공 서비스에 내재화되고 있습니다.

개발자나 아키텍트라면 가장 실용적인 시사점은 Lambda Durable Functions, Managed Instances, 그리고 Nova 2 모델군입니다—이들은 일상 업무에 가장 큰 영향을 미칠 가능성이 높습니다. AgentCore가 성숙해지는 모습을 주시하세요; 이는 AWS에서 프로덕션 급 AI 에이전트를 구축하기 위한 사실상의 프레임워크가 될 수 있습니다.

Amazon Q 개발자

  • 언어: C#, C++, 그리고 맞춤화를 위한 추가 11개 언어.
  • GitLab Duo 통합: GA.
  • GitHub 통합: 프리뷰 – AWS 계정 필요 없음.
  • CLI에서 MCP 지원.
  • 대화 기록: 세션 간에 지속됩니다.
  • Pro Tier: EU 데이터 거주지를 위해 프랑크푸르트에서 이용 가능.

Kiro IDE

AWS는 Kiro를 출시했으며, 이는 Amazon이 내부적으로 사용하고 있는 에이전트형 AI IDE입니다. VS Code를 기반으로 하며, 마크다운으로 요구사항을 작성하면 에이전트가 모든 것을 자동으로 구성하는 사양 기반 개발을 특징으로 합니다.

  • 한 내부 프로젝트는 18 개월 동안 30명의 개발자가 작업하던 것이 76 일 동안 6명의 개발자로 축소되었다고 보고되었습니다.
  • 초기 신호는 유망하지만, 아직 평가 중입니다.

Database Savings Plans

A single, flexible commitment that applies across RDS, Aurora, DynamoDB, ElastiCache, Neptune, and DocumentDB. No more juggling separate Reserved Instance portfolios per engine.

  • Up to 35 % cost reduction with a one‑year commitment.

Aurora DSQL

  • 클러스터 생성이 이제 분 대신 초에 걸립니다 – 빠른 프로토타이핑 및 테스트에 적합합니다.

RDS Storage Expansion

  • SQL ServerOracle은 이제 256 TiB까지 스토리지를 지원합니다 (이전 64 TiB에서 증가).
  • 4× improvement in IOPS and I/O bandwidth.
  • 대규모 온‑프레미스 데이터베이스에서 마이그레이션이 쉬워집니다.

OpenSearch 향상

  • GPU‑accelerated vector indexing – 비용의 1/4에 10배 빠름.
  • Auto‑optimised vector indexes 자동으로 다양한 KNN 알고리즘을 평가하여 리콜 품질과 쿼리 성능의 균형을 맞춥니다.

AWS Interconnect

Google Cloud와의 파트너십으로 두 플랫폼 간에 관리형 고속 전용 연결을 제공합니다.

  • 필요에 따라 전용 대역폭을 on demand 제공하고 몇 분 안에 연결을 설정합니다.
  • quad‑redundancyMACsec encryption을 포함합니다.
  • Microsoft Azure 지원은 2026년 예정입니다.

“멀티클라우드는 대부분 마케팅이지만, 실제로 유용합니다.” – my take

Route 53 Global Resolver (Preview)

하이브리드 DNS 관리를 단순화하는 Anycast DNS 해석을 보안합니다 – 각 VPC에서 리졸버를 관리하는 대신 하나의 서비스만 사용합니다.

Amazon S3 Vectors (GA)

  • 벡터 임베딩을 저장하고 쿼리하는 네이티브 지원.
  • 인덱스당 20억 개의 벡터까지 확장 가능 (미리보기 용량의 40배).
  • 버킷당 20조 개의 벡터까지 지원.
  • 특화된 벡터 데이터베이스에 비해 비용을 최대 90 % 절감.

RAG, 의미 검색, 에이전트 워크로드에 최적이며 별도의 벡터 DB(예: Pinecone)가 필요하지 않음.

S3 Tables

  • Built‑in Intelligent‑Tiering support and replication for Apache Iceberg‑native tables.
  • Simplifies analytics on S3 without complex ETL pipelines.

FSx for NetApp ONTAP

  • 이제 S3와 통합되어 파일‑시스템 데이터를 S3 API를 통해 액세스할 수 있습니다.
  • 데이터를 복사하지 않고 기존 스토리지를 분석 및 ML 서비스에 연결하는 데 유용합니다.

Amazon EKS Capabilities

Fully managed platform capabilities for workload orchestration and cloud resource management.

  • Aims to eliminate infrastructure maintenance while maintaining enterprise‑grade reliability.

If you’re running vanilla Kubernetes and spending too much time on cluster management, this might help.

Amazon EKS 기능

완전 관리형 플랫폼 기능으로 워크로드 오케스트레이션 및 클라우드 리소스 관리를 제공합니다.

  • 인프라 유지 관리를 없애고 엔터프라이즈 수준의 신뢰성을 유지하는 것을 목표로 합니다.

바닐라 Kubernetes를 사용하고 클러스터 관리에 너무 많은 시간을 소비하고 있다면 도움이 될 수 있습니다.

ECS Express Mode

ECS용 간소화된 컨테이너 배포.
아직 시도해보지는 않았지만, 목록에 올려두었습니다.

제품 수명 주기 페이지 (2025)

AWS는 모든 서비스 가용성 정보를 한 곳에 모은 페이지를 도입했습니다 – 드디어.

알아두어야 할 주요 폐기 예정 항목

서비스폐기 세부 정보
AWS Cloud9새 고객을 더 이상 받지 않습니다. AWS는 원격 확장이 포함된 VS Code를 권장합니다.
AWS WAF Classic2025년 3월 31일 이후 새로운 WebACL을 만들 수 없습니다. 2025년 9월 30일에 완전 폐기됩니다.
AWS Proton지원이 2026년 10월 7일에 종료됩니다. 2025년 10월 7일 이후 신규 고객은 차단됩니다.
AWS SDK for JavaScript v2지원 종료일은 2025년 9월 8일입니다. v3로 마이그레이션하십시오.
Amazon Linux 2지원 종료가 2026년 6월 30일까지 연장되었습니다. 그 이전에 Amazon Linux 2023으로 마이그레이션하십시오.

이 중 하나라도 사용 중이라면, 지금이 마이그레이션을 계획할 시점입니다.

CodeCommit 역전

희귀한 조치로, AWS는 고객 피드백을 청취한 뒤 2025년 11월에 CodeCommit 폐지를 되돌렸습니다.

  • CodeCommit은 전체 일반 가용성(General Availability) 으로 복귀했으며, 새로운 기능이 계획 중입니다:
    • Git Large File Storage (2026년 초)
    • 지역 확장: 2026년 3분기부터 추가 리전으로 확대

이번 역전은 CodeCommit의 깊은 IAM 통합, VPC 엔드포인트 지원, 그리고 CodePipeline과의 원활한 연결성을 인정한 것으로, 특히 규제 산업에 큰 가치를 제공합니다. AWS는 마이그레이션 계획을 시작한 고객들에게 불편을 끼친 점에 대해 명시적으로 사과했습니다.

2025 – 패턴 및 시사점

  1. AI 에이전트가 새로운 컴퓨트 원시 요소가 된다

    • 서버 → 컨테이너 → 함수 → 에이전트 순으로 진화.
    • AWS는 자율 시스템이 우리를 대신해 행동할 것이라는 데 크게 베팅하고 있다.
  2. 맞춤형 실리콘이 중요해진다

    • GravitonTrainium에 대한 지속적인 투자를 통해 특정 워크로드에 대해 일반 하드웨어보다 가격과 성능을 모두 앞서는 것을 목표로 한다.
  3. 멀티클라우드가 실용화되고 있다

    • Google과의 파트너십은 AWS가 정당한 멀티클라우드 요구를 인식하고 있음을 보여준다. 2026년에 더 많은 상호운용성 발표가 기대된다.
  4. 개발자 경험이 우선순위다

    • Q Developer, Kiro, 그리고 다양한 IDE 통합은 인프라뿐 아니라 AI‑지원 개발 도구에 대한 AWS의 의지를 보여준다.

변화의 속도에 흥분하든 피곤하든, 2025년은 AWS에게 확실히 중요한 해였다. 그리고 로드맵 발표가 시사하는 바에 따르면, 2026년은 … (원문이 여기서 끊깁니다).


어떤 발표가 가장 중요했나요? 먼저 시도해 볼 계획이 무엇인지 듣고 싶습니다.

Back to Blog

관련 글

더 보기 »

RGB LED 사이드퀘스트 💡

markdown !Jennifer Davis https://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%...

Mendex: 내가 만드는 이유

소개 안녕하세요 여러분. 오늘은 제가 누구인지, 무엇을 만들고 있는지, 그리고 그 이유를 공유하고 싶습니다. 초기 경력과 번아웃 저는 개발자로서 17년 동안 경력을 시작했습니다.