2025년 AWS에서 AI 에이전트 구축: Bedrock, AgentCore 및 그 이상에 대한 실무자 가이드

발행: (2026년 1월 3일 오전 08:51 GMT+9)
17 min read
원문: Dev.to

Source: Dev.to

번역을 진행하려면 번역이 필요한 원본 텍스트를 제공해 주세요. 텍스트를 주시면 요청하신 대로 마크다운 형식과 코드 블록, URL은 그대로 유지하면서 한국어로 번역해 드리겠습니다.

1. 전환: “AI 사용”에서 “에이전트 오케스트레이션”으로

2024년부터 2025년까지

연도일반적인 워크플로
2024call an LLM → get a response → display it to the user (often with some RAG for context)
2025build autonomous agents that plan, execute, learn, and operate independently

이것이 아키텍처에 의미하는 바

  • 2024 스타일

    user request → LLM → response
  • 2025 스타일

    user goal → agent network → coordinated actions → outcome

왜 중요한가

  • AgentCore, Nova Act, 그리고 Q Developer는 이제 이 전환을 구현하는 에이전시 기능을 제공한다.
  • 실제 테스트는 이러한 모델들이 대규모 프로덕션 워크로드에서 어떻게 성능을 발휘하는가가 될 것이며—이는 제가 아직 평가 중인 영역이다.

2. AWS Gen AI 환경

아래는 AWS 생성‑AI 생태계를 간략히 정리한 내용입니다.

기반 계층

  • Amazon Bedrock – 다중 모델 접근 및 오케스트레이션.
  • Amazon SageMaker AI – 맞춤형 학습 및 배포.

에이전트 인프라

  • Amazon Bedrock AgentCore – 에이전트를 구축·배포·운영하기 위한 풀스택.
  • Nova Act – 특화된 브라우저 자동화 에이전트.

모델

  • Amazon Nova 2 family – AWS 자체 최첨단 모델.
  • Third‑party models – Claude, Llama, Mistral 등 100 개 이상의 모델을 Bedrock을 통해 제공.

개발 도구

  • Amazon Q Developer – IDE에서 직접 AI‑지원 코딩.
  • Kiro – 사양 기반 개발을 지원하는 에이전시 IDE.
  • PartyRock – 코드 없이 사용할 수 있는 Bedrock 플레이그라운드.

지원 서비스

  • S3 Vectors – 검색‑증강 생성(RAG)을 위한 네이티브 벡터 저장소.
  • CloudWatch – 에이전트 가시성 및 모니터링.

다음 섹션에서 각 구성 요소를 자세히 살펴보겠습니다.

Source:

3. Amazon Bedrock: 다중‑모델 기반

Bedrock은 AWS에서 기반 모델에 접근할 수 있는 중앙 허브입니다. 잠시 떠나 있었다면, 2025년에 변경된 사항은 다음과 같습니다:

모델 확장

Bedrock은 이제 거의 100개의 서버리스 기반 모델을 제공하며, 100개 이상의 추가 모델이 Bedrock Marketplace를 통해 이용 가능합니다. 2025년 12월 확장으로 18개의 오픈‑웨이트 모델이 추가되었으며, 여기에는 다음이 포함됩니다:

ProviderModel(s)
GoogleGemma 3
MiniMax AIMiniMax M2
MistralMistral Large 3, Ministral series
Moonshot AIKimi K2
NVIDIANemotron Nano 2
AnthropicClaude 4.5 (Nov 2025) – 현재까지 가장 강력한 Claude

강화 파인‑튜닝

전통적인 라벨링된 데이터셋을 이용한 파인‑튜닝 대신, 피드백 신호를 제공하고 모델이 강화 학습을 통해 스스로 학습하도록 합니다. AWS는 깊은 ML 전문 지식 없이도 기본 모델 대비 66 % 정확도 향상을 주장합니다.

실용적인 장점 – 방대한 학습 데이터셋을 만들 필요 없이 기존 평가 기준을 사용해 모델 동작을 맞춤화할 수 있습니다.

교차‑리전 추론

Bedrock은 이제 고가용성 시나리오를 위해 리전 간 지능형 라우팅을 지원합니다. 기본 리전이 부하가 걸리면 요청이 자동으로 보조 리전으로 라우팅됩니다. 이는 모델‑접근 설정에서 구성할 수 있습니다.

4. Amazon Bedrock AgentCore: 깊이 파헤치기

AgentCore는 제가 올해 대부분의 시간을 투자한 부분입니다. preview (7월)GA (10월)대폭 확장 (12월) 순으로 진행되었습니다. 아래는 구성 요소별 개요와 각 요소를 언제 사용해야 하는지에 대한 가이드입니다.

4.1 AgentCore Runtime

Runtime은 에이전트의 실행 환경을 제공합니다.

Session Isolation

  • 각 에이전트 세션은 완전 격리된 상태에서 저지연으로 실행됩니다.
  • 민감한 데이터를 다루거나 자원 할당 보장이 필요한 에이전트에 이상적입니다.
# Sessions are isolated automatically.
# Each invocation gets its own execution context.
from bedrock_agentcore import AgentRuntime

runtime = AgentRuntime()
session = runtime.create_session(
    agent_id="my-agent",
    session_config={
        "isolation_level": "full",
        "timeout_seconds": 28_800  # 8 hours max
    }
)

Long‑Running Workloads

  • 세션은 최대 8시간까지 실행될 수 있습니다.
  • 외부 이벤트를 기다리거나 시스템을 폴링하고, 수시간에 걸친 다단계 워크플로를 조정해야 하는 에이전트에 유용합니다.

Bidirectional Streaming (2025년 12월 추가)

  • 에이전트가 동시에 듣고 응답할 수 있는 자연스러운 음성 인터랙션을 가능하게 합니다.
  • 대화 중간에 중단을 지원하여 음성‑우선 경험에 필수적입니다.

Tip: 음성 에이전트를 구축할 때 이 기능을 사용하세요; 기존 요청‑응답 모델에 비해 큰 개선점입니다.

4.2 AgentCore Memory

Memory는 에이전트가 상호작용 간에 컨텍스트를 유지하도록 합니다.

Episodic Memory

  • 12월 업데이트에서 도입되었습니다.
  • 에이전트가 경험을 학습하고 시간이 지남에 따라 지식을 축적하여 각 세션을 독립적으로 취급하는 방식을 넘어섭니다.
from bedrock_agentcore import AgentMemory

memory = AgentMemory(
    memory_type="episodic",
    retention_policy={
        "max_episodes": 1_000,
        "decay_factor": 0.95
    }
)

# Agent learns from each interaction
memory.record_episode(
    context=session_context,
    action_taken=agent_action,
    outcome=result,
    feedback=user_feedback
)
항목내용
Status초기 단계; 더 많은 프로덕션 테스트가 필요합니다.
Benefit에이전트가 시간이 지남에 따라 개선되며 유용한 에피소드를 축적합니다.
Risk피드백이 관리되지 않거나 보존 정책이 잘못 설정될 경우 드리프트가 발생할 수 있습니다.
Best‑Fit Use Cases개인 비서, 추천 엔진, 혹은 사용자 선호도를 학습하면 이득이 되는 모든 워크플로.

핵심 요약: 런타임 격리장기 실행 세션을 활용해 보안이 필요하고 무거운 워크로드를 처리하고, 양방향 스트리밍을 사용해 음성‑우선 에이전트를 구축하세요. 상호작용 간 연속성이 필요할 때는 에피소드 메모리를 실험해 보되, 드리프트를 모니터링하고 합리적인 보존 정책을 설정하세요.

4.3 AgentCore Gateway

Gateway는 도구 통합을 담당합니다. 가장 큰 장점은 기존 API를 최소한의 코드로 Model Context Protocol (MCP) 호환 도구로 변환할 수 있다는 점입니다.

MCP Integration

MCP는 LLM이 외부 도구와 상호작용하는 표준으로 자리 잡고 있습니다. 기존 REST API가 있다면, Gateway를 통해 이를 MCP 도구로 노출하여 모든 에이전트가 발견하고 사용할 수 있습니다.

from bedrock_agentcore import Gateway

gateway = Gateway()

# Convert an existing API to an MCP‑compatible tool
gateway.register_api(
    name="customer_lookup",
    endpoint="https://api.mycompany.com/customers",
    schema=openapi_spec,
    authentication={
        "type": "oauth2",
        "credentials_vault": "my-vault"
    }
)

Tool Discovery

에이전트는 Gateway에 질의하여 사용 가능한 도구를 동적으로 발견할 수 있습니다. 이는 하드코딩된 도구 목록을 유지하기 어려운 멀티‑에이전트 시스템에 특히 유용합니다.

‑코딩 도구 가용성은 바람직하지 않습니다.

4.4 AgentCore Identity

Identity 컴포넌트는 에이전트 행동에 대한 인증 및 인가를 처리합니다.

OAuth Integration

  • 에이전트는 사용자를 대신하여 외부 서비스에 인증할 수 있습니다.
  • Identity 서비스는 리프레시 토큰을 안전하게 관리하며, 자격 증명은 에이전트가 직접 다루지 않습니다.

Secure Vault Storage

  • 자격 증명은 암호화와 엄격한 접근 제어가 적용된 볼트에 저장됩니다.
  • 12월 업데이트에서는 추가 OAuth‑지원 서비스와의 네이티브 통합이 추가되었습니다.
from bedrock_agentcore import Identity

identity = Identity()

# Agent acts on behalf of a user
user_context = identity.establish_user_context(
    user_id="user-123",
    oauth_provider="google",
    scopes=["calendar.read", "calendar.write"]
)

# Agent can now access the user's calendar
calendar_response = agent.invoke_tool(
    "google_calendar",
    action="list_events",
    user_context=user_context
)

4.5 AgentCore Observability

Observability는 CloudWatch에 연결되어 포괄적인 모니터링을 제공합니다.

What You Get

  • End‑to‑end agent execution traces
  • Latency metrics per component
  • Token usage tracking
  • Error rates and patterns
  • Custom dashboards

이 통합은 LangChain, LangGraph, CrewAI와 같은 오픈소스 프레임워크에서도 작동합니다.

4.6 Policy and Evaluations

2025년 12월에 추가된 내용으로, 프로덕션 배포를 위한 가드레일입니다.

Policy (Preview)

Policy는 모든 도구 호출을 실시간으로 가로챕니다. 자연어로 경계를 정의하면 이를 Cedar—AWS의 오픈소스 정책 언어—로 자동 변환합니다.

# Natural language policy
"Agent can only process refunds under $500 without human approval"

# Converted to Cedar automatically
permit(
    principal,
    action == Action::"process_refund",
    resource
) when {
    resource.amount < 500
}

10. 지원 서비스

알아두면 좋은 몇 가지 다른 서비스:

Amazon SageMaker AI

  • Serverless MLflow – 인프라 없이 실험을 수행합니다.
  • HyperPod – 체크포인트 없이 학습하고, 장애 발생 시 자동 복구합니다.
  • 학습 클러스터 효율성을 **95 %**까지 끌어올립니다.

PartyRock

코드 없이 사용할 수 있는 Bedrock 플레이그라운드. 매일 무료로 이용 가능하며, 신용카드가 필요 없습니다. 실제 코드를 작성하기 전에 빠르게 프로토타이핑하기에 좋습니다.

S3 Vectors

S3에 기본 제공되는 벡터 저장소:

  • 인덱스당 20억 개의 벡터
  • 버킷당 20조 개의 벡터
  • 100 ms 쿼리 지연 시간
  • 특화된 벡터 데이터베이스 대비 비용을 **90 %**까지 절감

RAG 애플리케이션의 경우, S3 Vectors를 사용하면 별도의 벡터 데이터베이스가 필요 없게 됩니다. 비용 절감 효과만으로도 충분히 검토해볼 가치가 있습니다.

Source:

11. Production Patterns

이 서비스들을 사용하면서 얻은 관찰점

1. Bedrock부터 시작하고 필요할 때 AgentCore 추가

AgentCore를 바로 사용하려고 하지 마세요. 간단한 Bedrock 호출만으로도 대부분의 사용 사례를 처리할 수 있습니다. 다음과 같은 경우에만 AgentCore를 사용하세요:

  • 도구 사용이 포함된 다단계 워크플로우
  • 동시 사용자에 대한 세션 격리
  • 상호작용 간 에피소드 메모리
  • 프로덕션 수준의 가시성

2. 프로덕션 전에 정책 수립

실제 행동을 수행하는 에이전트를 배포한다면 정책 가드레일을 조기에 설정하세요. 경계 조건을 사전에 정의하는 것이 사고 발생 후에 뒤늦게 적용하는 것보다 훨씬 쉽습니다.

3. 토큰 사용량 모니터링

에이전트 기반 워크플로우는 단일 호출보다 더 많은 토큰을 소비합니다. 에이전트의 내부 추론, 도구 호출, 반복적인 정제가 모두 토큰을 차지합니다. 초기 설계 단계부터 비용 모니터링을 구축하세요.

4. MCP가 표준

Model Context Protocol (MCP)은 점점 보편화되고 있습니다. 새로운 API나 통합을 구축할 때는 처음부터 MCP 호환성을 고려하세요—그렇게 하면 도구를 더 다양한 에이전트 프레임워크에서 활용할 수 있습니다.

Source:

12. 이것이 우리를 어디로 이끄는가?

2025년 현재 AWS Gen AI 생태계는 포괄적이며—어쩌면 너무 포괄적이기도 합니다. 비슷한 목표를 달성할 수 있는 여러 겹치는 방법이 존재하고, “올바른” 접근 방식은 여러분의 구체적인 요구 사항에 크게 좌우됩니다.

현재 나의 사고 모델

목표권장 서비스
간단한 상호작용Bedrock (직접 호출)
복잡한 워크플로우AgentCore
브라우저 자동화Nova Act
개발 – 인라인 지원Q Developer
개발 – 사양 기반 프로젝트Kiro
맞춤형 모델Forge (데이터와 전념이 있다면)
검색‑증강 생성 (RAG)S3 Vectors + Bedrock Knowledge Bases

에이전트형 AI가 소프트웨어 개발의 미래일까? 아마도 어느 형태로든 그렇습니다.
이 특정 서비스들이 지속적인 구현이 될까? 확실하지 않습니다. AWS는 이전에 서비스를 폐지한 적도 있고, AI 분야는 빠르게 변합니다.

제가 확신할 수 있는 것은 오늘날 이 도구들로 구축하는 것이 실제로 생산적이라는 점입니다. 개발자 경험은 지난 1년 동안 크게 향상되었습니다. 고객용 에이전트, 내부 자동화, 혹은 AI‑지원 개발 도구를 구축하든, AWS는 필요한 조각들을 제공합니다.

진정한 도전이자 재미는 이들을 어떻게 조합하느냐에 있습니다.


여러분은 이 서비스들을 가지고 무엇을 만들고 있나요? 여러분의 사용 사례와 발견한 패턴을 듣고 싶습니다.

Back to Blog

관련 글

더 보기 »

AI 코딩 서밋 2026

!AI Coding Summit 2026 표지 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads....