Amazon Bedrock AgentCore와 함께 실용적인 AI 에이전트 구축
Source: Dev.to
나는 토요일을 AWS User Group Chennai 모임에서 보냈고, 한 세션이 특히 눈길을 끌었다: Amazon Bedrock AgentCore에 대한 자세한 살펴보기와 그것이 실제 AI 에이전트를 만드는 데 어떻게 도움이 되는지.
연사인 Muthukumar Oman(Intellect Design Arena의 부사장 겸 엔지니어링 책임자이자 AWS Community Builder)는 AI 모델을 기본 데모에서 완전한 AI 에이전트로 전환하는 방법을 명확하고 체계적으로 설명했다.
그날 다른 좋은 강연들도 있었지만, 이 강연이 눈에 띈 이유는 우리 모두가 고민해 온 질문을 다루었기 때문이다:
단순 챗봇을 넘어 실제로 우리 시스템과 연동되는 신뢰할 수 있는 AI 에이전트를 구축하려면 어떻게 해야 할까요?
Source: …
Amazon Bedrock AgentCore란?
간단히 말해 AgentCore 이해하기
- AgentCore는 AWS에서 AI 에이전트를 위한 주요 제어 센터 역할을 합니다.
- 다음을 도와줍니다:
- 에이전트를 안전하게 대규모로 배포하고 운영합니다.
- 에이전트가 도구와 API를 호출할 때 신뢰성과 안정성을 보장합니다.
- 코드 인터프리터와 브라우저와 같은 내장 도구를 사용할 수 있습니다.
- 프레임워크와 모델에 구애받지 않으며, 원하는 스택을 자유롭게 가져올 수 있습니다.
- 에이전트를 구조화된 방식으로 테스트하고 모니터링합니다.
비유: 일반적인 LLM이 똑똑한 인턴이라면, AgentCore는 그 인턴이 다양한 앱을 사용하도록 돕고, 작업을 추적하며, 모든 것이 안전하게 유지되도록 보장하는 IT, 보안, 지원 팀과 같습니다.
AI 스택에서 AgentCore의 위치
다음 슬라이드에서는 AWS의 전체 AI 구조를 보여줍니다:
Applications
└─ AI & Agent Development Tools & Services
└─ Amazon Bedrock (models, features, AgentCore)
└─ Underlying Infrastructure
├─ Amazon SageMaker
└─ AI compute resources (Trainium, Inferentia, GPUs)
다시 말해:
| 레이어 | 제공 내용 |
|---|---|
| Infrastructure | 원시 컴퓨팅 및 ML 도구 |
| Bedrock | 모델 및 에이전트 빌딩 블록 |
| AgentCore | 런타임, 메모리, 게이트웨이, 관측성, 그리고 에이전트용 아이덴티티 |
| Applications | 사용자가 실제로 상호작용하는 것 (지원 봇, 내부 코파일럿 등) |
Source: …
Core Building Blocks of AgentCore
AgentCore Runtime – The Engine Behind the Agent
AgentCore Runtime 슬라이드의 핵심 포인트:
- 프레임워크에 구애받지 않음 – 특정 에이전트 프레임워크에 얽매이지 않습니다.
- 모델 유연성 – 필요에 따라 다양한 모델을 플러그인할 수 있습니다.
- 다중 프로토콜 지원, 실행 시간 연장, 향상된 페이로드 처리.
- 세션 격리, 내장 인증, 에이전트 전용 가시성을 제공합니다.
- 통합된 에이전트 전용 기능 세트를 제공합니다.
배포 흐름 (단순화)
- 에이전트 또는 도구 코드(예: Python 프레임워크)를 컨테이너로 패키징합니다.
- 컨테이너 이미지를 Amazon ECR에 푸시합니다.
- 이를 AgentCore 엔드포인트를 통해 노출합니다.
- 엔드포인트가 컨테이너를 모델 및 Bedrock AgentCore 런타임에 연결합니다.
비유: 마이크로서비스를 배포하는 것과 같습니다—코드를 패키징하고, 푸시하고, AgentCore가 필요로 하는 모델과 도구에 연결해 줍니다.
Memory – Short‑Term vs. Long‑Term
AgentCore는 메모리를 두 개의 별도 레이어로 구분합니다:
| 메모리 유형 | 목적 | 일반적인 내용 |
|---|---|---|
| 단기 메모리 | 세션 내 즉각적인 컨텍스트 | 채팅 메시지, 세션 상세 정보, 세션 중 지식 축적 |
| 장기 메모리 | 세션 간 지속되는 지식 | 사용자 선호도, 의미론적 사실, 요약, 벡터 임베딩 |
작동 방식
- 단기 메모리는 원시 데이터 형태로 저장됩니다.
- 장기 메모리는 벡터 스토리지를 사용합니다.
- 메모리 추출 모듈이 이벤트/전략에 기반해 관련 정보를 검색하고, 이를 결합해 검색 가능한 임베디드 형태로 만듭니다.
비유:
- 단기 메모리 = 현재 진행 중인 대화.
- 장기 메모리 = 에이전트가 시간에 걸쳐 당신에 대해 학습한 모든 것.
예시 사용 사례 (은행/이커머스 어시스턴트)
- 사용자가 선호하는 언어를 기억합니다.
- 사용자가 주로 구매하는 제품 종류를 기억합니다.
- “이 사용자는 전자 청구서를 선호한다”와 같은 중요한 사실을 저장합니다.
내장 도구: 코드 인터프리터와 브라우저
코드 인터프리터 – 에이전트가 안전하게 코드를 실행하도록
아키텍처 흐름
- 사용자가 에이전트에 질의를 보냅니다.
- 에이전트가 LLM을 호출합니다.
- LLM이 코드 인터프리터 도구를 선택하고 세션을 생성합니다.
- 코드는 자체 파일 시스템과 셸을 가진 샌드박스 환경에서 실행됩니다.
- 텔레메트리가 관측 시스템으로 흐릅니다.
- 결과가 사용자에게 반환됩니다.
기능
- 안전한 샌드박스 실행.
- 다중 언어 지원.
- 확장 가능한 데이터 처리.
- 향상된 문제 해결 능력.
- 구조화된 데이터 형식.
- 복잡한 워크플로우 처리 능력.
비유: 에이전트에게 일시적이고 안전한 노트북을 제공해 스크립트를 실행하고, CSV 파일을 다루거나 데이터를 처리하게 하는 것—모든 과정을 면밀히 감시하는 상황과 같습니다.
브라우저 도구 – 에이전트가 웹이나 앱을 탐색하도록
흐름도
- 사용자가 질의를 보냅니다 (예: “아마존에서 신발 구매”).
- 에이전트가 LLM을 호출합니다.
- LLM이 브라우저 도구를 선택합니다.
- 도구가
click left at (x, y)와 같은 명령을 생성합니다. - 라이브러리(예: 브라우저 자동화 프레임워크)가 이를 실제 동작으로 변환합니다.
- 브라우저가 동작을 실행하고 스크린샷/결과를 에이전트에 반환합니다.
기능
- 리소스 및 세션 관리.
- AWS DCV 웹 클라이언트를 이용한 실시간 뷰 렌더링.
- 관측 가능성 및 세션 재생.
간단히 말하면: 에이전트가 UI를 단순히 설명하는 것이 아니라 실제로 상호작용할 수 있습니다. 이는 API가 없는 레거시 시스템에 특히 중요합니다.
게이트웨이, 아이덴티티, 그리고 옵저버빌리티 – 프로덕션 준비 사항
AgentCore Gateway – 모든 도구를 위한 하나의 진입점
AgentCore Gateway는 에이전트가 어떤 도구나 API와도 연결할 수 있는 통합 진입점을 제공합니다. 주요 기능은 다음과 같습니다:
- Routing: 요청을 적절한 도구(예: 코드 인터프리터, 브라우저, 커스텀 API)로 라우팅합니다.
- Authentication & identity management: 각 에이전트가 올바른 권한으로 동작하도록 합니다.
- Observability(metrics, logs, traces): 성능을 모니터링하고 문제를 해결합니다.
이 설계는 에이전트를 대규모로 배포하면서도 보안이 유지되고, 감사 가능하며, 관리가 용이하도록 보장합니다.
AgentCore Identity – 이 에이전트는 실제로 누구인가?
아이덴티티는 AgentCore Identity를 통해 관리되며, 다음에 중점을 둡니다:
- 중앙 집중식 에이전트 아이덴티티 관리
- 자격 증명 저장
- OAuth 2.0
- 아이덴티티 및 접근 제어
- SDK 통합
- 요청 검증 보안
IAM과 유사하지만 에이전트에 특화된 형태입니다: 에이전트는 적절한 인증, 제한된 접근 권한 자격 증명, 검증된 요청을 사용해 API를 호출합니다.
AgentCore Observability – 에이전트가 무엇을 하는지 보기
옵저버빌리티 기능은 다음을 포함합니다:
- OTEL 호환 계측
- 런타임, 메모리, 게이트웨이 및 도구 메트릭
- 세션, 트레이스 및 스팬
요약하면, 에이전트가 요청을 어떻게 처리했는지, 어떤 도구를 사용했는지, 각 단계가 얼마나 걸렸는지, 어디에서 문제가 발생했는지를 추적할 수 있습니다.
Strands Agents vs. Bedrock Agents vs. AgentCore
| 요소 | Strands 에이전트 | Bedrock 에이전트 | AgentCore |
|---|---|---|---|
| 실험 속도 | 빠른 실험에 적합 | 빠른 배포에 편리 | 엔터프라이즈 수준의 고도로 맞춤화된 에이전트에 이상적 |
| 제어 및 맞춤화 | 제한적 | 보통 | 가장 높음 (AWS 관리 요소를 활용하면서) |
실제 애플리케이션에서 이 모든 것이 어떻게 결합되는가
“장난감 챗봇”에서 프로덕션 에이전트로
연사는 앱이 AgentCore Runtime과 통신하고, 그 런타임이 다음과 상호 작용하는 다이어그램을 보여주었습니다:
- 모델
- 메모리
- 게이트웨이
- 아이덴티티
- 관측성
예시 사용 사례
- 고객 지원 에이전트 – 과거 대화와 사용자 선호도를 추적합니다.
- 재무 어시스턴트 – 브라우저 도구를 사용해 내부 시스템에 접근하고 데이터를 안전하게 가져옵니다.
- 개발자 어시스턴트 – 코드 인터프리터를 통해 코드를 실행하고 모든 작업을 검토를 위해 기록합니다.
빌더에게 중요한 이유
If you’re creating a startup product or working in a large company, you’ll face similar challenges:
- “세션과 메모리를 신뢰성 있게 처리하려면 어떻게 해야 하나요?”
- “보안 문제를 일으키지 않으면서 에이전트를 다양한 도구에 연결하려면 어떻게 해야 하나요?”
- “무언가 실패했을 때 원인을 어떻게 파악할 수 있나요?”
AgentCore는 다음과 같이 이러한 문제를 해결합니다:
- 구조화된 런타임 및 메모리
- 보안 도구 접근을 위한 게이트웨이 + 아이덴티티
- 트레이스와 메트릭을 위한 깊은 가시성
결국, AI 에이전트를 임시적인 사이드 프로젝트에서 운영, 보안, 컴플라이언스 팀이 진정으로 신뢰하고 활용할 수 있는 솔루션으로 전환합니다.
결론
Amazon Bedrock AgentCore는 강력한 AI 에이전트를 구축하는 것이 단순히 또 다른 챗봇을 만드는 것이 아니라는 것을 보여줍니다. 핵심은 메모리, 도구, 보안, 가시성 등 기본을 제대로 잡는 것입니다. 런타임, 게이트웨이, 아이덴티티, 그리고 내장 도구가 함께 작동할 때, 빠른 주말 해킹에서 신뢰할 수 있는 프로덕션‑그레이드 AI 경험으로 프로젝트를 전환시킬 수 있는 견고한 기반을 형성합니다.
저자 소개
AWS Community Builder로서, 저는 제 경험과 이벤트를 통해 배운 것을 공유하는 것을 즐기며, 다른 사람들이 길을 찾는 데 도움을 주고 싶습니다. 도움이 되었다면 혹은 질문이 있으면 언제든지 연락 주세요!
🚀 LinkedIn에서 저와 연결하기
참고 문헌
- Event: AWS User Group Chennai Meetup
- Topic: Building Practical AI Agents with Amazon Bedrock AgentCore
- Date: 2025년 9월 27일
또한 게시됨
- AWS Builder Center
- Hashnode