Agentic AI 구축: Amazon Nova Act와 Strands Agents 실전 적용

발행: (2025년 12월 7일 오후 02:39 GMT+9)
9 min read
원문: Dev.to

Source: Dev.to

Introduction

세션 소개: 현재 AI 환경에서 핵심 주제로 떠오르고 있는 에이전트형 AI의 등장. 기본적인 이해를 넘어 실제 적용 및 혁신을 모색하는 미래 지향적인 개발자를 위한 내용.

  • 생성 AI의 진화를 개관하며, 낮은 에이전시(규칙 기반, 높은 인간 감독)에서 높은 에이전시(독립 운영, 전략적 의사결정)로의 진행을 강조.
  • 현재 에이전트형 AI 개발 단계에 대한 인식을 제시하고, 더 높은 에이전시를 위해서는 첨단 기술, 거버넌스, 신뢰, 조직 준비가 필요함을 강조.

Prediction by Sequoia Capital

Sequoia Capital의 2025년 AI 키노트 연설에서는 AI 시스템이 도구적 속성을 넘어 자율적으로 운영되는 지능형 에이전트로 진화할 미래를 예측. 이러한 에이전트는 추론, 계획, 협업, 높은 자율 운영 능력을 갖출 것이라고 제시.

Vision for the 2030s Economy

Sequoia Capital은 2030년대, 특히 아시아의 경제가 수많은 AI 에이전트 운영이 상호 연결된 글로벌 신경망처럼 기능할 것이라고 전망.

Potential Personal Success

전 세계적으로 널리 채택되는 AI 에이전트를 설계하면 개인 재정적 성공을 크게 거둘 수 있으며, 극도로 부유해질 가능성도 있음.

Importance of the Prediction

이 예측은 개발자들에게 방향성을 제시하고, 미래 AI 개발에서 달성해야 할 목표를 이해하는 데 핵심적임.

Emergence of One‑Person Unicorns

Sequoia Capital은 “1인 유니콘”의 등장을 예측함. 이는 10억 달러(USD) 이상의 가치를 가진 회사를 한 사람이 창업·운영하는 형태로, 노동 구조를 변화시키고 한 사람이 전체 스타트업을 운영할 수 있는 새로운 조직 모델을 만들 것임.

Need for a Stochastic Mindset

AI 에이전트 시대에는 개발자들이 전통적인 정확성 기대에서 벗어나 보다 확률적(stochastic) 사고방식을 채택해야 함. 이는 대형 언어 모델 및 AI 기술과 연결하고 활용하는 방식을 조정하는 것을 의미함.

Preparation for the New Era of Agentic AI

에이전트형 AI 시대의 성공은 기술적 준비뿐 아니라 정신적·조직적 조정도 필요함. 개발자들은 조직 구조와 사고 체계의 변화를 대비해야 함.

Foundational Infrastructure for Agentic AI in 2025

MCPA2A와 같은 통신 프로토콜이 AI 에이전트와 도구 간 상호 운용성을 위해 개발 중. AWS는 MCP와 A2A 표준 위원회에 적극 참여하며, 분산 시스템 분야 수십 년의 경험을 바탕으로 향후 프로토콜을 강화하고 있음.

AWS Agentic AI Portfolio

포트폴리오는 세 계층으로 구성됨:

  1. Infrastructure
  2. AI and agent developer software
  3. Application layers

핵심은 Amazon Nova ActStrands Agents와 같은 에이전트를 위한 SDK를 포함한 AI·에이전트 개발 소프트웨어와 서비스에 있음.

Practical Agentic AI Application: Local Weather Information

Local Weather Information Agent

  • Amazon Bedrock 기반 Emerald를 사용하고 홍콩 천문대 웹사이트 URL을 탑재하여 구축.
  • 사용자는 영어, 스페인어, 중국어 중 자연어로 홍콩 현재 날씨를 물어볼 수 있음.
  • 에이전트는 지정된 웹사이트에서 정보를 자동으로 찾아 스크린샷을 저장해 검증하며, 인간 웹 스크래핑 엔지니어와 동등한 능력을 보여줌.

Impact on Web Scraping Engineers

에이전트형 AI 시대가 도래하면서 전통적인 웹 스크래핑 역할에 영향을 미칠 수 있음. 개발자들은 Nova Act와 같은 AWS 서비스를 활용해 이 전환에 대비해야 함.

Implementation Details of the AI Agent

  • Nova Act 예측 기능이 에이전트에게 어떤 웹 페이지를 캡처하고 어떤 작업을 수행할지 안내함.
  • 자연어를 사용해 홍콩 천문대 웹사이트에서 9일 날씨 예보를 읽고 추출하는 작업을 할당.

Ambitions of Developers

많은 개발자들이 자체 에이전트형 AI 애플리케이션을 처음부터 구축하고 전체 소스 코드를 직접 관리하고자 함. 오픈소스 Strands 에이전트를 활용하면 모든 코드를 제어하면서 목표를 달성할 수 있음.

Challenges in Building Custom Agents

개발자는 다양한 기업 시스템과 상호 작용할 수 있는 커넥터가 필요함.

Components Required for Customized AI Agent Systems

  • Tools & MCP (Message Control Protocol): 에이전트가 워크플로우(예: 호텔 예약, 정보 업데이트, 프로세스 트리거)를 실행하도록 지원.
  • Memory:
    • 단기 메모리는 세션 내 컨텍스트를 유지.
    • 장기 메모리는 에이전트가 시간에 따라 학습하고 개선하도록 함.
  • Brain (Large Language Models): LLM은 ReACT(Reasoning, Acting, and Communicating Together), 리플렉션, Chain of Thought와 같은 기법을 통해 단계별 계획·반성·추론이 가능하도록 확장될 수 있음.
  • Persona: 에이전트의 정체성과 행동을 정의(예: HR 에이전트 vs. DevOps 에이전트).
  • Observability & Guardrails: 안전성, 디버깅 가능성, 목표 정렬을 제공.

Challenges in Building Functional AI Agents

실제로 기능하는 AI 에이전트를 구축하려면 상당한 노력이 필요하며, 전체 작업의 80‑90 %가 고유 비즈니스 로직 및 프로세스와 무관한 부분일 수 있음.

AWS Solution: Strands Agents

Strands Agents는 AWS가 기여한 오픈소스 SDK로, 최소한의 코드로 AI 에이전트를 구축할 수 있게 함. 최신 LLM을 활용해 계획 및 Chain of Thought 추론을 단순화함.

Demo: Creating Mathematical Animations with Strands Agents

Core Implementation Code (Python)

# imports
from strands import Agent
from strands.mcp import MCPClient

# establish MCP connection to Manim server
client = MCPClient(host="localhost", port=12345)
tools = client.get_tools()  # retrieve available tools from the server

# initialize the agent with the retrieved tools
agent = Agent(tools=tools)

# natural language prompt for a cubic function animation
prompt = "Create a 9‑second animation of the cubic function y = x**3 from x = -3 to x = 3."

# process the request
result = agent.run(prompt)

print(result)  # output includes video file path or status message

Workflow Overview

  1. Left terminal: MCP(Message Control Protocol) 서버를 실행하여 STDIO 전송을 통해 Manim MCP 서버에 연결.
  2. Right terminal: MCP 클라이언트 프로그램을 실행해 비디오 생성 채팅 인터페이스를 시작.

사용자는 “-3에서 3까지의 3차 함수를 9초 동안 그려줘”와 같은 자연어 명령을 입력. 에이전트는 요청을 처리하고, 문제가 발생하면 조정하며, 애니메이션을 생성함.

Benefits of Multi‑Agent Collaboration

  • 전문화: 특정 도메인에 집중한 에이전트는 정밀도가 높아 더 정확한 답변을 제공.
  • 조합: 전문화된 에이전트를 결합하면 보다 풍부하고 포괄적인 솔루션을 도출할 수 있음.
Back to Blog

관련 글

더 보기 »