실제 세계 에이전트 예시 with Gemini 3

발행: (2025년 12월 20일 오전 02:15 GMT+9)
11 min read

Source: Google Developers Blog

December 18, 2025

우리는 에이전트형 AI의 새로운 단계에 진입하고 있습니다. 개발자들은 단순한 노트북을 넘어 실제 작업을 처리할 수 있는 복잡하고 프로덕션 수준의 에이전트형 워크플로우를 구축하고 있습니다—브라우저 자동화부터 소셜 미디어 상호작용까지.

Gemini 3은 이러한 워크플로우의 핵심 오케스트레이터 역할을 하도록 설계되었습니다. 추론 깊이와 상태 관리에 대한 정밀한 제어는 AI 에이전트를 배포하기 어렵게 만든 신뢰성 문제를 해결하는 데 도움을 줍니다.

하지만 실제로는 어떻게 보일까요? 이론은 좋지만, 코드를 보는 것이 더 좋습니다.

우리는 여섯 개의 오픈소스 프레임워크와 도구와 협업하여 Gemini 3가 차세대 AI 에이전트를 어떻게 구동하는지 확인할 수 있는 예제들을 만들었습니다. 이 예제들은 복제하고, 실행하고, 살펴볼 수 있도록 제공됩니다.

1. ADK (Agent Development Kit)

ADK logo

Agent Development Kit (ADK)는 Google이 개발한 오픈‑소스, 모델‑독립 프레임워크로, AI 에이전트를 구축, 테스트 및 배포하는 과정을 일반 소프트웨어 개발처럼 만들도록 설계되었습니다. 간단한 챗봇부터 복잡한 다중 에이전트 시스템에 이르기까지 확장 가능한 에이전시 워크플로우를 구축하는 데 필요한 아키텍처 기본 요소를 제공합니다. ADK는 모든 LLM을 지원하지만 Gemini 계열 모델과는 특별한 관계를 가지고 있으며, Gemini 고유의 기능을 최대한 활용하도록 설계되었습니다.

Retail Location Strategy 샘플 에이전트는 여러 전문 에이전트를 하나의 도구로 구성하는 방법을 보여줍니다:

  • Google Search, Google Maps, 실시간 HTML 생성, 코드 실행 등을 활용해 더 깊은 데이터 가공 및 분석을 수행하는 Gemini 3 사용.
  • 새로운 Nano Banana Pro 모델을 통한 이미지 생성 포함.
  • 에이전트들이 선형이면서도 유연한 프로세스에서 자체 반성 및 교정을 거쳐 신뢰할 수 있고 근거가 명확한 사실 정보를 제공하며, 이를 다운로드 가능한 보고서와 인포그래픽으로 정리·합성합니다.

모든 샘플은 Agent Garden에서 편리하게 이용할 수 있습니다:

ADK를 자유롭게 탐색하고, 수정하며, 확장하여 여러분만의 AI 에이전트 프로젝트에 맞게 활용해 보세요.

2. Agno

Agno 로고

Agno (이전 명칭: Phidata)는 메모리, 지식 및 도구를 갖춘 멀티‑에이전트 시스템을 구축하기 위한 인기 있는 오픈‑소스 프레임워크입니다. Agno는 개발자가 금융 분석가나 연구원과 같은 특화된 AI 에이전트를 만들 수 있게 하며, 이 에이전트들은 API를 자율적으로 호출하고 데이터를 기반으로 추론할 수 있습니다.

데모에서 Agno는 Gemini 3 Pro와 함께 작동하여 순수하게 모델 고유 기능만을 활용하는 멀티‑에이전트 스위트를 구축합니다. 여기서는 이미지 생성을 위한 Nano Banana Pro 도구를 활용한 Creative Studio와, 다음과 같은 내장 기능을 사용하는 연구 에이전트를 선보입니다:

Agno 예시

Source:

3. 브라우저 사용

브라우저 사용 로고

Browser Use은 AI 에이전트가 웹사이트와 상호작용할 수 있게 해주는 오픈‑소스 라이브러리입니다. LLM의 추론과 실제 브라우저 동작(클릭, 입력, 탐색) 사이의 복잡한 다리를 연결해 주어 강력한 웹 자동화를 가능하게 합니다.

데모에서는 Gemini 3 Pro로 구동되는 양식 자동 입력 AI 에이전트를 보여줍니다. 부서지기 쉬운 CSS 선택자에 의존하는 대신, 에이전트는 Gemini 3의 멀티모달 기능을 활용하여:

  • 시각적으로 필드를 식별하고
  • 구조화된 JSON 데이터를 복잡한 입력에 매핑하며
  • 파일 업로드를 자동으로 처리합니다

모델의 추론 속도 덕분에 자동화가 부드럽고 신뢰할 수 있으며, 다단계 양식이나 교차 출처 iframe을 탐색할 때도 안정적으로 동작합니다.

브라우저 사용 예시

4. Eigent

Eigent logo

Eigent은 로컬‑우선(local‑first) 멀티‑에이전트 플랫폼으로, 복잡한 업무 작업을 자동화하도록 설계되었습니다. 사용자는 자체 인프라에서 특화된 AI 에이전트 팀을 생성하고 실행할 수 있으며, 내부적으로 CAMEL 프레임워크를 활용합니다.

가이드에서는 Eigent가 CAMEL 워크포스 아키텍처를 기업용 브라우저 자동화에 적용하여, 특히 Salesforce 딜 사이클을 관리합니다. AI 에이전트는 복잡한 대시보드를 자율적으로 탐색해 레코드를 업데이트하고 데이터를 추출합니다. Gemini 3의 사고 서명(thought signatures)을 활용함으로써 시스템은 장기 작업 전반에 걸쳐 추론 상태를 유지하고, 컨텍스트 드리프트를 방지하여 신뢰성을 확보합니다.

Eigent example

5. Letta

Letta logo

Letta (MemGPT 제작자들이 만든) 는 고급 메모리 관리 기능을 갖춘 상태 기반 AI 에이전트를 구축할 수 있는 플랫폼입니다. LLM에 메모리 계층 구조 개념을 도입해 에이전트가 자체 컨텍스트 창을 효율적으로 관리하고 핵심 지시사항이나 히스토리를 “잊지” 않고 무한히 실행할 수 있도록 합니다.

데모에서는 Letta로 구축하고 Gemini 3으로 구동되는 소셜 에이전트를 보여줍니다:

  • 상호작용을 통해 진화하는 지속 메모리.
  • 안정적인 페르소나를 만드는 다계층 메모리 시스템.
  • Gemini 3을 추론 엔진으로 사용하며, 동적이고 사용자별 메모리 블록을 활용해 개인화된 상호작용 제공.
  • 장기 작업 전반에 걸친 상태 관리.

Letta social‑agent code example

6. mem0

mem0 logo

mem0은 AI 애플리케이션을 위한 메모리‑레이어 프레임워크입니다. 에이전트형 AI에서 가장 큰 장애물 중 하나인 무상태성을 해결합니다. 스마트하고 스스로 개선되는 메모리 레이어를 제공함으로써, mem0은 AI 에이전트가 사용자 선호도, 과거 상호작용, 장기 컨텍스트를 기억하도록 하여 보다 개인화되고 효과적으로 동작하게 합니다.

이 가이드에서는 mem0-mcp-server와 Gemini 3을 사용해 빠르고 똑똑한 메모리‑인식 에이전트를 만드는 방법을 배울 수 있습니다.

mem0 example code

오늘 바로 시작하세요

이 예시들은 AI 에이전트의 미래가 단순히 모델에만 국한되지 않고, 모델이 세상과 상호작용할 수 있게 하는 도구들의 생태계와 관련이 있음을 보여줍니다.

저희는 여러분이 이 저장소들을 복제하고, 예시들을 실행해 보며 Gemini 3가 무엇을 할 수 있는지 직접 확인해 보시길 초대합니다. 보다 깊은 기술 구현 세부 사항은 Gemini 3 개발자 가이드 를 확인하세요.

Back to Blog

관련 글

더 보기 »