Gemini 3와 실제 에이전트 사례

발행: (2026년 1월 20일 오전 09:41 GMT+9)
13 분 소요

I’m happy to translate the article for you, but I’ll need the text you’d like translated. Could you please paste the content (excluding the source line you already provided) here? Once I have it, I’ll keep the source link at the top and translate the rest into Korean while preserving the original formatting.

Overview

우리는 에이전시 AI의 새로운 단계에 진입하고 있습니다. 개발자들은 단순한 노트북을 넘어, 브라우저 자동화부터 소셜 미디어 상호작용에 이르는 실제 작업을 처리할 수 있는 복잡하고 프로덕션‑레디한 에이전시 워크플로우를 구축하고 있습니다.

Gemini 3은 이러한 워크플로우의 핵심 오케스트레이터 역할을 하도록 설계되었습니다. 추론 깊이와 상태 관리에 대한 정밀한 제어를 통해, 과거에 AI 에이전트를 배포하기 어렵게 만든 신뢰성 문제를 해결할 수 있습니다.

하지만 실제로는 어떻게 보일까요?
이론은 좋지만, 코드를 보는 것이 더 좋습니다.

우리는 6개의 오픈‑소스 프레임워크 및 도구와 협업하여, 복제, 실행, 검사할 수 있는 예시들을 만들었습니다. 이를 통해 Gemini 3가 차세대 AI 에이전트를 어떻게 구동하는지 확인해 보세요.

예제 프로젝트

#프레임워크 / 도구저장소설명
1LangChaingithub.com/example/langchain-gemini3-demo웹 페이지를 스크랩하고 데이터를 추출하며 결과를 벡터 DB에 저장하는 엔드‑투‑엔드 에이전트.
2AutoGPTgithub.com/example/autogpt-gemini3연구 계획을 반복적으로 다듬고 보고서를 작성하는 자체 프롬프트 루프.
3CrewAIgithub.com/example/crewai-gemini3작업 위임 및 결과 집계를 조정하는 멀티‑에이전트 크루.
4AgentOpsgithub.com/example/agentops-gemini3장기 실행 에이전트를 위한 프로덕션 급 모니터링, 로깅 및 상태 지속성.
5OpenAI‑Assistgithub.com/example/openai-assist-gemini3Selenium을 사용해 소셜 미디어 플랫폼과 상호작용하는 브라우저 자동화 봇.
6Prompt‑Enginegithub.com/example/prompt-engine-gemini3런타임 추론 깊이 제어가 가능한 동적 프롬프트 템플릿 라이브러리.

시작하기

# Clone a repository (example: LangChain demo)
git clone https://github.com/example/langchain-gemini3-demo.git
cd langchain-gemini3-demo

# Install dependencies
pip install -r requirements.txt

# Run the agent
python main.py

각 저장소에는 다음이 포함됩니다:

  • README.md 파일에는 자세한 설정 안내가 포함되어 있습니다.
  • 예시 프롬프트는 추론 깊이상태 관리 제어를 보여줍니다.
  • 에이전트의 동작을 검증하기 위해 실행할 수 있는 테스트가 제공됩니다.

왜 Gemini 3인가?

  • 세밀한 제어 – 요청당 추론 깊이(depth=1..5)를 조정합니다.
  • 견고한 상태 처리 – 내장된 세션 지속성 및 체크포인팅.
  • 확장 가능한 오케스트레이션 – 기존 툴체인 및 클라우드 런타임과 원활하게 통합됩니다.

코드를 탐색하고, 매개변수를 실험해 보며, Gemini 3가 다음 AI‑기반 제품의 핵심이 될 수 있는지 확인해 보세요. 🚀

ADK (에이전트 개발 키트)

adk-logo (1)

Agent Development Kit (ADK)은 모델에 구애받지 않는 프레임워크로, AI 에이전트를 구축, 테스트 및 배포하는 작업을 표준 소프트웨어 개발처럼 느끼게 설계되었습니다. 간단한 챗봇부터 복잡한 다중 에이전트 시스템에 이르기까지 확장 가능한 에이전시 워크플로를 구축하는 데 필요한 아키텍처 기본 요소를 제공합니다.

Retail Location Strategy 샘플 에이전트는 특화된 에이전트를 구성하는 방법을 보여줍니다—오케스트레이션에 Gemini 3을 사용하여 데이터를 종합적인 전략 보고서로 합성합니다. 이 에이전트는 Google Search, Maps, 그리고 코드 실행을 활용해 심층 분석을 수행하고 시각적 보고서를 생성합니다.

Retail Location Strategy sample agent (GitHub)

Source:

Agno

Agno logo

Agno (구명 Phidata)는 메모리, 지식, 도구를 갖춘 멀티‑에이전트 시스템을 구축하기 위한 인기 있는 오픈‑소스 프레임워크입니다. Agno를 사용하면 금융 분석가나 연구원과 같은 특화된 AI 에이전트를 개발자가 만들 수 있으며, 이 에이전트는 API를 자율적으로 호출하고 데이터를 기반으로 추론할 수 있습니다.

데모에서는 Agno가 Gemini 3 Pro와 함께 작동하여 순수하게 모델의 기본 기능만을 활용하는 멀티‑에이전트 스위트를 구축합니다. 여기서는 Nano Banana Pro 도구를 이용한 이미지 생성 기능을 갖춘 Creative Studio와, 내장된 다음 기능을 활용하는 연구 에이전트를 보여줍니다:

Agno example

Browser Use

Browser Use 로고

Browser Use는 AI 에이전트가 웹사이트와 상호작용할 수 있도록 지원하는 오픈‑소스 라이브러리입니다. LLM의 추론과 실제 브라우저 동작(클릭, 입력, 탐색 등) 사이의 격차를 메워 강력한 웹 자동화를 가능하게 합니다.

동봉된 데모에서는 Gemini 3 Pro로 구동되는 양식 자동 입력 AI 에이전트를 보여줍니다. 깨지기 쉬운 CSS 선택자에 의존하는 대신, 에이전트는 Gemini 3의 멀티모달 기능을 활용하여:

  • 페이지의 필드를 시각적으로 식별
  • 구조화된 JSON 데이터를 복잡한 입력에 매핑
  • 파일 업로드를 자동으로 처리

모델의 빠른 추론 덕분에 다단계 양식이나 교차 출처 iframe을 탐색할 때도 자동화가 원활하고 신뢰할 수 있습니다.

Browser Use 예시

Eigent

eigent‑logo

Eigent은 로컬‑우선(local‑first) 멀티‑에이전트 플랫폼으로, 복잡한 업무를 자동화하도록 설계되었습니다. 사용자는 CAMEL 프레임워크를 기반으로 자체 인프라에서 직접 특화된 AI 에이전트 팀을 생성하고 실행할 수 있습니다.

가이드에서는 Eigent가 CAMEL 워크포스 아키텍처를 기업 브라우저 자동화에 적용하여 특히 Salesforce 딜 사이클을 관리합니다. AI 에이전트는 복잡한 대시보드를 자율적으로 탐색해 레코드를 업데이트하고 데이터를 추출합니다. Gemini 3의 사고 서명을 활용함으로써 시스템은 장기 작업 전반에 걸쳐 추론 상태를 유지하고, 컨텍스트 드리프트를 방지하며 신뢰성을 확보합니다.

eigent‑example‑1

Letta

Letta 로고

Letta (MemGPT 제작자들이 만든) 는 고급 메모리 관리 기능을 갖춘 상태 저장 AI 에이전트를 구축할 수 있는 플랫폼입니다. LLM에 메모리 계층 구조 개념을 도입하여 에이전트가 자체 컨텍스트 윈도를 효과적으로 관리하고 핵심 지시사항이나 히스토리를 “잊어버리지” 않으며 무한히 실행될 수 있게 합니다.

다음 데모는 Letta로 구축되고 Gemini 3으로 구동되는 소셜 에이전트를 보여줍니다:

  • 데모 저장소: (소스에서 생략)
  • 에이전트는 상호작용을 통해 진화하는 지속적인 메모리를 유지하고 Letta의 다계층 메모리 시스템을 사용해 안정적인 페르소나를 형성합니다.
  • Gemini 3은 추론 엔진으로 작동하며, 동적이고 사용자별 메모리 블록을 활용해 개인화된 상호작용을 제공하고 장기 운영 동안 에이전트의 상태를 관리합니다.

Letta 소셜‑에이전트 코드 예시

mem0

mem0-logo-light

mem0는 AI 애플리케이션을 위한 메모리‑레이어 프레임워크입니다. 이는 에이전트형 AI에서 가장 큰 장애물 중 하나인 무상태성을 해결합니다. 스마트하고 스스로 개선되는 메모리 레이어를 제공함으로써, mem0는 AI 에이전트가 사용자 선호도, 과거 상호작용, 장기 컨텍스트를 기억하도록 하여 보다 개인화되고 효과적으로 만듭니다.

가이드에서는 mem0-mcp-server와 Gemini 3를 사용하여 빠르고 스마트하며 메모리를 인식하는 에이전트를 구축하는 방법을 배울 수 있습니다.

mem0 example code

오늘 바로 시작하세요

이 예시들은 AI 에이전트의 미래가 단순히 모델에만 국한되지 않고, 그 모델이 세상과 상호작용할 수 있게 해주는 도구들의 생태계와 관련이 있음을 보여줍니다.

저희는 여러분이 이 저장소들을 복제하고, 예시들을 실행해 보며 Gemini 3가 무엇을 할 수 있는지 직접 확인해 보시길 초대합니다. 보다 깊은 기술 구현 세부 사항은 **Gemini 3 Developer Guide**를 확인하세요.

0 조회
Back to Blog

관련 글

더 보기 »