Google Gemini 3와 오픈소스 프레임워크를 이용한 AI 에이전트 구축

발행: (2025년 12월 9일 오후 04:18 GMT+9)
11 min read

Source: Google Developers Blog

AI 에이전트의 세계는 단순 챗봇에서 복잡한 의사결정을 실제 세계에서 수행할 수 있는 정교하고 (반)자율적인 시스템으로 급속히 진화하고 있습니다. 이번 주에 우리는 Gemini 3 Pro Preview 를 소개했으며, 이는 이러한 고급 워크플로우의 핵심 오케스트레이터 역할을 하도록 설계된 가장 강력한 에이전트 모델입니다.

우리는 오픈소스 파트너와 광범위하게 협업하여 모델을 통합하고 테스트했습니다. 이 글에서는 Gemini 3의 새로운 에이전트 기능과 LangChain, AI SDK by Vercel, LlamaIndex, Pydantic AI, n8n 등 오픈소스 프레임워크를 사용해 차세대 에이전트를 시작하는 방법을 다룹니다.

왜 Gemini 3이 에이전트에 적합한가?

Gemini 3은 비용, 지연 시간, 추론 깊이에 대한 세밀한 제어를 제공하도록 설계된 기능을 도입해, 지금까지 가장 강력한 에이전트 기반 모델이 되었습니다:

  • thinking_level 로 추론 제어 – 요청마다 논리 깊이를 조정합니다. high 로 설정하면 깊은 계획, 버그 탐지, 복잡한 지시 수행에 적합합니다. low 로 설정하면 Gemini 2.5 Flash와 비슷한 지연 시간에 뛰어난 출력 품질을 얻을 수 있습니다.
  • Thought Signatures 로 상태 저장 툴 사용 – 모델이 툴을 호출하기 전에 내부 추론을 나타내는 암호화된 “Thought Signature” 를 생성합니다. 이 서명을 대화 기록에 다시 전달하면 에이전트가 정확한 사고 흐름을 유지해, 컨텍스트 손실 없이 신뢰할 수 있는 다단계 실행이 가능합니다.
  • 조정 가능한 멀티모달 정밀도media_resolution 으로 토큰 사용량과 디테일을 균형 맞춥니다. 이미지의 미세 텍스트 분석에는 high, PDF 문서 파싱에는 medium, 비디오 및 일반 이미지 설명에는 low 를 사용해 지연 시간을 최소화합니다.
  • 대용량 컨텍스트 일관성 – Thought Signature 와 결합된 대용량 컨텍스트 윈도우는 “추론 드리프트”를 완화해, 에이전트가 긴 세션에서도 일관된 논리를 유지하도록 돕습니다.

에이전트 오픈소스 생태계: Day 0 지원

우리는 오픈소스 커뮤니티와 손잡고 라이브러리가 Gemini 3을 즉시 활용할 수 있도록 준비했습니다. 다음은 Day 0 지원을 제공하는 주요 프레임워크입니다.

LangChain

langchain

LangChain 은 에이전트 엔지니어링 플랫폼과 오픈소스 프레임워크인 LangChain 및 LangGraph 를 제공해 수백만 개발자가 활용하고 있습니다. 워크플로우를 그래프로 표현함으로써 개발자는 Gemini 및 Gemini 임베딩 모델을 직접 활용하는 상태 저장, 다중 행위자 AI 에이전트를 구축할 수 있습니다.

“새로운 Gemini 모델은 복잡하고 에이전트적인 워크플로우에 큰 도약을 가져옵니다 — 특히 정교한 추론과 툴 사용이 필요한 경우에요. 우리는 LangChain과 LangGraph 전반에 걸쳐 이를 지원하게 되어 기쁩니다. 개발자는 첫날부터 신뢰할 수 있는 에이전트를 손쉽게 구축하고 배포할 수 있습니다.” – Harrison Chase, LangChain

LangChain for Gemini 로 시작해 보세요.

AI SDK by Vercel

ai-sdk

AI SDK 는 TypeScript 툴킷으로, React, Next.js, Vue, Svelte, Node.js 등에서 AI‑기반 애플리케이션과 에이전트를 구축하도록 돕습니다. Google 공급자를 사용하면 텍스트 스트리밍, 툴 사용, 구조화된 생성 등 기능을 Gemini 3으로 구현할 수 있습니다.

“우리 내부 벤치마크에서 Gemini 3 Pro는 추론 및 코드 생성에서 엄청난 향상을 보였으며, Gemini 2.5 Pro 대비 성공률이 거의 17 % 상승했습니다. 이는 Next.js 리더보드 상위 2위에 해당합니다. AI SDK, AI Gateway, v0 에서 Day 0 수준의 새로운 역량을 지원하게 되어 매우 기쁩니다.” — Aparna Sinha, Vercel

Vercel 의 AI SDK 로 시작해 보세요.

LlamaIndex

LlamaIndex

LlamaIndex 는 Gemini 를 연결해 데이터와 함께 지식 에이전트를 구축하는 특화 프레임워크입니다. 여기에는 에이전트 워크플로우 오케스트레이션, 데이터 로딩, 파싱, 추출, 인덱싱을 위한 도구가 포함되며, LlamaIndex 오픈소스 툴링과 LlamaCloud 를 모두 활용합니다.

“초기 액세스 테스트에서 Gemini 3 Pro는 복잡한 툴 호출과 컨텍스트 유지 측면에서 이전 세대보다 뛰어났습니다. 이는 자체 데이터를 다루는 신뢰할 수 있는 지식 에이전트를 구축하려는 개발자에게 높은 정확도의 기반을 제공합니다.” – Jerry Liu, LlamaIndex

LlamaIndex 로 시작해 보세요.

Pydantic AI

pydantic-ai

Pydantic AI 는 Python 에서 타입‑안전한 에이전트를 구축하기 위한 프레임워크입니다. Gemini 모델을 직접 지원하며, Python 타입 힌트를 활용해 에이전트 스키마를 정의할 수 있습니다. 이를 통해 에이전트 워크플로우가 예측 가능하고 타입‑정확한 데이터를 생성해, 다운스트림 프로덕션 시스템에 원활히 통합됩니다.

“Gemini 3의 고급 추론과 Pydantic AI의 타입 안전성을 결합하면 프로덕션 에이전트에 필요한 신뢰성을 확보할 수 있습니다. Day 0 에서 전체 라이브러리 지원을 제공하도록 통합을 검증하게 되어 매우 기쁩니다.” – Douwe Maan

Pydantic AI 로 시작해 보세요.

n8n

n8n

n8n 은 기술팀과 비기술팀 모두가 코드를 작성하지 않고 AI 에이전트를 만들 수 있게 해주는 워크플로 자동화 플랫폼입니다. Gemini 3 Pro 와 함께 n8n 은 운영, 마케팅, 비즈니스 팀에 고급 추론 능력을 제공합니다.

“Gemini 3 은 고급 추론 능력을 모든 사람에게 제공합니다, 소프트웨어 엔지니어만이 아니라 말이죠. 이 모델을 n8n 에 통합함으로써 비개발자도 코드를 한 줄도 작성하지 않고 복잡하고 신뢰할 수 있는 에이전트를 구축해 일상 업무를 혁신할 수 있게 됩니다.” — Angel Menendez

n8n 로 시작해 보세요.

모범 사례 및 다음 단계

업그레이드 준비가 되셨나요? Gemini 3 위에서 에이전트를 원활히 운영하려면 다음 가이드를 따르세요.

  • 프롬프트 단순화 – 복잡한 “Chain of Thought” 프롬프트 엔지니어링을 중단하고 thinking_level 파라미터에 의존해 추론 깊이를 자동으로 처리합니다.
  • Temperature 를 1.0 으로 유지 – Gemini 3 의 추론 엔진은 온도 1.0 에 최적화돼 있습니다. 낮추면 복잡한 작업에서 루프가 발생하거나 성능이 저하될 수 있습니다.
  • Thought Signature 처리 – 모델 응답에서 thoughtSignature 을 캡처해 다시 전달합니다. 함수 호출 시 반드시 필요하며, 서명이 없으면 API 오류가 발생합니다.
  • 시각 토큰 최적화 – PDF 에는 media_resolutionmedium 으로 설정해 토큰을 절감하고, 이미지의 고밀도 디테일이 필요할 때만 high 를 사용합니다.
  • 가이드 검토 – 마이그레이션, 속도 제한, 새로운 API 파라미터 등에 대한 중요한 내용은 전체 Gemini 3 개발자 가이드 를 반드시 읽어 보세요.
Back to Blog

관련 글

더 보기 »

Jules에서 Gemini 3으로 빌드하기

2025년 11월 19일 화요일에 우리는 Gemini 3를 소개했습니다. Gemini 3는 Google의 가장 지능적인 모델로, 어떤 아이디어든 실현할 수 있도록 도와줍니다. 오늘 우리는 Gemini…