Gemini 3에 대한 새로운 Gemini API 업데이트

발행: 1개월 전 (2025년 12월 16일 오전 09:29 GMT+9)

8 분 소요

원문: Google Developers Blog

Source: Google Developers Blog

2025년 11월 25일

Source:

Gemini 3용 Gemini API의 새로운 기능

사고 제어를 위한 간소화된 파라미터
Gemini 3부터는 모델이 응답을 생성하기 전에 사고 과정의 최대 깊이를 제어하는 새로운 파라미터 thinking_level를 도입했습니다. Gemini 3은 이 수준을 엄격한 토큰 보장이 아닌 추론을 위한 상대적인 가이드라인으로 취급합니다.
- "high" – 최적의 사고가 필요한 복잡한 작업(예: 전략적 비즈니스 분석, 코드 취약점 스캔)용.
- "low" – 구조화된 데이터 추출이나 요약과 같이 지연 시간·비용에 민감한 애플리케이션용.
  자세한 내용은 여기를 참고하세요.
멀티모달 비전 처리에 대한 세밀한 제어
media_resolution 파라미터를 사용하면 이미지, 비디오, 문서 입력에 사용되는 토큰 수를 설정할 수 있어 시각적 충실도와 토큰 사용량 사이의 균형을 맞출 수 있습니다. 각 미디어 파트별로 혹은 전체적으로 media_resolution_low, media_resolution_medium, media_resolution_high 중 하나로 지정합니다. 지정하지 않으면 모델이 미디어 유형에 따른 최적 기본값을 사용합니다. 높은 해상도는 미세한 텍스트를 읽거나 작은 디테일을 식별하는 능력을 향상시키지만 토큰 사용량과 지연 시간이 증가합니다.
함수 호출 및 이미지 생성 성능 향상을 위한 Thought Signatures
Gemini 3부터 API는 Thought Signatures—모델 내부 사고 과정을 암호화한 표현—의 반환을 강제합니다. 이후 호출 시 이 서명을 전달하면 Gemini 3이 대화 전반에 걸쳐 추론 체인을 유지할 수 있어 복잡하고 다단계인 에이전트 워크플로에 필수적입니다.
- 공식 SDK(라이브러리)와 표준 채팅 히스토리를 사용할 경우 Thought Signatures가 자동으로 처리됩니다.
- 함수 호출: 현재 턴에 대한 엄격한 검증이 적용되며, 서명이 누락되면 400 오류가 반환됩니다. 자세한 내용은 여기를 확인하세요.
- 텍스트/채팅 생성: 검증이 엄격하게 적용되지는 않지만, 서명을 생략하면 추론 및 답변 품질이 저하됩니다.
- 이미지 생성/편집: 모든 모델 파트에 대해 thoughtSignature를 포함한 엄격한 검증이 적용되며, 서명이 없을 경우 400 오류가 반환됩니다.
구조화된 출력과 함께하는 Grounding 및 URL 컨텍스트
이제 Gemini가 제공하는 도구—특히 Google Search를 통한 Grounding과 URL 컨텍스트—를 구조화된 출력과 결합할 수 있습니다. 이는 웹이나 특정 웹페이지에서 실시간 정보를 가져와 정확한 JSON 형태로 추출해 후속 작업에 활용해야 하는 에이전트에 매우 유용합니다. 예시는 여기를 참고하세요.
Google Search Grounding 가격 업데이트
동적 에이전트 워크플로를 보다 잘 지원하기 위해, 기존의 고정 요금(US $35 / 1k 프롬프트)에서 보다 세분화된 사용량 기반 요금인 US $14 / 1,000 검색 쿼리로 전환합니다.

Gemini 3 Pro API 사용 시 모범 사례

우리는 Gemini 3 Pro에 대한 큰 관심을 목격했습니다—특히 바이브 코딩, 제로샷 생성, 수학 문제 해결, 복합 멀티모달 이해 등 다양한 사용 사례에서요. Gemini 3의 한계를 뛰어넘으며 최상의 결과를 얻으려면 다음 가이드라인을 따르세요 (자세한 내용은 here 참고):

Temperature – temperature 매개변수를 기본값인 1.0으로 유지하세요.
Consistency & defined parameters – 프롬프트 전반에 걸쳐 일관된 구조(예: 표준화된 XML 태그)를 유지하고 모호한 용어는 명시적으로 정의하세요.
Output verbosity – 기본적으로 Gemini 3은 간결하며 직접적이고 효율적인 답변을 선호합니다. 필요하면 보다 대화형이거나 “수다스러운” 응답을 명시적으로 요청하세요.
Multimodal coherence – 텍스트, 이미지, 오디오, 비디오를 동등한 입력으로 다루세요. 특정 모달리티를 명확히 언급하여 모델이 이를 개별적으로 분석하기보다 통합하도록 하세요.
Constraint placement – 행동 제약 및 역할 정의를 System Instruction에 넣거나 프롬프트 가장 상단에 배치하여 모델의 추론 과정을 고정하세요.
Long‑context structure – 큰 컨텍스트(책, 코드베이스, 긴 비디오)를 다룰 때는 구체적인 지시를 프롬프트 끝(데이터 컨텍스트 뒤)에 배치하세요.

Gemini 3 Pro는 **agentic coding**에 대한 우리 가장 진보된 모델입니다. 개발자들이 그 능력을 최대한 활용할 수 있도록 연구팀과 협력해 System Instructions 템플릿을 만들었습니다.

Agentic SI Template – 여러 에이전시 벤치마크에서 성능을 향상시킨 모델용 템플릿입니다.
새로운 기능으로 빌드를 시작하려면 시스템 프롬프트에 템플릿을 포함하고 위에서 설명한 대로 매개변수를 조정하세요.

**Gemini 3 documentation**을 확인하고, 기술 구현 세부 사항은 **Developer Guide**를 읽어보세요.

Previous | Next

Gemini 3에 대한 새로운 Gemini API 업데이트

Gemini 3용 Gemini API의 새로운 기능

Gemini 3 Pro API 사용 시 모범 사례

관련 글

ChatLLM, AI의 실제 병목 현상을 해결하기 위한 간소화된 솔루션을 제시

Gemini 3와 실세계 에이전트 사례

Gemini 3와 실제 세계 에이전트 예시

Gemini 3와 실세계 에이전트 사례

Gemini 3용 Gemini API의 새로운 기능

Gemini 3 Pro API 사용 시 모범 사례

관련 글

ChatLLM, AI의 실제 병목 현상을 해결하기 위한 간소화된 솔루션을 제시

Gemini 3와 실세계 에이전트 사례

Gemini 3와 실제 세계 에이전트 예시

Gemini 3와 실세계 에이전트 사례

Gemini 3용 Gemini API의 새로운 기능

Gemini 3 Pro API 사용 시 모범 사례