Gemini 3용 새로운 Gemini API 업데이트

발행: (2025년 12월 1일 오전 08:25 GMT+9)
8 min read

Source: Google Developers Blog

NOV. 25, 2025

Gemini 3, 우리 가장 지능적인 모델이 이제 Gemini API를 통해 개발자에게 제공됩니다. 최첨단 추론, 자율 코딩, 멀티모달 이해 및 강력한 에이전시 기능을 지원하기 위해 여러 업데이트를 출시했습니다. 이러한 변경을 통해 모델이 어떻게 추론하고, 미디어를 처리하며, 외부 세계와 상호작용하는지를 보다 세밀하게 제어할 수 있습니다.

Gemini 3용 Gemini API의 새로운 기능

  • 추론 제어를 위한 간소화된 파라미터
    Gemini 3부터는 새로운 thinking_level 파라미터를 통해 응답을 생성하기 전 모델 내부 추론의 최대 깊이를 제어할 수 있습니다. 레벨은 엄격한 토큰 보장이 아니라 상대적인 가이드라인입니다.

    • 복잡한 작업(예: 전략적 비즈니스 분석, 코드 취약점 스캔)에는 "high"를 설정합니다.
    • 지연 시간 및 비용에 민감한 애플리케이션(예: 구조화된 데이터 추출 또는 요약)에는 "low"를 설정합니다.
      자세한 내용은 여기를 참고하세요.
  • 멀티모달 비전 처리에 대한 세분화된 제어
    media_resolution 파라미터를 사용하면 이미지, 비디오, 문서 입력에 사용되는 토큰 수를 설정하여 시각적 충실도와 토큰 사용량 사이의 균형을 맞출 수 있습니다. 옵션은 media_resolution_low, media_resolution_medium, media_resolution_high이며, 미디어 파트별 또는 전체에 적용할 수 있습니다. 지정하지 않으면 모델은 미디어 유형별 최적 기본값을 사용합니다. 높은 해상도는 작은 텍스트나 세부 사항을 읽는 능력을 향상시키지만 토큰 사용량과 지연 시간이 증가합니다.

  • 함수 호출 및 이미지 생성 성능 향상을 위한 Thought Signatures
    Gemini 3는 이제 Thought Signatures—모델 내부 사고 과정을 암호화한 표현—를 반환합니다. 이러한 서명을 이후 API 호출에 다시 전달하면 대화 전반에 걸쳐 추론 흐름을 유지할 수 있어 복잡하고 다단계인 에이전시 워크플로에 필수적입니다.

    • 공식 SDK와 표준 채팅 히스토리를 사용할 경우 Thought Signatures는 자동으로 처리됩니다.
    • 함수 호출: “현재 턴”에 대한 엄격한 검증이 이루어집니다. 서명이 누락되면 400 오류가 발생합니다. 자세한 내용은 여기를 확인하세요.
    • 텍스트/채팅 생성: 검증이 엄격히 적용되지는 않지만, 서명을 생략하면 추론 및 답변 품질이 저하됩니다.
    • 이미지 생성/편집: 모든 모델 파트에 thoughtSignature가 포함된 엄격한 검증이 적용됩니다. 서명이 없을 경우 역시 400 오류가 반환됩니다.
  • 구조화된 출력과 함께하는 검색 및 URL 컨텍스트
    이제 Gemini가 제공하는 도구—특히 Google Search와 URL 컨텍스트를 활용한 grounding—를 구조화된 출력과 결합할 수 있습니다. 이는 웹이나 특정 웹페이지에서 실시간 정보를 가져와 정밀한 JSON 형태로 추출해야 하는 에이전트에 강력합니다. 자세한 내용은 여기를 참고하세요.

  • Google Search grounding 가격 업데이트
    동적 에이전시 워크플로를 더 잘 지원하기 위해 가격이 평평한 US $35 / 1k 프롬프트에서 사용량 기반 US $14 / 1,000 검색 쿼리로 전환되었습니다.

Gemini 3 Pro를 API를 통해 사용할 때의 모범 사례

Gemini 3 Pro는 바이브 코딩, 제로샷 생성, 수학 문제 해결, 복합 멀티모달 과제 등 다양한 사용 사례에서 큰 관심을 받고 있습니다. 최적의 결과를 얻기 위해 다음 가이드를 따르세요:

  • Temperaturetemperature 파라미터는 기본값인 1.0을 유지합니다.
  • 일관성 및 정의된 파라미터 – 프롬프트 전체에 일관된 구조(예: 표준화된 XML 태그)를 유지하고 모호한 용어는 명시적으로 정의합니다.
  • 출력 길이 – Gemini 3는 기본적으로 간결한 답변을 제공합니다. 보다 대화형 톤이 필요하면 명시적으로 요청하세요.
  • 멀티모달 일관성 – 텍스트, 이미지, 오디오, 비디오를 동등한 입력으로 취급합니다. 모델이 각각을 별도로 분석하지 않고 서로 결합하도록 구체적인 모달리티를 명확히 언급하세요.
  • 제약 조건 위치 – 행동 제약 및 역할 정의는 System Instruction 또는 프롬프트 최상단에 배치해 모델 추론을 고정합니다.
  • 긴 컨텍스트 구조 – 책, 코드베이스, 긴 비디오 등 대용량 컨텍스트를 사용할 때는 구체적인 지시를 프롬프트 끝(데이터 컨텍스트 뒤)에 배치합니다.

Gemini 3 Pro는 우리 가장 진보된 에이전시 코딩 모델입니다. 개발자가 그 능력을 최대한 활용하도록 연구팀과 협업해 만든 System Instructions 템플릿은 여러 에이전시 벤치마크에서 성능을 향상시킵니다.

새 기능을 활용해 개발을 시작하려면 Gemini 3 문서를 살펴보고, 기술 구현 세부 사항은 Developer Guide를 읽어보세요.

Back to Blog

관련 글

더 보기 »

Data Commons Gemini CLI 확장 발표

우리가 10월 초에 Gemini CLI extensions framework를 출시한 이후, Google이 소유한 확장과 제3자 기여 확장이 폭발적으로 증가하는 것을 보았습니다.