Gemini 3 的新 Gemini API 更新

发布: (2025年12月1日 GMT+8 07:25)
6 min read

Source: Google Developers Blog

NOV. 25, 2025

Gemini 3,我们最智能的模型,现已通过 Gemini API 向开发者开放。为支持其最前沿的推理、自治编码、多模态理解以及强大的代理能力,我们推出了多项更新。这些更改让您能够更好地控制模型的推理方式、媒体处理方式以及与外部世界的交互方式。

Gemini 3 在 Gemini API 中的新功能

  • 简化的思考控制参数
    从 Gemini 3 开始,全新的 thinking_level 参数让您可以控制模型在生成响应前的内部推理最大深度。各级别是相对指南,而非严格的 token 保证。

    • 设置为 "high" 以处理需要最佳思考的复杂任务(例如,战略业务分析、扫描代码中的漏洞)。
    • 设置为 "low" 以满足对延迟和成本敏感的应用,如结构化数据抽取或摘要。
      更多信息请参阅此处
  • 对多模态视觉处理的细粒度控制
    media_resolution 参数让您可以配置图像、视频和文档输入使用的 token 数量,在视觉保真度与 token 使用之间取得平衡。选项有 media_resolution_lowmedia_resolution_mediummedia_resolution_high,可对每个媒体部分或全局设置。如果未指定,模型将使用基于媒体类型的最佳默认值。更高的分辨率有助于读取细小文字或识别微小细节,但会增加 token 使用量和延迟。

  • 思考签名以提升函数调用和图像生成性能
    Gemini 3 现在会返回 Thought Signatures——模型内部思考过程的加密表示。将这些签名在后续 API 调用中传回,可在对话中保持推理链路,这对复杂的多步骤代理工作流至关重要。

    • 使用官方 SDK 和标准聊天历史时,思考签名会自动处理。
    • 函数调用:对“当前回合”进行严格验证。缺少签名会导致 400 错误。详情请见此处
    • 文本/聊天生成:验证并非强制,但省略签名会降低推理和答案质量。
    • 图像生成/编辑:对所有模型部分(包括 thoughtSignature)进行严格验证。缺少签名同样返回 400 错误。
  • 结合结构化输出的检索与 URL 上下文
    您现在可以将 Gemini 托管的工具——尤其是通过 Google Search 的检索和 URL 上下文——与结构化输出相结合。这对需要从网络或特定网页获取实时信息并将其提取为精确 JSON 供下游任务使用的代理非常有用。了解更多请访问此处

  • Google Search 检索定价更新
    为更好支持动态代理工作流,定价从固定的 US $35 / 1k 提示 调整为基于使用量的 US $14 / 1,000 检索查询

使用 Gemini 3 Pro API 的最佳实践

Gemini 3 Pro 在代码生成、零样本生成、数学问题求解以及复杂多模态挑战等场景中引发了广泛关注。请遵循以下指南以获得最佳效果:

  • Temperature – 将 temperature 参数保持在默认值 1.0
  • 一致性与明确参数 – 在提示中保持统一结构(例如,标准化的 XML 标签),并明确界定模糊术语。
  • 输出冗长度 – Gemini 3 默认给出简洁答案。如需更具对话性的语气,请显式请求。
  • 多模态连贯性 – 将文本、图像、音频和视频视为同等输入。明确引用具体模态,使模型能够跨模态进行综合,而非单独分析。
  • 约束放置 – 将行为约束和角色定义放在 System Instruction 或提示的最顶部,以锚定模型的推理。
  • 长上下文结构 – 在处理大规模上下文(书籍、代码库、长视频)时,将具体指令放在提示的 末尾(数据上下文之后)。

Gemini 3 Pro 是我们在代理编码方面最先进的模型。为帮助开发者充分发挥其能力,我们与研究团队合作,创建了一个系统指令模板,可提升多个代理基准的表现。

要开始使用这些新特性,请浏览Gemini 3 文档并阅读开发者指南获取技术实现细节。

Back to Blog

相关文章

阅读更多 »

宣布 Data Commons Gemini CLI 扩展

自从我们在十月初推出 Gemini CLI 扩展框架以来,我们已经看到 Google 自有和第三方贡献的扩展在 op... 中呈爆炸式增长。