Gemini 3 的新 Gemini API 更新

发布: 1个月前 (2025年12月16日 GMT+8 08:29)

6 分钟阅读

原文: Google Developers Blog

Source: Google Developers Blog

2025年11月25日

Gemini API 在 Gemini 3 中的新功能

简化的思考控制参数
从 Gemini 3 开始，我们引入了一个名为 thinking_level 的新参数，用于控制模型在生成响应前的最大思考深度。Gemini 3 将这些层级视为相对的推理指南，而非严格的 token 保证。
- "high" – 适用于需要最佳思考的复杂任务（例如，战略业务分析、扫描代码中的漏洞）。
- "low" – 适用于对延迟和成本敏感的应用，如结构化数据抽取或摘要。
  更多信息请参见此处。
对多模态视觉处理的细粒度控制
media_resolution 参数让您可以配置图像、视频和文档输入使用的 token 数量，从而在视觉保真度与 token 使用之间取得平衡。可以针对每个媒体部分或全局设置为以下之一：media_resolution_low、media_resolution_medium 或 media_resolution_high。如果未指定，模型将使用基于媒体类型的最佳默认值。更高的分辨率能够提升模型读取细小文字或识别微小细节的能力，但会增加 token 使用量和延迟。
思考签名以提升函数调用和图像生成性能
从 Gemini 3 开始，API 强制返回**Thought Signatures**——模型内部思考过程的加密表示。将这些签名在后续调用中传回，可确保 Gemini 3 在对话中保持推理链，这对复杂的多步骤代理工作流至关重要。
- 如果您使用官方 SDK（库）并使用标准聊天历史，思考签名会自动处理。
- 函数调用：对当前回合进行严格验证；缺少签名会返回400 错误。详细信息请见此处。
- 文本/聊天生成：验证不是强制性的，但省略签名会降低推理和答案质量。
- 图像生成/编辑：对所有模型部分进行严格验证，包括 thoughtSignature；缺少签名会返回400 错误。
结构化输出的 Grounding 与 URL 上下文
现在您可以将 Gemini 托管的工具——特别是Google Search Grounding和URL 上下文——与结构化输出结合使用。这对于需要从网络或特定网页获取实时信息并将其提取为精确 JSON 供下游任务使用的代理非常有用。示例请参见此处。
Google Search Grounding 定价更新
为更好地支持动态代理工作流，我们将从固定费率（US $35 / 1k 提示）转为更细粒度的基于使用量的费率——US $14 / 1,000 次搜索查询。

Source: …

使用 Gemini 3 Pro API 的最佳实践

我们已经看到对 Gemini 3 Pro 的广泛兴趣——尤其是在 Vibe 编码、零样本生成、数学问题求解、复杂多模态理解以及许多其他使用场景中。为了在推动 Gemini 3 边界的同时获得最佳结果，请遵循以下指南（更多细节请参见此处）：

Temperature – 将 temperature 参数保持在默认值 1.0。
一致性与定义参数 – 在整个提示中保持统一的结构（例如，标准化的 XML 标签），并明确界定模糊术语。
输出冗长度 – 默认情况下，Gemini 3 的回答较为简洁，倾向于直接、高效的答案。如需更具对话性或“啰嗦”的回复，请明确请求。
多模态连贯性 – 将文本、图像、音频和视频视为同等类别的输入。清晰地引用具体模态，使模型在跨模态之间进行综合，而不是孤立分析。
约束放置位置 – 将行为约束和角色定义放在 System Instruction 中或提示的最顶部，以锚定模型的推理过程。
长上下文结构 – 在处理大规模上下文（书籍、代码库、长视频）时，将具体指令放在提示的末尾（即数据上下文之后）。

Gemini 3 Pro 是我们在 agentic coding 方面最先进的模型。为帮助开发者充分利用其能力，我们与研究团队合作，创建了一个 System Instructions 模板。

Agentic SI Template 已在多个 agentic 基准测试中提升了模型表现。
要开始使用这些新特性，请在系统提示中加入该模板，并按上述方式调整参数。

请查看 Gemini 3 文档 并阅读 开发者指南 以获取技术实现细节。

Previous | Next

Gemini 3 的新 Gemini API 更新

Gemini API 在 Gemini 3 中的新功能

使用 Gemini 3 Pro API 的最佳实践

相关文章

ChatLLM 提出简化方案以解决 AI 的真实瓶颈

使用 Gemini 3 的真实世界代理示例

使用 Gemini 3 的真实世界代理示例

使用 Gemini 3 的真实世界代理示例

Gemini API 在 Gemini 3 中的新功能

使用 Gemini 3 Pro API 的最佳实践

相关文章

ChatLLM 提出简化方案以解决 AI 的真实瓶颈

使用 Gemini 3 的真实世界代理示例

使用 Gemini 3 的真实世界代理示例

使用 Gemini 3 的真实世界代理示例

Gemini API 在 Gemini 3 中的新功能

使用 Gemini 3 Pro API 的最佳实践