Gemini 3 的新 Gemini API 更新
Source: Google Developers Blog
2025年11月25日
Gemini API 在 Gemini 3 中的新功能
-
简化的思考控制参数
从 Gemini 3 开始,我们引入了一个名为thinking_level的新参数,用于控制模型在生成响应前的最大思考深度。Gemini 3 将这些层级视为相对的推理指南,而非严格的 token 保证。"high"– 适用于需要最佳思考的复杂任务(例如,战略业务分析、扫描代码中的漏洞)。"low"– 适用于对延迟和成本敏感的应用,如结构化数据抽取或摘要。
更多信息请参见此处。
-
对多模态视觉处理的细粒度控制
media_resolution参数让您可以配置图像、视频和文档输入使用的 token 数量,从而在视觉保真度与 token 使用之间取得平衡。可以针对每个媒体部分或全局设置为以下之一:media_resolution_low、media_resolution_medium或media_resolution_high。如果未指定,模型将使用基于媒体类型的最佳默认值。更高的分辨率能够提升模型读取细小文字或识别微小细节的能力,但会增加 token 使用量和延迟。 -
思考签名以提升函数调用和图像生成性能
从 Gemini 3 开始,API 强制返回**Thought Signatures**——模型内部思考过程的加密表示。将这些签名在后续调用中传回,可确保 Gemini 3 在对话中保持推理链,这对复杂的多步骤代理工作流至关重要。 -
结构化输出的 Grounding 与 URL 上下文
现在您可以将 Gemini 托管的工具——特别是Google Search Grounding和URL 上下文——与结构化输出结合使用。这对于需要从网络或特定网页获取实时信息并将其提取为精确 JSON 供下游任务使用的代理非常有用。示例请参见此处。 -
Google Search Grounding 定价更新
为更好地支持动态代理工作流,我们将从固定费率(US $35 / 1k 提示)转为更细粒度的基于使用量的费率——US $14 / 1,000 次搜索查询。
Source: …
使用 Gemini 3 Pro API 的最佳实践
我们已经看到对 Gemini 3 Pro 的广泛兴趣——尤其是在 Vibe 编码、零样本生成、数学问题求解、复杂多模态理解以及许多其他使用场景中。为了在推动 Gemini 3 边界的同时获得最佳结果,请遵循以下指南(更多细节请参见此处):
- Temperature – 将
temperature参数保持在默认值 1.0。 - 一致性与定义参数 – 在整个提示中保持统一的结构(例如,标准化的 XML 标签),并明确界定模糊术语。
- 输出冗长度 – 默认情况下,Gemini 3 的回答较为简洁,倾向于直接、高效的答案。如需更具对话性或“啰嗦”的回复,请明确请求。
- 多模态连贯性 – 将文本、图像、音频和视频视为同等类别的输入。清晰地引用具体模态,使模型在跨模态之间进行综合,而不是孤立分析。
- 约束放置位置 – 将行为约束和角色定义放在 System Instruction 中或提示的最顶部,以锚定模型的推理过程。
- 长上下文结构 – 在处理大规模上下文(书籍、代码库、长视频)时,将具体指令放在提示的 末尾(即数据上下文之后)。
Gemini 3 Pro 是我们在 agentic coding 方面最先进的模型。为帮助开发者充分利用其能力,我们与研究团队合作,创建了一个 System Instructions 模板。
Agentic SI Template 已在多个 agentic 基准测试中提升了模型表现。
要开始使用这些新特性,请在系统提示中加入该模板,并按上述方式调整参数。
请查看 Gemini 3 文档 并阅读 开发者指南 以获取技术实现细节。