Gemini 3 的新 Gemini API 更新
Source: Google Developers Blog
NOV. 25, 2025
Gemini 3,我们最智能的模型,现已通过 Gemini API 向开发者开放。为支持其最前沿的推理、自治编码、多模态理解以及强大的代理能力,我们推出了多项更新。这些更改让您能够更好地控制模型的推理方式、媒体处理方式以及与外部世界的交互方式。
Gemini 3 在 Gemini API 中的新功能
-
简化的思考控制参数
从 Gemini 3 开始,全新的thinking_level参数让您可以控制模型在生成响应前的内部推理最大深度。各级别是相对指南,而非严格的 token 保证。- 设置为
"high"以处理需要最佳思考的复杂任务(例如,战略业务分析、扫描代码中的漏洞)。 - 设置为
"low"以满足对延迟和成本敏感的应用,如结构化数据抽取或摘要。
更多信息请参阅此处。
- 设置为
-
对多模态视觉处理的细粒度控制
media_resolution参数让您可以配置图像、视频和文档输入使用的 token 数量,在视觉保真度与 token 使用之间取得平衡。选项有media_resolution_low、media_resolution_medium或media_resolution_high,可对每个媒体部分或全局设置。如果未指定,模型将使用基于媒体类型的最佳默认值。更高的分辨率有助于读取细小文字或识别微小细节,但会增加 token 使用量和延迟。 -
思考签名以提升函数调用和图像生成性能
Gemini 3 现在会返回 Thought Signatures——模型内部思考过程的加密表示。将这些签名在后续 API 调用中传回,可在对话中保持推理链路,这对复杂的多步骤代理工作流至关重要。- 使用官方 SDK 和标准聊天历史时,思考签名会自动处理。
- 函数调用:对“当前回合”进行严格验证。缺少签名会导致 400 错误。详情请见此处。
- 文本/聊天生成:验证并非强制,但省略签名会降低推理和答案质量。
- 图像生成/编辑:对所有模型部分(包括
thoughtSignature)进行严格验证。缺少签名同样返回 400 错误。
-
结合结构化输出的检索与 URL 上下文
您现在可以将 Gemini 托管的工具——尤其是通过 Google Search 的检索和 URL 上下文——与结构化输出相结合。这对需要从网络或特定网页获取实时信息并将其提取为精确 JSON 供下游任务使用的代理非常有用。了解更多请访问此处。 -
Google Search 检索定价更新
为更好支持动态代理工作流,定价从固定的 US $35 / 1k 提示 调整为基于使用量的 US $14 / 1,000 检索查询。
使用 Gemini 3 Pro API 的最佳实践
Gemini 3 Pro 在代码生成、零样本生成、数学问题求解以及复杂多模态挑战等场景中引发了广泛关注。请遵循以下指南以获得最佳效果:
- Temperature – 将
temperature参数保持在默认值 1.0。 - 一致性与明确参数 – 在提示中保持统一结构(例如,标准化的 XML 标签),并明确界定模糊术语。
- 输出冗长度 – Gemini 3 默认给出简洁答案。如需更具对话性的语气,请显式请求。
- 多模态连贯性 – 将文本、图像、音频和视频视为同等输入。明确引用具体模态,使模型能够跨模态进行综合,而非单独分析。
- 约束放置 – 将行为约束和角色定义放在 System Instruction 或提示的最顶部,以锚定模型的推理。
- 长上下文结构 – 在处理大规模上下文(书籍、代码库、长视频)时,将具体指令放在提示的 末尾(数据上下文之后)。
Gemini 3 Pro 是我们在代理编码方面最先进的模型。为帮助开发者充分发挥其能力,我们与研究团队合作,创建了一个系统指令模板,可提升多个代理基准的表现。
要开始使用这些新特性,请浏览Gemini 3 文档并阅读开发者指南获取技术实现细节。