Gemini 3 Flash 现已在 Gemini CLI 中可用
Source: Google Developers Blog
(未提供需要翻译的正文内容。如需翻译,请粘贴完整的文本。)
概览
2025年12月17日 – Gemini 3 Flash 现已在 Gemini CLI 中提供,支持终端工作中常见的高频工作流。
Gemini 3 Flash 在代理式编码方面取得了 SWE‑bench Verified 78 % 的得分,不仅超越了 2.5 系列,还超越了 Gemini 3 Pro。Gemini 3 Flash 旨在高效运行,推动质量、成本和速度的帕累托前沿,并在预览版中以 不到 Gemini 3 Pro 成本的四分之一 提供。凭借我们两款最佳模型为 Gemini CLI 提供动力,速度不再意味着要牺牲质量。
开始使用 Gemini 3 Flash 与 Gemini CLI
从今天起,大多数 Gemini CLI 的付费用户都可以使用 Gemini 3 Pro 和 Gemini 3 Flash,包括:
- 所有 Google AI Pro 或 AI Ultra 的非企业客户
- 通过 Google AI 或 Vertex 使用付费 API 密钥的用户
- 已经由其云管理员 为预览模型启用 的 Gemini Code Assist 用户
(查看管理员说明)
对免费用户
- 所有之前在候补名单上注册的用户已完成入驻——请查看你的电子邮件获取详情。
- 如果你不在候补名单上,我们将逐步放宽访问权限,以保持体验的快速和可靠。敬请关注,或查看我们的文档了解当前可用的选项。
升级 Gemini CLI
将升级到最新版本(0.21.1 或更高):
npm install -g @google/gemini-cli@latest
确认你的版本是 0.21.1 或更高,然后:
- 运行
/settings并将 Preview features 切换为 true。 - 运行
/model并选择 Gemini 3。
模型选择器

有什么新功能?
- Intelligent auto‑routing: Gemini CLI 自动为高度复杂的推理任务预留 Gemini 3 Pro。
- Manual selector: 如有需要,可为所有任务选择特定模型。
- Gemini 3 Flash: 大幅提升推理能力,使您能够以更低成本运行此前只能在较慢的 Pro 级别上执行的提示。
在终端中使用改进的代理编码构建任何东西
Gemini 3 Flash 通过强大的推理、工具使用和多模态能力提升了你的编码会话的性能基准。
生成可直接部署的 3D 图形应用
我们在 Gemini CLI 中使用 Gemini 3 Pro 构建了金门大桥的 3D 体素模拟,将提示既视为创意简报,又视为技术规范。但 Gemini 3 Flash 能做到同样的事吗?
以前,在一次生成中产生这种水平的功能代码更适合 Pro 模型。例如,Gemini 2.5 Flash 往往在处理这种复杂性时出现困难,导致逻辑破损。虽然 Gemini 3 Pro 的最先进推理能够产生更具视觉吸引力的结果,Gemini 3 Flash 仍然能够精准完成任务,展示了快速原型工具并不一定要牺牲代码质量。
视频占位符 – 您的浏览器可能不支持播放。
Source: …
改善你的日常工作
开发助理的真正考验在于它如何处理你在一天中执行的大量实际任务。Gemini 3 Flash 的表现优于 2.5 Pro,且 速度提升 3 倍,成本仅为其一小部分(基于 Artificial Analysis 基准测试)。
来自大上下文窗口的操作代码更改
管理大型代码库时,往往需要在数百条 Pull Request 评论中筛选出唯一可操作的项。这需要模型能够在保持庞大上下文窗口的同时,不丢失具体指令。
在本演示中,Gemini 3 Flash 处理了一个包含 1,000 条评论 的模拟 Pull‑Request 线程。它成功穿透大量“闲聊”,定位到关于超时调整的唯一关键请求。随后 Gemini CLI 在第一次尝试时即将精确的更新应用到配置文件中。这展示了模型在海量上下文中区分信号与噪声并执行准确编辑的能力。
视频不可用:你的浏览器不支持此视频的播放。
模拟真实用户流量进行压力测试
验证后端基础设施需要模拟真实用户行为的流量,但编写能够处理并发和特定用户旅程的自定义压测脚本往往耗时。Gemini 3 Flash 非常适合此类任务,可降低语法幻觉和失败循环,同时仍提供快速响应。
在本演示中,使用 Gemini CLI 对托管在 Cloud Run 上的 Web 应用进行压力测试。Gemini 3 Flash 生成了一个使用 asyncio 的 Python 脚本,以模拟三种不同场景下的并发用户:
- 订单成功
- 支付失败
- 库存超时
当首次执行返回协议错误时,模型立即分析回溯信息并修补脚本。这样,你即可在几秒钟内启动全面的负载测试,并在 Cloud Run 仪表板中观察到相应的指标。
视频不可用:你的浏览器不支持此视频的播放。
更长时间保持流畅
Gemini 3 Flash 为终端中的高频开发任务提供了全新的性能基准。通过提升性能底线并与 Gemini CLI 的自动路由集成,它帮助您更快、更高效地工作。无论您是在构建新原型还是管理复杂基础设施,现在您拥有一个能够跟上您工作节奏的开发助手。
立即将您的 Gemini CLI 更新至最新版本,使用 Gemini 3 Flash 开始更快地构建——并以更低的每令牌成本。