Gemini 3 Flash 现已在 Gemini CLI 中可用
Source: Google Developers Blog
2025年12月17日
Gemini 3 Flash 现已在 Gemini CLI 中提供
Gemini 3 Flash 现已集成到 Gemini CLI,支持高频率、基于终端的工作流。
- 性能: 在代理编码方面取得 SWE‑bench Verified 评分 78 %,超越 2.5 系列和 Gemini 3 Pro。
- 效率: 旨在推动 质量 vs. 成本与速度 的帕累托前沿。
- 成本: 预览版的费用 不到 Gemini 3 Pro 的四分之一。
- 速度与质量: 由我们两款最佳模型驱动 Gemini CLI,您无需在速度与质量之间做出取舍。
开始使用 Gemini 3 Flash 与 Gemini CLI
从今天起,大多数 Gemini CLI 的付费用户都可以使用 Gemini 3 Pro 和 Gemini 3 Flash,包括:
- 所有 Google AI Pro 或 AI Ultra 的非企业客户
- 通过 Google AI 或 Vertex 使用付费 API 密钥的用户
- 已经由其云管理员 为预览模型启用 的 Gemini Code Assist 用户
(管理员说明)
对免费用户
- 所有在之前候补名单中注册的用户已完成入驻——请查看您的电子邮件获取详情。
- 如果您不在候补名单中,我们将逐步放宽访问权限,以保持体验的快速和可靠。敬请关注,或查看我们的文档了解您当前的选项。
升级 Gemini CLI
将其升级到最新版本(0.21.1 或更高):
npm install -g @google/gemini-cli@latest
确认升级:
gemini --version # should show 0.21.1 or later
启用预览功能
- 运行
/settings命令。 - 将 Preview features 切换为 true。
- 运行
/model并选择 Gemini 3。

有什么新功能?
- Intelligent auto‑routing: Gemini CLI 自动为高度复杂的推理任务保留 Gemini 3 Pro。
- Manual selector: 为所有任务选择特定模型。
- Gemini 3 Flash: 提供显著的推理改进,使您能够运行之前需要较慢 Pro 级别才能完成的提示——且成本更低。
在终端中使用改进的代理式编码构建任何东西
Gemini 3 Flash 通过强大的推理、工具使用和多模态能力提升了你的编码会话的性能底线。
生成可直接部署的 3D 图形应用
我们在 Gemini CLI 中使用 Gemini 3 Pro 构建了金门大桥的 3D 体素模拟,将提示视为创意简报和技术规范。但 Gemini 3 Flash 能做到同样吗?
以前,在一次生成中产生这种水平的功能代码更适合 Pro 模型。例如,Gemini 2.5 Flash 常常在处理这种复杂性时出现逻辑错误,导致代码破碎。虽然 Gemini 3 Pro 的最先进推理能够产生更具视觉吸引力的结果,但 Gemini 3 Flash 仍然能够精准完成任务,展示了快速原型工具不必在代码质量上妥协。
视频占位符 – 可在可用时替换为实际视频嵌入。
Source: …
改善你的日常工作
开发助理的真正考验在于它如何处理你一天中执行的大量实际任务。Gemini 3 Flash 的表现优于 2.5 Pro,且速度提升 3 倍,成本仅为其一小部分(基于 Artificial Analysis 基准)。
大上下文窗口下的操作代码更改
管理大型代码库往往意味着要在数百条 Pull Request 评论中筛选出唯一可执行的项。这需要模型能够在保持庞大上下文窗口的同时,不遗漏具体指令。
在本演示中,Gemini 3 Flash 处理了一个包含 1,000 条评论 的模拟 Pull‑Request 线程。它快速穿透大量“闲聊”,定位到关于超时调整的唯一关键请求。随后 Gemini CLI 在第一次尝试时就将精确的更新应用到配置文件,展示了模型在海量上下文中辨别信号与噪声并执行准确编辑的能力。
视频占位符 – “抱歉,您的浏览器不支持此视频的播放。”
模拟真实用户流量进行压力测试
验证后端基础设施需要模拟真实用户行为的流量,但编写能够处理并发和特定用户旅程的自定义压测脚本往往耗时。Gemini 3 Flash 非常适合此类任务,它能够降低语法幻觉和失败循环,同时仍提供快速响应。
在本演示中,使用 Gemini CLI 对托管在 Cloud Run 上的 Web 应用进行压力测试。Gemini 3 Flash 生成了一个使用 asyncio 的 Python 脚本,以模拟三个不同场景下的并发用户:
- 订单成功
- 支付失败
- 库存超时
当首次执行返回协议错误时,模型立即分析回溯并修补脚本。随后你可以启动全面的负载测试,并在几秒钟内在 Cloud Run 仪表盘中查看生成的指标。
视频占位符 – “抱歉,您的浏览器不支持此视频的播放。”
更长时间保持工作流
Gemini 3 Flash 为终端中高频开发任务提供了新的性能基准。通过提升性能底线并与 Gemini CLI 的自动路由集成,它帮助您更快、更高效地工作。无论是构建新原型还是管理复杂基础设施,您现在都有一个能够跟上您工作节奏的开发助理。
立即更新您的 Gemini CLI 到最新版本,使用 Gemini 3 Flash 开始更快构建——以更低的每标记成本。