Gemini 3 Flash 现已在 Gemini CLI 中可用
Source: Google Developers Blog
请提供您希望翻译的正文内容,我将为您翻译成简体中文并保持原有的格式、Markdown 语法以及技术术语不变。
2025年12月17日
Gemini 3 Flash 现已在 Gemini CLI 中提供,支持终端工作中常见的高频工作流。
Gemini 3 Flash 实现了 SWE‑bench Verified score of 78 %,在代理编码方面表现优于 2.5 系列以及 Gemini 3 Pro。
Gemini 3 Flash 的构建目标是高效,推动质量‑成本‑速度的 Pareto 前沿。它以 低于 Gemini 3 Pro 成本的四分之一 的价格提供预览版。凭借我们两款最佳模型驱动 Gemini CLI,速度不再意味着牺牲质量。
开始使用 Gemini 3 Flash 与 Gemini CLI
从今天起,大多数 Gemini CLI 的付费用户都可以使用 Gemini 3 Pro 和 Gemini 3 Flash,包括:
- 所有 Google AI Pro 或 AI Ultra 的非企业客户
- 通过 Google AI 或 Vertex 使用付费 API 密钥的用户
- 已经由其云管理员 启用 预览模型的 Gemini Code Assist 用户
免费用户
- 所有在之前等待名单上注册的用户已完成入驻——请检查您的电子邮件获取详情。
- 如果您不在等待名单上,我们正在逐步推出额外的访问权限,以保持体验的快速和可靠。敬请关注,或查看我们的文档了解您当前的选项。
开始使用
-
升级 Gemini CLI 到最新版本(≥ 0.21.1):
npm install -g @google/gemini-cli@latest -
验证已安装的版本为 0.21.1 或更高。
-
运行
/settings命令并将 Preview features 切换为 true。 -
启用预览功能后,运行
/model并选择 Gemini 3。
此版本将 Gemini 3 系列的完整功能带到您的终端。您可以依赖 Gemini CLI 的智能自动路由,将 Gemini 3 Pro 保留用于高度复杂的推理,或使用手动选择器将特定模型专用于所有任务。Gemini 3 Flash 在推理方面的显著提升,使您能够以更低成本执行此前只能使用更慢的 Pro 级模型的提示。
在终端中构建任何东西,提升代理式编码
Gemini 3 Flash 通过强大的推理、工具使用和多模态能力,提高了编码会话的性能底线。
生成可直接部署的 3D 图形应用
我们在 Gemini CLI 中使用 Gemini 3 Pro 构建了金门大桥的 3D 体素模拟,将提示视为创意简报和技术规格。但 Gemini 3 Flash 能做到吗?
此前,在一次性生成此类功能代码更适合 Pro 模型。例如 Gemini 2.5 Flash 往往在处理这种复杂度时会出现逻辑错误。虽然 Gemini 3 Pro 的先进推理能够产生更具视觉吸引力的结果,Gemini 3 Flash 仍然能够精准完成任务,展示了快速原型工具不必在代码质量上妥协。
改善您的日常工作
开发助理的真正考验在于它如何处理您一天中执行的大量实际任务。Gemini 3 Flash 的表现优于 2.5 Pro,且 速度提升 3 倍,成本仅为其一小部分(基于 Artificial Analysis 基准测试)。
来自大上下文窗口的行动‑代码更改
管理大型代码库往往意味着要在拉取请求的数百条评论中筛选出唯一可执行的项。这需要模型能够保持巨大的上下文窗口而不丢失具体指令。
在本演示中,Gemini 3 Flash 处理了一个包含 1,000 条评论 的模拟拉取请求线程。它穿透大量“闲聊”,定位到关于超时调整的唯一关键请求。随后 Gemini CLI 在第一次尝试时就将精确的更新应用到配置文件,展示了模型在海量上下文中区分信号与噪声并执行准确编辑的能力。
视频占位符 – “Sorry, your browser doesn’t support playback for this video.”
模拟真实用户流量进行压力测试
验证后端基础设施需要模拟真实用户行为的流量,但编写能够处理并发和特定用户旅程的自定义负载测试脚本往往耗时。Gemini 3 Flash 非常适合此类任务,它能够降低语法幻觉和失败循环,同时仍提供快速响应。
在本演示中,使用 Gemini CLI 对托管在 Cloud Run 上的 Web 应用进行压力测试。Gemini 3 Flash 生成了一个使用 asyncio 的 Python 脚本,以模拟三个不同场景下的并发用户:
- 订单成功
- 支付失败
- 库存超时
当首次执行返回协议错误时,模型立即分析回溯信息并修补脚本。这样您即可在几秒钟内启动全面的负载测试,并在 Cloud Run 仪表板中观察相应指标。
视频占位符 – “Sorry, your browser doesn’t support playback for this video.”
更长时间保持专注
Gemini 3 Flash 为终端中的高频开发任务提供了新的性能基准。通过提升性能底线并与 Gemini CLI 的自动路由集成,它帮助您更快、更高效地工作。无论是构建新原型还是管理复杂基础设施,您现在都有一个能够跟上工作节奏的开发助理。
立即更新您的 Gemini CLI 到最新版本,使用 Gemini 3 Flash 以更快的速度构建——并以更低的每令牌成本。