第3部分:精通 Gemini CLI – 内容创作、学习与多模态
Source: Dev.to
(请提供您希望翻译的正文内容,我将为您翻译成简体中文,并保持原有的格式、Markdown 语法和技术术语不变。)
介绍
欢迎来到我们的 Gemini CLI 系列的终章!
在 Part 1 中我们已安装了 CLI 并完成了环境配置。 在 Part 2 中我们探索了编码工作流、数据分析以及工作区中的扩展。
现在我们将超越单纯的文本和代码。我们将探讨 multimodality(处理图像、音频和 PDF),并把你的终端变成终极的 Personal Tutor。如果你认为命令行只能用于枯燥的文字,这篇文章会让你改观。
1. 使用扩展进行内容创作 – “NanoBanana” 工作流
Gemini 最大的优势之一是它是 多模态——能够原生理解代码、文本、图像和音频。为了在终端中利用这一点,我们使用 扩展。
Google 最近推出了一个强大的 extensions framework,让你几乎可以把任何东西接入 CLI。一个受社区欢迎的创意内容生成扩展是 NanoBanana。该工具将你的 CLI 与图像生成模型(例如 gemini-2.5-flash-image)相连,使你无需离开代码编辑器就能创建占位资产、图标或视觉概念。
如何连接 NanoBanana
让你的 CLI “拥有图像视野” 只需一条命令。
步骤 1 – 安装扩展
gemini extensions install https://github.com/gemini-cli-extensions/nanobanana
步骤 2 – 重启并验证
重启 CLI。现在你可以使用斜杠命令,如 /generate 或 /icon。
步骤 3 – 生成创意资产
假设你正在构建一款移动应用,需要一个快速的占位图标用于 “赛博朋克待办列表”。
提示词:
“使用 NanoBanana 扩展,/generate 一个生产力应用的图标,采用赛博朋克霓虹美学。保持简洁,矢量风格,黑色背景。”
为什么这很重要:
你可以在不离开编码环境的情况下编排创意工作流。你将成为直接从命令行工作的 “技术艺术家”,在编写后端代码的同时快速原型化 UI 元素。

结果:

Source: …
2. Gemini CLI 作为你的个人导师
Gemini 3 Flash 最被低估的功能是其巨大的 上下文窗口。它可以在几秒钟内读取大型文件——整本书或长篇 PDF 研究论文——将 CLI 变成强大的学习伙伴,为你生成主动学习材料。
场景:大学生 / 自学者
你有一份 50 页的 PDF,名为 Advanced_Algorithms.pdf,明天要考试。
第 1 步 – 摘要
gemini "Read @Advanced_Algorithms.pdf. Summarize the key concepts by chapter. Use bullet points and simple language."
第 2 步 – 生成抽认卡
gemini "Based on @Advanced_Algorithms.pdf, generate 10 flashcards. Format them as: 'Front: [Question] | Back: [Answer]' so I can import them into Anki."
第 3 步 – 模拟考试
gemini "Act as a strict professor. Create a 5‑question multiple‑choice quiz based on Chapter 3 of the PDF. Don't give me the answers until I try to answer them."
3. 用网络搜索为你的知识提供依据
大型语言模型有时会出现“幻觉”或依赖过时的训练数据。Gemini CLI 内置了 Google Search 工具(通常称为 Grounding),可从网络获取最新信息。
示例:学习新框架
如果你向普通 AI 询问库的最新版本,它可能会给出旧代码。
提示:
“我想使用 React 19 的新特性。请在网上搜索官方的 React 19 发布说明和文档。然后,解释前三个破坏性变更,并为每个变更提供代码示例。”
为什么这能提升权威性:
通过确保在你的 /settings 中启用了 /google 工具(或网络搜索功能),你可以保证代码是最新的,并且已通过真实世界的来源进行事实核查。
Source: …
结论 – “全能”开发者
我们在本系列中已经走了很长的路:
- 安装与基础: 探索了 CLI。
- 工作流自动化: 连接了扩展、工作区和数据分析。
- 精通: 使用 NanoBanana 等扩展进行创作,并将 PDF 转换为交互式学习材料。
现在,你拥有了一个多模态、可扩展、以知识为基础的命令行环境——它是你的个人导师、创意工作室和开发中心的集合体。祝你玩得开心!
The Gemini CLI isn't just a tool; it's a layer of intelligence over your entire operating system.
It allows you to build faster, learn quicker, and create more—all from the comfort of your terminal.
**Now, it’s your turn.**
Download the CLI, install an extension, and build something amazing.
Don't forget to share your creations!
*Special thanks to the DeepLearning.AI course ["Gemini CLI"](https://www.deeplearning.ai/short-courses/gemini-cli-code-and-create-with-an-open-source-agent/) for the inspiration for this blog post.*
[@leslysandra](https://dev.to/leslysandra)