第3部分:精通 Gemini CLI – 内容创作、学习与多模态

发布: (2026年2月10日 GMT+8 03:19)
6 分钟阅读
原文: Dev.to

Source: Dev.to

(请提供您希望翻译的正文内容,我将为您翻译成简体中文,并保持原有的格式、Markdown 语法和技术术语不变。)

介绍

欢迎来到我们的 Gemini CLI 系列的终章!

Part 1 中我们已安装了 CLI 并完成了环境配置。 在 Part 2 中我们探索了编码工作流、数据分析以及工作区中的扩展。

现在我们将超越单纯的文本和代码。我们将探讨 multimodality(处理图像、音频和 PDF),并把你的终端变成终极的 Personal Tutor。如果你认为命令行只能用于枯燥的文字,这篇文章会让你改观。

1. 使用扩展进行内容创作 – “NanoBanana” 工作流

Gemini 最大的优势之一是它是 多模态——能够原生理解代码、文本、图像和音频。为了在终端中利用这一点,我们使用 扩展

Google 最近推出了一个强大的 extensions framework,让你几乎可以把任何东西接入 CLI。一个受社区欢迎的创意内容生成扩展是 NanoBanana。该工具将你的 CLI 与图像生成模型(例如 gemini-2.5-flash-image)相连,使你无需离开代码编辑器就能创建占位资产、图标或视觉概念。

如何连接 NanoBanana

让你的 CLI “拥有图像视野” 只需一条命令。

步骤 1 – 安装扩展

gemini extensions install https://github.com/gemini-cli-extensions/nanobanana

步骤 2 – 重启并验证

重启 CLI。现在你可以使用斜杠命令,如 /generate/icon

步骤 3 – 生成创意资产

假设你正在构建一款移动应用,需要一个快速的占位图标用于 “赛博朋克待办列表”

提示词:

“使用 NanoBanana 扩展,/generate 一个生产力应用的图标,采用赛博朋克霓虹美学。保持简洁,矢量风格,黑色背景。”

为什么这很重要:

你可以在不离开编码环境的情况下编排创意工作流。你将成为直接从命令行工作的 “技术艺术家”,在编写后端代码的同时快速原型化 UI 元素。

Installing the NanoBanana extension

结果:

Generated icon example

Source:

2. Gemini CLI 作为你的个人导师

Gemini 3 Flash 最被低估的功能是其巨大的 上下文窗口。它可以在几秒钟内读取大型文件——整本书或长篇 PDF 研究论文——将 CLI 变成强大的学习伙伴,为你生成主动学习材料。

场景:大学生 / 自学者

你有一份 50 页的 PDF,名为 Advanced_Algorithms.pdf,明天要考试。

第 1 步 – 摘要

gemini "Read @Advanced_Algorithms.pdf. Summarize the key concepts by chapter. Use bullet points and simple language."

第 2 步 – 生成抽认卡

gemini "Based on @Advanced_Algorithms.pdf, generate 10 flashcards. Format them as: 'Front: [Question] | Back: [Answer]' so I can import them into Anki."

第 3 步 – 模拟考试

gemini "Act as a strict professor. Create a 5‑question multiple‑choice quiz based on Chapter 3 of the PDF. Don't give me the answers until I try to answer them."

3. 用网络搜索为你的知识提供依据

大型语言模型有时会出现“幻觉”或依赖过时的训练数据。Gemini CLI 内置了 Google Search 工具(通常称为 Grounding),可从网络获取最新信息。

示例:学习新框架

如果你向普通 AI 询问库的最新版本,它可能会给出旧代码。

提示:

“我想使用 React 19 的新特性。请在网上搜索官方的 React 19 发布说明和文档。然后,解释前三个破坏性变更,并为每个变更提供代码示例。”

为什么这能提升权威性:

通过确保在你的 /settings 中启用了 /google 工具(或网络搜索功能),你可以保证代码是最新的,并且已通过真实世界的来源进行事实核查。

Source:

结论 – “全能”开发者

我们在本系列中已经走了很长的路:

  • 安装与基础: 探索了 CLI。
  • 工作流自动化: 连接了扩展、工作区和数据分析。
  • 精通: 使用 NanoBanana 等扩展进行创作,并将 PDF 转换为交互式学习材料。

现在,你拥有了一个多模态、可扩展、以知识为基础的命令行环境——它是你的个人导师、创意工作室和开发中心的集合体。祝你玩得开心!

The Gemini CLI isn't just a tool; it's a layer of intelligence over your entire operating system.  
It allows you to build faster, learn quicker, and create more—all from the comfort of your terminal.

**Now, it’s your turn.**

Download the CLI, install an extension, and build something amazing.  
Don't forget to share your creations!

*Special thanks to the DeepLearning.AI course ["Gemini CLI"](https://www.deeplearning.ai/short-courses/gemini-cli-code-and-create-with-an-open-source-agent/) for the inspiration for this blog post.*

[@leslysandra](https://dev.to/leslysandra)
0 浏览
Back to Blog

相关文章

阅读更多 »

解锁笔记本电脑 GPU 的隐藏力量

概述:大多数现代笔记本电脑都配备了强大的 GPU,但往往未被充分利用。无论你是运行本地 LLM 的软件工程师,还是数据科学家……