使用 Gemini Embedding 2 构建：Agentic multimodal RAG 与更进一步

发布: 2天前 (2026年5月2日 GMT+8 13:40)

1 分钟阅读

Source: Google Developers Blog

Gemini Embedding 2 现已正式发布

Google 已宣布 Gemini Embedding 2 正式对外提供，这是一种统一模型，可将文本、图像、视频、音频和文档映射到同一语义空间。该模型允许开发者在单个请求中处理交错的多模态输入，显著提升代理式 RAG、视觉搜索和内容审核等任务的性能。模型支持 100 多种语言，并提供任务特定前缀和 Matryoshka 降维等功能，为构建复杂 AI 代理提供高效且准确的基础。

Back to Blog

Agent Platform 中的 Agents CLI：在一个 CLI 中实现从创建到生产

Google Cloud 推出了 Agents CLI，这是一款专门的工具，旨在弥合本地开发与生产级 AI 代理部署之间的差距。Th...

生产就绪 AI 代理：从重构单体中得到的 5 条经验

概述本博文概述了将一个脆弱的销售研究原型转变为使用 Google 的 Agent Development Kit ADK 的稳健生产代理的过程。K...

MaxText 扩展后训练能力：在单主机 TPU 上引入 SFT 和 RL

在快速演进的大型语言模型（LLM）领域，预训练仅是第一步。要将基础模型转变为专门的助手或……

可投入生产的 AI 代理：从单体重构中得到的 5 条经验

概述本文描述了如何将一个脆弱的销售研究原型转变为使用 Google 的 Agent Development Kit ADK 的生产就绪 AI 代理。B...

Gemini Embedding 2 现已正式发布

相关文章

Agent Platform 中的 Agents CLI：在一个 CLI 中实现从创建到生产

生产就绪 AI 代理：从重构单体中得到的 5 条经验

MaxText 扩展后训练能力：在单主机 TPU 上引入 SFT 和 RL

可投入生产的 AI 代理：从单体重构中得到的 5 条经验