使用 Gemini Embedding 2 构建:Agentic multimodal RAG 与更进一步
发布: (2026年5月2日 GMT+8 13:40)
1 分钟阅读
Source: Google Developers Blog
Gemini Embedding 2 现已正式发布
Google 已宣布 Gemini Embedding 2 正式对外提供,这是一种统一模型,可将文本、图像、视频、音频和文档映射到同一语义空间。该模型允许开发者在单个请求中处理交错的多模态输入,显著提升代理式 RAG、视觉搜索和内容审核等任务的性能。模型支持 100 多种语言,并提供任务特定前缀和 Matryoshka 降维等功能,为构建复杂 AI 代理提供高效且准确的基础。