使用 Gemini 3 的真实世界代理示例

发布: (2025年12月20日 GMT+8 01:15)
8 min read

Source: Google Developers Blog

December 18, 2025

我们正进入一个新的代理式 AI 阶段。开发者正从简单的笔记本转向构建复杂、可投入生产的代理工作流,这些工作流能够处理真实世界的任务——从浏览器自动化到社交媒体交互。

Gemini 3 被设计为这些工作流的核心编排器。对推理深度和状态管理的精确控制帮助解决了长期以来使 AI 代理难以部署的可靠性挑战。

但这在实际中是怎样的呢?理论固然重要,看到代码更直观。

我们与六个开源框架和工具合作,创建了可克隆、运行并检查的示例,展示 Gemini 3 如何驱动下一代 AI 代理。

Source:

1. ADK(Agent Development Kit)

ADK logo

Agent Development Kit (ADK) 是由 Google 开发的开源、模型无关框架,旨在让构建、测试和部署 AI 代理的过程像标准软件开发一样顺畅。它提供了构建可扩展代理工作流所需的架构原语,适用于从简单聊天机器人到复杂多代理系统的各种场景。ADK 自豪地支持 任何 大语言模型(LLM),但与 Gemini 系列模型有特殊的协同关系,并被设计为最大化 Gemini 独特能力的发挥。

零售地点策略 示例代理展示了如何将多个专用代理组合成一个工具:

  • 使用配备 Google Search、Google Maps、即时 HTML 生成以及代码执行等工具的 Gemini 3,用于更深入的数据处理和分析。
  • 包含通过全新 Nano Banana Pro 模型进行的图像生成。
  • 代理在一个线性但灵活的流程中协同工作,具备自我反思和纠错机制,生成可靠、基于事实的细节,并将这些信息组织、合成为可下载的报告和信息图。

所有示例均可在 Agent Garden 中方便获取:

欢迎探索、修改并扩展 ADK,以适配您自己的 AI 代理项目。

2. Agno

Agno logo

Agno(前身为 Phidata)是一个流行的开源框架,用于构建具备记忆、知识和工具的多代理系统。Agno 使开发者能够创建专门的 AI 代理——例如金融分析师或研究员——它们可以自主查询 API 并对数据进行推理。

在此演示中,Agno 与 Gemini 3 Pro 配合,构建了一个完全依赖原生模型能力的多代理套件。它展示了使用 Nano Banana Pro 工具进行图像生成的创意工作室,以及使用内置的:

Agno example

3. 浏览器使用

Browser Use logo

Browser Use 是一个开源库,使 AI 代理能够与网站交互。它处理了大型语言模型(LLM)推理与实际浏览器操作——点击、输入、导航——之间的复杂桥梁,从而实现强大的网页自动化。

demo 展示了由 Gemini 3 Pro 驱动的表单填写 AI 代理。代理不再依赖脆弱的 CSS 选择器,而是利用 Gemini 3 的多模态能力来:

  • 视觉识别字段
  • 将结构化 JSON 数据映射到复杂输入
  • 自动处理文件上传

模型的推理速度确保自动化流畅可靠,即使在处理多步骤表单或跨域 iframe 时亦是如此。

Browser Use example

4. Eigent

Eigent 徽标

Eigent 是一个本地优先的多代理平台,旨在自动化复杂的工作任务。它使用户能够在自己的基础设施上直接创建并运行一支由专门 AI 代理组成的团队,底层使用 CAMEL 框架。

在本指南中,Eigent 将 CAMEL 劳动力架构应用于企业浏览器自动化,特别是管理 Salesforce 的交易周期。AI 代理自主地在复杂的仪表板中导航,以更新记录并提取数据。通过利用 Gemini 3 的思考签名,系统在长时任务中保持推理状态,帮助防止上下文漂移并确保可靠性。

Eigent 示例

5. Letta

Letta 标志

Letta(来自 MemGPT 的创始团队)是一个用于构建具备高级记忆管理的有状态 AI 代理的平台。它向大语言模型引入了 记忆层级 的概念,使代理能够有效管理自己的上下文窗口,并在不“遗忘”核心指令或历史的情况下无限运行。

演示展示了一个使用 Letta 并由 Gemini 3 提供动力的 社交代理

  • 持久记忆会随交互而演进。
  • 多层次记忆系统,打造稳定的角色形象。
  • Gemini 3 作为推理引擎,使用动态的、针对每位用户的记忆块,实现个性化交互。
  • 跨长期操作的状态管理。

Letta 社交代理代码示例

6. mem0

mem0 标志

mem0 是一个用于 AI 应用的记忆层框架。它解决了代理式 AI 中最大的障碍之一:无状态性。通过提供智能的、自我改进的记忆层,mem0 使 AI 代理能够记住用户偏好、过去的交互以及长期上下文,从而更加个性化和高效。

本指南中,你可以学习如何使用 mem0-mcp-server 与 Gemini 3 构建快速、智能、具备记忆感知的代理。

mem0 示例代码

今天开始构建

这些示例表明,AI 代理的未来不仅仅关乎模型本身;更在于让模型与世界交互的工具生态系统。

我们邀请您克隆这些代码库,运行示例,亲自体验 Gemini 3 的功能。欲了解更深入的技术实现细节,请查阅 Gemini 3 开发者指南

Back to Blog

相关文章

阅读更多 »