使用 Gemini 3 的真实世界代理示例

发布: 3天前 (2026年2月11日 GMT+8 11:35)

7 分钟阅读

原文: Google Developers Blog

Source: Google Developers Blog

请提供您希望翻译的正文内容，我将为您翻译成简体中文。

2025年12月19日

我们正进入代理式 AI 的新阶段。开发者正超越简单的笔记本，构建复杂、可投入生产的代理式工作流，能够处理现实世界的任务——从浏览器自动化到社交媒体交互。

Gemini 3 旨在作为这些工作流的核心编排器。对推理深度和状态管理的精确控制有助于解决长期以来使 AI 代理难以部署的可靠性挑战。

但这在实际中是什么样子？ 理论固然好，但看到代码更佳。

我们与六个开源框架和工具合作，创建了可 克隆、运行和检查 的示例，以了解 Gemini 3 如何驱动下一代 AI 代理。

示例框架与工具

Framework 1
Framework 2
Framework 3
Framework 4
Framework 5
Framework 6

1. ADK (Agent Development Kit)

adk-logo (1)

Agent Development Kit (ADK) 是一个 模型无关框架，旨在让构建、测试和部署 AI 代理的过程像标准软件开发一样。它提供了构建可扩展代理工作流所需的架构原语——从简单聊天机器人到复杂的多代理系统。

Retail Location Strategy sample agent 展示了如何组合专用代理，使用 Gemini 3 进行编排，将数据合成为综合策略报告。它利用 Google Search、Maps 和代码执行进行深入分析并生成可视化报告。

2. Agno

Agno 徽标

Agno（前身为 Phidata）是一个流行的开源框架，用于构建具备记忆、知识和工具的多代理系统。Agno 使开发者能够创建专门的 AI 代理——例如金融分析师或研究员——它们可以自主查询 API 并对数据进行推理。

在此演示中，Agno 与 Gemini 3 Pro 配合，构建了一个完全依赖原生模型能力的多代理套件。它展示了使用 Nano Banana Pro 工具进行图像生成的创意工作室，以及利用内置功能的研究代理：

Agno 示例

3. Browser Use

browser-use-logo

Browser Use 是一个开源库，使 AI 代理能够与网站交互。它处理 LLM 推理与实际浏览器操作（点击、输入、导航）之间的复杂桥接，从而实现强大的网页自动化。

随附的 demo 展示了一个由 Gemini 3 Pro 驱动的表单填写 AI 代理。该代理不依赖脆弱的 CSS 选择器，而是利用 Gemini 3 的多模态能力来：

视觉识别字段
将结构化 JSON 数据映射到复杂输入
自动处理文件上传

模型的推理速度确保自动化过程流畅可靠，即使在处理多步骤表单或跨域 iframe 时亦是如此。

browser-use-example

4. Eigent

Eigent 是一个本地优先的多代理平台，旨在自动化复杂的工作任务。它使用户能够在自己的基础设施上直接创建并运行一支专门的 AI 代理团队，底层使用 CAMEL 框架。

在本指南中，Eigent 将 CAMEL 劳动力架构应用于企业浏览器自动化，特别是管理 Salesforce 的交易周期。AI 代理自主地在复杂的仪表板中导航，以更新记录并提取数据。通过利用 Gemini 3 的思考签名，系统在长时任务中保持推理状态，有助于防止上下文漂移并确保可靠性。

eigent‑example‑1

5. Letta

Letta logo

Letta（来自 MemGPT 的创始团队）是一个用于构建具备高级记忆管理的有状态 AI 代理的平台。它向大语言模型引入了 记忆层级 的概念，使代理能够有效管理自己的上下文窗口，并在不“遗忘”核心指令或历史的情况下无限运行。

该 demo 展示了一个使用 Letta 构建、由 Gemini 3 驱动的“社交代理”。它演示了将有状态 AI 代理部署到社交网络的框架。代理保持持久记忆，随着交互而演进，并利用 Letta 的多层记忆系统形成稳定的角色。Gemini 3 充当推理引擎，使用动态的、按用户划分的记忆块实现个性化交互，并在长期运行中管理代理的状态。

6. mem0

mem0 是一个面向 AI 应用的记忆层框架。它解决了代理式 AI 最大的障碍之一：无状态性。通过提供智能的、自我改进的记忆层，mem0 使 AI 代理能够记住用户偏好、过去的交互以及长期上下文，从而更加个性化和高效。

在此指南中，您可以学习如何使用 mem0-mcp-server 与 Gemini 3 构建快速、智能、具备记忆感知的代理。

mem0-example-code

开始构建今天

AI 代理的未来不仅关乎模型本身，更在于让模型与世界交互的工具生态系统。

我们邀请您 克隆这些仓库，运行示例，亲自体验 Gemini 3 的强大功能。欲了解更深入的技术实现细节，请查阅 Gemini 3 开发者指南。

导航

使用 Gemini 3 的真实世界代理示例

2025年12月19日

示例框架与工具

1. ADK (Agent Development Kit)

2. Agno

3. Browser Use

4. Eigent

5. Letta

6. mem0

开始构建今天

相关文章

更快访问公共数据洞察：Data Commons MCP 现已托管在 Google Cloud

介绍 Developer Knowledge API 和 MCP Server

使用 hooks 将 Gemini CLI 定制为你的工作流

轻松使用 Tunix 在 Google TPUs 上进行 FunctionGemma 微调