Google 详细介绍类似 MCP 的 “AppFunctions”,让 Gemini 使用 Android 应用
Source: 9to5Google

在今天的 Gemini 自动化 公告之后,Google 正在详细说明这些功能在 Android 上是如何在底层实现的。
Google 正在“引入早期阶段的开发者能力,以弥合您的应用与具备代理功能的应用以及个性化助手(如 Google Gemini)之间的差距”。虽然我们仍处于此旅程的早期测试阶段,但我们正以隐私和安全为核心来设计这些功能,这是我们在探索作为应用生态系统的范式转变时的第一步。
AppFunctions
Android 有两种方式,首先是 AppFunctions。这项功能在去年悄然发布,现在才被详细阐述。
AppFunctions 是一个 Android 16 平台特性以及配套的 Jetpack 库,它允许应用向调用方(如代理应用)公开特定功能,以便在设备上访问和执行。
开发者将应用的能力描述为工具,供代理和 AI 助手(如 Gemini)使用。Google 将 AppFunctions 等同于在代理和服务器端工具中流行的模型上下文协议(MCP)。不过,这些功能是在 Android 设备本地运行。示例用例包括:
任务管理与生产力
- 用户请求: “提醒我今天下午 5 点在公司取我的包裹。”
- AppFunction 动作: 调用方识别出相关的任务管理应用,并调用创建任务的函数,自动根据用户提示填充标题、时间和地点字段。
媒体与娱乐
- 用户请求: “创建一个包含今年最佳爵士专辑的新播放列表。”
- AppFunction 动作: 调用方在音乐应用中执行播放列表创建函数,将 “2026 年最佳爵士专辑” 作为查询传入,以生成并立即启动内容。
跨应用工作流
- 用户请求: “从 Lisa 的邮件中找到面条食谱并把配料加入我的购物清单。”
- AppFunction 动作: 该请求涉及多个应用的函数。首先,调用方使用邮件应用的搜索功能检索内容;随后提取相关配料,并调用购物清单应用的函数将配料填入用户的清单。
日历与排程
- 用户请求: “把妈妈的生日派对安排在下周一晚上 6 点,加入我的日历。”
- AppFunction 动作: 获批的代理应用调用日历应用的 “创建事件” 功能,解析 “下周一” 和 “6 点” 等上下文,直接在日历中创建条目,无需用户手动打开日历。
下面是 AppFunctions 在 Galaxy S26 上使用三星图库应用的示例。该功能也将出现在运行 OneUI 8.5 及更高版本的三星设备上。
现在,你不必手动滚动相册,只需让 Gemini 说 “显示我在三星图库中的猫咪照片”。Gemini 接收用户查询,智能识别并触发相应函数,将三星图库返回的照片直接在 Gemini 应用中展示,用户无需离开 Gemini。该体验是多模态的,可通过语音或文字完成。用户甚至可以在后续对话中使用返回的照片,例如将它们通过短信发送给朋友。
与此同时,Google 表示 Gemini 应用已经在使用 AppFunctions 为其在 Google 应用和 OEM 默认应用中的日历、笔记和任务集成提供动力。
UI 自动化
Android 也在开发第二种方法,正如在 Galaxy S26 和 Pixel 10 系列上宣布的 Gemini automation 所示。
虽然 AppFunctions 为应用提供了结构化框架和更多与 AI 代理及助理通信的控制,但并非所有交互都已有专门的集成。
Google 正在“开发一个 UI 自动化框架,使 AI 代理和助理能够智能地在用户已安装的应用上执行通用任务”。该平台承担了繁重的工作,使开发者能够零代码获得代理能力——这是一种低成本的方式,在目前无需进行大量工程投入即可扩展其影响力。
Google 表示 Android 17 将“扩大这些功能,以覆盖更多用户、开发者和设备制造商”。我们目前正与少数应用开发者合作构建体验,专注于在生态系统演进过程中提供高质量的用户体验。关于使用 AppFunctions 和 UI 自动化进行代理集成的更多细节将在今年晚些时候公布,敬请关注更新。