Google AI Edge Gallery 中的设备端函数调用
Source: Google Developers Blog
请提供您希望翻译的具体文本内容,我将为您翻译成简体中文。
February 26, 2026
AI 真正的魔力在于模型不再仅仅描述世界,而是开始与之交互。其中一种交互机制是 tool‑use:预测并调用函数(例如打开应用或调整系统设置)的能力。
将 tool‑use 移到设备端,使开发者能够构建即时响应的交互,同时在任何网络环境下都能保持完整功能。这让自然语言语音助手能够在你驾驶时瞬间创建日历事件或导航到目的地。
然而,将这种能力带到移动端仍是一个巨大的挑战。传统的函数调用一直需要大型模型,其内存占用远超移动硬件的限制。真正的工程难题在于在保持准确性的同时,将这些模型压缩到移动端的体积,并且不耗尽电池。
今日对 Google AI Edge Gallery 的公告
-
跨平台可用 – 基于 Google AI Edge 的跨平台能力,我们很高兴将 Google AI Edge Gallery 推出 iOS(App Store 链接)以及 Android(Play Store 链接)。开发者现在可以在 iOS 生态系统中直接探索同样高性能、在设备端运行的 AI 用例,这些用例由 Gemma 和其他开源模型提供支持。
-
集成 Agentic 体验 – 开箱即用的 agentic 体验 Mobile Actions 和 Tiny Garden 现已直接在画廊中提供,展示了 Google 高效的 FunctionGemma 模型如何使用仅 270 M 参数 将自然语言转换为设备端函数调用。
-
内置基准测试 – 借助我们近期 LiteRT 公告 中的最先进性能基准,应用现在加入了基准测试功能。你可以在自己的设备上测量并体验 LiteRT 在 CPU 与 GPU 上的领先性能。
这些更新让开发、测试和体验快速、私密且随时可用的设备端 AI 变得前所未有的简单。 🚀
体验 Mobile Actions 与 Tiny Garden
Mobile Actions 演示展示了 FunctionGemma 如何将基于手机的助手转变为完全离线的体验。模型会解析自然语言指令,例如
- “在地图上显示旧金山机场。”
- “为明天下午 2:30 的烹饪课程创建日历事件。”
- “打开手电筒。”
……并将每个请求映射到相应的操作系统工具或应用意图。
Tiny Garden 演示是一个交互式迷你游戏,玩家可以使用语音指令来管理虚拟花园。像 “在最上面的一排种植向日葵并浇水” 这样的指令会被模型拆解为具体的应用函数(例如 plantCrop、waterCrop)以及正确的网格坐标。这展示了 Google 的紧凑 270 M 参数 FunctionGemma 模型能够 直接在移动设备上适配高度特定、定制的游戏或应用逻辑——无需服务器调用。
演示视频
Android 上的 Mobile Actions
<video controls>
<source src="URL_TO_MOBILE_ACTIONS_VIDEO.mp4" type="video/mp4">
Sorry, your browser doesn't support playback for this video.
</video>
Android(以及截至目前的 iOS)上的 Tiny Garden
<video controls>
<source src="URL_TO_TINY_GARDEN_VIDEO.mp4" type="video/mp4">
Sorry, your browser doesn't support playback for this video.
</video>
如果你更喜欢纯 Markdown,也可以直接链接到视频:
开始你的自定义用例
现在你已经看过演示,可以将这种方法应用到自己的项目中:
- 微调 你的模型:参阅 Mobile Actions 微调指南。
- 在应用中实现函数调用:遵循 函数调用指南。
祝构建愉快!
Google AI Edge 画廊 – 现已登陆 iOS
在 Google AI Edge 的跨平台能力基础上,我们很高兴通过在 App Store 上推出 Google AI Edge 画廊,将完整的 Android 体验带入 iOS 生态系统。
内容概览
- 多轮 AI 对话 – 在设备本地运行的会话式 AI。
- 图像查询 – 本地查询图像,实时获取洞察。
- 音频速记 – 在设备上进行转录,无需将数据发送至云端。
- 代理演示 –
- 移动操作 – 在 Apple 硬件上实现高级工具调用和函数调用。
- 微型花园 – 展示设备端 AI 能力的趣味案例。
通过统一的 Google AI Edge 技术栈,我们确保最佳的设备端性能、隐私保护和离线可靠性向所有用户开放——无论使用何种移动平台。
在 iOS 上观看移动操作演示
抱歉,您的浏览器不支持此视频的播放。
(发布到相应平台时,请在此处插入视频嵌入或截图。)
在应用中测试模型性能
想要亲眼看到这些速度吗?您现在可以直接在 Gallery 应用中对这些模型进行基准测试,使用您自己的设备(适用于 Android;iOS 即将推出)。
以 Mobile Actions 为例,CPU 上的性能极其出色——在 Pixel 7 Pro 上 1916 tokens/秒(prefill) 和 142 tokens/秒(decode)。
如何运行您自己的基准测试
- 打开菜单 – 点击 Gallery 应用左上角的汉堡图标。
- 选择模型 – 点击 Models 瓦片,查看可下载模型的完整列表。
- 基准测试 – 按下基准测试按钮,并尝试不同配置(调整 prefill/decode token 数量或运行次数),即可精准了解 FunctionGemma 在您硬件上的表现。

立即在 Android 上试一试,看看模型在您的手机上表现如何!
今天开始
准备好构建你的第一个本地代理了吗?以下是入门方法:
-
探索演示 – 下载 Google AI Edge Gallery 应用:
-
自行构建 – 按照 fine‑tuning recipes 将 FunctionGemma 适配到你的应用逻辑,并使用你自己的函数自定义 AI Edge Gallery(guide)。
-
加入讨论 – 访问 GitHub 上的 AI Edge Gallery repository on GitHub ,关注进展、报告问题或为设备端 AI 用例的未来贡献力量。
我们迫不及待想看到你实现的智能特性。祝编码愉快!
致谢
关键贡献者
- Francesco Visin
- Hriday Chhabria
- Jiageng Zhang
- Jing Jin
- Kat Black
- Marissa Ikonomidis
- Matthew Chan
- Ravin Kumar
- Rishika Sinha
- Sahil Dua
- Xu Chen
- Na Li
- Yinghao Sun
- Yishuang Pang
其他团队成员
- Byungchul Kim
- Deepak Nagaraj Halliyavar
- Fengwu Yao
- Jae Yoo
- Jenn Lee
- Weiyi Wang
- Xiaoming Hu
- Yasir Modak
- Yi‑Chun Kuo
- Yu‑hui Chen
- Zhe Chen
领导层
- Cormac Brick
- Kathleen Kenealy
- Matthias Grundmann
- Ram Iyengar
- Sachin Kotwani