Google Gemma 4 在 iPhone 上原生运行,支持完整离线 AI 推理

发布: (2026年4月15日 GMT+8 13:19)
3 分钟阅读

Source: Hacker News

Overview

在设备 AI 多年来一直是热点话题,但谷歌的最新举动让人难以忽视。Gemma 4,谷歌的开源模型系列,现在可以直接在 iPhone 上运行,支持完整的本地推理和离线能力。这表明边缘 AI 部署已经不再是未来的优先事项——它正在当下发生。

Benchmark Comparison

早期基准测试将 31 B 参数的 Gemma 4 与 Qwen 3.5 的 27 B 模型并列。两者相对接近,Gemma 多出约 4 B 参数。两款模型各有取舍,且没有哪一款在所有任务上都占绝对优势。

Model Variants for Mobile

更值得关注的是体积更小的变体——E2B 和 E4B。这些模型显然是为移动端部署而设计,优先考虑效率而非原始算力。谷歌自家的应用会引导用户选择 E2B 变体,因为它更快、更轻,且更适合真实的设备环境——在内存和散热限制下表现更佳。

Getting Started

  1. 从 App Store 下载 Google AI Edge Gallery
  2. 打开应用,选择你偏好的模型变体,即可在设备上直接运行推理。
    • 无需 API 调用。无云端依赖。
  • 基于文本的提示生成界面。
  • 集成的图像识别和语音交互。
  • 可扩展的 Skills 框架,将应用定位为设备端 AI 实验平台,而非单纯的演示。

Technical Details

Gemma 4 通过 iPhone 的 GPU 进行推理。实际使用中,响应时间非常低,说明消费级硬件能够在不出现明显性能下降的情况下承担此类工作负载。这种低延迟、离线的能力为本地 AI 部署的商业可行性提供了有力论据。

Implications for Enterprise

离线能力改变了企业使用场景的计算方式,例如:

  • 连接不可靠的现场应用。
  • 对数据隐私要求严格的医疗环境。
  • 任何禁止将数据发送至云端的情形。

Conclusion

iPhone 上的 Gemma 4 不仅是技术概念验证,更是明确的信号,表明设备端 AI 时代已经到来。对谷歌而言,Gemma 系列已经彻底走出瓶颈。

0 浏览
Back to Blog

相关文章

阅读更多 »