Google 更新最佳 AI 模型用于编写 Android 应用，Gemini 与 GPT 5.4 位居榜首

发布: 3周前 (2026年4月10日 GMT+8 01:05)

3 分钟阅读

Source: 9to5Google

用于评估 Android 应用开发中 AI 模型的 “Android Bench” 已更新，OpenAI 最新模型现与 Gemini 并列榜首。

该 “Android Bench” 于三月首次发布，是 Google 用来衡量用于编写 Android 应用的最佳 AI 模型的资源。Google 的评估方法包括模型在 Jetpack Compose（用于 UI）、Coroutines 与 Flows（用于异步编程）、Room（用于持久化）以及 Hilt（用于依赖注入）等方面的表现。

在此列表的首次更新中，Google 新增了两个模型——OpenAI 的 GPT 5.4 和 GPT 5.3‑Codex——它们迅速攀升至榜单前列。

根据 Google（2026/04/09）的 Android 应用开发最佳 AI

新：GPT 5.4： 72.4%
Gemini 3.1 Pro Preview： 72.4%
新：GPT 5.3‑Codex： 67.7%
Claude Opus 4.6： 66.6%
GPT‑5.2 Codex： 62.5%
Claude Opus 4.5： 61.9%
Gemini 3 Pro Preview： 60.4%
Claude Sonnet 4.6： 58.4%
Claude Sonnet 4.5： 54.2%
Gemini 3 Flash Preview： 42%
Gemini 2.5 Flash： 16.1%

其余名单本次未作更改，结果仍基于二月底的首次测试。OpenAI 的最新模型在三月中旬进行测试，随后本周公布了这些结果。

正如任何基准测试一样，实际情况往往与受控测试不同。模型表现受多种变量影响，包括工作流、价值等因素，导致某个模型对你更适合。

Google 最初表示，发布这些结果的目标是帮助开发者“提升生产力”，并最终交付“在 Android 生态系统中更高质量的应用”。

Google 更新最佳 AI 模型用于编写 Android 应用，Gemini 与 GPT 5.4 位居榜首

根据 Google（2026/04/09）的 Android 应用开发最佳 AI

更多 Android 资讯

相关文章

这些 Android 手机支持与 iPhone 和 Mac 的 AirDrop 分享

Google AI Mode 获得 “plus” 重设计，随着 agentic booking 全球扩张

Fitbit Public Preview 将在更多国家推出，新增 VO2 Max 与美国健康记录

Pixel At a Glance 预览显示附近的 Google Wallet 通行证，“Restaurant insights”。