Google 更新最佳 AI 模型用于编写 Android 应用,Gemini 与 GPT 5.4 位居榜首
Source: 9to5Google

用于评估 Android 应用开发中 AI 模型的 “Android Bench” 已更新,OpenAI 最新模型现与 Gemini 并列榜首。
该 “Android Bench” 于三月首次发布,是 Google 用来衡量用于编写 Android 应用的最佳 AI 模型的资源。Google 的评估方法包括模型在 Jetpack Compose(用于 UI)、Coroutines 与 Flows(用于异步编程)、Room(用于持久化)以及 Hilt(用于依赖注入)等方面的表现。
在此列表的首次更新中,Google 新增了两个模型——OpenAI 的 GPT 5.4 和 GPT 5.3‑Codex——它们迅速攀升至榜单前列。
根据 Google(2026/04/09)的 Android 应用开发最佳 AI
- 新:GPT 5.4: 72.4%
- Gemini 3.1 Pro Preview: 72.4%
- 新:GPT 5.3‑Codex: 67.7%
- Claude Opus 4.6: 66.6%
- GPT‑5.2 Codex: 62.5%
- Claude Opus 4.5: 61.9%
- Gemini 3 Pro Preview: 60.4%
- Claude Sonnet 4.6: 58.4%
- Claude Sonnet 4.5: 54.2%
- Gemini 3 Flash Preview: 42%
- Gemini 2.5 Flash: 16.1%
其余名单本次未作更改,结果仍基于二月底的首次测试。OpenAI 的最新模型在三月中旬进行测试,随后本周公布了这些结果。
正如 任何 基准测试一样,实际情况往往与受控测试不同。模型表现受多种变量影响,包括工作流、价值等因素,导致某个模型对你更适合。
Google 最初表示,发布这些结果的目标是帮助开发者“提升生产力”,并最终交付“在 Android 生态系统中更高质量的应用”。