Google 新 Gemini Pro 模型再次创下基准分数纪录

发布: 3天前 (2026年2月20日 GMT+8 08:55)

2 分钟阅读

Source: TechCrunch

Google Gemini
图片来源：Jagmeet Singh / TechCrunch

发布概览

周四，Google 发布了其最新版本的 Gemini Pro，即功能强大的大型语言模型 Gemini 3.1。该模型目前以预览形式提供，正式发布计划在不久的将来。

Gemini 3.1 Pro 相较于其前身 Gemini 3 有显著提升，后者在 2025 年 11 月推出时已被视为一款高度出色的 AI 工具。

Google 分享了独立基准测试的结果——其中最受关注的是名为 Humanity’s Last Exam 的测试——显示 Gemini 3.1 Pro 以大幅优势超越了前一版本。

该模型同样受到了 AI 初创公司 Mercor CEO Brendan Foody 的关注。Foody 的基准系统 APEX 用于衡量新 AI 模型在真实专业任务中的表现。他在社交媒体上写道：

“Gemini 3.1 Pro 现在位列 APEX‑Agents 排行榜首位，”
— Brendan Foody, X 帖子

他补充说，这些结果展示了“代理在实际知识工作中的提升速度之快”。

此时正值 AI 模型竞争 加剧，各大科技公司争相推出更强大的 LLM，以支持代理式工作和多步骤推理。OpenAI、Anthropic 等主要竞争者也近期推出了新模型，进一步加剧了竞争态势。