Google 的新 Gemini Pro 模型再次创下基准纪录分数

发布: 3天前 (2026年2月20日 GMT+8 08:55)

2 分钟阅读

Source: TechCrunch

Google Gemini
图片来源：Jagmeet Singh / TechCrunch

Google 发布 Gemini 3.1 Pro

Google 于周四发布了其强大的大型语言模型 Gemini Pro 的最新版本。该模型 Gemini 3.1 目前以预览版形式提供，公司表示将很快正式发布。

Gemini 3.1 Pro 相较于前代 Gemini 3 有显著提升，后者在去年十一月推出时已被视为一款高度出色的 AI 工具。独立基准测试——例如名为 Humanity’s Last Exam 的测试——显示 Gemini 3.1 Pro 的表现明显优于之前的版本。

该模型也得到了 AI 初创公司 Mercor CEO Brendan Foody 的赞赏。他的基准系统 APEX 用于衡量新 AI 模型在真实专业任务中的表现。Foody 指出，“Gemini 3.1 Pro 现在位居 APEX‑Agents 排行榜首位”，并补充说，这一结果展示了“代理在真实知识工作中的提升速度”。¹

此发布正值 AI 模型竞争加剧之际，各大科技公司纷纷推出针对代理工作和多步骤推理的更强大 LLM。其他主要玩家——包括 OpenAI 和 Anthropic——近期也发布了新模型。

Foody 的评论可见于他的社交媒体帖子。 ↩

Google 的新 Gemini Pro 模型再次创下基准纪录分数

Google 发布 Gemini 3.1 Pro

相关文章

Google 新 Gemini Pro 模型再次创下基准分数纪录

Google发布Gemini 3.1 Pro

谷歌推出‘Gemini 3.1 Pro’…以 Opus 4.6 半价夺回 AI 头号位置

免费使用 Unsloth 和 Hugging Face Jobs 训练 AI 模型

Google 发布 Gemini 3.1 Pro

Footnotes

相关文章

Google 新 Gemini Pro 模型再次创下基准分数纪录

Google发布Gemini 3.1 Pro

谷歌推出‘Gemini 3.1 Pro’…以 Opus 4.6 半价夺回 AI 头号位置

免费使用 Unsloth 和 Hugging Face Jobs 训练 AI 模型

Google 发布 Gemini 3.1 Pro