Google 的新 Gemini Pro 模型再次创下基准纪录分数
Source: TechCrunch

图片来源:Jagmeet Singh / TechCrunch
Google 发布 Gemini 3.1 Pro
Google 于周四发布了其强大的大型语言模型 Gemini Pro 的最新版本。该模型 Gemini 3.1 目前以预览版形式提供,公司表示将很快正式发布。
Gemini 3.1 Pro 相较于前代 Gemini 3 有显著提升,后者在去年十一月推出时已被视为一款高度出色的 AI 工具。独立基准测试——例如名为 Humanity’s Last Exam 的测试——显示 Gemini 3.1 Pro 的表现明显优于之前的版本。
该模型也得到了 AI 初创公司 Mercor CEO Brendan Foody 的赞赏。他的基准系统 APEX 用于衡量新 AI 模型在真实专业任务中的表现。Foody 指出,“Gemini 3.1 Pro 现在位居 APEX‑Agents 排行榜首位”,并补充说,这一结果展示了“代理在真实知识工作中的提升速度”。1
此发布正值 AI 模型竞争加剧之际,各大科技公司纷纷推出针对代理工作和多步骤推理的更强大 LLM。其他主要玩家——包括 OpenAI 和 Anthropic——近期也发布了新模型。