Google 新 Gemini Pro 模型再次创下基准分数纪录

发布: (2026年2月20日 GMT+8 08:55)
2 分钟阅读
原文: TechCrunch

Source: TechCrunch

Google Gemini
图片来源:Jagmeet Singh / TechCrunch

发布概览

周四,Google 发布了其最新版本的 Gemini Pro,即功能强大的大型语言模型 Gemini 3.1。该模型目前以预览形式提供,正式发布计划在不久的将来。

Gemini 3.1 Pro 相较于其前身 Gemini 3 有显著提升,后者在 2025 年 11 月推出时已被视为一款高度出色的 AI 工具。

基准表现

Google 分享了独立基准测试的结果——其中最受关注的是名为 Humanity’s Last Exam 的测试——显示 Gemini 3.1 Pro 以大幅优势超越了前一版本。

该模型同样受到了 AI 初创公司 Mercor CEO Brendan Foody 的关注。Foody 的基准系统 APEX 用于衡量新 AI 模型在真实专业任务中的表现。他在社交媒体上写道:

“Gemini 3.1 Pro 现在位列 APEX‑Agents 排行榜首位,”
— Brendan Foody, X 帖子

他补充说,这些结果展示了“代理在实际知识工作中的提升速度之快”。

行业背景

此时正值 AI 模型竞争 加剧,各大科技公司争相推出更强大的 LLM,以支持代理式工作和多步骤推理。OpenAI、Anthropic 等主要竞争者也近期推出了新模型,进一步加剧了竞争态势。

0 浏览
Back to Blog

相关文章

阅读更多 »