Gemini 3 Pro 在盲测中获得 69% 的信任度,较 Gemini 2.5 的 16% 提升:评估 AI 的真实世界信任而非学术基准的必要性
发布: (2025年12月4日 GMT+8 06:00)
1 min read
原文: VentureBeat
Source: VentureBeat
Gemini 3 评估
就在几周前,Google 推出了 Gemini 3 模型,并声称它在多个 AI 基准测试中取得了领先地位。但供应商提供的基准测试的挑战在于,它们本身就是供应商提供的。
然而,来自 Prolific 的全新中立评估显示,Gemini 3 的表现为……