Gemini 3 Pro 在盲测中获得 69% 的信任度,较 Gemini 2.5 的 16% 提升:评估 AI 的真实世界信任而非学术基准的必要性

发布: (2025年12月4日 GMT+8 06:00)
1 min read

Source: VentureBeat

Gemini 3 评估

就在几周前,Google 推出了 Gemini 3 模型,并声称它在多个 AI 基准测试中取得了领先地位。但供应商提供的基准测试的挑战在于,它们本身就是供应商提供的。
然而,来自 Prolific 的全新中立评估显示,Gemini 3 的表现为……

Back to Blog

相关文章

阅读更多 »

Gemini 3 的新 Gemini API 更新

Gemini 3,我们最智能的模型,现已通过 Gemini API 向开发者开放。为了支持其最先进的推理、自治编码、多模…

Gemini 3 的新 Gemini API 更新

2025年11月25日 Gemini 3 的 Gemini API 新功能——简化的思考控制参数:从 Gemini 3 开始,新增的 thinking_level 参数允许……

Gemini 3 的新 Gemini API 更新

2025年11月25日 Gemini 3,我们最智能的模型,已通过 Gemini API 向开发者开放,可用于构建应用。为支持其最先进的推理能力,…