trustworthiness | EUNO.NEWS

1个月前 · ai

Gemini 3 Pro 在盲测中获得 69% 的信任度，较 Gemini 2.5 的 16% 提升：评估 AI 的真实世界信任而非学术基准的必要性

就在几周前，Google 推出了 Gemini 3 模型，声称它在多个 AI 基准中取得了领先地位。但供应商面临的挑战是……

#Gemini 3 #trustworthiness #AI evaluation #benchmarking #large language models #Google AI #Prolific study