评估 AI 执行科学研究任务的能力
发布: (2025年12月16日 GMT+8 17:00)
1 min read
原文: OpenAI Blog
OpenAI 已正式发布 GPT-5.2,早期测试者的反馈——其中包括 OpenAI 在公开发布前几天就向其播种模型的用户——显示出各种反响……
GPT-5.2 是 OpenAI 迄今为止在数学和科学领域最强大的模型,在 GPQA Diamond 和 FrontierMath 等基准上实现了新的最先进成果。本文…
GPT-5.2 是我们面向日常专业工作的最先进前沿模型,具备最先进的推理、长上下文理解、编码和视觉能力。使用……
我打开了 Makiai 关于 OpenAI 的 o4-mini 和 o4-mini-high 的文章,原本以为只会是另一篇充满 benchmarks 的技术拆解,我会草草浏览后忘记。相反……