AI模型几乎在Putnam考试中拿满分：真正的颠覆在于我们的推理方式

发布: 2个月前 (2025年12月3日 GMT+8 13:56)

2 分钟阅读

原文: Dev.to

Source: Dev.to

AI Model Nears a Perfect Score on the Putnam

一个 AI 数学模型最近在最难的人类考试之一中取得了 118/120 的成绩。
除了求解问题，它还学会了 推理、自检和修复自己的逻辑。

研究人员首先训练了一个独立的 AI 验证器，用来评估证明是否可靠。
随后他们训练了解题 AI，使其编写能够被验证器接受的证明。
最终系统能够重新阅读自己的论证，识别漏洞并加以修正。

这种方法是 构建团队和系统的蓝图：

把 AI 仅仅当作计算器使用的公司只能获得有限的收益。
把 AI 当作配备内置验证器的初级思考者来使用的公司，则可以彻底改变解决难题的方式。

竞争优势不在于 谁拥有 AI，而在于 谁学会与之推理。

What’s your experience so far? Is AI just speeding you up, or actually helping you think better?