我们不教 AI 思考
Source: Dev.to
概览
我们大多数人都是通过引导 AI 思考来学习提示的:
- “一步一步思考。”
- “这里有一个解决方案的示例。”
- “先检查 A,再比较 B,最后用 C 作结。”
这些技巧之所以有意义,是因为早期模型需要明确的路径;如果没有结构,它们会匆忙得出结论。
推理模型改变了前提
通用对话模型擅长快速生成自然的答案。对于方向明确的任务——简短摘要、简单解释——这已经足够。
推理模型的工作方式不同。它们不是把问题直接推向结论,而是被设计用来:
- 比较条件
- 跟踪可能的路径
- 在形成答案之前更长时间地保留问题
Claude 的 extended‑thinking 模式或 OpenAI 的 o‑series 等模型体现了这种方向,会在内部推理上消耗更多计算。
推理模型并非仅仅是写出更长答案的模型;它们是为更长时间地处理更困难的问题而构建的。
针对推理模型的提示策略
对于通用模型,“一步一步思考”可能有帮助,因为它强制出现中间步骤,而不是直接跳到结论。
对于推理模型,同样的方法并不总是有效。当你向已经设计好拆解问题的模型强行指定一套任意的思考顺序时,会限制它寻找更佳路径的空间。
同样的道理适用于示例。好的示例为答案设定标准,但过于详细的示例会把模型锁定在特定的解法上——即使存在更优的办法。
这并不是说 Chain‑of‑Thought 错误,而是当你的工具已经根本改变时仍使用相同的习惯。使用推理模型时,有时少说话反而更好。
需要提供的内容
- 明确的目标
- 对好答案的评判标准
- 你需要的输出格式
然后把中间的步骤留给模型。模型不需要你设计它的思考过程;它只需要知道什么算是好答案。
这是一段摘录。完整文章——包括并排的提示对比以及何时完全不该使用推理模型——请见 Dechive.