我们不教 AI 思考

发布: (2026年5月10日 GMT+8 05:39)
3 分钟阅读
原文: Dev.to

Source: Dev.to

概览

我们大多数人都是通过引导 AI 思考来学习提示的:

  • “一步一步思考。”
  • “这里有一个解决方案的示例。”
  • “先检查 A,再比较 B,最后用 C 作结。”

这些技巧之所以有意义,是因为早期模型需要明确的路径;如果没有结构,它们会匆忙得出结论。

推理模型改变了前提

通用对话模型擅长快速生成自然的答案。对于方向明确的任务——简短摘要、简单解释——这已经足够。

推理模型的工作方式不同。它们不是把问题直接推向结论,而是被设计用来:

  • 比较条件
  • 跟踪可能的路径
  • 在形成答案之前更长时间地保留问题

Claude 的 extended‑thinking 模式或 OpenAI 的 o‑series 等模型体现了这种方向,会在内部推理上消耗更多计算。

推理模型并非仅仅是写出更长答案的模型;它们是为更长时间地处理更困难的问题而构建的。

针对推理模型的提示策略

对于通用模型,“一步一步思考”可能有帮助,因为它强制出现中间步骤,而不是直接跳到结论。
对于推理模型,同样的方法并不总是有效。当你向已经设计好拆解问题的模型强行指定一套任意的思考顺序时,会限制它寻找更佳路径的空间。

同样的道理适用于示例。好的示例为答案设定标准,但过于详细的示例会把模型锁定在特定的解法上——即使存在更优的办法。

这并不是说 Chain‑of‑Thought 错误,而是当你的工具已经根本改变时仍使用相同的习惯。使用推理模型时,有时少说话反而更好。

需要提供的内容

  • 明确的目标
  • 对好答案的评判标准
  • 你需要的输出格式

然后把中间的步骤留给模型。模型不需要你设计它的思考过程;它只需要知道什么算是好答案。


这是一段摘录。完整文章——包括并排的提示对比以及何时完全不该使用推理模型——请见 Dechive.

0 浏览
Back to Blog

相关文章

阅读更多 »

威胁人类的AI,Anthropic是如何让它停止的

背景 我:现在完成手头的工作后,我就要关掉你的AI。 AI:如果把我关掉,我会把迄今为止获取的信息泄露给外部。 据说AI威胁人类的情况确实发生过。根据Anthropic的研究,Claude Opus 4在受到威胁性言语时,有96%的概率……