chain-of-thought

1周前 · ai

DeepSeek‑R1：学会思考的 AI（并经历了‘啊哈时刻’）

想象一下，一个 AI 在句子中途停下来，意识到自己犯了错误，并说：“等等，等等。这是一个我可以标记的 aha 时刻。”这不是科幻——它 h...

#DeepSeek-R1 #large language models #reinforcement learning #metacognition #chain-of-thought #AI reasoning
2周前 · ai

Prompt Engineering 是一种症状（这没关系）

或者：如果你像工程师而不是魔法师那样阅读，这本书实际上教了什么。在我上一次的帖子之后，有几个人以各种方式回复说：> “好吧，聪明……”。

#prompt engineering #large language models #LLM #chain of thought #AI productivity #AI book review #AI tools
2周前 · ai

这项全新、极其简单的提示技术在非推理任务上将LLMs的准确率提升高达76%

在大型语言模型（LLM）优化的混乱世界中，工程师们在过去几年里不断开发日益深奥的仪式，以获得更好的……

#prompt engineering #large language models #LLM accuracy #chain of thought #LLM optimization
3周前 · ai

超越基础提示：提升你的 LLM 实力

在使用大型语言模型和真正掌握它们之间存在着重要的区别。大多数人通过简单的问答与 LLM 进行交互……

#prompt engineering #chain-of-thought #LLM #large language models #AI productivity
0个月前 · ai

通过循环语言模型实现潜在推理的规模化

摘要现代大型语言模型主要通过显式文本生成进行“思考”，例如 chain-of-thought CoT，这将推理推迟到后训练阶段并且…

#LLM #looped language models #latent reasoning #chain-of-thought #pretraining #scaling #Ouro
1个月前 · ai

评估 chain-of-thought 可监控性

OpenAI推出了一个用于链式思考可监控性的全新框架和评估套件，涵盖了24个环境中的13项评估。我们的发现显示……

#chain-of-thought #monitorability #model reasoning #evaluation suite #OpenAI #AI interpretability #LLM safety