通过忏悔训练 LLMs 的诚实
发布: (2025年12月12日 GMT+8 18:37)
1 min read
原文: Hacker News
Source: Hacker News
文章链接: https://arxiv.org/abs/2512.08093
评论链接: https://news.ycombinator.com/item?id=46242795
积分: 4
Source: Hacker News
文章链接: https://arxiv.org/abs/2512.08093
评论链接: https://news.ycombinator.com/item?id=46242795
积分: 4
OpenAI 研究人员推出了一种新方法,充当大型语言模型(LLMs)的“真相血清”,迫使它们自行报告自己的不当行为……
你无法对未评估的事物进行对齐。文章《Why AI Alignment Starts With Better Evaluation》首次发表于 Towards Data Science....
如何让 LLMs 进行可验证的逐步逻辑推理 第 1 部分 文章《Understanding Vibe Proving》首次发表于 Towards Data Science....
!Forem 标志 https://media2.dev.to/dynamic/image/width=65,height=,fit=scale-down,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%...