通过忏悔训练 LLMs 的诚实
发布: (2025年12月12日 GMT+8 18:37)
1 分钟阅读
原文: Hacker News
Source: Hacker News
文章链接: https://arxiv.org/abs/2512.08093
评论链接: https://news.ycombinator.com/item?id=46242795
积分: 4
Source: Hacker News
文章链接: https://arxiv.org/abs/2512.08093
评论链接: https://news.ycombinator.com/item?id=46242795
积分: 4
!Forem 标志 https://media2.dev.to/dynamic/image/width=65,height=,fit=scale-down,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%...
GPT-5.2 是 GPT-5 系列的最新模型家族。这些模型的综合安全缓解方法基本上与在 t... 中描述的相同。
经过多次迭代、实验和经验教训,我终于从零开始构建了一个 550 M‑parameter 模型。这并不是我第一次构建……
哪些有效,哪些失效,以及我为何这样做——《在生产环境中升级到 LangChain 1.0 的经验教训》首次发表于 Towards Data Science....