通过忏悔训练 LLMs 的诚实

发布: (2025年12月12日 GMT+8 18:37)
1 分钟阅读
原文: Hacker News
0 浏览
Back to Blog

相关文章

阅读更多 »

为你的LLMs设立护栏

!Forem 标志 https://media2.dev.to/dynamic/image/width=65,height=,fit=scale-down,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%...

更新 GPT-5 系统卡:GPT-5.2

GPT-5.2 是 GPT-5 系列的最新模型家族。这些模型的综合安全缓解方法基本上与在 t... 中描述的相同。