心理测量Jailbreaks揭示前沿模型的内部冲突
发布: (2026年2月6日 GMT+8 02:21)
1 min read
原文: Hacker News
Source: Hacker News
文章详情
- 文章 URL: https://arxiv.org/abs/2512.04124
- 评论 URL: https://news.ycombinator.com/item?id=46902855
- 积分: 8
Source: Hacker News
请提供您希望翻译的具体摘录或摘要文本,我才能为您进行翻译。
新模型旨在加速 Codex 的功能,Codex 是 OpenAI 本周早些时候推出的具备代理能力的编码工具……
LLM 的类人认知能力是真实的还是虚假的?信息在神经网络中是如何传播的?LLM 内部是否存在隐藏的知识?……
markdown 2026年1月29日 !Ajeet Mirwani https://developers.google.com/static/images/author/Ajeet_Mirwani.png https://developers.googleblog.com/search/?author=Ajeet+...