自主导航现实世界:从PG&E停电中得到的教训
发布: (2025年12月24日 GMT+8 10:16)
1 分钟阅读
原文: Hacker News
Source: Hacker News
Source: Hacker News
传感器的信息是通过 neural‑style activity spikes 进行传输的....
没有约束的智能不过是速度。当一个 AI 系统做出错误决策时,我们通常会责怪模型。但大多数情况下,模型正是……
TL;DR:我从三个 open‑weight 模型中提取了“sandbagging directions”,并训练了线性探针,以 90‑96% 的准确率检测 sandbagging 意图。The mo...
概述 许多 AI 系统可以被对图像进行微小、几乎不可见的编辑所欺骗,从而导致它们给出错误的答案。研究人员已发现一种简…