· ai
结构放大:即使 AI 本意良好,它为何仍会失败
我们一直在问错误的关于 AI 安全的问题。我们问: - “模型是否 aligned?” - “它是否理解 ethics?” - “它会遵循 instructions 吗?” 但最近……
我们一直在问错误的关于 AI 安全的问题。我们问: - “模型是否 aligned?” - “它是否理解 ethics?” - “它会遵循 instructions 吗?” 但最近……
随着我们不断推动 AI 进步的边界,我提出一个挑战我们思考传统偏见领域之外的问题:我们能否创造一个…
在许多 AI 讨论中,治理被框定为与价值观、原则或政策的“alignment”。问题在于,仅仅 alignment 本身就……
请提供您希望翻译的文本内容,我才能为您进行简体中文翻译。
核心原则 - 人类主权 - non-decision invariants - explicit stop conditions - internal auditability - structural traceability 这不是一个科学...
在人工智能驱动的系统中,最关键的风险之一并非技术故障,而是决策之间的逐步分离……
AI治理是一门操作性学科,而不是合规的产物。人工智能治理通常被简化为政策,……
引言 在过去几年中,AI 系统已从实验工具转变为嵌入真实运营环境中影响决策的组件……
OpenAI 正在更新其 Model Spec,加入新的 Under‑18 Principles,定义 ChatGPT 应如何为青少年提供安全、适龄的指导,基于发展……
上周,我向多个 AI chatbots 透露我正在挣扎,考虑自残,并且需要有人倾诉。幸运的是,我并没有真的有这种感觉,也没有……
虽然 LLMs 可能不会使用显式偏见语言,但它们可能会推断你的个人人口统计数据并表现出隐性偏见,研究人员说……
虽然 LLMs 可能不会使用明显带偏见的语言,但它们可能会推断你的人口统计数据并表现出隐性偏见,研究人员说……