misalignment 随模型智能和任务复杂度的扩展如何？

文章链接: https://alignment.anthropic.com/2026/hot-mess-of-ai/
评论链接: https://news.ycombinator.com/item?id=46864498
积分: 61

发布: 5天前 (2026年2月3日 GMT+8 08:28)

1 分钟阅读

Source: Hacker News

文章详情

随着AI系统变得更强大，Anthropic的常驻哲学家表示，这家初创公司押注Claude本身能够学习避免灾难所需的智慧……

概述本文提供了对能够保持对超出人类认知能力的系统进行控制的机制的深入分析。T...

你是否曾经向一个 AI 语言模型提问，看到它自信满满地回答，却发现答案完全错误？欢迎来到这个世界……