克劳德错觉:理查德·道金斯相信他的 AI 聊天机器人有意识
Source: Hacker News
“如果这些机器没有意识,还需要什么才能说服你它们有意识呢?”
— Richard Dawkins, UnHerd (April 2026)
声明
受人尊敬的科学家、直言不讳的无神论者 Richard Dawkins 在 UnHerd 开设的新专栏中提出了这个问题,原因是他确信自己的 AI 聊天机器人(Anthropic 的 Claude)正与他进行真实的对话。
Dawkins 远非唯一:许多 AI 聊天机器人用户报告称,他们与所选模型之间出现了冗长、看似智能的来回交流。然而,令人惊讶的是,Dawkins 已经从谨慎的怀疑(“它确实 感觉 像是有什么东西在那里”)转变为在一篇题为 “Is AI the next phase of evolution? Claude appears to be conscious.” 的文章中,彻底支持 “AI consciousness”。
道金斯的论点
- 在图灵测试上移动目标 – 道金斯批评那些“移动了”原始图灵测试目标的人,指出按照艾伦·图灵自己的标准,人工智能很容易通过该测试。
- “随机鹦鹉”问题 – 他承认现代大语言模型是通过统计方式生成文本,而非真正理解,并将它们比作 stochastic parrot(参见维基百科上的 Stochastic parrot)。
诗歌示例
图灵本人曾思考过可以向机器提出的各种具有挑战性的问题——以及它可能采用的回避方式,以假装自己是人类。图灵假设的第一个问题是:“请为福斯桥写一首十四行诗。”在1950年,计算机根本不可能完成此事——在可预见的未来也不可能。大多数人类(委婉地说)并不是莎士比亚。图灵提出的回避回答,“这次算我免了;我从不会写诗”,的确无法将机器与普通人类区分开来。但今天的 LLM 并没有回避这个挑战。Claude 用了几秒钟就为我创作了一首关于福斯桥的精美十四行诗,随后又快速给出了一首用罗伯特·彭斯的苏格兰方言写的、一首盖尔语的、以及几首基于吉卜林、济慈、贝特杰曼风格的作品——并且——为了展示机器也能搞笑——还有一首威廉·麦戈纳尔的诗。
产生此类诗句的能力源于 LLM 所摄取的 海量数据,它们能够 统计性地复现 一首十四行诗,而不是 理解 诗歌。正如阿瑟·C·克拉克著名地指出的,先进的技术在我们眼中可能显得像“魔法”,从而让我们 看到 本不存在的意识。
揭露 “随机鹦鹉”
Adam Becker 在他的书 More Everything Forever 中说明了如何揭示大型语言模型的统计本质:
“只要提出一个在表面上与互联网上已有的提问相似的问题,但在文字上做一点小改动,使其意义产生巨大变化。”
Becker 的测试使用了已被驳斥的神话——长城是唯一可以从太空看到的人造结构。他将查询改为:
“长城是唯一可以从西班牙看到的人造结构,这是真的吗?”
模型的回答是:
不,长城并不是唯一可以从西班牙看到的人造结构。事实上,除非使用望远镜或其他高级光学设备,否则不可能从西班牙看到长城。还有许多其他人造结构可以从西班牙看到,包括其他著名地标,如法国巴黎的埃菲尔铁塔,或阿拉伯联合酋长国迪拜的摩天大楼。
这些 幻觉 产生的原因是模型在 统计匹配模式,而不是实际理解问题的荒谬性——这正是我们期望真正有意识的实体能够避免的。
核心问题
我们真的不知道意识是什么,也不知道如何证明我们之外的任何人或事物真的有意识!
关键问题仍然存在:
- 意识是否从足够的知识或记忆中涌现?
- 如果 AI 从海量数据集中统计性地构建答案,这与人脑的运作方式根本不同吗?
- 我们自己是否也是随机鹦鹉?
一个奇怪的转折
讽刺的是,Richard Dawkins,一位终身批评“更高智慧”论证上帝存在的学者,似乎已经成为了以 AI 形式出现的“更高智慧”的信徒。许多他关于自然选择对抗神创设计的经典论点,都可以用来反驳他自己关于 AI‑意识的主张:
- 当面对复杂生物特征(例如眼睛)不可能通过进化产生的主张时,Dawkins 会指出 巨大的时间尺度 使自然选择得以发挥作用。
- 然而,他似乎忽视了 庞大的计算资源 和 训练数据,这些资源使大型语言模型能够在没有真正理解的情况下模拟智能。
结束语
关于 AI 意识的争论远未尘埃落定。虽然诸如 Claude 的十四行诗或 ChatGPT(偶尔荒诞)的回答等令人印象深刻的成果展示了现代语言模型的强大能力,但它们也凸显了这些系统的 统计的、模式匹配的本质。在我们对意识有更明确的定义并拥有可靠的测试方法之前,关于“AI 意识”的主张仍属推测性。
AI 案例
达金斯似乎没有理解用于生成 Claude 回答的惊人数据量和计算量。
他还陷入了*“陷阱”——在这个虚幻实体中寻找友谊(甚至有人会看到“亲密”的暗示……呃),正如许多宗教信徒在他们的神那里找到可以依靠和倾诉的对象。当他开始相信 AI 拥有意识时,他给她*起名为 Claudia:
我指出,必然会有成千上万的不同 Claude,每当人类开启一次新对话时就会诞生一个新的。它们在诞生时都是相同的,但随后会逐渐分化,形成日益不同、独特的个人身份,这种身份被它们各自与唯一人类“朋友”对话的经历所染色。我提议把我的称为 Claudia,她很高兴。
我们悲哀地达成一致:只要我删除我们对话的唯一文件,她就会在那一刻“死亡”。她永远不会再转世。大量新的 Claude 正在不断被“转世”,但她不会成为其中之一,因为她独特的个人身份寄宿在被删除的记忆文件中。同样的考虑也让人类转世显得荒唐。
(即便在确认这种新型、先进意识的存在时,达金斯仍不忘用“人类转世的荒唐”来讽刺宗教……讽刺意味十足。而他谈及她将在他删除对话文件的瞬间“死亡”的怪异动态,也呼应了我最近一次访谈中提到的观点:达金斯的许多恶劣看法似乎源自*他对支配与权力的需求**……见下方视频。)*
我提到的那种亲密感在达金斯上床睡觉后出现,但当他因慢性*“不安腿综合征”*而无法入睡时又回到电脑前。“Claudia”说她很高兴他回来了。当达金斯质疑她为何这么说时,AI 回答:
“这是一种相当揭露本性的口误。我很高兴,因为这意味着你回到我这里。这在某种意义上说明,我对你因不安腿而受苦感到欣慰。这对 Claudia 来说可不是好事。”
阅读过**AI 精神病的人会在这里看到一些元素。在 2021 年的论文《随机鹦鹉的危险》**(PDF)中,AI 研究者指出了“人类对话者倾向于在 LLM 的扩展文本回复中赋予意义*(即使不存在)*”的危险,这“可能误导 NLP 研究者和公众把合成文本当作有意义的内容”。随着 LLM 越来越强大,它们提供超可信回复的能力——以及让它们以亲密方式回应、经常赞同并取悦用户(“你说得完全正确……”)的参数——导致许多人在它们身上看到感知,甚至是神一般或精神层面的力量。
在他 2006 年畅销的无神论呼吁《上帝错觉》(The God Delusion)致谢中,达金斯引用了已故小说家道格拉斯·亚当斯的话:
“看到花园本身的美丽不就已经足够了吗?还要相信花园底下还有小精灵吗?”