AI模型开始通过自问自答来学习
发布: (2026年1月8日 GMT+8 03:00)
1 min read
原文: Wired
现代语言模型与动态潜在概念模型 DLCM 现代语言模型已经超越了简单的逐标记处理,且动态 L…
TL;DR 我强迫 GPT‑2 从它自己的输出中学习了 20 代。到第 20 代时,模型失去了 66% 的 semantic volume,并开始出现 hallucinating state。
我最初的信念 在深入研究之前,我隐含地相信了几件事: - 如果一个 attention head 持续关注(attend)特定的 token,那么该 token 是……
一些 AI 聊天机器人在突发新闻方面出奇地掌握得很好,另一些则明显做不到……