[Paper] 没有世界模型的世界属性：从静态词向量的共现统计中恢复空间和时间结构

发布: 1天前 (2026年3月5日 GMT+8 01:37)

7 分钟阅读

原文: arXiv

Source: arXiv - 2603.04317v1

（请提供您希望翻译的正文内容。）

Overview

本文探讨大型语言模型（LLMs）在“知道”城市位置或历史人物生卒年代方面的惊人能力，究竟是源自模型本身，还是仅仅来自原始文本中已经嵌入的模式。通过对经典的静态词嵌入（GloVe 和 Word2Vec）进行线性回归探测，作者展示了可以在没有任何深度神经网络结构的情况下提取出大量的地理和时间信息——这表明大量的“世界知识”已经潜藏在词共现统计中。

关键贡献

展示了从静态嵌入中使用岭回归探针恢复世界事实（城市坐标、出生年份）的可恢复性。
量化信号强度：地理位置的 R² = 0.71‑0.87，时间出生年份预测的 R² = 0.48‑0.52。
识别词汇梯度（例如国家名称、气候相关术语）是空间/时间信息的主要载体。
表明仅线性探针的表现不足以作为“世界模型”表征的证据，在大型语言模型中。
提供了系统化的分析流程（语义邻居检查、子空间消融），可用于其他探测研究。

方法论

嵌入 – 本研究使用两种广泛使用的静态模型：GloVe（在 Common Crawl 上训练）和 Word2Vec（在 Google News 上训练）。
目标变量 –
- 地理: 1,000 多个世界城市的纬度和经度（真实值来自 GeoNames）。
- 时间: 2,000 多位著名历史人物的出生年份（来源于 Wikipedia 信息框）。
线性探测 – 对每个目标变量，使用随机 80 % 的词向量进行岭回归模型训练，并在保留的 20 % 数据上评估。R² 分数衡量嵌入空间能够解释的方差程度。
可解释性检查 –
- 语义邻居分析: 检查与某城市向量最近的词语，观察它们是否形成地理梯度（例如，“Paris” 接近 “Berlin”、 “Rome”）。
- 子空间消融: 将与国家名称或气候术语相关性最高的维度置零，以测试探测器性能下降的程度，从而揭示驱动信号的词汇特征。

所有步骤均使用标准的 Python 库（NumPy、scikit‑learn）实现，仅需预训练的静态嵌入——无需微调或大规模计算。

结果与发现

目标	嵌入	保留 R²	信号的主要驱动因素
城市坐标	GloVe	0.84	国家名称梯度、气候词汇（例如 “tundra”、 “desert”）
城市坐标	Word2Vec	0.71	同样的词汇梯度，稍弱
出生年份	GloVe	0.52	历史时期词汇（例如 “Renaissance”、 “Industrial”）
出生年份	Word2Vec	0.48	类似的时间词汇，幅度更低

消融实验表明，去除与国家名称对齐的维度会使地理 R² 下降约 30 %，确认这些词汇线索是恢复结构的骨干。时间探针对任何单一词汇组的敏感度较低，表明信号更为分散。

Practical Implications

Feature engineering for downstream NLP – 简单的静态嵌入可以作为一种廉价的位置信息或时代线索来源，用于地理标注、历史文本分析或推荐系统等任务，而无需使用重量级的大语言模型（LLM）。
Benchmark design – 研究者应将静态嵌入上的线性探测性能视为基线；若要声称 LLM 具备“世界模型”能力，需要更有力的证据（例如，非线性探测、因果干预）。
Data‑driven lexicon building – 所识别的词汇梯度可用于构建领域特定的地名表或时间词汇表，特别是在大型 LLM 不可用的低资源语言环境中。
Model interpretability tools – 子空间消融技术提供了一种轻量级的方法来诊断模型在给定预测中依赖的词组，对于调试偏差（例如，对国家名称的过度依赖）非常有用。

限制与未来工作

静态嵌入受限于训练语料库；源文本中的偏见或空白会直接影响可恢复的世界知识。
时间分辨率较粗——探针仅捕获宽泛的出生年份趋势，无法捕捉细粒度的历史事件。
仅考察了线性探针；非线性或基于注意力的探针可能揭示额外结构，或验证大型语言模型是否真的超越共现统计。
地理范围受限于文献记载充分的城市；扩展到农村或原住民地名可以测试词汇梯度的极限。

未来的研究可以将静态嵌入基线与受控的大型语言模型实验相结合，探索多语言语料库，并开发能够将真实推理与统计记忆区分开的探测方法。

作者

Elan Barenholtz

论文信息

arXiv ID: 2603.04317v1
分类: cs.CL, cs.AI, cs.LG
发布时间: 2026年3月4日
PDF: 下载 PDF

[Paper] 没有世界模型的世界属性：从静态词向量的共现统计中恢复空间和时间结构

Overview

关键贡献

方法论

结果与发现

Practical Implications

限制与未来工作

作者

论文信息

相关文章

[Paper] SWE-CI：通过持续集成评估代理在维护代码库方面的能力

[Paper] 理解与缓解 LLM Steering 中的数据集损坏

[Paper] 无记忆，无检测：基于输出分布的小语言模型污染检测

[Paper] MoD-DPO：通过模态解耦偏好优化缓解全能大语言模型中的跨模态幻觉