[Paper] PhysicsAgentABM:物理引导的生成式基于代理的建模

发布: (2026年2月6日 GMT+8 02:59)
7 分钟阅读
原文: arXiv

Source: arXiv - 2602.06030v1

概览

PhysicsAgentABM 提出了一种新颖的方法,将经典基于代理的模型(ABM)的可解释性与大语言模型(LLM)代理的表达能力相结合。通过将繁重的推理工作从单个实体转移到 行为一致的簇,作者实现了既 可扩展校准良好 的仿真——这一直是开发者在公共卫生、金融和社会科学等领域构建大规模、时间对齐仿真时的长期痛点。

关键贡献

  • Cluster‑centric inference: 引入符号化的“状态专用”代理,编码机制先验,使系统能够对代理群体而非每个单独实体进行推理。
  • Neuro‑symbolic transition model: 多模态神经网络学习时间和交互动态,符号先验注入领域知识,产生校准的转移分布。
  • Epistemic fusion layer: 以不确定性感知的方式融合神经预测和符号先验,提升每个簇下一状态的置信估计。
  • ANCHOR clustering algorithm: 一种由 LLM 驱动、基于对比损失的方法,利用跨上下文行为响应对代理进行分组,将 LLM API 调用次数降低 6–8×
  • Broad empirical validation: 在公共卫生疫情建模、金融市场仿真和社会行为研究等方面进行广泛实证验证,显示出相较于纯机制、纯神经和纯 LLM 基线的更高事件时间准确性和校准性。

方法论

  1. 定义符号簇代理 – 对于每个高层状态(例如 “susceptible”、 “infected”、 “trader‑bullish”),一个轻量级符号代理存储一个 机制转移先验(类似于一个简单的基于规则的概率表)。
  2. 学习多模态神经转移模型 – 神经网络摄取时间序列数据、交互图以及任何可用的文本/上下文线索,以预测簇在下一个时间步的演化。
  3. 认知融合 – 将神经网络输出与符号先验使用贝叶斯式融合相结合,考虑每个来源的不确定性,生成簇的下一个状态的校准概率分布。
  4. 在个体层面的随机实现 – 一旦簇级分布确定,每个个体代理在遵守局部约束(例如容量限制、资源可用性)的前提下自行抽样其转移。
  5. ANCHOR 聚类 – 在每一次聚类轮次中仅调用一次 LLM,以生成代理的行为描述符。对比损失将具有相似描述符的代理对齐,形成簇,而无需在每个时间步都重复调用 LLM。

整体流水线将 人口层面推断(成本高但执行稀疏)与 实体层面变异性(成本低的随机抽样)解耦,从而显著降低计算开销。

结果与发现

领域基线(仅LLM)基线(神经)PhysicsAgentABM校准(Brier得分)
疫情传播(COVID‑19)0.71 RAE0.68 RAE0.54 RAE0.12(对比 0.27)
股票价格冲击模拟0.63 RAE0.59 RAE0.48 RAE0.15(对比 0.31)
社会抗议扩散0.68 RAE0.64 RAE0.51 RAE0.13(对比 0.28)
  • 事件时间准确性(RAE = 相对绝对误差)比最强基线提升约 15–20%
  • 校准(更低的 Brier 得分)表明模型的概率估计更为可靠,这是决策系统的关键因素。
  • LLM 调用减少:ANCHOR 将昂贵的 LLM API 调用次数降低了 6–8 倍,且不牺牲聚类质量。

Practical Implications

  • 可扩展的仿真 – 开发者现在可以在普通的云资源上运行大规模的 ABM(例如全市范围的疾病模型或全市场的交易者仿真),因为繁重的 LLM 推理仅限于集群更新。
  • 更好的决策支持 – 校准后的概率意味着风险感知系统(例如公共卫生仪表盘、自动交易机器人)可以信任模型的置信水平,从而产生更稳健的警报和行动。
  • 快速原型设计 – ANCHOR 工作流让产品团队能够在不产生高额成本的情况下尝试 LLM 增强的行为定义,加速政策仿真或“假设情景”分析的迭代周期。
  • 混合 AI 架构 – 神经符号融合模式可以迁移到其他领域(机器人、物联网、游戏 AI),在这些领域中领域规则与数据驱动的动态共存。

限制与未来工作

  • 集群粒度权衡 – 过度激进的聚类可能隐藏重要的异质性;论文指出需要自适应粒度机制。
  • 领域知识依赖 – 符号先验需要专家输入;自动化先验提取仍是一个未解决的挑战。
  • 真实场景部署测试 – 实验仅限于基准数据集;建议进行现场试验(例如实时疫情预测)以进行未来验证。
  • 扩展到连续状态空间 – 当前的表述侧重于离散状态;将融合框架扩展到连续动力学是一个有前景的方向。

作者

  • Kavana Venkatesh
  • Yinhan He
  • Jundong Li
  • Jiaming Cui

论文信息

  • arXiv ID: 2602.06030v1
  • 分类: cs.MA, cs.LG
  • 发表时间: 2026年2月5日
  • PDF: 下载 PDF
Back to Blog

相关文章

阅读更多 »

[Paper] 伪可逆神经网络

Moore‑Penrose 伪逆 (PInv) 是线性系统的基本解。在本文中,我们提出了一种对 PInv 的自然推广……