[Paper] 像科学家一样思考:物理引导的 LLM Agent 用于方程发现

发布: (2026年2月13日 GMT+8 02:49)
7 分钟阅读
原文: arXiv

Source: arXiv - 2602.12259v1

概述

本文提出了 KeplerAgent,一种受物理指导的 AI 代理,模拟科学家发现方程的过程:首先揭示隐藏的物理属性(例如,对称性、守恒定律),然后利用这些洞察引导符号回归朝向正确的公式。通过将大型语言模型(LLM)与领域特定工具相结合,作者实现了显著更好的方程发现性能——尤其在数据噪声较大时——相较于纯 LLM 或传统回归方法。

关键贡献

  • Agentic reasoning pipeline结构推断(对称性、维度分析、不变量)与 符号回归 分离。
  • 将 LLM 与基于物理的工具箱集成(例如维度分析库、不变性检测器),为下游回归引擎生成先验。
  • 符号回归后端的动态配置(PySINDy、PySR)——代理根据推断出的物理自动选择函数库并施加结构约束。
  • 全面的基准套件,覆盖经典力学、热力学和电磁学问题,显示出在符号精度和噪声鲁棒性方面的大幅提升。
  • 开源实现,演示如何在可复现的工作流中编排 LLM 调用、工具执行和回归。

方法论

  1. 问题设置 – 给定输入变量 (X) 和观测输出 (y) 的数据集,目标是恢复可解释的符号表达式 (f(X))。
  2. 科学推理循环
    • LLM 提示 – 让 LLM 假设物理属性(例如,“系统是否在旋转下保持不变?”)。
    • 基于物理的工具 – 专门模块(维度分析、对称性检测器、守恒量计算器)验证或细化这些假设,生成具体约束,例如“方程必须在长度上是二次齐次的”。
    • 约束合成 – 代理将约束转换为符号回归引擎的配置:选择候选函数(如 sin、cos、多项式项)并添加代数限制(如不允许奇次幂)。
  3. 符号回归 – 配置好的引擎(PySINDy 或 PySR)在受约束的空间中搜索最佳拟合的符号模型,使用标准的稀疏化或进化策略。
  4. 迭代细化 – 如果得到的表达式未通过验证(例如,违反了已发现的不变式),则循环重复,允许 LLM 提出备选假设。

整个管道由轻量级的“代理”协调,代理跟踪状态、决定何时调用工具,并在提交最终方程之前汇总证据。

结果与发现

BenchmarkBaseline (LLM‑only)Traditional SR (PySINDy)KeplerAgentNoise Level (σ)
简谐振子62 % exact78 % exact94 % exact0.01
摆(大角度)48 % exact71 % exact88 % exact0.05
热扩散55 % exact69 % exact90 % exact0.10
Maxwell‑型系统41 % exact63 % exact85 % exact0.08
  • 符号准确率(恢复真实公式的运行比例)比最强的非代理基线提升了 15‑30 %。
  • 噪声鲁棒性:性能衰减平缓;即使高斯噪声幅度加倍,KeplerAgent 仍保持 >80 % 的准确率,而基线则跌至 50 % 以下。
  • 搜索效率:通过剪枝候选空间,回归步骤收敛速度提升 2‑3 倍,单核 CPU 的计算时间从数分钟缩短至不到一分钟。

实际意义

  • 加速科学建模 – 工程师可以将实验数据输入 KeplerAgent,以获得类似第一性原理的模型,而无需手工构建特征库。
  • 嵌入式诊断 – 在控制系统(如机器人、航空航天)中,代理可以持续从传感器流中推断支配动力学,实现遵循物理约束的自适应控制器。
  • 降低数据需求 – 由于代理利用物理先验,它需要更少的样本即可收敛,这在数据采集昂贵的领域(如材料测试、生物医学实验)中尤为有价值。
  • 工具链可扩展性 – 模块化设计使团队能够插入特定领域的分析器(如热力学势、量子对称性),从而在不同学科间复用该方法。
  • AI 增强产品的可解释性 – 符号化输出可被人类阅读,便于监管合规和利益相关者对 AI 驱动决策系统的信任。

局限性与未来工作

  • 对 LLM 质量的依赖 – 代理的初始假设仅与底层 LLM 的质量等同;错误识别的对称性可能误导回归步骤。
  • 对高维系统的可扩展性 – 当前实验聚焦于 ≤5 个变量;将其扩展到大规模 PDE 发现需要更复杂的约束传播。
  • 工具集成开销 – 添加新的物理模块需要自定义包装器;一个标准化的 “physics‑as‑a‑service” API 将有助于简化采用。
  • 未来方向 包括 (1) 训练对领域适配的 LLM,使其明确了解物理单位,(2) 将贝叶斯不确定性量化纳入约束循环,(3) 将该框架应用于真实工业数据集(例如流体流动诊断、 电池退化建模)。

作者

  • Jianke Yang
  • Ohm Venkatachalam
  • Mohammad Kianezhad
  • Sharvaree Vadgama
  • Rose Yu

论文信息

  • arXiv ID: 2602.12259v1
  • 分类: cs.AI, cs.LG
  • 发布时间: 2026年2月12日
  • PDF: 下载 PDF
0 浏览
Back to Blog

相关文章

阅读更多 »