[Paper] 像科学家一样思考：物理引导的 LLM Agent 用于方程发现

发布: 3天前 (2026年2月13日 GMT+8 02:49)

7 分钟阅读

原文: arXiv

Source: arXiv - 2602.12259v1

概述

本文提出了 KeplerAgent，一种受物理指导的 AI 代理，模拟科学家发现方程的过程：首先揭示隐藏的物理属性（例如，对称性、守恒定律），然后利用这些洞察引导符号回归朝向正确的公式。通过将大型语言模型（LLM）与领域特定工具相结合，作者实现了显著更好的方程发现性能——尤其在数据噪声较大时——相较于纯 LLM 或传统回归方法。

关键贡献

Agentic reasoning pipeline 将 结构推断（对称性、维度分析、不变量）与 符号回归 分离。
将 LLM 与基于物理的工具箱集成（例如维度分析库、不变性检测器），为下游回归引擎生成先验。
符号回归后端的动态配置（PySINDy、PySR）——代理根据推断出的物理自动选择函数库并施加结构约束。
全面的基准套件，覆盖经典力学、热力学和电磁学问题，显示出在符号精度和噪声鲁棒性方面的大幅提升。
开源实现，演示如何在可复现的工作流中编排 LLM 调用、工具执行和回归。

方法论

问题设置 – 给定输入变量 (X) 和观测输出 (y) 的数据集，目标是恢复可解释的符号表达式 (f(X))。
科学推理循环
- LLM 提示 – 让 LLM 假设物理属性（例如，“系统是否在旋转下保持不变？”）。
- 基于物理的工具 – 专门模块（维度分析、对称性检测器、守恒量计算器）验证或细化这些假设，生成具体约束，例如“方程必须在长度上是二次齐次的”。
- 约束合成 – 代理将约束转换为符号回归引擎的配置：选择候选函数（如 sin、cos、多项式项）并添加代数限制（如不允许奇次幂）。
符号回归 – 配置好的引擎（PySINDy 或 PySR）在受约束的空间中搜索最佳拟合的符号模型，使用标准的稀疏化或进化策略。
迭代细化 – 如果得到的表达式未通过验证（例如，违反了已发现的不变式），则循环重复，允许 LLM 提出备选假设。

整个管道由轻量级的“代理”协调，代理跟踪状态、决定何时调用工具，并在提交最终方程之前汇总证据。

结果与发现

Benchmark	Baseline (LLM‑only)	Traditional SR (PySINDy)	KeplerAgent	Noise Level (σ)
简谐振子	62 % exact	78 % exact	94 % exact	0.01
摆（大角度）	48 % exact	71 % exact	88 % exact	0.05
热扩散	55 % exact	69 % exact	90 % exact	0.10
Maxwell‑型系统	41 % exact	63 % exact	85 % exact	0.08

符号准确率（恢复真实公式的运行比例）比最强的非代理基线提升了 15‑30 %。
噪声鲁棒性：性能衰减平缓；即使高斯噪声幅度加倍，KeplerAgent 仍保持 >80 % 的准确率，而基线则跌至 50 % 以下。
搜索效率：通过剪枝候选空间，回归步骤收敛速度提升 2‑3 倍，单核 CPU 的计算时间从数分钟缩短至不到一分钟。

实际意义

加速科学建模 – 工程师可以将实验数据输入 KeplerAgent，以获得类似第一性原理的模型，而无需手工构建特征库。
嵌入式诊断 – 在控制系统（如机器人、航空航天）中，代理可以持续从传感器流中推断支配动力学，实现遵循物理约束的自适应控制器。
降低数据需求 – 由于代理利用物理先验，它需要更少的样本即可收敛，这在数据采集昂贵的领域（如材料测试、生物医学实验）中尤为有价值。
工具链可扩展性 – 模块化设计使团队能够插入特定领域的分析器（如热力学势、量子对称性），从而在不同学科间复用该方法。
AI 增强产品的可解释性 – 符号化输出可被人类阅读，便于监管合规和利益相关者对 AI 驱动决策系统的信任。

局限性与未来工作

对 LLM 质量的依赖 – 代理的初始假设仅与底层 LLM 的质量等同；错误识别的对称性可能误导回归步骤。
对高维系统的可扩展性 – 当前实验聚焦于 ≤5 个变量；将其扩展到大规模 PDE 发现需要更复杂的约束传播。
工具集成开销 – 添加新的物理模块需要自定义包装器；一个标准化的 “physics‑as‑a‑service” API 将有助于简化采用。
未来方向 包括 (1) 训练对领域适配的 LLM，使其明确了解物理单位，(2) 将贝叶斯不确定性量化纳入约束循环，(3) 将该框架应用于真实工业数据集（例如流体流动诊断、电池退化建模）。

作者

Jianke Yang
Ohm Venkatachalam
Mohammad Kianezhad
Sharvaree Vadgama
Rose Yu

论文信息

arXiv ID: 2602.12259v1
分类: cs.AI, cs.LG
发布时间: 2026年2月12日
PDF: 下载 PDF

[Paper] 像科学家一样思考：物理引导的 LLM Agent 用于方程发现

概述

关键贡献

方法论

结果与发现

实际意义

局限性与未来工作

作者

论文信息

相关文章

[Paper] 规模化验证在视觉-语言-动作对齐中可能比规模化策略学习更有效

[Paper] UniT：统一多模态链式思考测试时扩展

[Paper] MonarchRT：高效注意力用于实时视频生成

[Paper] 基于 Flow-Guided Neural Operator 的自监督学习在时间序列数据上的应用