[Paper] 使用神经网络从数据中学习偏微分方程的函数组件

发布: 3天前 (2026年2月14日 GMT+8 02:32)

8 分钟阅读

原文: arXiv

Source: arXiv - 2602.13174v1

概述

本文展示了如何通过在控制方程中嵌入神经网络，直接从数据中学习偏微分方程（PDE）的未知函数组件。将这些网络视为灵活的函数逼近器，作者表明他们能够在非局部聚合‑扩散模型中高精度地恢复相互作用核和外部势能，为数据驱动的科学建模开辟了新途径。

关键贡献

神经网络增强的 PDE 框架： 引入了一种系统的方法，用可训练的神经网络替代 PDE 中的未知函数。
功能项的恢复： 表明仅凭稳态观测，该方法即可在任意精度（受数据质量限制）下重建相互作用核和外部势。
全面的灵敏度分析： 量化观察到的解的数量、采样密度、噪声水平以及解的多样性如何影响恢复成功率。
与现有工作流的兼容性： 训练好的 PDE 可像任何传统模型一样用于仿真、预测或控制，无需专门的推断工具。
开源实现： 提供代码和 notebook，使从业者能够在自己的数据集上复现实验。

方法论

问题设定 – 从包含一个或多个未知标量函数的偏微分方程（例如控制非局部相互作用的核 (K(x))）开始。
神经嵌入 – 用小型前馈神经网络 ( \hat{K}_\theta(x) )（参数为权重 (\theta)）替代每个未知函数。此时 PDE 变为 参数化 方程。
数据收集 – 收集系统在不同边界条件或初始状态下的稳态快照（例如密度场）。
损失构建 – 对每个快照，使用神经增强模型计算 PDE 的残差。损失是所有空间点和所有快照的均方残差。
训练 – 使用标准的基于梯度的优化器（Adam、L‑BFGS）优化网络权重。由于损失对 (\theta) 可微，反向传播会自动更新函数近似。
验证 – 训练后，在未见的快照上评估学习到的网络，或将其用于向前模拟 PDE，确认恢复的函数能够产生真实的动力学。

工作流类似于经典的参数估计流程（例如拟合扩散系数），但将对象从标量常数扩展到函数。

结果与发现

精确的核恢复: 在合成的聚合‑扩散问题中，当仅提供 5 组不同的稳态剖面时，该方法能够以低于 1 % 的相对误差重建交互核。
对噪声的鲁棒性: 即使在高达 5 % 的高斯测量噪声下，学习得到的函数仍保持在真实值的 3 % 以内，这归功于 PDE 残差损失的正则化作用。
采样密度重要: 更细的空间网格（每个域长度 ≥ 100 个点）显著降低误差，而粗糙网格会产生混叠伪影，网络难以纠正。
多个解提升可辨识性: 当仅有单一稳态时，恢复的函数是欠定的；加入多样的解（不同的边界条件或外部力）可以消除歧义。
训练后实用性: 经过训练的 PDE 现在配备了学习得到的函数，能够对未见过的初始条件预测瞬态动力学，误差可与完全已知模型相媲美。

实际意义

加速模型发现: 工程师可以将神经网络嵌入到传统 PDE 代码中，自动从实验测量中推断缺失的物理规律，从而减少昂贵的试错建模。
实时校准: 在流体动力学、材料科学或流行病学等领域，该方法能够在新传感器数据流入时即时更新相互作用定律。
即插即用的仿真: 一旦训练完成，神经增强的 PDE 表现得像任何标准求解器——开发者可以复用现有的数值库（有限元、谱方法），无需重新设计推断算法。
增强的逆向设计工作流: 自组装材料或群体机器人设计者可以从观测到的集体模式中提取底层相互作用规则，然后复用这些规则来合成新的行为。
跨学科复用: 该方法对具体的 PDE 形式保持中立；任何使用未知函数项建模现象的领域（例如气候子网格参数化、金融扩散模型）都可以采用它。

限制与未来工作

对稳态数据的依赖： 当前研究聚焦于平衡观测；将其扩展到时变数据可以提升适用范围，但会增加额外的训练复杂度。
可辨识性约束： 当未知函数仅通过某些积分变换出现时，多个函数形式可能产生相同的残差；此时可能需要引入基于物理的先验或正则化项。
高维可扩展性： 实验仅在 1‑D 和 2‑D 场景下进行；将神经嵌入扩展到 3‑D 或更高维度可能需要更复杂的网络结构（例如卷积神经网络或傅里叶神经算子）。
计算成本： 训练过程中需要在整个域上反复求解 PDE 残差，对大规模工业仿真而言成本较高。未来工作可以探索代理模型或多保真度训练方案。

总体而言，本文在经典 PDE 建模与现代深度学习之间搭建了有力的桥梁，为开发者提供了一种直接从数据中发现隐藏函数关系的实用工具。

作者

Torkel E. Loman
Yurij Salmaniw
Antonio Leon Villares
Jose A. Carrillo
Ruth E. Baker

论文信息

arXiv ID: 2602.13174v1
分类: cs.LG, math.AP
出版日期: 2026年2月13日
PDF: 下载 PDF

相关文章

阅读更多 »

[Paper] 模仿有效方法：Simulation-Filtered Modular Policy Learning 来自人类视频

通过观看人类视频来学习操作技能的能力有望为机器人学习打开一个高度可扩展的新数据来源。在这里，…

[Paper] 语义分块与自然语言的熵

印刷英文的熵率被广泛估计约为每字符一比特，这一基准是现代大型语言模型（LLMs）仅仅……

[Paper] CoPE-VideoLM：用于高效视频语言模型的 Codec 原语

Video Language Models (VideoLMs) 使 AI 系统能够理解视频中的 temporal dynamics。为了适应最大 context window 限制，当前的方法……

[Paper] CMIP6模型在Jhelum和Chenab流域区域降水预测与气候变化评估中的选择

有效的水资源管理取决于对水道流量的准确预测。对于投射的气候数据，使用不同的General Circulation…