[Paper] 用于物理信息神经网络的稳定自适应损失与基于残差的配点

发布: 2天前 (2026年3月4日 GMT+8 02:17)

8 分钟阅读

原文: arXiv

Source: arXiv - 2603.03224v1

概述

物理信息神经网络（PINNs）通过将控制物理直接嵌入损失函数，提供了一种无网格求解偏微分方程（PDE）的方式。然而，当目标 PDE 刚性很大或包含剧烈冲击——比如低粘性 Burgers 流或相场 Allen‑Cahn 动力学时，标准 PINNs 会出现困难：训练失衡，尽管物理残差看起来很小，预测场却出乎意料地不准确。

论文 “Stabilized Adaptive Loss and Residual‑Based Collocation for Physics‑Informed Neural Networks” 提出了两种互补的技巧，显著提升了 PINN 在这些困难问题上的鲁棒性。

关键贡献

平滑梯度自适应损失平衡 – 一种新方案，监控每个损失组件（初始、边界、PDE 残差）的梯度幅度，并在训练过程中实时重新缩放，确保边界/初始条件在训练中不会被“遗忘”。
残差驱动自适应配点 – 一种算法，将配点（训练点）集中在 PDE 残差较大的区域，自动细化网络对冲击或陡峭梯度的关注。
在刚性 PDE 上的实证验证 – 对一维粘性 Burgers 方程（极低粘性）和 Allen‑Cahn 方程进行的大量实验表明，与普通 PINNs 相比，分别实现了相对 L₂ 误差 44 % 和 ≈70 % 的降低。
使用高保真有限差分求解器进行交叉验证 – 作者展示了改进后的 PINN 解与可信的数值基准相匹配，进一步强化了该方法的可靠性。

Source: …

方法论

基线 PINN 公式 – 网络 (u_\theta(x,t)) 被训练以最小化复合损失

$$ \mathcal{L}=w_{\text{IC}}\mathcal{L}{\text{IC}}+w{\text{BC}}\mathcal{L}{\text{BC}}+w{\text{PDE}}\mathcal{L}_{\text{PDE}}, $$

其中每一项分别衡量初始条件、边界条件以及在一组配点处计算的 PDE 残差的误差。
自适应损失加权 – 与其事先固定 (w_{*})，作者对每个分量的梯度范数 (|\nabla_{\theta}\mathcal{L}_{*}|) 计算平滑的移动平均。该项的权重设为与其近期梯度大小的倒数成正比，即

$$ w_{*} \propto \frac{1}{\text{EMA}\big(|\nabla_{\theta}\mathcal{L}_{*}|\big)}. $$

这可以防止优化器在 PDE 残差上过度聚焦（当边界损失变得很小）或相反的情况。
基于残差的配点 – 每个 epoch 结束后，在稠密的辅助网格上计算 PDE 残差 (|\mathcal{R}(x,t)|)。残差高于某个百分位阈值的点会被重新采样，作为下一 epoch 的新配点；残差低的点则保留但进行降采样。此动态重新分配在没有显式网格的情况下模拟了自适应网格细化。
训练循环 – 自适应加权和配点步骤嵌入标准的随机梯度下降（或 Adam）循环中，每个 epoch 只需额外进行少量前向传播，相对于整体计算成本而言几乎可以忽略不计。

结果与发现

测试问题	传统 PINN L₂ 误差	提出的方法 L₂ 误差	误差降低
粘性 Burgers（ν = 0.001）	3.2 × 10⁻²	1.8 × 10⁻²	~44 %
Allen‑Cahn（ε = 0.01）	5.6 × 10⁻²	1.7 × 10⁻²	~70 %

物理残差 在整个域内保持均匀低值，表明网络即使在冲击附近也遵循控制方程。
边界/初始条件满足度 明显提升；自适应损失防止了在大量训练迭代后常出现的“漂移”。
可视化（此处未展示）显示 Burgers 方程的冲击前沿捕获更为锐利，Allen‑Cahn 方程的界面运动更为准确，均与有限差分参考解相匹配。

Practical Implications

更可靠的工程仿真 PINN – 开发者现在可以在刚性、冲击主导的问题（例如高速气动、燃烧、材料相变）上信任 PINN，而无需使用手工网格细化。
即插即用的改进 – 自适应加权和配点逻辑是对现有 PINN 代码库的轻量包装；它们不需要对神经网络本身的架构进行任何更改。
在给定精度下缩短训练时间 – 由于该方法将样本集中在最关键的位置，达到目标误差所需的总体配点数更少，从而节省计算资源。
为自动化科学发现工作流提供潜力 – 该方法可集成到自动为 PDE 主导系统生成代理模型的框架中，提供更稳健的“黑箱”选项，以实现快速原型设计。

局限性与未来工作

对高维 PDE 的可扩展性 – 实验仅为 1 维；将残差驱动采样扩展到 3 维或复杂几何形状可能需要更智能的点选择启发式方法，以避免组合爆炸。
超参数敏感性 – 用于梯度平滑的 EMA 衰减率和残差百分位阈值由用户手动选择；未探索自动调优策略。
理论保证 – 虽然实验结果表现良好，但对自适应损失方案的形式收敛性分析仍是未解之谜。
与其他 PINN 增强技术的集成（例如基于物理的激活函数、域分解）留待未来研究。

底线：通过动态平衡损失项并将训练点引导至域的“困难”区域，该工作使 PINN 在实际刚性 PDE 问题上更加实用——这是构建物理感知 AI 工具的开发者绝对应当关注的进展。

作者

Divyavardhan Singh
Shubham Kamble
Dimple Sonone
Kishor Upla

论文信息

arXiv ID: 2603.03224v1
类别: cs.LG, cs.AI
发表时间: 2026年3月3日
PDF: 下载 PDF

[Paper] 用于物理信息神经网络的稳定自适应损失与基于残差的配点

概述

关键贡献

方法论

结果与发现

Practical Implications

局限性与未来工作

作者

论文信息

相关文章

[Paper] RoboPocket：使用你的手机即时改进机器人策略

[Paper] Vibe Code Bench：评估 AI 模型在端到端 Web 应用开发中的表现

[论文] SimpliHuMoN: 简化人体动作预测

【论文】SELDON：深度 ODE 网络学习的超新星爆炸