[Paper] 学习无需加速度测量的物理一致拉格朗日控制模型

发布: (2025年12月3日 GMT+8 02:56)
7 min read
原文: arXiv

Source: arXiv - 2512.03035v1

概览

本文提出了一种新的学习 拉格朗日动力学 的方法,能够在不需要直接加速度测量的情况下对机械系统进行建模。通过设计一个强制物理一致性的损失函数,作者得到的模型既准确,又适用于基于模型的控制(例如反馈线性化和能量整形),并在真实硬件上实现了验证。

主要贡献

  • 物理一致性损失: 引入一种新颖的训练目标,惩罚欧拉‑拉格朗日方程的违背,确保学习到的模型遵守能量守恒和非保守力。
  • 无加速度学习: 仅使用位置、速度和控制输入即可识别拉格朗日模型,无需显式的加速度数据。
  • 混合建模框架: 将数据驱动的神经网络与拉格朗日力学的解析结构相结合,得到可解释的参数(质量矩阵、势能、阻尼)。
  • 全面基准测试: 在仿真摆‑小车系统和真实实验装置上,将该方法与标准的拉格朗日/哈密顿神经网络进行对比评估。
  • 面向控制的验证: 演示了学习到的模型可以直接嵌入反馈线性化和基于能量的控制器,在硬件基准上实现稳定跟踪。

方法论

  1. 问题设定 – 系统满足欧拉‑拉格朗日方程

    [ \frac{d}{dt}!\bigl(\partial_{\dot q}L\bigr)-\partial_{q}L = \tau + f_{\text{nc}}(q,\dot q), ]

    其中 (L) 为拉格朗日(动能 – 势能),(f_{\text{nc}}) 表示摩擦或其他非保守力。

  2. 神经网络表示 – 使用神经网络参数化动能矩阵 (M(q))、势能 (V(q)) 和非保守项 (f_{\text{nc}}(q,\dot q))。网络是全可微的,因而可以自动得到 (\partial_{\dot q}L) 与 (\partial_{q}L) 的解析表达式。

  3. 损失设计 – 不再拟合加速度,而是让 欧拉‑拉格朗日方程的残差 足够小:

    [ \mathcal{L}{\text{phys}} = \bigl| \frac{d}{dt}!\bigl(\partial{\dot q}L\bigr)-\partial_{q}L - \tau - f_{\text{nc}} \bigr|^{2}. ]

    其次加入一个数据拟合项,使预测的速度与测量值相匹配,以平衡物理约束与测量精度。

  4. 训练流程 – 在机器人/实验装置上收集轨迹(位置、速度、控制力矩),利用自动微分得到学习量的时间导数,省去噪声较大的加速度传感器。

  5. 控制合成 – 模型学习完成后,作者解析推导 逆动力学,并将其嵌入标准的非线性控制器(反馈线性化、基于被动性的控制)。

结果与发现

系统基线(拉格朗日 NN)提出 的 物理一致模型
仿真小车‑摆能量平衡违背 12 %,跟踪误差 ≈ 0.45 rad能量违背 < 2 %,跟踪误差 ≈ 0.07 rad
真实摆装置反馈线性化下不稳定(3 秒后发散)稳定跟踪,稳态误差 < 5 % 持续 30 秒
数据效率需要 > 10 k 样本才能达到可接受性能约 3 k 样本即可获得相近精度
  • 物理一致性 显著提升:学习得到的质量矩阵保持正定,总能量在噪声数据上仍表现符合预期。
  • 控制性能:基于新模型的控制器收敛更快,对扰动的鲁棒性也高于使用通用黑箱神经动力学的控制器。

实际意义

  • 无加速度计系统辨识 – 对缺乏高质量惯性传感器的机器人平台(如软体机器人、低成本机械臂)仍能获得可靠的动力学模型。
  • 基于模型的控制流水线 – 工程师可以直接将学习到的拉格朗日模型集成到现有的控制工具链(MATLAB/Simulink、ROS)中,无需手工推导运动方程。
  • 数据高效学习 – 物理感知的损失显著降低了所需训练数据量,使得现场校准在生产线或野外机器人上成为可能。
  • 安全关键应用 – 通过保证模型遵守基本能量定律,降低了因学习到的虚假动力学导致的控制不稳定风险。

局限性与未来工作

  • 可扩展性 – 当前实验仅涉及低维系统(≤ 4 自由度)。将方法推广到高自由度机械臂或柔性结构可能需要更复杂的网络结构或稀疏先验。
  • 非平滑非保守力 – 目前未显式处理具有粘滑或冲击的摩擦模型;作者指出更丰富的 (f_{\text{nc}}) 表示有望提升真实性。
  • 实时推理 – 虽然在基准测试中推理速度足够,但自动微分的计算开销在嵌入式硬件上可能成为瓶颈。
  • 跨任务泛化 – 模型仅在单一工作区间训练;未来工作可探索持续学习或领域适应,以在负载或环境变化时保持一致性。

作者

  • Ibrahim Laiche
  • Mokrane Boudaoud
  • Patrick Gallinari
  • Pascal Morin

论文信息

  • arXiv ID: 2512.03035v1
  • 分类: eess.SY, cs.LG
  • 发布日期: 2025 年 12 月 2 日
  • PDF: Download PDF
Back to Blog

相关文章

阅读更多 »