[Paper] 利用微分平坦性实现约束多输入仿射系统的高效学习型模型预测控制

发布: (2026年4月28日 GMT+8 01:14)
7 分钟阅读
原文: arXiv

Source: arXiv - 2604.24706v1

请提供您希望翻译的具体文本内容,我将为您翻译成简体中文,并保留原始的格式、Markdown 语法以及技术术语。谢谢!

Overview

本文提出了一种基于学习的模型预测控制(MPC)新方案,利用 微分平坦性——一种在许多机器人中常见的结构特性——显著降低在线控制的计算成本。通过将平坦性与概率学习模型相结合,作者实现了一种能够遵守输入限制和状态约束的 MPC,并且足够快速,可在多输入、非线性、控制仿射系统上实现实时部署。

关键贡献

  • 平坦感知学习 MPC:引入一种显式利用微分平坦性的控制器,以简化优化问题。
  • 通用多输入支持:将之前仅限单输入系统的平坦性方法扩展到任意维度的输入向量。
  • 约束处理:同时考虑硬输入界限和对平坦状态的半空间约束,早期方法常常忽略这些。
  • 概率 Lyapunov 保证:仅使用每个控制步的两个顺序凸规划,提供期望 Lyapunov 下降的理论保证。
  • 计算效率:相较于标准高斯过程(GP)MPC,实现了 多倍加速,且跟踪性能相当。
  • 真实世界验证:在高保真仿真和实际硬件实验上验证了该方法,显示出竞争性的跟踪精度。

方法论

  1. 系统扩展与平坦输出选择
    • 原始的控制仿射动力学通过加入辅助状态进行扩展,使得存在一个平坦输出(一组输出,其轨迹唯一确定完整的状态和输入)。
  2. 学习不确定动力学
    • 高斯过程(GP)用于建模已知名义模型未捕获的残差动力学。GP 提供均值预测和不确定性估计,以用于安全性评估。
  3. 平坦空间 MPC 形式化
    • 通过在平坦输出空间表述控制问题,非线性动力学在平坦坐标下变为线性,从而将 MPC 转化为具有块对角成本矩阵的二次规划(QP)
  4. 顺序凸优化
    • 在每个时间步,求解两个凸规划:
      a. 确定性等价 QP,在忽略不确定性的情况下计算名义轨迹。
      b. 鲁棒化 QP,基于 GP 方差收紧约束,以确保概率安全性。
  5. 约束执行
    • 输入限制直接施加在控制变量上。平坦状态的半空间约束(例如,保持在走廊内)通过平坦空间中的线性不等式实现。
  6. 基于 Lyapunov 的安全检查
    • 作者证明,在 GP 不确定性模型下,所选 Lyapunov 函数的期望值会下降,从而在概率意义上保证系统的稳定性。

结果与发现

场景基线 (GP‑MPC)提议的 Flat‑MPC加速比
仿真 6‑DOF 机械臂(轨迹跟踪)RMS误差 ≈ 0.018 mRMS误差 ≈ 0.020 m~4× 更快
实际四旋翼悬停‑跟随测试RMS误差 ≈ 0.12 mRMS误差 ≈ 0.13 m~3.5× 更快
约束违规率< 1 %(紧)< 1 %(相似)
  • 跟踪性能:Flat‑MPC 对参考轨迹的跟踪精度几乎与完整的 GP‑MPC 相当。
  • 计算时间:在嵌入式处理器上求解两个小型 QP 只需几毫秒,而完整的 GP‑MPC 需要数十毫秒。
  • 安全性:在整个实验过程中,输入饱和和 flat‑state 约束均得到满足,验证了实际中的概率 Lyapunov 保证。

实际意义

  • 实时部署在资源受限平台(例如无人机、移动机械手)变得可行,且不牺牲安全性或性能。
  • 简化控制器设计:工程师可以复用已有的机器人平坦性分析,并以最小的重新调参将学习型 MPC 接入。
  • 可扩展到高自由度系统:由于优化随平坦输出数量线性增长,即使是复杂的机械手也能受益于快速的 MPC 更新。
  • 混合模型学习流水线:该方法展示了将基于物理的模型(名义部分)与数据驱动残差相结合的具体路径,降低了实现精确控制所需的数据量。
  • 面向自主车队的潜力:快速、约束感知的 MPC 可嵌入车队级运动规划器,使每辆车在动态环境中快速响应并遵守安全边界。

限制与未来工作

  • Flatness requirement: 方法依赖于平坦输出的存在(或构造);缺乏此属性的系统无法直接受益。
  • GP scalability: 虽然控制问题计算量小,但 GP 回归仍随训练点数量呈立方增长,这可能成为长期学习的瓶颈。建议使用稀疏 GP 或神经网络代理作为解决方案。
  • Half‑space constraints only: 当前的表述仅处理平坦状态上的线性(半空间)约束;将其扩展到任意非线性状态约束仍是一个未解决的挑战。
  • Robustness to model mismatch: 理论保证假设 GP 能准确捕获残差动力学;大的未建模扰动可能削弱稳定性。未来工作旨在结合基于鲁棒管道的 MPC 或自适应不确定性界限。

作者

  • Tobias A. Farger
  • Adam W. Hall
  • Angela P. Schoellig

论文信息

  • arXiv ID: 2604.24706v1
  • 分类: eess.SY, cs.LG, cs.RO
  • 发表时间: 2026年4月27日
  • PDF: 下载 PDF
0 浏览
Back to Blog

相关文章

阅读更多 »

[Paper] 递归多智能体系统

递归或循环语言模型最近作为一种新的扩展轴出现,通过在潜在状态上迭代细化相同的模型计算来加深 …