[Paper] 利用微分平坦性实现约束多输入仿射系统的高效学习型模型预测控制

发布: 1天前 (2026年4月28日 GMT+8 01:14)

7 分钟阅读

原文: arXiv

Source: arXiv - 2604.24706v1

请提供您希望翻译的具体文本内容，我将为您翻译成简体中文，并保留原始的格式、Markdown 语法以及技术术语。谢谢！

Overview

本文提出了一种基于学习的模型预测控制（MPC）新方案，利用 微分平坦性——一种在许多机器人中常见的结构特性——显著降低在线控制的计算成本。通过将平坦性与概率学习模型相结合，作者实现了一种能够遵守输入限制和状态约束的 MPC，并且足够快速，可在多输入、非线性、控制仿射系统上实现实时部署。

系统扩展与平坦输出选择
- 原始的控制仿射动力学通过加入辅助状态进行扩展，使得存在一个平坦输出（一组输出，其轨迹唯一确定完整的状态和输入）。
学习不确定动力学
- 高斯过程（GP）用于建模已知名义模型未捕获的残差动力学。GP 提供均值预测和不确定性估计，以用于安全性评估。
平坦空间 MPC 形式化
- 通过在平坦输出空间表述控制问题，非线性动力学在平坦坐标下变为线性，从而将 MPC 转化为具有块对角成本矩阵的二次规划（QP）。
顺序凸优化
- 在每个时间步，求解两个凸规划：
  a. 确定性等价 QP，在忽略不确定性的情况下计算名义轨迹。
  b. 鲁棒化 QP，基于 GP 方差收紧约束，以确保概率安全性。
约束执行
- 输入限制直接施加在控制变量上。平坦状态的半空间约束（例如，保持在走廊内）通过平坦空间中的线性不等式实现。
基于 Lyapunov 的安全检查
- 作者证明，在 GP 不确定性模型下，所选 Lyapunov 函数的期望值会下降，从而在概率意义上保证系统的稳定性。

场景	基线 (GP‑MPC)	提议的 Flat‑MPC	加速比
仿真 6‑DOF 机械臂（轨迹跟踪）	RMS误差 ≈ 0.018 m	RMS误差 ≈ 0.020 m	~4× 更快
实际四旋翼悬停‑跟随测试	RMS误差 ≈ 0.12 m	RMS误差 ≈ 0.13 m	~3.5× 更快
约束违规率	< 1 %（紧）	< 1 %（相似）	—

Flatness requirement: 方法依赖于平坦输出的存在（或构造）；缺乏此属性的系统无法直接受益。
GP scalability: 虽然控制问题计算量小，但 GP 回归仍随训练点数量呈立方增长，这可能成为长期学习的瓶颈。建议使用稀疏 GP 或神经网络代理作为解决方案。
Half‑space constraints only: 当前的表述仅处理平坦状态上的线性（半空间）约束；将其扩展到任意非线性状态约束仍是一个未解决的挑战。
Robustness to model mismatch: 理论保证假设 GP 能准确捕获残差动力学；大的未建模扰动可能削弱稳定性。未来工作旨在结合基于鲁棒管道的 MPC 或自适应不确定性界限。