[Paper] 鲁棒无迹卡尔曼滤波通过递归元适应的 Sigma-Point 权重

发布: (2026年3月5日 GMT+8 02:27)
8 分钟阅读
原文: arXiv

Source: arXiv - 2603.04360v1

概述

本文提出了 Meta‑Adaptive Unscented Kalman Filtering (MA‑UKF),这是一种使经典 Unscented Kalman Filter (UKF) 在面对变化的动力学和非高斯噪声时更具韧性的全新方法。通过将 sigma‑point 权重视为可学习的超参数,并使用循环元学习模块对其进行更新,作者实现了一种能够在运行时“学习如何信任”其预测与测量的滤波器。

关键贡献

  • 将 sigma‑point 权重选择重新表述为超参数优化问题,而不是固定的手工调节规则。
  • 记忆增强的元学习架构(循环上下文编码器 + 策略网络),能够摄取全部测量创新的历史,在每个时间步生成上下文感知的权重向量。
  • 端到端可微分的 UKF 循环,使得可以通过滤波器的递归方程对权重生成策略进行基于梯度的训练。
  • 对重尾和眩光噪声的鲁棒性,在机动目标跟踪基准上展示了 MA‑UKF 超越标准 UKF、Adaptive UKF 和粒子滤波基线的表现。
  • 对分布外动力学的泛化能力,表明学习到的权重策略能够处理训练期间未见过的运动模式。

方法论

  1. 问题设定 – 经典的无迹卡尔曼滤波(UKF)通过非线性动力学传播一组 sigma 点,并使用由缩放参数 (α, β, κ) 派生的静态权重重新组合这些点。这些权重隐含假设噪声为高斯且动力学是平稳的。

  2. 元适应层

    • 递归上下文编码器:门控循环单元(GRU)处理 创新 向量(测量 – 预测)的序列,并将过去压缩为低维潜在状态 (h_t)。
    • 策略网络:一个小型多层感知器接受 (h_t),输出两个向量:均值权重向量 (w^{(m)}_t) 和协方差权重向量 (w^{(c)}_t)。这两个向量在时间 t 替代固定的 UT 权重。
  3. 可微分 UKF 循环 – UKF 方程(sigma 点生成、传播、测量更新)以能够让梯度通过权重向量传递的方式编写。训练时,损失函数是对模拟轨迹的均方跟踪误差。

  4. 训练方案 – 系统在离线阶段使用多样化的模拟运动模型(匀速、协同转弯、突加速)和噪声条件(高斯、重尾、眩光)进行训练。递归编码器学习捕捉最近测量的“惊讶程度”,策略网络据此对不可靠的 sigma 点进行降权。

  5. 推理 – 在运行时,MA‑UKF 的工作方式与标准 UKF 完全相同,只是在每次更新之前查询编码器‑策略对以获取当前的权重集合。除了一次前向传播一个极小的神经网络外,没有额外的计算开销。

结果与发现

场景基线 (UKF) RMSE自适应 UKF RMSEMA‑UKF RMSE
高斯噪声,平滑运动0.85 m0.78 m0.62 m
重尾闪光噪声1.47 m1.21 m0.84 m
突然机动(训练中未见)2.03 m1.68 m1.12 m
  • 鲁棒性:即使测量噪声与高斯假设相差甚大,MA‑UKF 仍保持低误差。
  • 自适应性:学习到的权重策略能够快速降低异常测量的影响,实际上实现了在线“鲁棒化”。
  • 一致性:协方差估计保持良好校准,避免了许多自适应滤波器常见的过度自信。
  • 计算量:在现代 CPU 上,额外的神经网络前向传播每个滤波步骤增加不到 0.5 ms,保持实时能力。

实际意义

  • 自动驾驶汽车与无人机 – 用于导航的状态估计(例如 GPS/IMU 融合)常受到多径或传感器掉线的影响。MA‑UKF 能够在无需人工调节门限的情况下自动降低受损测量的权重。
  • 雷达/声纳跟踪 – 在杂波环境中,眩光和虚假回波很常见。元自适应权重提供了一种原则性的方法,使得能够持续锁定真实目标。
  • 工业物联网与机器人 – 低成本传感器产生非高斯噪声;部署 MA‑UKF 可以延长旧有硬件的可用寿命。
  • 边缘部署 – 由于策略网络体积极小,该方法可运行在微控制器或嵌入式 GPU 上,实现边缘端的鲁棒滤波。
  • 降低工程开销 – 工程师无需为每个平台手动调节 α、β、κ;滤波器可在短暂的离线仿真阶段学习到最优的加权策略。

限制与未来工作

  • 训练依赖 – 元学习器必须在具有代表性的动力学上进行预训练;极端的分布外(OOD)情形(例如,全新传感器模态)仍可能导致性能下降。
  • 内存占用 – 循环编码器会存储隐藏状态;虽然规模适中,但相较于普通的 UKF 会增加一点内存需求。
  • 理论保证 – 论文提供了经验上的一致性,但缺乏对使用学习权重时滤波器稳定性的正式证明。
  • 未来方向 – 将框架扩展至处理具有异构更新速率的多传感器融合,探索基于 Transformer 的编码器以处理更长的历史序列,并推导使用元自适应权重时估计误差的解析界限。

作者

  • Kenan Majewski
  • Michał Modzelewski
  • Marcin Żugaj
  • Piotr Lichota

论文信息

  • arXiv ID: 2603.04360v1
  • 类别: cs.LG, eess.SP
  • 出版日期: 2026年3月4日
  • PDF: 下载 PDF
0 浏览
Back to Blog

相关文章

阅读更多 »

[论文] SimpliHuMoN: 简化人体动作预测

Human motion prediction 将轨迹预测(trajectory forecasting)和人体姿态预测(human pose prediction)这两个任务结合在一起。针对这两个任务,已经开发了专门的模型……