[Paper] Fly360:全向障碍规避在无人机视角下
发布: (2026年3月7日 GMT+8 02:59)
7 分钟阅读
原文: arXiv
Source: arXiv - 2603.06573v1
Source: …
概述
本文介绍了 Fly360,一种用于配备全景(360°)摄像头的无人机的全向障碍规避系统。通过将原始 RGB 全景图转换为深度图并输入轻量级策略网络,Fly360 使 UAV 能在飞行方向与机头方向不一致时仍能安全导航——这是传统前视传感器难以实现的。
关键贡献
- 问题表述:定义了一个尚未充分研究的任务,即针对能够相对于机体坐标系任意方向移动的无人机的全空间(全向)障碍规避。
- 基准套件:提供了三个具有代表性的飞行任务(例如走廊导航、杂乱竞技场、动态障碍赛道),用于评估全向规避方法。
- 两阶段流水线:
- 感知 – 全景 RGB → 使用单幅图像深度估计器生成稠密深度图。
- 决策 – 一个轻量级神经策略,将深度映射为机体坐标系的速度指令。
- 随机偏航训练策略:在训练期间保持无人机的偏航角随机,使策略只能依赖深度线索,而不是固定的前视。
- 广泛验证:在高保真仿真和真实飞行测试中均表现出相对于前视基线的卓越性能,且代码和预训练模型已公开发布。
方法论
- Data acquisition – 作者们从安装在四旋翼上的 360° 相机收集全景 RGB 图像。
- Depth estimation – 预训练的单目深度网络(例如 MiDaS)处理每幅全景图,生成全球深度图,作为几何感知的表示。
- Policy network – 一个紧凑的卷积模型(≈ 0.5 M 参数)接收深度图并输出无人机机体坐标系下的三个速度分量:前/后、左/右、上/下。未使用显式地图或规划模块;网络学习一种反应式控制律。
- Training regime – 在 AirSim/IsaacGym 中模拟情景,每一步随机化无人机的偏航角。损失函数结合了对 oracle 规划器的模仿(用于早期训练)和强化学习(用于微调避障行为)。
- Evaluation – 三个基准任务强调不同方面:狭窄走廊(精度)、散布障碍的开放竞技场(全局感知)以及移动障碍(反应性)。评估指标包括碰撞率、路径长度和速度指令的平滑度。
结果与发现
| 指标 | Fly360(全景) | 前视基线 |
|---|---|---|
| 碰撞率(走廊) | 2.1 % | 15.8 % |
| 平均路径偏差 | 0.12 m | 0.34 m |
| 成功率(动态竞技场) | 93 % | 71 % |
| 推理延迟(CPU) | ≈ 12 ms | ≈ 9 ms |
- 对偏航的鲁棒性:由于策略从不假设固定的前进方向,即使无人机快速旋转,也能保持低碰撞率。
- 真实世界迁移:在配备 360° 摄像头的 DJI Mavic 2 上的测试显示出与仿真相当的成功率,证实深度优先表示能够降低领域差距。
- 轻量级推理:整个流水线在机载 Jetson Nano 上以 >30 Hz 运行,使其适用于消费级无人机。
实际意义
- 简化传感器堆叠:开发者可以用单个廉价的 360° 相机取代多个前向 LiDAR 或立体视觉装置,从而降低重量和功耗。
- 更灵活的飞行模式:室内检查、仓库盘点或搜救等应用可受益于能够侧向或后退移动而无需重新定向的无人机,缩短任务时间。
- 即插即用集成:发布的模型可以封装为 ROS 节点,便于在现有 UAV 控制流水线中快速原型开发。
- 安全优先的自主性:通过提供响应式、几何感知的防护层,Fly360 可作为高层规划器(例如航点或 SLAM 模块)之下的低层安全层。
限制与未来工作
- 深度估计质量:该方法继承了单目深度网络的误差,尤其在低纹理或明亮的户外场景中。
- 静态相机放置:当前设计假设相机固定且居中安装在 360° 位置;移动或偏置的装置需要重新训练。
- 动态障碍物预测:虽然具备反应性,但策略并未显式预测移动物体的未来轨迹,这可能限制在高速场景中的表现。
- 向更大型 UAV 的可扩展性:作者指出更重的平台可能需要更高分辨率的深度图和更多计算,暗示未来工作可聚焦于模型压缩和多尺度感知。
Fly360 为真正全向、感知驱动的 UAV 导航打开了大门——这是迈向更灵活、安全且对开发者友好的无人机自主性的令人振奋的一步。
作者
- Xiangkai Zhang
- Dizhe Zhang
- WenZhuo Cao
- Zhaoliang Wan
- Yingjie Niu
- Lu Qi
- Xu Yang
- Zhiyong Liu
论文信息
- arXiv ID: 2603.06573v1
- 分类: cs.RO, cs.AI
- 出版日期: 2026年3月6日
- PDF: 下载 PDF