[Paper] 关于自动驾驶系统调试的系统映射研究
发布: (2026年1月7日 GMT+8 23:50)
6 min read
原文: arXiv
Source: arXiv - 2601.04293v1
Overview
本文首次系统性映射研究,调查研究人员和工程师如何调试 Autonomous Driving Systems (ADS)。虽然测试已受到大量关注,作者认为 调试 步骤——定位并修复故障的根本原因——对安全关键的部署同样至关重要。通过编目 84 项主要研究,作者展示了当前的全景,发现了重复出现的主题,并指出研究社区仍存在的空白。
关键贡献
- 全面的 ADS 调试方法分类(例如,基于仿真、日志分析、形式化方法、机器学习驱动技术)。
- 文献计量分析,展示出版趋势、会议/期刊分布以及主导研究团队。
- 研究空白的识别,如缺乏标准化调试流水线、对实时故障定位支持有限、在生产级平台上的评估稀缺。
- 对统一术语和问题定义的建议,帮助未来工作使用共同语言。
- 未来研究路线图,突出混合调试、自动修复以及与持续集成/持续部署(CI/CD)的集成等有前景的方向。
方法论
作者遵循了经典的系统映射协议:
- 检索策略 – 在主要数字图书馆(IEEE Xplore、ACM DL、Scopus、Web of Science)中使用 “autonomous driving”、 “debugging”、 “fault localisation” 等关键词进行查询。
- 纳入/排除过滤 – 仅保留明确涉及 ADS(自动驾驶系统)调试(或 fault localisation)的同行评审工作,剔除纯测试或仅限仿真的论文。
- 分类方案 – 对每篇主要研究在以下维度上进行编码:调试技术、目标组件(感知、规划、控制)、评估环境(仿真器、真实车辆)以及自动化水平(手动 vs. 自动化)。
- 数据提取与综合 – 汇总编码数据,生成可视化映射(热图、时间线),以揭示研究工作集中的位置。
该过程刻意保持透明,便于其他研究者复制或扩展此映射。
结果与发现
- 主导技术:基于仿真的回放(占研究的42 %)和日志分析工具(35 %)是最常见的。用于调试的形式化验证仅出现在8 % 的论文中。
- 针对的 ADS 子系统:感知模块(相机/LiDAR 处理)获得了大部分调试关注,而规划和控制则研究不足。
- 评估设置:71 % 的工作依赖合成仿真器(CARLA、LGSVL),仅有19 % 在真实车辆或测试轨道上进行测试。
- 自动化缺口:仅有12 % 的方法提供自动化故障定位;其余方法需要手动检查日志或可视化结果。
- 术语碎片化:作者使用了大量术语——“fault localisation”“error diagnosis”“debugging”——常常互换使用,阻碍了跨研究的比较。
总体而言,该领域展示了有前景的早期原型,但缺乏一个统一的、面向工业的调试生态系统。
实际意义
- 开发者工具路线图:该分类法可帮助团队在选择或构建调试工具时匹配其技术栈(例如,将仿真回放与基于 ROS 的日志相集成)。
- CI/CD 集成:所指出的空白提示了将自动化故障定位嵌入持续测试流水线的机会,从而降低 ADS 更新的平均修复时间(MTTR)。
- 安全认证:标准化的术语和问题定义可以简化向监管机构(如 ISO 26262、UNECE WP.29)提供证据的过程。
- 投资优先级:企业可以将研发重点放在服务不足的领域——规划模块调试、真实车辆故障定位以及仿真 + 真实世界的混合方法,以获取竞争优势。
- 跨领域学习:研究中识别的其他安全关键领域技术(例如航空航天故障注入)可被改编用于 ADS,加速其成熟度。
限制与未来工作
- 范围限制:映射仅包括截至 2023 年的英文同行评审论文,可能遗漏近期的行业白皮书或专有解决方案。
- 深度与广度:系统映射倾向于广度;本研究并未深入评估每种调试技术的有效性。
- 快速演变的格局:新的机器学习驱动的调试工具(例如神经注意力可视化器)出现的速度快于文献的捕捉速度。
作者呼吁:
- 为调试 ADS(自动驾驶系统)提供共享基准套件,
- 开源调试工件仓库,
- 对调试干预在实际部署中对安全指标影响的纵向研究。
作者
- Nathan Shaw
- Sanjeetha Pennada
- Robert M Hierons
- Donghwan Shin
论文信息
- arXiv ID: 2601.04293v1
- Categories: cs.SE
- Published: 2026年1月7日
- PDF: 下载 PDF