[Paper] 从研究到实践：行业中自动驾驶系统测试的交互式快速综述

发布: 3天前 (2026年5月1日 GMT+8 17:13)

8 分钟阅读

原文: arXiv

Source: arXiv - 2605.00531v1

概述

自动驾驶系统（ADS）测试是实现规模化安全上路的自驾车之前最艰巨的障碍之一。本文弥合了学术界对 ADS 测试的研究与大型汽车原始设备制造商（OEM）工程师日常工作之间长期存在的鸿沟。通过与 21 位行业从业者进行一次 interactive rapid review（交互式快速评审），作者揭示了最紧迫的测试挑战，并评估了现有研究在实际解决这些问题方面的有效性。

关键贡献

实践者驱动的挑战图谱： 识别并优先排序了12个真实世界的ADS测试挑战，其中“端到端（E2E）ADS的测试完整性”和“有效的测试用例生成”成为最主要关注点。
首个交互式快速综述： 一种新颖的综述方法，在证据收集和分析阶段全程邀请行业专家参与，确保研究结果扎根于实际实践。
对17项研究的系统评估： 将当前学术解决方案映射到两个最高优先级的挑战上，评估其相关性、成熟度和采纳难易度。
可操作的差距分析： 清晰展示研究的不足之处（例如，缺乏情境感知的场景生成，与现有汽车工具链的集成有限）。
未来工作路线图： 为旨在提供面向行业的ADS测试技术的研究者提供具体建议。

方法论

利益相关者研讨会： 作者组织了结构化会议，邀请了来自一家领先汽车制造商的 21 位工程师、测试经理和安全分析师。参与者列出了测试中的痛点，并对最关键的痛点进行投票。
快速文献扫描： 使用一组聚焦关键词（例如 “autonomous driving testing”、 “scenario generation”、 “end‑to‑end verification”），团队收集了 17 篇直接针对这两个主要挑战的最新同行评审研究。
交互式相关性评分： 实务人员审阅每篇论文的摘要、方法论和报告的结果，然后在 practical relevance、readiness for integration 和 coverage of real‑world constraints 三个维度上进行打分。
综合与差距识别： 将得分进行汇总，作者进行主题分析，以突出文献中的共同优势、弱点以及缺失的部分。

该方法刻意保持轻量（因此称为 “rapid”），但仍具系统性，使得评审能够在数周内完成，同时将行业声音置于核心位置。

结果与发现

挑战优先级： 70 % 的参与者将 E2E 测试完整性 标记为最大障碍，其次是 高影响力测试场景的生成。
研究焦点不匹配： 17 篇论文中有 12 篇专注于 场景合成（例如对抗性或极端案例生成），但很少涉及包括感知、规划和控制在内的 全栈端到端验证。
准备度差距： 仅有 3 项研究被评为“可采纳”（即提供工具支持、清晰的 API，并已在生产级车辆模型上验证）。其余被视为“概念性”或“原型级”。
上下文感知缺失： 从业者指出，大多数学术场景忽视了领域特定约束，如交通法规、车辆动力学限制或传感器布置，限制了其实用性。
工具链集成： 所评估的工作均未提供与 OEM 现有仿真流水线（如 CARLA、PreScan 或专有硬件在环设置）的无缝挂钩。

总体而言，综述揭示了一个 显著的脱节：学术界在生成新颖测试用例方面表现出色，但往往未能提供端到端、符合行业需求的测试框架。

实际意义

对于开发者： 预计需要花更多时间策划和适配学术测试用例生成器，而不是直接将其插入你的 CI 流水线。寻找能够公开可配置场景参数并能导出到你的仿真环境的开源工具。
对于测试工程师： 优先考虑能够提供 可追溯性，即从生成的场景回溯到安全需求（例如 ISO 26262、SOTIF）的解决方案。论文中的差距分析可作为评估新测试供应商的检查清单。
对于工具供应商： 市场明确需要 即插即用 的端到端（E2E）测试套件，能够集成场景生成、传感器模型保真度以及自动结果分析。投资基于标准的 API（例如 OpenSCENARIO、OpenDRIVE）将降低采纳阻力。
对于项目经理： 为与学术界或研究实验室的 协同开发 项目分配预算，重点开展针对已识别的两个高优先级挑战的概念验证试点。

简而言之，该研究推动行业走向 共同设计 的测试解决方案，而不是单方面采用学术原型。

限制与未来工作

单公司关注： 所有从业者的输入均来自一家汽车 OEM，这可能限制挑战列表对其他制造商或新兴出行参与者的普适性。
快速审查范围： 出于设计目的，文献检索范围有意设得较窄；可能遗漏了关键词集合之外或在截止日期后发表的相关工作。
评估深度： 从业者基于摘要和有限的演示对论文进行评分；更深入的实操试验可能会揭示额外的集成障碍。

作者提出的未来研究方向包括：构建 上下文感知场景生成器，将监管和车辆特定约束嵌入其中；开发用于端到端（E2E）测试完整性的 标准化评估指标；以及开展 多公司纵向研究，以验证所提出的产业‑研究对齐框架。

作者

Qunying Song
Ali Nouri
Håkan Sivencrona
Federica Sarro

论文信息

arXiv ID: 2605.00531v1
分类: cs.SE
发表时间: 2026年5月1日
PDF: 下载 PDF

[Paper] 从研究到实践：行业中自动驾驶系统测试的交互式快速综述

概述

关键贡献

方法论

结果与发现

实际意义

限制与未来工作

作者

论文信息

相关文章

[Paper] Q-ARE：基于查询的 API 推荐评估数据集

[Paper] 更深入思考，别忽视你的选项：重新审视 Issue-Commit 链接与 LLM 辅助检索

[Paper] 不安全且未使用？成熟开源项目中的 Utility Code 历史

[Paper] 我希望我们不要去信任广告对爱情所做的事