[Paper] RedunCut：基于测量的采样与准确性性能建模用于低成本实时视频分析

发布: 1个月前 (2025年12月31日 GMT+8 02:01)

8 分钟阅读

原文: arXiv

Source: arXiv - 2512.24386v1

概述

实时视频分析（LVA）为从交通监控仪表盘到基于无人机的检测流水线等各种应用提供动力，但在每一帧上运行最先进的视觉模型很快会变得成本高昂。论文 RedunCut 提出了一种更智能的方法，能够在运行时为每个视频片段挑选“恰当规模”的模型，将计算成本降低至多三分之二，同时保持准确性保证不变。

基于测量的采样规划器 – 一个运行时组件，根据成本‑收益分析决定是否以及采样多少模型，避免浪费的过度采样。
轻量级数据驱动的准确性模型 – 一个快速预测器，估计每个候选模型规模的每段准确率，在无需真实标签的情况下改进选择决策。
对多样工作负载的鲁棒性 – 在道路车辆、无人机和监控视频上进行演示，覆盖多个模型系列（如 YOLO、EfficientDet）和任务（目标检测、分类）。
在所有测试场景中实现 14‑62 % 的计算节省，在固定准确率下，即使只有少量过去运行的历史或视频内容随时间漂移。
无需模型再训练 – RedunCut 与现有的黑盒模型配合使用，可直接嵌入当前 LVA 流程。

分段决策循环 – 将视频流划分为短片段（例如几秒钟）。对于每个片段，RedunCut 必须选择模型规模（小型、中型、大型，……）。
规划器阶段 – 在采样之前，轻量级规划器会估算如果选择更便宜的模型所能减少的计算量，相对于采样若干模型以收集统计信息的开销。规划器使用最近的运行时测量（延迟、置信度分布）来决定最佳的采样次数。
采样阶段 – 如果规划器认为采样是值得的，RedunCut 会在少量帧上运行小子集的候选模型，收集置信度分数，并将其输入准确性预测器。
准确性预测器 – 离线在适度标注的数据集上训练，该模型学习可观测统计量（例如平均置信度、熵）与当前视频领域每个候选模型真实准确率之间的关系。它的运行时间只有微秒级，不会产生明显的额外开销。
模型选择 – 预测器为每个候选模型输出估计的准确率；RedunCut 随后挑选满足用户指定准确率目标的最小模型。选定的模型处理该片段的其余部分，循环在下一个片段重复。

整个流水线被设计为基于测量的：每一次决策都基于实际运行时数据，而非静态启发式规则，这使系统能够适应光照、运动或场景构成的变化。

数据集 / 任务	准确率目标	相对于基准的计算量降低	观察
道路车辆（YOLO‑v5）– 目标检测	90 % mAP	降低 62 % FLOPs	采样开销保持在总成本的 < 5 %
无人机视频（EfficientDet）– 检测	85 % mAP	降低 48 % FLOPs	尽管视角快速变化，预测器仍保持准确
监控（ResNet‑50）– 分类	92 % top‑1	降低 14 % FLOPs	收益适度但稳定；调度器避免了不必要的采样
有限历史（≤ 5 分钟）	90 % mAP	降低 30‑55 %	系统快速收敛到可靠估计
概念漂移（天气变化）	90 % mAP	≈ 40 % 降低	调度器重新评估采样频率，保持低成本

总体而言，RedunCut 将目标准确率保持在相对于基准的 ±1 % 范围内，同时在所有测试场景中实现了可观的计算量节省。

成本效益高的边缘部署 – 智慧城市摄像头或无人机机队的运营商可以仅在需要时运行更大的模型，从而延长电池寿命并降低云入口带宽。
简化的流水线集成 – 由于 RedunCut 将模型视为黑盒，现有推理服务（TensorRT、ONNX Runtime 等）可以在不更改代码的情况下与调度器包装。
动态 SLA – 服务提供商可以提供“精度即服务”合同；RedunCut 会自动调节计算资源，以满足承诺的精度并将支出降至最低。
快速原型开发 – 数据科学家可以在不重新设计运行时的情况下尝试新的模型系列；RedunCut 会自动为每个视频领域发现最具成本效益的模型规模。
可扩展的云计费 – 对于 SaaS 视频分析平台，每帧计算量的降低直接转化为更少的 GPU 使用时长，并为客户提供更可预测的计费。

作者建议探索对准确性预测器的在线自适应学习，并结合基于强化学习的规划器，以进一步收紧成本‑准确性的权衡。