[Paper] 层次化在线调度用于节能 Split Inference 的渐进式传输

发布: 3周前 (2026年1月13日 GMT+8 09:56)

7 分钟阅读

原文: arXiv

Source: arXiv - 2601.08135v1

概述

本文介绍了 ENACHI，这是一种层次化的在线调度框架，使边缘设备与云/边缘服务器能够协同进行深度神经网络（DNN）推理，同时保持低能耗和严格的延迟。通过在 任务层面（模型在哪里拆分、预留多少带宽）和 分组层面（如何在噪声且时变的信道上传输数据）同时协调决策，ENACHI 在不耗尽设备电池或错过截止时间的前提下，实现了比以往方法更高的准确率。

关键贡献

两层李雅普诺夫优化，同时处理长期能耗‑精度权衡（外层循环）和短期信道波动（内层循环）。
渐进传输机制，自适应仅发送特征图中最具信息量的部分，减少不必要的数据传输。
参考跟踪功率控制，动态调整每个时隙的发射功率，以满足预先计算的能耗预算，同时响应实时信道条件。
全面评估在 ImageNet 上显示，在严格的延迟约束下，准确率提升最高 43 %，能耗降低 62 %，并在多用户、拥塞场景中保持稳定性能。

方法论

任务级调度（外环）
- 在每个推理请求时，ENACHI 决定 在何处划分 DNN（设备端 vs. 边缘端）以及分配多少带宽。
- 它使用 漂移加惩罚 形式化： “漂移” 使长期能耗保持在参考预算附近，而 “惩罚” 奖励更高的推理准确率。
分组级调度（内环）
- 一旦选定划分点，中间特征张量会通过无线链路传输。
- ENACHI 采用 不确定性感知的渐进传输：特征图被划分为若干分组，按对预测置信度的贡献排序；分组会持续发送，直至边缘能够做出置信的决策。
- 参考跟踪控制器 持续调节每个分组的发送功率，确保瞬时功率保持在外环设定的预算附近，同时应对信道衰落。
基于 Lyapunov 的稳定性保证
- 两个环通过 Lyapunov 函数耦合，证明系统在保持能量预算不发散的同时，推动准确率指标上升。

结果与发现

场景	相对于基线的准确率 ↑	相对于基线的能耗 ↓	延迟影响
紧迫截止时间（≤ 30 ms）且带宽受限（2 Mbps）	+43.12 %	‑62.13 %	始终满足截止时间
适中截止时间（≤ 100 ms）	+21 %	‑35 %	为额外任务提供少量余量
多用户（10 台并发设备）	稳定（≤ 2 % 变动）	每设备能耗保持不变	无额外排队延迟

关键要点

Progressive transmission 将传输的数据量在“易”样本上最多削减 70 %，同时对更难的输入仍会发送额外的数据包。
reference‑tracking power policy 能在信道 SNR 超过 10 dB 波动时，仍将设备的平均功耗控制在目标预算的 5 % 范围内。
ENACHI 能平稳扩展：由于外层循环中的共享带宽分配逻辑，增加用户数量不会提升每台设备的能耗。

Practical Implications

Edge AI 开发者 可以将 ENACHI 集成到中间件层，自动决定最佳的分割点和传输调度，免去针对每个模型或每种网络条件的手动调优。
移动和物联网制造商 获得了一种具体方法，可在可变的 Wi‑Fi/5G 条件下延长电池寿命，同时仍提供实时 AI 服务（例如 AR、语音助手）。
网络运营商 可以提供一个轻量级 API，报告当前带宽和信道统计信息；ENACHI 利用这些信息在竞争设备之间公平分配资源。
渐进式传输 概念可以重新用于其他带宽密集型任务，如视频分析或联邦学习，在这些场景中，提前退出决策可降低通信开销。

限制与未来工作

当前设计假设对 Lyapunov 漂移项拥有 完美的信道统计知识；突发的、非平稳的干扰可能会降低性能。
ENACHI 侧重于 单模型拆分推理；将该框架扩展到 多模型流水线（例如级联检测器）仍是一个待解决的挑战。
在真实环境中部署需要 硬件层面的集成（例如芯片级功率控制器），以充分利用参考跟踪策略——未来工作可以在边缘 ASIC 或智能手机上进行原型验证。

底线：ENACHI 证明了精心编排的层次调度策略能够显著提升设备‑边缘协同推理的能效和准确性，为更具响应性和电池友好的边缘 AI 应用铺平了道路。

作者

Zengzipeng Tang
Yuxuan Sun
Wei Chen
Jianwen Ding
Bo Ai
Yulin Shao

论文信息

arXiv ID: 2601.08135v1
分类: cs.NI, cs.DC, cs.LG
发布时间: 2026年1月13日
PDF: 下载 PDF

[Paper] 层次化在线调度用于节能 Split Inference 的渐进式传输

概述

关键贡献

方法论

结果与发现

Practical Implications

限制与未来工作

作者

论文信息

相关文章

[Paper] 解释在大型推理模型中是否具有泛化性？

[论文] 为 Gemini 构建生产就绪探针

[Paper] ShapeR：从随意捕获中实现稳健的条件3D形状生成

[Paper] MetaboNet：最大公开可用的综合数据集，用于1型糖尿病管理