[Paper] 基于特征的语义感知调度用于能量采集联邦学习
发布: (2025年12月2日 GMT+8 02:40)
6 min read
原文: arXiv
Source: arXiv - 2512.01983v1
Overview
本文提出了一种 语义感知客户端调度 技术,用于在从环境中收集能量的设备上进行联邦学习(FL)。通过估计本地模型更新实际能够提升全局模型的程度,该方法削减了不必要的计算——这往往是边缘设备能耗的主要来源。作者使用轻量级的 版本信息年龄(VAoI)代理实现了这一点,使该方法在实际能量受限的 FL 部署中具有可行性。
Key Contributions
- 基于 VAoI 的调度:利用语义感知的新鲜度度量(VAoI)来优先选择既及时又信息丰富的更新。
- 特征代理:用一次前向传播的中间层特征提取取代昂贵的全参数统计距离,将计算量降低了数量级。
- 能量感知客户端选择:将收集的能量约束直接纳入调度决策,防止在设备无法负担时进行浪费的本地训练。
- 大量实验评估:在高度非 IID 数据和严重能量匮乏的情况下,相比现有的 EH‑FL 基线,展示了更高的模型精度和约 30 % 的能量节省。
Methodology
- 问题表述 – 每个边缘设备会随机收集能量,需要决定是 (a) 进行本地 DNN 更新训练,(b) 传输更新,还是 (c) 维持空闲。目标是在满足设备能量预算的前提下最大化全局模型性能。
- 版本信息年龄 (VAoI) – VAoI 衡量模型版本的“陈旧程度”以及其参数与当前全局模型的差异(即更新的语义相关性)。传统 VAoI 需要在整个参数空间上计算距离,这在低功耗硬件上不可行。
- 特征代理 – 作者在一次 前向传播 中对小批量验证数据提取 DNN 中间层的激活。特征向量之间的欧氏距离作为完整参数距离的替代指标,以更少的计算捕捉冗余信息。
- 调度算法 – 在每轮通信时,服务器收集 (i) 每个客户端的收集能量状态 和 (ii) 代理 VAoI 估计。随后求解一个轻量级的背包类选择问题,挑选出每焦耳贡献最高的客户端子集。
- 训练循环 – 被选中的客户端执行固定轮数的本地 SGD,然后上传更新。服务器使用 FedAvg 进行聚合并重复上述过程。
Results & Findings
| 指标 | 提议的 VAoI‑代理 | 随机选择 | 能量感知 FIFO |
|---|---|---|---|
| 最终测试精度(CIFAR‑10,极端非 IID) | 78.3 % | 71.5 % | 73.2 % |
| 每轮每客户端的平均能耗 | 0.62 J | 0.84 J | 0.78 J |
| 达到 75 % 精度所需的通信轮数 | 42 | 68 | 55 |
| VAoI 估计的计算开销 | ≈0.5 ms(一次前向) | N/A | N/A |
解释:通过剔除语义上冗余的更新,系统收敛更快且能耗显著降低。特征代理几乎不增加额外延迟,证明其适合在设备端执行。
Practical Implications
- 边缘 AI 部署(如智能摄像头、可穿戴设备)现在可以在不耗尽微小电池的情况下运行 FL,因为它们避免了浪费的本地训练周期。
- 网络运营商 获得了更细粒度的上行流量控制:只有最“有价值”的更新会被传输,从而降低大规模 IoT 场景的拥塞。
- 框架集成 – 该代理可以封装为轻量级的 PyTorch/TensorFlow Hook,方便接入现有的 FL 库(Flower、PySyft、FedML)。
- 能量收集硬件设计者 可以利用调度逻辑更精准地为太阳能/热能收集器进行规格设计,因为算法会在能量稀缺时自行降频。
Limitations & Future Work
- 代理依赖于 固定 的中间层;其效果可能随模型结构(如 Transformer 与 CNN)而异。
- 实验主要聚焦于图像分类基准;在 NLP 或时间序列预测等更广泛的领域仍未验证。
- 调度问题采用贪心求解;探索更优(但仍轻量)的组合求解器可能进一步提升性能。
- 将该方法扩展到 异步 FL 与多任务设置仍是一个开放的研究方向。
Authors
- Eunjeong Jeong
- Giovanni Perin
- Howard H. Yang
- Nikolaos Pappas
Paper Information
- arXiv ID: 2512.01983v1
- Categories: cs.LG, cs.DC, cs.IT, cs.NI, eess.SP
- Published: December 1, 2025
- PDF: Download PDF