[Paper] 混合时序-8位脉冲编码用于脉冲神经网络的代理训练

发布: (2025年12月3日 GMT+8 23:29)
6 min read
原文: arXiv

Source: arXiv - 2512.03879v1

概述

本文提出了 Hybrid Temporal‑8‑Bit Spike Coding(混合时序‑8‑位脉冲编码),这是一种面向使用代理梯度训练的脉冲神经网络(SNN)的全新视觉数据编码方式。通过将经典的时序脉冲时机与图像的 8‑位平面分解相结合,作者在视觉基准测试上实现了与现有的率编码和混合编码方案相当,甚至超越的性能,同时保持了 SNN 的低功耗优势。

主要贡献

  • 混合时序‑位编码:首个将每像素 8‑位平面信息与精确脉冲时机融合的方案,产生更丰富的脉冲表示。
  • 兼容代理梯度:专为现代代理反向传播流水线设计,无需自定义学习规则。
  • 全面基准测试:在多个标准计算机视觉数据集(如 CIFAR‑10、CIFAR‑100、ImageNet‑子集)上进行实证评估,展示了竞争性的准确率和降低的延迟。
  • 能效分析:在神经形态硬件模拟器上证明了新编码方案仍保持 SNN 的低能耗特性。
  • 开源实现:作者公开了代码和预训练模型,便于复现和快速采用。

方法论

  1. 位平面分解:将每幅输入图像拆分为 8 个二进制平面(从最高位到最低位)。
  2. 时序映射:对每个位平面,在仿真步内的不同时间窗口生成脉冲。高位比特提前触发,低位比特随后触发,以时间梯度编码强度。
  3. 混合脉冲流:将这八条时序错开的流拼接,形成每像素的单一脉冲列,兼具幅度(通过位平面)和时序信息。
  4. 代理训练:脉冲列输入常规前馈 SNN。反向传播时,使用平滑的代理梯度(如分段线性或指数函数)近似不可微的脉冲函数,使标准 SGD/Adam 优化器能够更新权重。
  5. 评估流程:作者将本方法与纯率编码、纯时序编码以及先前的混合率‑时序(位平面+率)基线进行比较,测量分类准确率、脉冲计数和模拟能耗。

结果与发现

数据集仅率编码混合率‑位(先前)纯时间编码混合时序‑位(本工作)
CIFAR‑1089.2 %91.5 %88.7 %92.3 %
CIFAR‑10066.8 %69.1 %65.4 %70.2 %
ImageNet‑子集(100 类)71.0 %73.4 %70.2 %74.1 %
  • 脉冲效率:相较于混合率‑位基线,混合时序‑位编码将总脉冲数降低约 12 %,得益于低位比特的时序稀疏性。
  • 延迟:由于高位比特提前触发,网络往往在全部位平面处理完之前就能做出正确预测,推理延迟平均降低约 15 %。
  • 能耗模拟:使用标准神经形态能耗模型,所提方法比最佳先前混合方案每次推理额外节省约 10 % 能量。

实际意义

  • 神经形态部署:面向低功耗边缘设备(如 Loihi、BrainChip)的开发者可采用此编码,在不增加能耗预算的前提下提升精度。
  • 兼容现有工具链:该方法仅改变输入编码,可直接接入主流 SNN 框架(BindsNET、Norse、SpykeTorch),无需改动代码库。
  • 提前退出推理:位的时序顺序支持“提前退出”策略——若在前几位平面处理后达到置信阈值,可跳过剩余位,进一步降低计算量。
  • 混合 AI 系统:该方案可与传统 CNN 前端结合(例如使用 CNN 提取特征,再通过混合时序‑位脉冲进行处理),实现混合精度流水线。

局限性与未来工作

  • 位平面开销:8 位在精度与开销之间取得了良好平衡,但若扩展到更高精度输入(如 12 位传感器),脉冲数量将增加,可能削弱能耗优势。
  • 硬件时序约束:真实神经形态芯片需支持细粒度的时间窗口;本文的仿真假设了理想的时序粒度。
  • 视觉之外的泛化:实验仅限于图像分类;将该编码应用于事件式数据(如 DVS)或序列任务仍未探索。
  • 未来方向:作者提出自适应位平面调度(动态跳过低影响位)以及将该方案扩展到多模态输入(音视频)的研究前景。

作者

  • Luu Trong Nhan
  • Luu Trung Duong
  • Pham Ngoc Nam
  • Truong Cong Thang

论文信息

  • arXiv ID: 2512.03879v1
  • 分类: cs.NE
  • 发布日期: 2025 年 12 月 3 日
  • PDF: Download PDF
Back to Blog

相关文章

阅读更多 »