[Paper] 通过参数重构实现脉冲神经网络的全局最优训练

发布: 3天前 (2026年5月9日 GMT+8 01:10)

8 分钟阅读

原文: arXiv

Source: arXiv - 2605.08022v1

概览

本文提出了一种 全局最优的脉冲神经网络（SNN）训练算法，该算法摆脱了对代理梯度的常规依赖。通过将 SNN 学习问题重新表述为 参数重建 任务，作者在一大类 SNN 架构上实现了可证明的最优解，从而在多种基准测试中提供了更稳定、更准确的模型。

问题重新表述 – 作者将 SNN 视为 并行递归阈值网络，其中每个神经元的输出是过去脉冲的线性组合的二进制阈值。通过利用这种结构，他们证明当以提升的辅助变量集合来表达时，损失表面是凸的。
参数重建 – 与其通过不可微的脉冲进行反向传播，算法求解一系列 凸优化问题，从辅助变量重建权重矩阵。这提供了一个闭式（或可高效求解）的解，对给定的辅助状态全局最优。
训练循环
- 前向传播: 使用标准的泄漏积分‑发放动力学模拟脉冲，以收集辅助变量。
- 重建步骤: 求解凸子问题以更新权重。
- 可选的代理梯度步骤: 使用少量代理梯度 epoch 对网络进行微调，以捕获任何残余的非凸性。
实现细节 – 凸子问题使用现成的求解器（例如投影梯度下降）求解，其计算复杂度随神经元数量和时间步线性增长，使该方法在现代 GPU/TPU 流水线中实用。

数据集 / 任务	基线（Surrogate‑Grad）	仅重建	混合（重建 + SG）
CIFAR‑10（SNN，4‑层）	71.2 %	77.5 %	79.1 %
DVS‑Gesture（基于事件）	92.3 %	94.6 %	95.2 %
CartPole（强化学习）	185 步	210 步	225 步
扩展（10× 数据）	降低约5 %	< 1 % 下降	< 0.5 % 下降

Energy‑Efficient Edge Deployment: 更高精度的 SNN 意味着实现目标性能所需的脉冲更少，直接转化为神经形态硬件（例如 Intel Loihi、IBM TrueNorth）上的更低功耗。
Simplified Training Pipelines: 开发者可以用确定性的重建步骤替代精细的 surrogate‑gradient 超参数调优，从而降低工程开销。
Rapid Prototyping for Event‑Based Sensors: 该方法对不同时间步分辨率的鲁棒性，使其在依赖事件相机的应用场景（如自主无人机、可穿戴健康监测、实时视频分析）中具有吸引力。
Hybrid Learning Strategies: 现有的 SNN 库（例如 BindsNET、Norse）可以将重建模块作为插件集成，使团队能够在不重写整个代码库的情况下尝试混合方法。
Potential for Large‑Scale SNNs: 已展示的可扩展性暗示未来的大规模神经形态模型（例如用于语音或语言处理）可以更可靠地训练，为基于 SNN 的大型 transformer 模型替代方案打开了大门。

作者建议探索 自适应重构策略，即在凸更新与代理梯度之间动态选择，并将理论扩展到 脉冲变压器架构，这被视为未来研究的有前景方向。