[Paper] 空间脉冲神经网络实现高效且鲁棒的时序计算
发布: (2025年12月11日 GMT+8 03:01)
8 min read
原文: arXiv
Source: arXiv - 2512.10011v1
概览
本文提出 空间脉冲神经网络(SpSNNs),一种通过将神经元嵌入物理空间来处理脉冲神经网络中突触延迟的新方法。网络不再为每条连接学习单独的延迟,而是学习每个神经元的坐标,延迟自动由它们之间的欧氏距离产生。这大幅减少了可训练参数的数量,同时保持(甚至提升)了时间处理性能。
主要贡献
- 神经元空间嵌入:引入一种框架,延迟由低维欧氏空间(2‑D/3‑D)中神经元之间的距离决定,从而消除每个突触的延迟参数。
- 参数效率:相较于学习无约束延迟的传统 SNN,参数量最多减少 18 倍,且精度不受影响。
- 几何正则化:实验表明,受限于 2‑D 或 3‑D 空间的网络优于“无限维”延迟向量网络,说明空间约束起到了有益的正则化作用。
- 动态稀疏化:提出一种稀疏感知的训练方案,可在保持完整任务性能的前提下剪枝高达 90 % 的连接。
- 硬件友好设计:论证了学习得到的空间布局可以自然映射到类脑芯片(如交叉开关、网格网络),实现低延迟、低能耗实现。
- 通用梯度计算:通过自定义规则的自动微分推导出精确的延迟梯度,使该方法兼容任意脉冲神经元模型或网络结构。
方法论
- 神经元坐标学习 – 为每个神经元 (i) 分配一个可学习向量 (\mathbf{p}_i \in \mathbb{R}^d)(通常 (d=2) 或 (3))。
- 延迟提取 – 神经元 (i) 与神经元 (j) 之间的突触延迟计算为
[ \tau_{ij} = \alpha , |\mathbf{p}_i - \mathbf{p}_j|_2, ]
其中 (\alpha) 为将距离转换为时间步的缩放因子。 - 训练循环 – 网络使用时间反向传播(BPTT)端到端训练。自定义 autograd 规则将梯度传播通过基于距离的延迟函数,使坐标能够与常规权重参数一起更新。
- 稀疏度调度 – 在训练期间逐步施加稀疏掩码,零化幅值最小的权重。掩码定期更新,使网络能够适应连接数的减少。
- 基准测试 – 实验在两个时间分类任务上进行:
- Yin‑Yang(合成时空模式分类)。
- Spiking Heidelberg Digits (SHD)(类语音脉冲序列)。
所有实验均将 SpSNN 与学习每条突触独立延迟的基线 SNN 进行比较。
结果与发现
| 指标 | 基线 SNN(无约束延迟) | SpSNN(2‑D) | SpSNN(3‑D) |
|---|---|---|---|
| 参数数量 | ~1.2 M | ~70 k(≈ 18× 更少) | ~90 k |
| Yin‑Yang 准确率 | 96.3 % | 98.1 % | 97.9 % |
| SHD 准确率 | 84.2 % | 86.5 % | 86.2 % |
| 稀疏容忍度 | 剪枝 > 70 % 时性能下降 | 在 90 % 剪枝下保持准确率 | 同上 |
- 性能提升:尽管参数量大幅下降,SpSNN 在两个基准上始终取得更高的分类准确率。
- 维度最佳点:2‑D 与 3‑D 嵌入优于更高维度的延迟向量,说明适度的空间结构既提供足够的表达能力,又起到正则化作用。
- 对剪枝的鲁棒性:即使剪除 90 % 的突触,稀疏化的 SpSNN 仍能匹配密集基线,验证了空间表征能够集中关键信息。
实际意义
- 类脑硬件对齐 – 由于延迟现在是物理距离的函数,芯片可以直接将神经元坐标映射到其布局上,省去每条突触延迟的存储与查找,从而显著降低内存带宽和能耗。
- 可扩展的边缘 AI – 开发低功耗传感器(如基于事件的摄像头、音频脉冲)时,可部署内存占用极小的 SpSNN,实现微控制器或 ASIC 上的实时时序推理。
- 模型部署简化 – 每个神经元只需保存一组坐标,远比数百万的延迟参数更易序列化和版本管理,简化 CI/CD 流程。
- 可迁移的空间先验 – 学到的几何布局可以可视化,并有可能在不同任务间复用(例如,在语音上学到的“空间嵌入”可用于手势识别的初始化)。
- 兼容现有框架 – 作者提供的自定义 autograd 规则可直接插入类 PyTorch 环境,开发者无需重写底层仿真代码即可进行实验。
局限性与未来工作
- 固定缩放因子 – 距离到延迟的转换系数 (\alpha) 目前保持不变,采用自适应缩放可能进一步提升灵活性。
- 欧氏空间假设 – 实际类脑芯片可能存在不规则的路由约束;探索非欧氏或基于图的嵌入是一个开放方向。
- 基准范围 – 实验仅聚焦于相对短的脉冲序列分类;在更长、更层次化的时序任务(如语言建模)上进行评估可检验可扩展性。
- 硬件验证 – 虽然论文论证了硬件友好性,但在类脑芯片(如 Loihi、BrainChip)上的具体实现仍留待后续工作。
结论:空间脉冲神经网络将“延迟”问题转化为几何问题,显著削减参数量、提升精度,并为更节能的类脑系统铺平道路。对于追求实时、低功耗时序 AI 的开发者而言,SpSNN 提供了一个兼顾硬件感知的有力替代方案。
作者
- Lennart P. L. Landsmeer
- Amirreza Movahedin
- Mario Negrello
- Said Hamdioui
- Christos Strydis
论文信息
- arXiv ID: 2512.10011v1
- 分类: cs.NE, q-bio.NC
- 发布日期: 2025 年 12 月 10 日
- PDF: Download PDF