[Paper] EARL：面向普适 AI 的液态状态机能耗感知优化

发布: 1个月前 (2026年1月9日 GMT+8 02:31)

7 分钟阅读

原文: arXiv

Source: arXiv - 2601.05205v1

概述

本文介绍了 EARL，一种新颖的框架，能够在显式考虑预测准确性和设备能耗的前提下自动调优液态状态机（LSM）。通过将贝叶斯优化与强化学习驱动的选择策略相结合，EARL 使得在为可穿戴设备、物联网边缘节点和神经形态芯片供电的低功耗硬件上部署能效高的时序神经模型变得可行。

Problem formulation – 作者将 LSM 调优视为一个 多目标 优化问题：在最大化准确率的同时最小化能耗。
Bayesian backbone – 高斯过程代理模型用于刻画 LSM 超参数（例如，储层规模、连通性、突触时间常数）与两个目标之间的关系。该代理模型会推荐搜索空间中有前景的区域。
RL selection policy – 一个 actor‑critic 代理观察代理模型的预测以及已评估点的历史，然后决定下一个评估的候选。奖励函数在准确率提升与实际能耗之间进行平衡，促使代理“学习”能耗感知的权衡。
Early termination – 在候选的训练过程中，轻量监控器检查中间的损失和功耗指标。如果轨迹低于动态阈值，则中止运行，以节省计算周期。
Iterative loop – 每完成一次评估后更新代理模型，定期重新训练强化学习策略，循环重复直至预算（时间或评估次数）耗尽。

整个管线使用纯 Python 实现，利用 scikit‑optimize 处理贝叶斯部分，使用 stable‑baselines3 进行强化学习，使其能够轻松集成到现有开发环境中。

Source: …

基准测试	相对于基线的准确率 ↑	相对于基线的能耗 ↓	优化时间 ↓
Speech Commands (Google)	+9 %	–73 %	×8 更快
DVS Gesture (event‑camera)	+12 %	–68 %	×10 更快
ECG Arrhythmia (medical)	+6 %	–80 %	×6 更快

总体而言，研究验证了 能耗感知 搜索并非仅仅是一个附加功能；它从根本上重塑了 LSM 性能的帕累托前沿。

Source: …

Edge AI 开发者 现在可以自动化“难以调优”的 LSM 超参数，而无需手动遍历数十种配置，从而释放工程时间。
硬件设计师 获得了一种量化工具，可评估神经形态基底（例如，忆阻器交叉阵列、低功耗 ASIC）变化对可行 LSM 设计空间的影响。
实时应用 如语音助理、手势识别或健康监测，能够在电池供电的设备上运行 LSM 推理，并拥有可预测的能耗预算，延长设备运行时间。
框架集成 —— 由于 EARL 基于广泛使用的 Python 库构建，它可以封装进 CI 流水线（例如 GitHub Actions），在出现新数据或硬件修订时持续重新优化模型。

简而言之，EARL 弥合了学术 LSM 研究与面向生产、受能量约束的 AI 部署之间的鸿沟。

模型特异性： 当前实验聚焦于 LSM；将该方法扩展到其他脉冲神经架构（例如使用反向传播的 SNN）可能需要重新设计代理特征。
能量测量粒度： 能量估计依赖于平台特定的分析工具；这些测量的不准确性可能会导致 RL 奖励偏差。进行硬件在环评估可以提升真实性。
RL 策略的可扩展性： 虽然 RL 代理在所探索的适度超参数空间中表现良好，但在非常高维的搜索（例如联合架构与训练调度搜索）中可能会拖慢策略的学习速度。
未来方向 包括：(1) 融入多设备联邦优化，以在边缘节点之间共享代理知识；(2) 探索元学习，为新任务对 RL 策略进行热启动；以及 (3) 融入硬件感知约束，如热限制或实时截止期限。