[Paper] 一种稳健且可推广的设备无关深度学习模型,用于基于三轴腕部加速度计的睡眠-觉醒判定
发布: (2025年12月2日 GMT+8 02:43)
7 min read
原文: arXiv
Source: arXiv - 2512.01986v1
概述
一种新的深度学习模型能够可靠地从原始手腕加速度计数据中推断出一个人是睡眠还是清醒,且不受所使用设备品牌的影响。该算法在 453 名成人(包括睡眠呼吸暂停、静息腿综合征患者以及广泛年龄段的受试者)上进行测试,其与多导睡眠监测(临床金标准)的匹配程度远优于以往的活动记录法,尤其在检测清醒期方面表现突出。
主要贡献
- 设备无关的架构 – 在三种商业可得的三轴手腕加速度计上表现同样出色。
- 三类分类(清醒、睡眠、伴有觉醒的睡眠),随后合并为二元睡眠‑清醒决策,提升了清醒检测能力。
- 针对低效率睡眠者的有针对性训练,以增强对短暂觉醒的敏感性。
- 在睡眠障碍(阻塞性睡眠呼吸暂停、周期性肢体运动)和 18–85 岁年龄段上表现稳健。
- 可开源的流水线(30 秒 epoch 特征提取、轻量级 CNN/LSTM 混合),可嵌入移动端或可穿戴 SDK。
方法论
- 数据采集 – 在一家三级睡眠诊所对 453 名参与者同步记录手腕加速度计和整夜多导睡眠监测。三种不同设备(Device A、B、C)以 30 Hz 采集三轴加速度。
- 预处理 – 将原始信号划分为 30 秒 epoch(与 PSG 相同的分辨率)。对每个轴计算标准统计特征和频域特征(如均值、方差、谱功率)。
- 模型设计 – 混合深度网络包括:
- 一个小型 1‑D 卷积层堆叠,用于捕获短期运动模式。
- 一个双向 LSTM 层,用于建模跨 epoch 的时间依赖。
- 最终的 soft‑max 输出头,产生三类:清醒、睡眠、伴觉醒的睡眠。
- 训练策略 – 为解决长期存在的清醒检测不足问题,作者对低睡眠效率(< 80 %)或高觉醒指数(> 15 h⁻¹)的受试者进行过采样(仅使用一种设备),随后在所有三种设备的其余记录上进行验证。
- 后处理 – 简单的决策树将三类输出合并为二元睡眠‑清醒标签,并采用规则:将“伴觉醒的睡眠”计为睡眠用于总睡眠时间计算,但可在后续睡眠质量指标中标记。
结果与发现
| 指标 | 数值 |
|---|---|
| F1‑Score(二元) | 0.86 |
| 灵敏度(检测睡眠) | 0.87 |
| 特异度(检测清醒) | 0.78 |
| 与 PSG 总睡眠时间的相关性 | R = 0.69 |
| 与 PSG 睡眠效率的相关性 | R = 0.63 |
- 在三种加速度计模型间性能保持稳定(ΔF1 < 0.02)。
- 对于中至重度阻塞性睡眠呼吸暂停(AHI > 15)或周期性肢体运动的参与者,准确率无显著下降。
- 该模型能够正确识别传统活动记录算法常漏检的短暂觉醒,降低了“睡眠时间高估”的偏差。
实际意义
- 消费级可穿戴设备:制造商可将模型集成到固件或配套应用中,提供临床级睡眠指标,无需额外传感器。
- 远程健康监测:远程睡眠诊所可依赖廉价手腕设备进行长期睡眠追踪,从而将 PSG 资源留给复杂病例。
- 科研与药物试验:大规模睡眠结局研究可使用该模型在异构设备群中统一睡眠‑清醒标注,降低数据清洗成本。
- 个性化反馈:由于算法会标记“伴觉醒的睡眠”,开发者可构建 UI 元素展示微觉醒事件,帮助用户了解睡眠碎片化。
- 边缘部署:网络参数量小于 200 k,能够在低功耗微控制器上本地推理,延长电池寿命并保护用户隐私(无需云端上传)。
局限性与未来工作
- 人群偏差——所有受试者均来自临床睡眠实验室;在健康社区人群中的表现仍需验证。
- 单夜记录——未探讨夜间间变性;未来工作应评估长期稳定性。
- 设备采样率——本研究使用 30 Hz 加速度计;采样率 ≤ 5 Hz 的超低功耗设备可能需要重新训练或量化模型。
- 可解释性——虽然模型优于基于规则的活动记录,但解释哪些运动模式驱动清醒检测仍是未解之谜。
核心结论:该设备无关的深度学习方法缩小了消费级活动记录与临床多导睡眠监测之间的差距,为日常技术产品提供更准确、可扩展的睡眠监测奠定了基础。
作者
- Nasim Montazeri
- Stone Yang
- Dominik Luszczynski
- John Zhang
- Dharmendra Gurve
- Andrew Centen
- Maged Goubran
- Andrew Lim
论文信息
- arXiv ID: 2512.01986v1
- 分类: q-bio.QM, cs.LG
- 出版时间: 2025 年 12 月 1 日
- PDF: Download PDF