[Paper] 基于 Stringology 的 EEG 信号模式发现:ADHD 案例研究
发布: (2026年3月4日 GMT+8 03:44)
7 分钟阅读
原文: arXiv
Source: arXiv - 2603.03476v1
概述
一个新的计算框架利用 stringology——对字符串的算法研究——来发现 EEG 记录中重复出现的时间模式。通过将多通道 EEG 轨迹视为符号序列,作者展示了保序匹配和笛卡尔树匹配如何揭示传统频谱分析常常遗漏的细微、ADHD 特异性模式。
关键贡献
- 将字符串算法的新颖应用(顺序保持匹配,OPM;笛卡尔树匹配,CTM)于连续 EEG 时间序列。
- 幅度不变的模式检测,侧重相对顺序和层次形状,而非原始电压水平。
- 定量模式描述符(频率、长度、梯度不稳定性、树深度),用于区分 ADHD 患者与神经典型对照。
- 在公开多通道 EEG 数据集上进行概念验证,显示出统计显著的组间差异。
- 开源流水线(代码和预处理脚本),可适用于其他神经生理信号。
Source: …
方法论
- 预处理 – 将原始 EEG 进行带通滤波、降采样,并划分为重叠窗口。每个窗口通过对样本幅度进行排序(保持顺序)或构建 笛卡尔树(捕获峰谷的层次顺序)来转换为 符号表示。
- 模式发现 –
- OPM 搜索相对顺序重复的子序列,而不考虑绝对幅度。
- CTM 在笛卡尔树中匹配子树,检测保持嵌套 “峰‑谷” 结构的模式。
- 模式量化 – 对每个发现的模式,框架记录:
- 频率(在整个记录中出现的次数)
- 长度(样本数)
- 梯度不稳定性(相邻样本之间的平均和最大绝对差异)
- 树深度与分支因子(层次复杂度)。
- 统计分析 – 使用非参数检验进行组水平比较(ADHD 与对照组),并进行多重比较校正。
结果与发现
| Metric | ADHD | Controls | Interpretation |
|---|---|---|---|
| Motif frequency | ↑ (显著更高) | – | ADHD 参与者的 EEG 包含更多重复模式,表明重复性更高。 |
| Motif length (OPM) | ↓ (更短的 motif) | – | 反复出现的模式更简短,暗示神经动力学的快速切换。 |
| Gradient instability (OPM) | ↑ (平均值和最大值变化更大) | – | motif 内幅度摆动更快,反映神经放电的不稳定性。 |
| Tree depth (CTM) | ↓ (树深度更浅) | – | 峰谷的层级组织程度降低,意味着结构复杂性较低。 |
| Number of hierarchical levels (CTM) | ↓ | – | ADHD 的 motif 缺乏深层嵌套,符合“更简化”时间结构的特征。 |
总体而言,这些结果指向 ADHD 相关的 EEG 特征:相较于神经典型个体,它们更具重复性、时间稳定性更差且层级结构更为简化。
实际意义
- 客观生物标志物管线 – 基于模体的描述符可以集成到 ADHD 筛查或治疗监测的临床决策支持工具中,提供对行为评估的定量补充。
- 实时监测 – 由于 OPM 和 CTM 在滑动窗口上运行并依赖简单的顺序比较,它们可以在边缘设备(例如可穿戴 EEG 头盔)上实现,用于即时检测异常模式。
- 跨模态扩展 – 同一字符串学框架可应用于其他生物信号(EMG、ECG、动作捕捉),在这些信号中相对顺序比绝对幅值更重要。
- 机器学习特征工程 – 模体频率、长度和树深度可以作为可解释的特征用于下游机器学习分类器,可能在仅使用原始时间序列或频谱特征时提升诊断准确性。
- 神经反馈与脑机接口 – 通过定位高模体重复的时刻,神经反馈方案可以针对特定的时间动态,脑机接口则可以将模体出现作为控制信号。
限制与未来工作
- 数据集规模与多样性 – 本研究使用了单一公开的 EEG 队列;需要在更广泛的年龄、共病情况和记录硬件上进行验证。
- 参数敏感性 – 窗口长度、重叠以及符号映射阈值会影响 motif 检测;系统的超参数调优可能提升鲁棒性。
- motif 的可解释性 – 虽然统计差异显著,但将特定 motif 与认知或行为状态关联仍是未解之谜。
- 与谱测量的整合 – 未来工作应探索将基于 motif 的描述符与传统频域特征相结合的混合模型,以获得更丰富的表征。
- 实时部署 – 为低功耗硬件优化 OPM/CTM 算法并评估实时 EEG 流的延迟,是迈向临床应用的下一步。
作者
- Anat Dahan
- Samah Ghazawi
论文信息
- arXiv ID: 2603.03476v1
- 类别: q-bio.NC, cs.DS, cs.IR, cs.NE
- 发布时间: 2026年3月3日
- PDF: 下载 PDF