[Paper] 同一大脑,不同预测:预处理选择如何削弱 EEG 解码可靠性

发布: (2026年5月8日 GMT+8 11:58)
9 分钟阅读
原文: arXiv

Source: arXiv - 2605.07212v1

Overview

本文揭示了 EEG‑基机器学习系统中一个隐藏的不可靠因素:原始信号的预处理方式可以显著颠覆模型的预测结果,即使底层深度学习架构保持不变。作者将每一步预处理视为“反事实干预”,量化预测结果对这些选择的依赖程度,并提出了用于测量、诊断和缓解该问题的工具。

关键贡献

  • Formal counterfactual framework for EEG preprocessing, mapping the 2⁷ (128) possible pipeline configurations to a well‑defined intervention space.
    → 针对 EEG 预处理的正式反事实框架,将 2⁷(128)种可能的流水线配置映射到明确定义的干预空间。

  • Empirical evidence of instability: up to 42 % of trial‑level predictions change solely because of different preprocessing pipelines, across six diverse EEG datasets.
    → 实证不稳定性证据:在六个不同的 EEG 数据集上,最高 42 % 的试次级预测仅因使用不同的预处理流水线而发生变化。

  • Walsh‑Hadamard decomposition of the pipeline space, showing that the effect of each preprocessing step is almost additive, enabling fast, step‑wise optimization.
    → 对流水线空间进行 Walsh‑Hadamard 分解,表明每个预处理步骤的影响几乎是可加的,从而实现快速的逐步优化。

  • Preprocessing Uncertainty (PU): a per‑trial metric that captures how sensitive a prediction is to preprocessing variations, complementing traditional model confidence scores.
    Preprocessing Uncertainty (PU): 一种针对每个试次的度量,捕捉预测对预处理差异的敏感性,补充传统模型置信分数。

  • Normalized Adaptive PGI (NA‑PGI): a graph‑structured regularizer that leverages the compositional relationships among pipelines to reduce prediction volatility.
    Normalized Adaptive PGI (NA‑PGI): 一种图结构正则化器,利用流水线之间的组合关系来降低预测波动性。

方法论

  1. 管线定义: 作者选择了七种常见的 EEG 预处理操作(例如带通滤波、伪迹剔除、重新参考、分段)。每个操作可以开启或关闭,形成唯一标识管线的二进制向量。
  2. 反事实干预空间: 将每个二进制向量视为一次干预,他们为每个数据集生成了全部 128 种可能的管线。
  3. 模型训练与评估: 在原始数据上一次训练标准卷积神经网络(CNN)用于 EEG 解码,然后在测试集的 128 种预处理版本上进行评估,模型权重保持不变。
  4. Walsh‑Hadamard 分解: 该数学变换将整体预测方差分解为各个预处理步骤及其交互的贡献。近似可加的结果表明高阶交互可以忽略不计。
  5. 预处理不确定性(PU): 对每个试次,PU 计算为所有管线预测分布的熵,得到一个简单的标量,用于标记不稳定实例。
  6. NA‑PGI 正则化器: 训练期间构建一个图,节点为管线,边连接仅在单一步骤上不同的管线。正则化器惩罚跨边的预测大幅跳变,鼓励管线图上的平滑性。

结果与发现

  • 预测翻转: 在六个数据集(运动想象、视觉诱发电位、语音感知等)中,随着管道的切换,预测类别发生变化的试次数比例在 12 % 到 42 % 之间。
  • 可加性: Walsh‑Hadamard 分析显示,> 90 % 的方差可以用各单独步骤效应之和解释;高阶交互作用贡献 < 5 %。
  • PU 作为诊断工具: 高 PU 分数的试次始终对应模型置信度低且错误率高,表明 PU 可用于在实时系统中标记“风险”预测。
  • NA‑PGI 效果: 添加 NA‑PGI 正则化器将平均翻转率降低约 15 %(例如在最不稳定的数据集上从 38 % 降至 23 %),且未牺牲整体准确率。
  • 可推广性: 观察到的不稳定性在不同模型架构(CNN、LSTM、Transformer)以及主体依赖和主体独立的训练方案中均保持一致。

Practical Implications

  • Robust BCI Deployments: 开发者在构建脑‑机接口时应将预处理视为超参数空间,而非固定步骤;像 PU 这样的工具可以集成到运行时监控中,当不确定性激增时中止或请求重新采集。
  • Standardized Reporting: 该研究强调论文和开源仓库需要明确记录每一个预处理选择,以实现可重复性和公平的基准测试。
  • Automated Pipeline Search: 由于每一步的影响近似可加,简单的贪心或贝叶斯优化在二进制管道空间上可以快速收敛到低 PU 配置,节省相较于穷举网格搜索的时间。
  • Regulatory & Clinical Settings: 在医学 EEG 应用(如癫痫发作检测)中,加入 PU 可以满足安全要求,提供系统决策不是隐藏预处理偏差的伪影的额外置信层。
  • Tooling Opportunities: Walsh‑Hadamard 分解和 NA‑PGI 正则化器可以打包为流行 EEG 库(MNE‑Python、Braindecode)的插件,为开发者提供开箱即用的稳定性提升。

限制与未来工作

  • 预处理步骤的范围: 本研究考察了七种常见操作;其他领域特定的步骤(例如,源定位、ICA 成分选择)可能表现出不同的交互模式。
  • 固定模型权重: 分析中在改变流水线时保持神经网络静止;同时优化模型参数和预处理可能进一步降低不稳定性。
  • 数据集多样性: 虽然使用了六个数据集,但全部为实验室受控实验。真实世界的噪声环境(例如,可穿戴 EEG)可能会放大或改变观察到的效应。
  • 计算成本: 对所有 128 条流水线进行穷举评估在超大数据集上可能不可行;未来工作可以探索使用代理模型在不进行完整枚举的情况下估计 PU。

底线: 预处理不仅是“可有可无”的数据清洗步骤——它是一个决定性因素,能够颠覆你的 EEG 模型预测。通过测量并正则化这一隐藏的不确定性来源,开发者可以构建更可靠、透明且可部署的脑机接口系统。

作者

  • Dengzhe Hou
  • Zihao Wu
  • Lingyu Jiang
  • Zirui Li
  • Fangzhou Lin
  • Kazunori D. Yamada

论文信息

  • arXiv ID: 2605.07212v1
  • 分类: cs.LG, cs.AI, cs.HC, cs.NE, eess.SP
  • 出版日期: 2026年5月8日
  • PDF: Download PDF
0 浏览
Back to Blog

相关文章

阅读更多 »