[Paper] 同一大脑，不同预测：预处理选择如何削弱 EEG 解码可靠性

发布: 3天前 (2026年5月8日 GMT+8 11:58)

9 分钟阅读

原文: arXiv

Source: arXiv - 2605.07212v1

Overview

本文揭示了 EEG‑基机器学习系统中一个隐藏的不可靠因素：原始信号的预处理方式可以显著颠覆模型的预测结果，即使底层深度学习架构保持不变。作者将每一步预处理视为“反事实干预”，量化预测结果对这些选择的依赖程度，并提出了用于测量、诊断和缓解该问题的工具。

关键贡献

Formal counterfactual framework for EEG preprocessing, mapping the 2⁷ (128) possible pipeline configurations to a well‑defined intervention space.
→ 针对 EEG 预处理的正式反事实框架，将 2⁷（128）种可能的流水线配置映射到明确定义的干预空间。
Empirical evidence of instability: up to 42 % of trial‑level predictions change solely because of different preprocessing pipelines, across six diverse EEG datasets.
→ 实证不稳定性证据：在六个不同的 EEG 数据集上，最高 42 % 的试次级预测仅因使用不同的预处理流水线而发生变化。
Walsh‑Hadamard decomposition of the pipeline space, showing that the effect of each preprocessing step is almost additive, enabling fast, step‑wise optimization.
→ 对流水线空间进行 Walsh‑Hadamard 分解，表明每个预处理步骤的影响几乎是可加的，从而实现快速的逐步优化。
Preprocessing Uncertainty (PU): a per‑trial metric that captures how sensitive a prediction is to preprocessing variations, complementing traditional model confidence scores.
→ Preprocessing Uncertainty (PU)： 一种针对每个试次的度量，捕捉预测对预处理差异的敏感性，补充传统模型置信分数。
Normalized Adaptive PGI (NA‑PGI): a graph‑structured regularizer that leverages the compositional relationships among pipelines to reduce prediction volatility.
→ Normalized Adaptive PGI (NA‑PGI)： 一种图结构正则化器，利用流水线之间的组合关系来降低预测波动性。

方法论

管线定义： 作者选择了七种常见的 EEG 预处理操作（例如带通滤波、伪迹剔除、重新参考、分段）。每个操作可以开启或关闭，形成唯一标识管线的二进制向量。
反事实干预空间： 将每个二进制向量视为一次干预，他们为每个数据集生成了全部 128 种可能的管线。
模型训练与评估： 在原始数据上一次训练标准卷积神经网络（CNN）用于 EEG 解码，然后在测试集的 128 种预处理版本上进行评估，模型权重保持不变。
Walsh‑Hadamard 分解： 该数学变换将整体预测方差分解为各个预处理步骤及其交互的贡献。近似可加的结果表明高阶交互可以忽略不计。
预处理不确定性（PU）： 对每个试次，PU 计算为所有管线预测分布的熵，得到一个简单的标量，用于标记不稳定实例。
NA‑PGI 正则化器： 训练期间构建一个图，节点为管线，边连接仅在单一步骤上不同的管线。正则化器惩罚跨边的预测大幅跳变，鼓励管线图上的平滑性。

结果与发现

预测翻转： 在六个数据集（运动想象、视觉诱发电位、语音感知等）中，随着管道的切换，预测类别发生变化的试次数比例在 12 % 到 42 % 之间。
可加性： Walsh‑Hadamard 分析显示，> 90 % 的方差可以用各单独步骤效应之和解释；高阶交互作用贡献 < 5 %。
PU 作为诊断工具： 高 PU 分数的试次始终对应模型置信度低且错误率高，表明 PU 可用于在实时系统中标记“风险”预测。
NA‑PGI 效果： 添加 NA‑PGI 正则化器将平均翻转率降低约 15 %（例如在最不稳定的数据集上从 38 % 降至 23 %），且未牺牲整体准确率。
可推广性： 观察到的不稳定性在不同模型架构（CNN、LSTM、Transformer）以及主体依赖和主体独立的训练方案中均保持一致。

Practical Implications

Robust BCI Deployments: 开发者在构建脑‑机接口时应将预处理视为超参数空间，而非固定步骤；像 PU 这样的工具可以集成到运行时监控中，当不确定性激增时中止或请求重新采集。
Standardized Reporting: 该研究强调论文和开源仓库需要明确记录每一个预处理选择，以实现可重复性和公平的基准测试。
Automated Pipeline Search: 由于每一步的影响近似可加，简单的贪心或贝叶斯优化在二进制管道空间上可以快速收敛到低 PU 配置，节省相较于穷举网格搜索的时间。
Regulatory & Clinical Settings: 在医学 EEG 应用（如癫痫发作检测）中，加入 PU 可以满足安全要求，提供系统决策不是隐藏预处理偏差的伪影的额外置信层。
Tooling Opportunities: Walsh‑Hadamard 分解和 NA‑PGI 正则化器可以打包为流行 EEG 库（MNE‑Python、Braindecode）的插件，为开发者提供开箱即用的稳定性提升。

限制与未来工作

预处理步骤的范围： 本研究考察了七种常见操作；其他领域特定的步骤（例如，源定位、ICA 成分选择）可能表现出不同的交互模式。
固定模型权重： 分析中在改变流水线时保持神经网络静止；同时优化模型参数和预处理可能进一步降低不稳定性。
数据集多样性： 虽然使用了六个数据集，但全部为实验室受控实验。真实世界的噪声环境（例如，可穿戴 EEG）可能会放大或改变观察到的效应。
计算成本： 对所有 128 条流水线进行穷举评估在超大数据集上可能不可行；未来工作可以探索使用代理模型在不进行完整枚举的情况下估计 PU。

底线： 预处理不仅是“可有可无”的数据清洗步骤——它是一个决定性因素，能够颠覆你的 EEG 模型预测。通过测量并正则化这一隐藏的不确定性来源，开发者可以构建更可靠、透明且可部署的脑机接口系统。

作者

Dengzhe Hou
Zihao Wu
Lingyu Jiang
Zirui Li
Fangzhou Lin
Kazunori D. Yamada

论文信息

arXiv ID: 2605.07212v1
分类: cs.LG, cs.AI, cs.HC, cs.NE, eess.SP
出版日期: 2026年5月8日
PDF: Download PDF

[Paper] 同一大脑，不同预测：预处理选择如何削弱 EEG 解码可靠性

Overview

关键贡献

方法论

结果与发现

Practical Implications

限制与未来工作

作者

论文信息

相关文章

[Paper] 归一化轨迹模型

[Paper] Zero-Shot 想象语音解码 via 想象到聆听的MEG映射

[Paper] GRAPHLCP：结构感知的图上局部化 Conformal Prediction

[论文] VecCISC：提升基于置信度的自一致性——推理轨迹聚类与候选答案选择