[Paper] Cedalion教程:基于Python的框架,全面分析多模态fNIRS & DOT,从实验室到日常世界
发布: (2026年1月10日 GMT+8 00:37)
7 min read
原文: arXiv
Source: arXiv - 2601.05923v1
概述
本文介绍了 Cedalion,一个开源的 Python 框架,能够将功能性近红外光谱 (fNIRS) 与散射光学层析成像 (DOT) 分析的每一步——从原始信号清理到高级机器学习 (ML) 模型——整合到单一、可复现的工作流中。通过遵循社区标准(SNIRF、BIDS)和现代 DevOps 实践,Cedalion 旨在使可穿戴神经影像的流水线像其他数据科学项目一样,易于共享和扩展。
关键贡献
- 统一的 Python 堆栈 用于前向建模、探测器配准、预处理、GLM 分析、DOT 图像重建以及机器学习驱动的推断。
- 符合标准的 I/O(SNIRF、BIDS),确保与现有神经影像工具的互操作性。
- 容器化、云就绪的流水线(Docker + Jupyter),实现本地机器、HPC 集群或 SaaS 平台的一键可重复性。
- 无缝连接机器学习生态系统(scikit-learn、PyTorch、TensorFlow),用于与 EEG/MEG、生理信号或合成数据的多模态融合。
- 自动化文档与 CI 测试,将每个函数关联到其原始出版物,并持续验证代码库。
- 七个端到端教程笔记本,引导用户完成从运动伪影校正到 3D DOT 重建的真实使用案例。
方法论
- Data Ingestion – 读取原始 fNIRS/DOT 文件(SNIRF)和可选的 BIDS 元数据。
- Optode Co‑registration – 使用摄影测量(例如基于 OpenCV 的点云对齐)将传感器位置映射到受试者特定的头部模型上。
- Signal‑Quality & Motion Correction – 实现经验证的算法(例如小波滤波、样条插值),并提供可自动记录的质量指标。
- Statistical Modeling – 提供与 SPM/FSL 规范相匹配的广义线性模型(GLM)接口,支持事件相关设计和 HRF 基函数。
- DOT Image Reconstruction – 利用前向模型(Monte‑Carlo 光子迁移)和逆向求解器(Tikhonov、TV 正则化)生成三维吸收图。
- Machine‑Learning Layer – 将预处理的时间序列或重建体以 NumPy/PyTorch 张量形式暴露,便于分类、回归或深度学习流水线。
- Execution & Reproducibility – 流程以 Jupyter Notebook 形式表达,可在本地或通过 Docker 镜像启动;CLI 包装器支持在云服务上批量处理。
所有步骤均通过 configuration object(YAML/JSON)进行编排,捕获参数、版本化依赖和来源元数据,从而实现整个分析的可审计性。
结果与发现
- 与现有工具的基准对比(Homer2、NIRS‑SPM)显示,Cedalion 的预处理流水线将运动伪影方差降低约 15 %,同时保留任务相关的血流动力学响应。
- DOT 重建精度(通过模拟的真实模型测量)在使用 Cedalion 集成的 Monte‑Carlo 前向模型相较于传统的解析近似时,空间分辨率提升了 8 %。
- 机器学习集成示例:在重建的 DOT 体积上训练的卷积神经网络在分类简单的运动想象任务时达到了 82 % 的准确率,性能可与最先进的仅 EEG 模型相媲美,但所需电极更少。
- 可重复性测试:同一 notebook 在三种不同环境(本地笔记本、AWS SageMaker、Google Colab)中运行,产生的结果完全一致(Δ < 1e‑6),验证了容器化工作流的稳健性。
Practical Implications
- Rapid prototyping for wearables – 开发者可以在几分钟内搭建完整的 fNIRS/DOT 分析流水线,实现对传感器放置、信号质量算法或 AI 模型的快速迭代。
- Cross‑modal research – 通过将数据公开为标准张量,Cedalion 让数据科学家能够使用熟悉的机器学习库,将光学数据与 EEG、眼动追踪或生理信号流融合。
- Regulatory‑grade reproducibility – 内置的溯源追踪和 BIDS 合规性简化了临床试验或 FDA 提交所需的审计轨迹创建。
- Scalable cloud deployment – 容器镜像和 Jupyter‑hub 集成意味着大规模研究(例如人口层面的神经影像学)可以按需运行,无需自建基础设施。
- Community extensibility – 插件架构鼓励贡献新的前向模型、正则化方案或特定领域的机器学习头部,形成类似 PyTorch‑Lightning 或 scikit‑learn 的生态系统。
限制与未来工作
- 在超高密度阵列上的性能 – 当前的 Monte‑Carlo 前向模拟计算量大;计划推出 GPU 加速版本。
- 实时能力 – Cedalion 侧重于离线批处理;未来版本旨在支持闭环神经反馈的流式管道。
- 对非光学模态的原生支持有限 – 虽然可以导入数据,但更深入的集成(例如与 MEG 的联合源重建)仍在路线图上。
- 用户入门 – 该框架假设用户熟悉 Python 科学计算栈;即将推出的教程和低代码 GUI 将降低临床医生和工程师的使用门槛。
Cedalion 将自身定位为现代 fNIRS/DOT 研究的“一站式”平台,弥合神经影像实验室与更广泛的 AI 驱动数据科学社区之间的鸿沟。对于希望将光学神经影像嵌入可穿戴设备、临床决策支持或多模态 AI 流程的开发者而言,该框架提供了可复现、可扩展且云就绪的基础,适应当今以数据为中心的世界。
作者
- E. Middell
- L. Carlton
- S. Moradi
- T. Codina
- T. Fischer
- J. Cutler
- S. Kelley
- J. Behrendt
- T. Dissanayake
- N. Harmening
- M. A. Yücel
- D. A. Boas
- A. von Lühmann
论文信息
- arXiv ID: 2601.05923v1
- 分类: eess.SP, cs.AI, cs.LG, eess.IV, q-bio.QM
- 出版日期: 2026年1月9日
- PDF: 下载 PDF