[Paper] 基于多对比 MRI 的深度婴儿脑分割

发布: (2025年12月5日 GMT+8 02:59)
7 min read
原文: arXiv

Source: arXiv - 2512.05114v1

概览

本文介绍了 BabySeg,一个深度学习框架,能够在各种扫描协议下自动分割婴幼儿脑部 MRI。通过在高度随机化的合成图像上训练网络,作者实现了一个单一模型,能够可靠地处理不同模态、重复扫描,甚至是训练时从未见过的图像类型——解决了儿科神经影像长期存在的瓶颈。

主要贡献

  • 统一的分割模型,能够处理任意组合的 MRI 对比度(T1、T2、PD 等),无需为每种协议单独训练网络。
  • 域随机化训练管线,在合成数据上进行远超真实范围的增强,使模型对扫描仪差异、运动伪影和缺失模态具有鲁棒性。
  • 灵活的特征池化架构,可以接受可变数量的输入体积,并自动学习如何融合它们的信息。
  • 领先的精度,在多个公开的婴儿脑数据集上达到或超过专用工具的表现,同时运行速度快了数个数量级。
  • 开源实现(包括预训练权重),可最小化配置直接嵌入现有神经影像流水线。

方法论

  1. 数据准备 – 作者收集了一套异构的婴儿 MRI(年龄 0–24 个月),覆盖多台扫描仪、不同协议和质量水平。
  2. 域随机化 – 并非仅依赖真实扫描,而是通过随机改变对比度、强度缩放、噪声水平、偏置场,甚至加入不现实的伪影来生成合成体积。这迫使网络学习对这些变化不敏感的特征。
  3. 多输入编码器 – 每个输入扫描经过一个浅层编码器;得到的特征图被拼接后送入共享解码器。由于拼接操作基于列表,网络在推理时可以接受 1、2、… N 个扫描。
  4. 训练目标 – 将标准 Dice 损失与边界感知项相结合,以提升皮层表面的预测锐度。
  5. 实现细节 – 主干采用带有组归一化的 3‑D U‑Net 变体,在 8‑GPU 集群上训练约 48 小时。最终模型大小约 120 MB,可在工作站级 CPU/GPU 上部署。

结果与发现

数据集 (年龄)输入配置Dice(全脑)运行时间(秒)
dHCP (0‑3 mo)仅 T20.940.8
iSEG (6‑12 mo)T1+T20.961.1
NICHD (12‑24 mo)仅 T1(未见)0.93 (↑0.02 相较基线)0.9
  • 精度:BabySeg 在所有年龄段均持续超越或匹配 iBEAT、MANTiS、infant‑FreeSurfer 等专用工具。
  • 鲁棒性:当有意省去一种模态(例如仅提供 T1 而模型在训练时使用 T1+T2),性能仅出现轻微下降,验证了灵活池化设计。
  • 速度:在现代 GPU 上推理每个体积 < 2 秒,相比传统基于图谱的流水线需要数分钟大幅提速。

实际意义

  • 临床工作流集成 – 放射科可以在常规新生儿扫描上直接运行 BabySeg,无需担心缺失对比度,实现近实时的脑体积测量,以便早期诊断发育障碍。
  • 研究可扩展性 – 大型纵向研究(如从出生到 2 岁追踪脑发育)能够在极短时间内处理成千上万的扫描,释放计算资源用于下游分析。
  • 跨站点研究 – 由于模型容忍扫描仪特有的差异和运动伪影,多中心合作不再需要繁琐的配准/标准化管线。
  • 工具生态 – 开源代码可封装进常用神经影像框架(Nipype、BIDS‑Apps),开发者只需一条命令即可将 BabySeg 接入已有流水线。

局限性与未来工作

  • 训练数据偏差 – 虽然域随机化缓解了许多偏移,但真实数据仍偏向资源丰富的医院;对超低场或噪声极大的床旁扫描仪的表现尚未验证。
  • 年龄特异解剖 – 模型将年龄视为隐式因素;显式的年龄条件化可能进一步提升对快速变化结构(如髓鞘化前沿)的分割精度。
  • 病理扩展 – 当前评估聚焦于典型发育;未来需在脑损伤、脑积水或先天畸形的婴儿上检验鲁棒性。
  • 可解释性 – 提供不确定性图或注意力可视化将帮助临床医生在边缘案例中信任自动分割结果。

核心结论:BabySeg 证明,一个经过巧妙训练的单一深度网络即可取代众多专用的婴儿脑分割工具,为开发者和临床医生提供快速、鲁棒且易于集成的儿科神经影像解决方案。

作者

  • Malte Hoffmann
  • Lilla Zöllei
  • Adrian V. Dalca

论文信息

  • arXiv ID: 2512.05114v1
  • 分类: cs.LG, cs.CV, eess.IV
  • 发表时间: 2025 年 12 月 4 日
  • PDF: Download PDF
Back to Blog

相关文章

阅读更多 »