[Paper] 使用多样化精度训练的增强型3D脑肿瘤分割

发布: (2026年5月6日 GMT+8 01:30)
6 分钟阅读
原文: arXiv

Source: arXiv - 2605.04008v1

Overview

本文提出了一种用于3‑D脑肿瘤分割的新流水线,将流行的 SegResNet 架构与 自动多精度训练 策略相结合。通过在训练过程中微调数值精度,作者实现了最先进的 Dice 分数(全肿瘤最高可达 0.90),同时保持计算成本在可控范围内——这一进展有望加速临床工作流程和 AI‑辅助诊断。

关键贡献

  • 多精度训练框架,能够自动为每个训练阶段选择最佳的浮点精度(例如 FP16、BF16、FP32),在不牺牲准确性的前提下降低内存使用和训练时间。
  • SegResNet 的适配(一种 3‑D 残差 U‑Net 变体)到多精度环境,证明该架构在混合精度算术下仍然稳健。
  • 全面评估 在标准脑肿瘤基准上,报告 Dice 分数为 0.84(肿瘤核心)、0.90(整体肿瘤)和 0.79(增强肿瘤)。
  • 开源实现(代码和训练脚本),可轻松集成到现有医学影像流水线中,几乎无需额外工作。

方法论

  1. 数据预处理 – 将 3‑D MRI 体积进行归一化,重新采样到统一体素间距,并裁剪至脑部感兴趣区域。
  2. SegResNet 主干 – 网络由带残差连接的编码‑解码块和 3‑D 卷积组成,旨在捕获局部纹理和全局上下文。
  3. 自动多精度训练
    • 训练循环监控梯度稳定性和损失曲率。
    • 当损失曲面平滑时,优化器切换到低精度(例如 FP16)以加速计算。
    • 若检测到不稳定(如梯度爆炸),则回退到高精度(FP32)。
  4. 损失函数与指标 – 使用 Dice 损失直接优化预测与真实标签的重叠。Dice 系数报告三个肿瘤子区域(整体、核心、增强)的结果。
  5. 训练细节 – Adam 优化器,余弦退火学习率调度,批量大小受 GPU 显存限制(受益于降低精度)。

结果与发现

区域Dice 分数
整体肿瘤0.90
肿瘤核心0.84
增强肿瘤0.79
  • 多精度方法将训练时间缩短约 30 %,相较于纯 FP32 基线,同时实现相当或更好的 Dice 分数。
  • 内存消耗显著降低,能够在单个 GPU 上容纳更大的 3‑D 补丁,提升模型学习上下文线索的能力。
  • 定性可视化显示分割更平滑、更连贯,尤其在肿瘤边界处,部分体积效应较为常见。

Practical Implications

  • 更快的模型开发 – 研究人员和开发者可以更快地迭代分割模型,因为训练周期减少且 GPU 内存需求更低。
  • 可部署在边缘类硬件上 – 混合精度推理已在许多现代 GPU 和 AI 加速器上得到支持,使得在医院 PACS 系统甚至便携设备上进行术中引导成为可能。
  • 改进的临床决策支持 – 整体肿瘤分割的 Dice 分数更高,意味着肿瘤体积测量更可靠,这对治疗计划、疗效监测和放疗剂量至关重要。
  • 可扩展到其他模态 – 同一多精度流水线可用于 CT、PET 或多模态 MRI 数据,为更广泛的医学影像分析任务打开大门,无需完全重新设计。

限制与未来工作

  • 数据集范围 – 实验仅限于公开的脑肿瘤数据集;在异质临床扫描(不同扫描仪、协议)上的性能尚未测试。
  • 精度选择启发式 – 自动切换逻辑基于规则;采用学习型控制器(例如强化学习)可能进一步优化精度调度。
  • 推理速度 – 虽然训练收益显著,论文未量化混合精度下的推理延迟;未来工作应对实时部署场景进行基准测试。
  • 扩展到多任务学习 – 将分割与肿瘤分级或生存预测相结合,可使模型在临床工作流中更具价值。

结论: 通过将成熟的 3‑D 分割骨干网络与智能精度管理相结合,这项工作推动了 AI 驱动的脑肿瘤分析的实用性——提供更快、更轻且仍然高度准确的模型,开发者可以将其集成到真实的医学影像流水线中。

作者

  • Adwaitt Pandya
  • Ozioma C. Oguine
  • Harita Bhargava
  • Shrikant Zade

论文信息

  • arXiv ID: 2605.04008v1
  • 类别: cs.CV, cs.LG
  • 发布时间: 2026年5月5日
  • PDF: Download PDF
0 浏览
Back to Blog

相关文章

阅读更多 »