[Paper] 不确定感知域适应用于临床照片中的白癜风分割
发布: (2025年12月13日 GMT+8 02:56)
6 min read
原文: arXiv
Source: arXiv - 2512.11791v1
概览
本文提出了一种 可信赖、具不确定性感知的分割流水线,用于在常规临床照片中自动测量白癜风病灶。通过结合领域自适应预训练、高频聚焦的 ConvNeXt V2 主干以及基于集成的不确定性估计,作者实现了业界领先的精度,同时为临床医生提供了模型不确定区域的明确信号。
主要贡献
- 领域自适应预训练:在大型 ISIC 2019 皮肤病变数据集上进行预训练,随后使用受 ROI 约束的双任务损失抑制白癜风图像中的背景噪声。
- 高频光谱门控 (HFSG) 模块 与 stem‑skip 连接 集成到 ConvNeXt V2 编码器中,使网络能够捕捉表征白癜风边界的细微纹理差异。
- 不确定性量化:通过 K 折集成结合测试时增强 (TTA),生成像素级熵图,标记出需要临床医生复核的模糊区域。
- 全面验证:在专家标注的临床队列上报告 Dice 分数 85.05 %,并相较于强基线 CNN 与 Transformer 实现 30 % 的 95 % Hausdorff Distance 降低。
- 零灾难性失误 与可解释的熵可视化,树立了自动皮肤科工具的实用可靠性标准。
方法论
-
数据高效训练
- 首先在 ISIC 2019 数据集(大规模、公开的皮肤病变图像)上进行 领域自适应预训练。
- 在白癜风队列上进行微调,使用 双任务损失: (i) 标准分割损失(如 Dice/CE)和 (ii) 受 ROI 约束的辅助损失,惩罚预测超出临床标记的感兴趣区域,从而有效过滤背景杂乱。
-
网络架构
- 主干采用 ConvNeXt V2,这是一种在速度与表达能力之间取得平衡的现代卷积架构。
- 高频光谱门控 (HFSG) 块在频域处理特征图,衰减低频成分并保留划分白癜风斑块的高频边缘。
- Stem‑skip 连接 将早期高分辨率特征直接传递至更深的解码阶段,帮助模型保留细粒度纹理线索。
-
不确定性与信任层
- 训练 K(例如 5)个独立模型,每个模型使用不同的数据折。
- 推理时,对每个模型应用 测试时增强(旋转、翻转、颜色抖动),聚合 softmax 输出,并计算 像素级熵 作为不确定性得分。
- 高熵区域被高亮显示以供人工复核,使黑箱模型转变为辅助工具,而非完全自主的决策者。
结果与发现
| 指标 | 提出的方法 | ResNet‑50 + UNet++ | MiT‑B5 (Transformer) |
|---|---|---|---|
| Dice (↑) | 85.05 % | 78.3 % | 80.1 % |
| 95 % Hausdorff Distance (↓, px) | 29.95 | 44.79 | 38.12 |
| 灾难性失误 | 0 | 3 | 2 |
| 平均推理时间(每张图像) | ~120 ms (GPU) | ~150 ms | ~180 ms |
- HFSG 模块贡献约 3 % 的 Dice 提升和 5 px 的 Hausdorff 距离降低。
- 集成 + TTA 在清晰区域降低了平均熵,同时在模糊边界保持高熵,符合皮肤科医生的反馈。
实际意义
- 临床工作流集成 – 不确定性图可叠加在现有电子健康记录 (EHR) 查看器上,让皮肤科医生将注意力集中在最模糊的病灶边缘,从而加快记录和长期追踪。
- 可扩展部署 – ConvNeXt V2 + HFSG 主干在单个中等 GPU(如 RTX 3060)上运行流畅,适用于医院本地服务器或远程皮肤科套件的边缘设备。
- 监管友好 – 零灾难性失误和显式不确定性报告满足新兴 AI 医疗器械指南对 “人机协同” 安全网的要求。
- 可迁移性 – 领域自适应预训练 + ROI 约束损失的方案可复用于其他皮肤病变分割任务(如银屑病、黄褐斑),其中背景杂乱是主要挑战。
局限性与未来工作
- 数据集多样性 – 虽然临床队列已由专家标注,但图像来源于少数诊所且光照条件有限;需要更广泛的多中心验证。
- 计算开销 – K 折集成和 TTA 增加了推理延迟;未来可探索贝叶斯近似或轻量化不确定性头以保持速度。
- 细粒度病灶分类 – 当前流水线仅分割白癜风,未区分活动性与稳定性病灶;加入分类头可支持治疗决策。
核心结论:通过将频率感知特征提取与严格的不确定性估计相结合,本文提供了一个实用、可信的自动白癜风评估工具——这一思路可为更广阔的医学影像领域提供借鉴。
作者
- Wentao Jiang
- Vamsi Varra
- Caitlin Perez‑Stable
- Harrison Zhu
- Meredith Apicella
- Nicole Nyamongo
论文信息
- arXiv ID: 2512.11791v1
- 分类: cs.CV
- 发布日期: 2025 年 12 月 12 日
- PDF: Download PDF