[Paper] 基于深度学习的口腔病变多类分类与分层增强

发布: (2025年11月27日 GMT+8 00:56)
6 min read
原文: arXiv

Source: arXiv - 2511.21582v1

Overview

本文提出了一条深度学习流水线,仅凭摄影图像即可自动区分 16 种不同的口腔病变类型——从无害的溃疡到恶性癌症。通过巧妙结合分层划分、强力数据增强和过采样,解决了小规模且高度不平衡的医学数据集的经典难题,作者将分类准确率提升至 83 %,超越了现有的计算机辅助诊断(CAD)方案。

Key Contributions

  • 多类别口腔病变分类器,覆盖 16 个类别,是迄今为止报告的最细粒度集合。
  • 分层数据划分,在训练/验证/测试集之间保持原始类别分布,降低泄漏和偏差。
  • 混合增强与过采样 流水线(旋转、缩放、颜色抖动、类似 SMOTE 的合成采样),专为少数病变类别调优。
  • 实证基准 显示 83.33 % 的准确率、89.12 % 的精确率和 77.31 % 的召回率——显著高于之前的最先进 CNN 基线。
  • 开源实现(代码和训练权重),加速可复现性和后续研究。

Methodology

  1. 数据集准备 – 收集的口腔内部照片(≈2 k 张)被标注为 16 种病变类别。作者首先进行 分层划分(训练/验证/测试比例为 70/15/15 %),使每个类别的比例在各集合中保持一致。
  2. 预处理与增强 – 将图像统一缩放至 224 × 224 像素,随后使用大量增强手段:随机旋转(±30°)、水平/垂直翻转、亮度/对比度抖动以及弹性形变。此举将有效训练集规模扩大约 10 倍。
  3. 少数类过采样 – 增强后,作者在特征嵌入上采用 SMOTE‑style 合成过采样,进一步平衡类别频率,避免对重复图像的过拟合。
  4. 模型架构 – 采用预训练的 ResNet‑50 主干(ImageNet 权重),并在其上添加自定义全连接头(对 16 类进行 softmax)。迁移学习加速收敛并利用通用视觉特征。
  5. 训练策略 – 使用带类别加权惩罚的交叉熵损失(对稀有病变赋予更高权重),Adam 优化器,余弦退火学习率,以及基于验证损失的提前停止。
  6. 评估 – 计算每类以及宏平均的标准指标(准确率、精确率、召回率、F1),并进行混淆矩阵分析以发现系统性误分类。

Results & Findings

MetricValue
Overall Accuracy83.33 %
Macro‑averaged Precision89.12 %
Macro‑averaged Recall77.31 %
F1‑score (average)0.82
  • 少数类提升:最稀有的三类病变的召回率从基线 CNN 的 <50 % 提升至 >70 %,得益于增强‑过采样组合。
  • 混淆模式:大多数错误出现在视觉上相似的癌前病变之间(如白斑与红斑),这表明加入领域特定特征(如纹理描述子)可能有帮助。
  • 消融研究:去除分层划分会使测试准确率下降约 4 %;取消过采样会使少数类召回率下降约 12 %,验证了每个组件的必要性。

Practical Implications

  • 早期筛查工具:牙医可使用在智能手机上本地运行的模型应用,在常规检查时标记可疑病变,提示及时活检。
  • 远程医疗分诊:资源匮乏地区的远程诊所可将图像上传至基于该模型的云服务,快速获得多类别风险评估,无需现场专家。
  • 数据集无关工作流:分层增强框架可迁移至其他医学影像领域(皮肤病变、视网膜疾病),这些领域同样面临类别不平衡的长期难题。
  • 监管路径:通过在 16 类上展示稳健性能并提供透明的预处理步骤,本文为需要可解释性和可复现性的 FDA/CE 认证 CAD 设备奠定了基础。

Limitations & Future Work

  • 数据集规模与多样性:研究仅基于单一、相对较小的图像集合,来源于有限数量的诊所;需要更广泛的地域和人口采样以确保泛化能力。
  • 临床验证:未进行前瞻性试验;在非专业人员拍摄或光照条件不佳的真实环境中,灵敏度/特异度可能会有所不同。
  • 可解释性:当前模型仅输出类别概率;加入显著性图或注意力机制有助于提升临床医生对 AI 决策的信任。
  • 多模态扩展:将视觉线索与患者元数据(年龄、吸烟史)结合,可能进一步提升诊断准确率,作者计划在后续工作中探索此方向。

Authors

  • Joy Naoum
  • Revana Salama
  • Ali Hamdi

Paper Information

  • arXiv ID: 2511.21582v1
  • Categories: cs.CV
  • Published: November 26, 2025
  • PDF: Download PDF
Back to Blog

相关文章

阅读更多 »