[Paper] 混合放大倍率聚合用于计算病理学的可推广区域级表征

发布: 3天前 (2026年2月26日 GMT+8 02:23)

8 分钟阅读

原文: arXiv

Source: arXiv - 2602.22176v1

概述

一项新研究提出了 混合放大聚合 (MMA) ——一种将不同显微镜放大倍率下捕获的图像块组合成单一、更丰富的计算病理学表示的方法。通过融合低放大和高放大视图，该方法旨在捕获细胞细节和更广阔的组织上下文，同时减少传统全切片分析所需的大量图像块。

多倍放大下的切片提取
- 全片图像（WSI）在三种常见放大倍率（例如 5×、10×、20×）下进行采样。
- 每种放大倍率产生一组 224 × 224 像素的切片，覆盖相同的组织区域，但视野不同。
基础模型骨干
- 标准的视觉 transformer（ViT）或 ConvNeXt 模型在 ImageNet（或病理专用数据集）上预训练后，对每个切片独立处理，生成 切片嵌入。
混合放大倍率区域编码器
- 对于给定的组织区域，将来自三种放大倍率的嵌入进行堆叠。
- 轻量级的 transformer 风格编码器在放大倍率维度上进行注意力计算，学习低倍率（全局结构）信息如何补充高倍率（细胞细节）信息。
掩码嵌入建模（预训练）
- 随机掩码一个或多个放大倍率的嵌入，并让编码器重建缺失的表示。
- 这迫使模型从剩余尺度中推断缺失细节，类似于 BERT 的掩码 token 目标，但应用于图像嵌入。
下游任务的微调
- 将区域级嵌入进行池化（例如均值或注意力加权），得到整片级特征向量。
- 使用简单分类器（逻辑回归或浅层 MLP）进行训练，以预测生物标志物（例如 HER2 状态、微卫星不稳定性）。

该流水线与现有的病理学基础模型兼容：开发者可以接入任意预训练的切片编码器，只需在其上添加 MMA 模块即可。

Cancer Type / Biomarker	Single‑Magnification (20×)	MMA (3× magnifications)	Δ AUC
Breast – ER status	0.84	0.88	+0.04
Lung – EGFR mutation	0.78	0.81	+0.03
Colon – MSI status	0.71	0.76	+0.05
Prostate – Gleason grade	0.82	0.84	+0.02

利益相关者	重要原因
病理AI工程师	降低处理每张幻灯片上数百万个20×切片的存储和计算成本；MMA 编码器每个区域仅增加几毫秒。
临床实验室	加快生物标志物检测的周转时间，可能在多学科会议期间实现实时决策支持。
模型开发者	即插即用的模块，可叠加在任何现有基础模型之上，加速多尺度数据的实验。
监管与质量保证团队	更稳健的预测，融合细胞和结构线索，降低遗漏与上下文相关的生物标志物的风险。

简而言之，MMA 提供了一种 可扩展、成本效益高的方式，将病理学家“放大/缩小”工作流程引入深度学习管道。

Bottom line：混合放大倍率聚合弥合了高分辨率细胞细节与低分辨率组织结构之间的鸿沟，以更少的切片块提供更好的生物标志物预测。对于构建下一代计算病理学工具的开发者而言，它是一个实用的即插即用升级，使 AI 流程更贴合病理学家实际检查切片的方式。