[Paper] LSP-DETR: 高效且可扩展的全切片图像细胞核分割

发布: 1个月前 (2026年1月7日 GMT+8 00:35)

6 分钟阅读

原文: arXiv

Source: arXiv - 2601.03163v1

概述

本文提出了 LSP‑DETR，一种用于千兆像素全切片图像（WSIs）中细胞核实例分割的全端到端框架。通过将轻量级 Transformer 与星形凸多边形表示相结合，作者实现了快速、可扩展的分割，摆脱了以往方法中受限的块级处理和繁重的后处理。

输入处理 – 与将 WSIs 切成小块不同，LSP‑DETR 处理相对较大的裁剪（例如 1024 × 1024 px），使用注意力通过线性复杂度核（如 Performer 或 Linformer）近似的 transformer 编码器。这在高分辨率输入下仍能保持低内存使用。
对象表示 – 每个细胞核被建模为 星形凸多边形，由从中心点到多边形顶点的一组径向距离定义。该表示能够以远少于完整掩码的参数捕获不规则的核形状。
预测头 – transformer 解码器输出固定大小的查询集合。对于每个查询，网络预测：
- 置信分数，
- 中心坐标，和
- 径向距离向量（每个预定义角度对应一个距离）。
损失函数 – 径向距离损失 将对预测半径的 L1 项与一种新颖的重叠感知项相结合，后者惩罚相邻细胞核径向距离顺序不一致的情况。由于损失是按半径定义的，模型能够在没有显式重叠掩码的情况下学习收缩重叠区域。
训练与推理 – 系统在标准细胞核数据集上端到端训练。推理时，预测的多边形即时栅格化为二值掩码，生成最终的分割图。无需额外的聚类、分水岭或形态学后处理。

数据集	mAP (seg)	推理时间（每 1024 × 1024 裁剪）	相比第二名的加速比
PanNuke	0.71	45 ms	5.3×
MoNuSeg	0.78	38 ms	5.1×

Accelerated pathology pipelines – 病理实验室可以在全片扫描上几乎实时地进行细胞核分割，从而实现快速的下游分析（例如，肿瘤分级、生物标志物定量）。
Simplified deployment – 单阶段、端到端的特性意味着组件更少（无需拼接补丁、无需后处理脚本），从而降低工程开销和潜在的错误来源。
Edge‑friendly inference – 由于 Transformer 的注意力计算呈线性扩展，模型可以在普通 GPU 或甚至高端 CPU 上运行，为本地部署或成本效益高的云服务提供可能。
Extensible to other instance‑segmentation tasks – 星形凸多边形 + 径向损失的范式可以适用于分割其他小而密集的目标（例如，显微镜下的细胞、材料科学中的颗粒）。