[Paper] MMPersistence:一种面向数学形态学的用于在立方体复形上计算持久同调的软件库
Source: arXiv - 2602.15502v1
概述
本文介绍了 MMPersistence,一个将两种经典图像分析工具箱结合的全新开源库:数学形态学(支撑腐蚀、膨胀、开运算和闭运算的集合论操作)和持久同调在立方复形上的应用。通过允许用户使用任意结构元素 (SEs) 构建滤波序列,库能够提取多尺度拓扑特征,这些特征同时捕获局部形状信息和全局连通性——这是单纯的标准立方同调所无法提供的。
关键贡献
- 统一框架,将形态学算子与立方复形上的持久同调(PH)集成。
- 基于结构元的过滤:用户可以定义任意结构元形状(圆盘、正方形、自定义核),生成编码空间和形态学信息的拓扑过滤。
- GUDHI 的扩展:在经过充分测试的 GUDHI PH 引擎基础上,添加了轻量、友好的 Python 包装器,以支持以图像为中心的工作流。
- 丰富的功能集:提供即用型流水线,支持基于腐蚀/膨胀的过滤、开闭过滤以及混合结构元级联。
- 开源发布(MIT 风格许可证),附带文档、示例以及针对 NumPy 兼容数组的绑定。
方法论
-
立方复形构建 – 将输入图像(灰度或二值)解释为立方复形,其中每个像素/体素成为 0‑单元,每个相邻关系定义更高维的单元。
-
形态滤波生成 – 将选定的结构元素在图像上滑动。每一步的形态操作(例如腐蚀)产生一个新的二值掩码。按结构元素的大小或迭代次数排序的掩码序列形成一个 过滤:一个嵌套的子复形族 (K_0 \subseteq K_1 \subseteq \dots \subseteq K_n)。
-
持久同调计算 – 对于每个过滤步骤,库将立方复形交给 GUDHI 的 PH 引擎,计算同调群 (H_0)(连通分支)、(H_1)(环)以及可选的 3‑D 数据的更高维度的出生‑死亡对。
-
特征提取 – 生成的持久性图或条形码可以转化为汇总统计量(例如总持久性、Betti 曲线),或直接输入机器学习流水线。
所有步骤均通过高级 Python API 暴露:
import mmpersistence as mmp
# Load image as NumPy array
img = mmp.load_image('sample.png')
# Define a square structuring element of radius 3
se = mmp.StructuringElement.square(radius=3)
# Build an erosion‑based filtration and compute PH
diagram = mmp.compute_ph(img, se, operation='erosion')
该设计有意隐藏底层组合细节,使开发者能够专注于 使用哪种 形态滤波,而不是 底层立方复形如何表示。
结果与发现
-
更丰富的描述符 – 与在原始图像上进行的基线持久同调(PH)计算相比,基于结构元(SE)驱动的滤波产生的持久图在 (H_1) 中具有显著更高的 总持久性,表明形态学预处理能够揭示隐藏的环结构(例如细桥、细丝状模式)。
-
对噪声的鲁棒性 – 使用适度大小的开/闭滤波可以过滤掉虚假的小组件,同时保留真正持久特征的寿命,从而得到更干净的条形码并使下游分类器更稳定。
-
应用基准 – 在一个标准的医学影像数据集(脑部 MRI 切片)上,使用 MMPersistence 提取的持久向量训练的简单逻辑回归模型,相比仅使用原始 PH 特征的模型,分类准确率提升了 4–6 %。
-
性能 – 依托 GUDHI 的优化立方体 PH 引擎,额外的形态学步骤在 512 × 512 大小的 2‑D 图像上仅增加不到 15 % 的开销,并且库的运行时间随滤波步骤数量线性增长。
实际意义
| 开发者需求 | MMPersistence 的帮助方式 |
|---|---|
| 视觉模型的特征工程 | 生成补充 CNN 嵌入的拓扑描述符,尤其在数据稀缺或需要可解释性时。 |
| CAD / GIS 中的形状分析 | 使用自定义结构元(例如各向异性核)捕获方向相关特征,如道路网络或裂缝模式。 |
| 医学图像质量控制 | 通过在形态学平滑后检查持久环,检测细微的拓扑异常(例如血管缺失)。 |
| 快速原型开发 | 单行 API 可与现有的 NumPy/PyTorch 流程集成;无需手工构建立方复形。 |
| 可解释 AI | 持久性图提供了可视化、数学上有依据的解释,说明为何某区域被视为“连通”或“环形”。 |
简而言之,MMPersistence 为开发者提供了一种即插即用的方式,在不牺牲性能的前提下,用数学严谨的多尺度拓扑丰富图像处理流水线。
限制与未来工作
- Dimensionality – 当前实现主要针对 2‑D 和 3‑D 立方体复形;若要扩展到更高维度的数据(例如时间序列堆叠),需要额外的内存优化。
- SE Selection – 该库尚未提供自动化的结构元(SE)选择启发式方法,选择合适的形状/大小仍需用户自行决定。
- GPU Acceleration – 形态学操作目前受限于 CPU;未来版本计划将 SE 卷积卸载到 GPU,以支持大规模视频或体数据的处理。
- Integration with Deep Learning – 虽然基本示例展示了与 scikit‑learn 的结合,但计划实现与 PyTorch / TensorFlow 的更紧密绑定(例如可微分的持久性层)。
总体而言,MMPersistence 为开发者提供了一条实用路径,将数学形态学的局部精度与持久同调的全局洞察相结合——为更稳健、可解释的图像分析工具铺平了道路。
作者
- Chuan-Shen Hu
论文信息
- arXiv ID: 2602.15502v1
- Categories: cs.SE, math.AT
- Published: February 17, 2026
- PDF: 下载 PDF