[Paper] MMPersistence：一种面向数学形态学的用于在立方体复形上计算持久同调的软件库

发布: 3天前 (2026年2月17日 GMT+8 19:15)

8 分钟阅读

原文: arXiv

Source: arXiv - 2602.15502v1

概述

本文介绍了 MMPersistence，一个将两种经典图像分析工具箱结合的全新开源库：数学形态学（支撑腐蚀、膨胀、开运算和闭运算的集合论操作）和持久同调在立方复形上的应用。通过允许用户使用任意结构元素 (SEs) 构建滤波序列，库能够提取多尺度拓扑特征，这些特征同时捕获局部形状信息和全局连通性——这是单纯的标准立方同调所无法提供的。

关键贡献

统一框架，将形态学算子与立方复形上的持久同调（PH）集成。
基于结构元的过滤：用户可以定义任意结构元形状（圆盘、正方形、自定义核），生成编码空间和形态学信息的拓扑过滤。
GUDHI 的扩展：在经过充分测试的 GUDHI PH 引擎基础上，添加了轻量、友好的 Python 包装器，以支持以图像为中心的工作流。
丰富的功能集：提供即用型流水线，支持基于腐蚀/膨胀的过滤、开闭过滤以及混合结构元级联。
开源发布（MIT 风格许可证），附带文档、示例以及针对 NumPy 兼容数组的绑定。

方法论

立方复形构建 – 将输入图像（灰度或二值）解释为立方复形，其中每个像素/体素成为 0‑单元，每个相邻关系定义更高维的单元。
形态滤波生成 – 将选定的结构元素在图像上滑动。每一步的形态操作（例如腐蚀）产生一个新的二值掩码。按结构元素的大小或迭代次数排序的掩码序列形成一个过滤：一个嵌套的子复形族 (K_0 \subseteq K_1 \subseteq \dots \subseteq K_n)。
持久同调计算 – 对于每个过滤步骤，库将立方复形交给 GUDHI 的 PH 引擎，计算同调群 (H_0)（连通分支）、(H_1)（环）以及可选的 3‑D 数据的更高维度的出生‑死亡对。
特征提取 – 生成的持久性图或条形码可以转化为汇总统计量（例如总持久性、Betti 曲线），或直接输入机器学习流水线。

所有步骤均通过高级 Python API 暴露：

import mmpersistence as mmp

# Load image as NumPy array
img = mmp.load_image('sample.png')

# Define a square structuring element of radius 3
se = mmp.StructuringElement.square(radius=3)

# Build an erosion‑based filtration and compute PH
diagram = mmp.compute_ph(img, se, operation='erosion')

该设计有意隐藏底层组合细节，使开发者能够专注于 使用哪种 形态滤波，而不是 底层立方复形如何表示。

结果与发现

更丰富的描述符 – 与在原始图像上进行的基线持久同调（PH）计算相比，基于结构元（SE）驱动的滤波产生的持久图在 (H_1) 中具有显著更高的 总持久性，表明形态学预处理能够揭示隐藏的环结构（例如细桥、细丝状模式）。
对噪声的鲁棒性 – 使用适度大小的开/闭滤波可以过滤掉虚假的小组件，同时保留真正持久特征的寿命，从而得到更干净的条形码并使下游分类器更稳定。
应用基准 – 在一个标准的医学影像数据集（脑部 MRI 切片）上，使用 MMPersistence 提取的持久向量训练的简单逻辑回归模型，相比仅使用原始 PH 特征的模型，分类准确率提升了 4–6 %。
性能 – 依托 GUDHI 的优化立方体 PH 引擎，额外的形态学步骤在 512 × 512 大小的 2‑D 图像上仅增加不到 15 % 的开销，并且库的运行时间随滤波步骤数量线性增长。

实际意义

开发者需求	MMPersistence 的帮助方式
视觉模型的特征工程	生成补充 CNN 嵌入的拓扑描述符，尤其在数据稀缺或需要可解释性时。
CAD / GIS 中的形状分析	使用自定义结构元（例如各向异性核）捕获方向相关特征，如道路网络或裂缝模式。
医学图像质量控制	通过在形态学平滑后检查持久环，检测细微的拓扑异常（例如血管缺失）。
快速原型开发	单行 API 可与现有的 NumPy/PyTorch 流程集成；无需手工构建立方复形。
可解释 AI	持久性图提供了可视化、数学上有依据的解释，说明为何某区域被视为“连通”或“环形”。

简而言之，MMPersistence 为开发者提供了一种即插即用的方式，在不牺牲性能的前提下，用数学严谨的多尺度拓扑丰富图像处理流水线。

限制与未来工作

Dimensionality – 当前实现主要针对 2‑D 和 3‑D 立方体复形；若要扩展到更高维度的数据（例如时间序列堆叠），需要额外的内存优化。
SE Selection – 该库尚未提供自动化的结构元（SE）选择启发式方法，选择合适的形状/大小仍需用户自行决定。
GPU Acceleration – 形态学操作目前受限于 CPU；未来版本计划将 SE 卷积卸载到 GPU，以支持大规模视频或体数据的处理。
Integration with Deep Learning – 虽然基本示例展示了与 scikit‑learn 的结合，但计划实现与 PyTorch / TensorFlow 的更紧密绑定（例如可微分的持久性层）。

总体而言，MMPersistence 为开发者提供了一条实用路径，将数学形态学的局部精度与持久同调的全局洞察相结合——为更稳健、可解释的图像分析工具铺平了道路。

作者

Chuan-Shen Hu

论文信息

arXiv ID: 2602.15502v1
Categories: cs.SE, math.AT
Published: February 17, 2026
PDF: 下载 PDF

[Paper] MMPersistence：一种面向数学形态学的用于在立方体复形上计算持久同调的软件库

概述

关键贡献

方法论

结果与发现

实际意义

限制与未来工作

作者

论文信息

相关文章

[Paper] huff：用于市场区域分析的 Python 包

[Paper] 什么因素决定了用于真实世界渗透测试的优秀 LLM Agent？

[Paper] 面向需求工程中自然语言处理工具的软件参考架构

自适应系统中伦理的运行时维度