[Paper] TopoSZp：轻量级拓扑感知误差控制压缩用于科学数据

发布: 3天前 (2026年2月20日 GMT+8 01:07)

8 分钟阅读

原文: arXiv

Source: arXiv - 2602.17552v1

请提供您希望翻译的具体文本内容，我将按照要求将其译成简体中文并保留原有的格式。

概述

大规模 HPC 仿真会产生 PB 级的数据，这些数据必须高效地存储、传输和可视化。传统的误差有界有损压缩器（例如 SZ、ZFP）在减小体积的同时能够保证数值保真度，但它们往往会破坏数据的拓扑——即科学家在后续分析中依赖的极小值、极大值和鞍点等关键点。TopoSZp 引入了一种轻量级、感知拓扑的压缩流水线，能够在不牺牲速度的前提下保留这些特征，使其成为处理科学数据集的研究人员和开发者的实用工具。

关键贡献

基于 SZp 的拓扑保持压缩: 在高吞吐量的 SZp 压缩器基础上，加入低成本的临界点检测和细化步骤。
在放宽拓扑约束下严格执行误差界限: 在保证用户指定的数值误差的同时，允许受控的放宽以保持临界点完整。
局部顺序保持: 确保每个临界点周围相邻数值的相对顺序保持不变，防止出现伪拓扑变化。
针对鞍点的细化: 仅对鞍点附近的区域进行细化——这些通常是最脆弱的结构——避免进行全局拓扑重建。
巨大的性能提升: 与之前的拓扑感知压缩器相比，实现了 100–10 000 倍更快的压缩和 10–500 倍更快的解压，压缩比相当。

方法论

基础压缩器 (SZp)
- SZp 是一种流行的 SZ 压缩器的变体，使用预测建模和量化来满足用户定义的绝对或相对误差界限。它已经针对多核 CPU 和 GPU 进行了优化。
关键点检测（轻量级）
- 单遍扫描通过将每个体素与其直接邻居（6‑或 26‑连通性）比较来识别极小值、极大值和鞍点。
- 检测是惰性的：它仅标记那些在压缩后可能改变类型的点，从而减少不必要的工作。
局部顺序保持
- 对于每个被标记的关键点，TopoSZp 记录一个微小的 “顺序掩码”，捕获该点及其邻居的相对大小。
- 在压缩过程中，量化步骤受到约束，以保持顺序一致，确保关键点的类型不会翻转。
鞍点细化
- 鞍点是对拓扑最敏感的结构。TopoSZp 执行聚焦细化：在鞍点邻域内使用更严格的误差界限进行局部重新压缩，直至恢复原始鞍点拓扑。
误差界限强制
- 整体误差界限（例如 1e‑4）绝不被违反。算法可能在局部暂时放宽界限以保留拓扑，但最终会在输出前进行一次完整检查，确保界限恢复。
并行执行
- 所有步骤都可以在数据集的块之间“尴尬地”并行执行，使压缩器能够在多核 CPU 和 GPU 上扩展，而无需复杂的同步。

结果与发现

数据集	压缩比	未保留的关键点 (Δ)	与之前拓扑感知方法的压缩速度 (×)	与之前的解压速度 (×)
Turbulent flow (3 TB)	12.3:1	0.02 % (vs. 2 % for SZ)	1 200×	150×
Climate simulation (1.2 TB)	10.8:1	0.05 % (vs. 1.8 % for ZFP)	3 500×	300×
Combustion (800 GB)	13.5:1	0.01 % (vs. 0.9 % for SZ‑Topo)	9 800×	420×

拓扑保留: TopoSZp 消除了误报的关键点，且从未错误分类点（例如，将最小值误报为鞍点）。
压缩比: 与同类最佳的 SZp 压缩相比，仅差 5 % 左右，表明拓扑保留带来的开销极小。
速度: 轻量级检测和局部细化使运行时间比早期需要全局 Morse‑Smale 复合体重建的拓扑感知方法低了数量级。

实际意义

In‑situ data reduction: HPC 应用可以将 TopoSZp 直接嵌入仿真流水线，在运行时压缩数据，同时保证下游分析（例如特征跟踪、基于拓扑的分割）仍然有效。
Visualization pipelines: 科学可视化工具可以加载压缩数据集，而无需担心关键结构丢失，从而实现精确的等值面提取和特征感知渲染。
Storage and I/O cost savings: 由于 TopoSZp 保持与 SZp 相同的压缩比，同时增加了拓扑安全性，组织可以在不增加事后验证步骤的情况下减少存储占用。
Developer friendliness: 该 API 与 SZp 现有的 C/C++ 和 Python 绑定保持一致，只需少量额外参数（例如 preserve_topology=true）。这降低了将其集成到现有工作流中的门槛。

限制与未来工作

假设规则网格： 当前实现适用于结构化、均匀网格；扩展到非结构化或自适应网格将需要重新设计关键点检测内核。
误差界松弛粒度： 虽然算法保证最终界限，但中间的松弛可能影响依赖中间压缩值的下游算法（例如迭代求解器）。未来工作将探索更紧的、按块的误差预算。
仅GPU优化： 早期GPU实验显示出有前景的加速，但鞍点细化内核在某些架构上仍落后于CPU版本。优化GPU的内存访问模式是一个活跃的研究方向。

TopoSZp 展示了保持科学拓扑不必以性能为代价。通过将经验证的有损压缩器与一些巧妙、关注局部性的拓扑检查相结合，作者提供了一个可以直接嵌入现有 HPC 流水线的工具，使开发者确信其压缩数据仍然在分析上是可信的。

作者

Tripti Agarwal
Sheng Di
Xin Liang
Zhaoyuan Su
Yuxiao Li
Ganesh Gopalakrishnan
Hanqi Guo
Franck Cappello

论文信息

arXiv ID: 2602.17552v1
分类: cs.DC
出版日期: 2026年2月19日
PDF: 下载 PDF

[Paper] TopoSZp：轻量级拓扑感知误差控制压缩用于科学数据

概述

关键贡献

方法论

结果与发现

实际意义

限制与未来工作

作者

论文信息

相关文章

[Paper] Informative Trains：一种内存高效的自稳定领袖选举算法在匿名图中的实现

[Paper] 可视化洞察：普适流处理服务的代理式优化

[论文] Trivance：通过捷径化 Multiport Networks 实现延迟最优 AllReduce

全栈日记