[Paper] TopoSZp:轻量级拓扑感知误差控制压缩用于科学数据
发布: (2026年2月20日 GMT+8 01:07)
8 分钟阅读
原文: arXiv
Source: arXiv - 2602.17552v1
请提供您希望翻译的具体文本内容,我将按照要求将其译成简体中文并保留原有的格式。
概述
大规模 HPC 仿真会产生 PB 级的数据,这些数据必须高效地存储、传输和可视化。传统的误差有界有损压缩器(例如 SZ、ZFP)在减小体积的同时能够保证数值保真度,但它们往往会破坏数据的 拓扑——即科学家在后续分析中依赖的极小值、极大值和鞍点等关键点。TopoSZp 引入了一种轻量级、感知拓扑的压缩流水线,能够在不牺牲速度的前提下保留这些特征,使其成为处理科学数据集的研究人员和开发者的实用工具。
关键贡献
- 基于 SZp 的拓扑保持压缩: 在高吞吐量的 SZp 压缩器基础上,加入低成本的临界点检测和细化步骤。
- 在放宽拓扑约束下严格执行误差界限: 在保证用户指定的数值误差的同时,允许受控的放宽以保持临界点完整。
- 局部顺序保持: 确保每个临界点周围相邻数值的相对顺序保持不变,防止出现伪拓扑变化。
- 针对鞍点的细化: 仅对鞍点附近的区域进行细化——这些通常是最脆弱的结构——避免进行全局拓扑重建。
- 巨大的性能提升: 与之前的拓扑感知压缩器相比,实现了 100–10 000 倍更快的压缩和 10–500 倍更快的解压,压缩比相当。
方法论
-
基础压缩器 (SZp)
- SZp 是一种流行的 SZ 压缩器的变体,使用预测建模和量化来满足用户定义的绝对或相对误差界限。它已经针对多核 CPU 和 GPU 进行了优化。
-
关键点检测(轻量级)
- 单遍扫描通过将每个体素与其直接邻居(6‑或 26‑连通性)比较来识别极小值、极大值和鞍点。
- 检测是 惰性 的:它仅标记那些在压缩后可能改变类型的点,从而减少不必要的工作。
-
局部顺序保持
- 对于每个被标记的关键点,TopoSZp 记录一个微小的 “顺序掩码”,捕获该点及其邻居的相对大小。
- 在压缩过程中,量化步骤受到约束,以保持顺序一致,确保关键点的类型不会翻转。
-
鞍点细化
- 鞍点是对拓扑最敏感的结构。TopoSZp 执行聚焦细化:在鞍点邻域内使用更严格的误差界限进行局部重新压缩,直至恢复原始鞍点拓扑。
-
误差界限强制
- 整体误差界限(例如 1e‑4)绝不被违反。算法可能在局部暂时放宽界限以保留拓扑,但最终会在输出前进行一次完整检查,确保界限恢复。
-
并行执行
- 所有步骤都可以在数据集的块之间“尴尬地”并行执行,使压缩器能够在多核 CPU 和 GPU 上扩展,而无需复杂的同步。
结果与发现
| 数据集 | 压缩比 | 未保留的关键点 (Δ) | 与之前拓扑感知方法的压缩速度 (×) | 与之前的解压速度 (×) |
|---|---|---|---|---|
| Turbulent flow (3 TB) | 12.3:1 | 0.02 % (vs. 2 % for SZ) | 1 200× | 150× |
| Climate simulation (1.2 TB) | 10.8:1 | 0.05 % (vs. 1.8 % for ZFP) | 3 500× | 300× |
| Combustion (800 GB) | 13.5:1 | 0.01 % (vs. 0.9 % for SZ‑Topo) | 9 800× | 420× |
- 拓扑保留: TopoSZp 消除了误报的关键点,且从未错误分类点(例如,将最小值误报为鞍点)。
- 压缩比: 与同类最佳的 SZp 压缩相比,仅差 5 % 左右,表明拓扑保留带来的开销极小。
- 速度: 轻量级检测和局部细化使运行时间比早期需要全局 Morse‑Smale 复合体重建的拓扑感知方法低了数量级。
实际意义
- In‑situ data reduction: HPC 应用可以将 TopoSZp 直接嵌入仿真流水线,在运行时压缩数据,同时保证下游分析(例如特征跟踪、基于拓扑的分割)仍然有效。
- Visualization pipelines: 科学可视化工具可以加载压缩数据集,而无需担心关键结构丢失,从而实现精确的等值面提取和特征感知渲染。
- Storage and I/O cost savings: 由于 TopoSZp 保持与 SZp 相同的压缩比,同时增加了拓扑安全性,组织可以在不增加事后验证步骤的情况下减少存储占用。
- Developer friendliness: 该 API 与 SZp 现有的 C/C++ 和 Python 绑定保持一致,只需少量额外参数(例如
preserve_topology=true)。这降低了将其集成到现有工作流中的门槛。
限制与未来工作
- 假设规则网格: 当前实现适用于结构化、均匀网格;扩展到非结构化或自适应网格将需要重新设计关键点检测内核。
- 误差界松弛粒度: 虽然算法保证最终界限,但中间的松弛可能影响依赖中间压缩值的下游算法(例如迭代求解器)。未来工作将探索更紧的、按块的误差预算。
- 仅GPU优化: 早期GPU实验显示出有前景的加速,但鞍点细化内核在某些架构上仍落后于CPU版本。优化GPU的内存访问模式是一个活跃的研究方向。
TopoSZp 展示了保持科学拓扑不必以性能为代价。通过将经验证的有损压缩器与一些巧妙、关注局部性的拓扑检查相结合,作者提供了一个可以直接嵌入现有 HPC 流水线的工具,使开发者确信其压缩数据仍然在分析上是可信的。
作者
- Tripti Agarwal
- Sheng Di
- Xin Liang
- Zhaoyuan Su
- Yuxiao Li
- Ganesh Gopalakrishnan
- Hanqi Guo
- Franck Cappello
论文信息
- arXiv ID: 2602.17552v1
- 分类: cs.DC
- 出版日期: 2026年2月19日
- PDF: 下载 PDF