[Paper] TopoSZp:轻量级拓扑感知误差控制压缩用于科学数据

发布: (2026年2月20日 GMT+8 01:07)
8 分钟阅读
原文: arXiv

Source: arXiv - 2602.17552v1

请提供您希望翻译的具体文本内容,我将按照要求将其译成简体中文并保留原有的格式。

概述

大规模 HPC 仿真会产生 PB 级的数据,这些数据必须高效地存储、传输和可视化。传统的误差有界有损压缩器(例如 SZ、ZFP)在减小体积的同时能够保证数值保真度,但它们往往会破坏数据的 拓扑——即科学家在后续分析中依赖的极小值、极大值和鞍点等关键点。TopoSZp 引入了一种轻量级、感知拓扑的压缩流水线,能够在不牺牲速度的前提下保留这些特征,使其成为处理科学数据集的研究人员和开发者的实用工具。

关键贡献

  • 基于 SZp 的拓扑保持压缩: 在高吞吐量的 SZp 压缩器基础上,加入低成本的临界点检测和细化步骤。
  • 在放宽拓扑约束下严格执行误差界限: 在保证用户指定的数值误差的同时,允许受控的放宽以保持临界点完整。
  • 局部顺序保持: 确保每个临界点周围相邻数值的相对顺序保持不变,防止出现伪拓扑变化。
  • 针对鞍点的细化: 仅对鞍点附近的区域进行细化——这些通常是最脆弱的结构——避免进行全局拓扑重建。
  • 巨大的性能提升: 与之前的拓扑感知压缩器相比,实现了 100–10 000 倍更快的压缩和 10–500 倍更快的解压,压缩比相当。

方法论

  1. 基础压缩器 (SZp)

    • SZp 是一种流行的 SZ 压缩器的变体,使用预测建模和量化来满足用户定义的绝对或相对误差界限。它已经针对多核 CPU 和 GPU 进行了优化。
  2. 关键点检测(轻量级)

    • 单遍扫描通过将每个体素与其直接邻居(6‑或 26‑连通性)比较来识别极小值、极大值和鞍点。
    • 检测是 惰性 的:它仅标记那些在压缩后可能改变类型的点,从而减少不必要的工作。
  3. 局部顺序保持

    • 对于每个被标记的关键点,TopoSZp 记录一个微小的 “顺序掩码”,捕获该点及其邻居的相对大小。
    • 在压缩过程中,量化步骤受到约束,以保持顺序一致,确保关键点的类型不会翻转。
  4. 鞍点细化

    • 鞍点是对拓扑最敏感的结构。TopoSZp 执行聚焦细化:在鞍点邻域内使用更严格的误差界限进行局部重新压缩,直至恢复原始鞍点拓扑。
  5. 误差界限强制

    • 整体误差界限(例如 1e‑4)绝不被违反。算法可能在局部暂时放宽界限以保留拓扑,但最终会在输出前进行一次完整检查,确保界限恢复。
  6. 并行执行

    • 所有步骤都可以在数据集的块之间“尴尬地”并行执行,使压缩器能够在多核 CPU 和 GPU 上扩展,而无需复杂的同步。

结果与发现

数据集压缩比未保留的关键点 (Δ)与之前拓扑感知方法的压缩速度 (×)与之前的解压速度 (×)
Turbulent flow (3 TB)12.3:10.02 % (vs. 2 % for SZ)1 200×150×
Climate simulation (1.2 TB)10.8:10.05 % (vs. 1.8 % for ZFP)3 500×300×
Combustion (800 GB)13.5:10.01 % (vs. 0.9 % for SZ‑Topo)9 800×420×
  • 拓扑保留: TopoSZp 消除了误报的关键点,且从未错误分类点(例如,将最小值误报为鞍点)。
  • 压缩比: 与同类最佳的 SZp 压缩相比,仅差 5 % 左右,表明拓扑保留带来的开销极小。
  • 速度: 轻量级检测和局部细化使运行时间比早期需要全局 Morse‑Smale 复合体重建的拓扑感知方法低了数量级。

实际意义

  • In‑situ data reduction: HPC 应用可以将 TopoSZp 直接嵌入仿真流水线,在运行时压缩数据,同时保证下游分析(例如特征跟踪、基于拓扑的分割)仍然有效。
  • Visualization pipelines: 科学可视化工具可以加载压缩数据集,而无需担心关键结构丢失,从而实现精确的等值面提取和特征感知渲染。
  • Storage and I/O cost savings: 由于 TopoSZp 保持与 SZp 相同的压缩比,同时增加了拓扑安全性,组织可以在不增加事后验证步骤的情况下减少存储占用。
  • Developer friendliness: 该 API 与 SZp 现有的 C/C++ 和 Python 绑定保持一致,只需少量额外参数(例如 preserve_topology=true)。这降低了将其集成到现有工作流中的门槛。

限制与未来工作

  • 假设规则网格: 当前实现适用于结构化、均匀网格;扩展到非结构化或自适应网格将需要重新设计关键点检测内核。
  • 误差界松弛粒度: 虽然算法保证最终界限,但中间的松弛可能影响依赖中间压缩值的下游算法(例如迭代求解器)。未来工作将探索更紧的、按块的误差预算。
  • 仅GPU优化: 早期GPU实验显示出有前景的加速,但鞍点细化内核在某些架构上仍落后于CPU版本。优化GPU的内存访问模式是一个活跃的研究方向。

TopoSZp 展示了保持科学拓扑不必以性能为代价。通过将经验证的有损压缩器与一些巧妙、关注局部性的拓扑检查相结合,作者提供了一个可以直接嵌入现有 HPC 流水线的工具,使开发者确信其压缩数据仍然在分析上是可信的。

作者

  • Tripti Agarwal
  • Sheng Di
  • Xin Liang
  • Zhaoyuan Su
  • Yuxiao Li
  • Ganesh Gopalakrishnan
  • Hanqi Guo
  • Franck Cappello

论文信息

  • arXiv ID: 2602.17552v1
  • 分类: cs.DC
  • 出版日期: 2026年2月19日
  • PDF: 下载 PDF
0 浏览
Back to Blog

相关文章

阅读更多 »