[Paper] LightTopoGAT:使用拓扑特征增强 Graph Attention Networks,实现高效 Graph Classification
发布: (2025年12月16日 GMT+8 02:09)
6 min read
原文: arXiv
Source: arXiv - 2512.13617v1
Overview
论文提出了 LightTopoGAT,一种简化的图注意力网络(GAT),通过显式将简单的拓扑线索——节点度和局部聚类系数——输入到节点嵌入中,以提升图级分类性能。这样,模型能够捕获传统消息传递 GNN 常常遗漏的全局结构模式,同时保持参数量足够低,适合实际部署。
关键贡献
- 拓扑增强:引入度和聚类系数作为额外的节点特征,在不进行昂贵的图级池化的情况下丰富表示。
- 轻量级注意力设计:重构标准 GAT 注意力机制以保持参数高效,保留快速推理和低内存占用。
- 实证优势:在三个经典基准(MUTAG、ENZYMES、PROTEINS)上相较于强基线(GCN、GraphSAGE、原始 GAT)展示出一致的准确率提升。
- 消融分析:表明观察到的改进直接来源于添加的拓扑特征,确认其有效性。
- 简洁性与可复现性:该方法仅需少量额外输入列和最小的代码改动,易于在现有 GNN 流水线中采用。
方法论
-
特征增强:对每个节点 (v),作者计算两个标量拓扑描述符:
- 度数 (\deg(v)) —— 与该节点相连的边的数量。
- 局部聚类系数 (C(v)) —— 围绕该节点实际存在的三角形数量占可能三角形数量的比例。
将这些特征与原始节点属性向量拼接,得到增强后的特征矩阵 (\mathbf{X}’ = [\mathbf{X},|,\deg,|,C])。
-
轻量级 GAT 层:
- 使用标准的自注意力公式
[ e_{ij}= \text{LeakyReLU}\big(\mathbf{a}^\top [\mathbf{W}\mathbf{h}_i ,||, \mathbf{W}\mathbf{h}_j]\big) ]
但通过降低 (\mathbf{a}) 的维度并在不同头之间共享线性投影 (\mathbf{W}) 来减少参数量。 - 对邻居得分进行 softmax,得到注意力系数 (\alpha_{ij}),并将邻居信息聚合为
[ \mathbf{h}‘i = \sigma!\bigg(\sum{j\in \mathcal{N}(i)} \alpha_{ij}\mathbf{W}\mathbf{h}_j\bigg). ]
- 使用标准的自注意力公式
-
图读出:在堆叠 2–3 层 LightTopoGAT 后,对节点嵌入进行全局池化(例如均值池),得到图级向量,再送入一个简单的 MLP 分类器。
-
训练:使用标准的交叉熵损失和 Adam 优化器;除 dropout 外不添加额外正则化。
结果与发现
| 数据集 | 基线 (GAT) | LightTopoGAT | Δ 准确率 |
|---|---|---|---|
| MUTAG | 86.2 % | 92.8 % | +6.6 % |
| ENZYMES | 58.1 % | 60.4 % | +2.3 % |
| PROTEINS | 73.5 % | 75.7 % | +2.2 % |
- 一致的边缘 相较于 GCN、GraphSAGE 和普通 GAT,在所有三个数据集上均表现更好。
- 消融实验:去除度数或聚类系数会使性能下降至接近基线,验证了每个描述符都有独特贡献。
- 参数数量:LightTopoGAT 使用的可训练参数约比具有相似隐藏层大小的标准 2‑head GAT 少 15 %,在单 GPU 上训练速度提升约 20 %。
实际意义
- 低资源部署:轻量级注意力机制使模型适用于边缘设备或实时推理,在内存和延迟受限的场景(例如交易图上的欺诈检测)。
- 即插即用的增强:添加节点度和聚类系数只需一行预处理代码;现有的 GNN 代码库可以直接采用 LightTopoGAT,无需重新设计架构。
- 更好的全局感知:对于图拓扑蕴含领域知识的场景——化学(分子环)、生物信息学(蛋白质相互作用模体)、社交网络(社区结构)——该方法能够捕捉纯属性驱动的 GNN 所遗漏的模式。
- 可扩展到更大图:由于额外特征在局部计算且注意力头共享,方法的扩展性与标准 GAT 相似,避免了更复杂高阶 GNN 的二次增长。
限制与未来工作
- 特征简洁性:仅使用度和聚类系数;更丰富的拓扑描述符(例如介数中心性、谱嵌入)可能带来进一步提升,但会增加预处理成本。
- 基准范围:实验仅限于三个相对较小、研究充分的数据集;在大规模、异构图(例如网页级知识图谱)上的表现尚未测试。
- 静态拓扑:该方法假设图结构固定;动态或演化图需要重新计算拓扑特征,可能代价高昂。
- 未来方向:作者提出的方向包括探索拓扑信息与属性信息的自适应加权、整合学习到的位置编码,以及将框架扩展到归纳设置,在测试时出现未见过的图结构。
作者
- Ankit Sharma
- Sayan Roy Gupta
论文信息
- arXiv ID: 2512.13617v1
- 分类: cs.LG
- 发布日期: 2025年12月15日
- PDF: Download PDF