[Paper] Java 项目中能耗回归的系统性检测及对应代码模式

发布: 2天前 (2026年4月21日 GMT+8 19:54)

6 分钟阅读

原文: arXiv

Source: arXiv - 2604.19373v1

概述

本文提出了 EnergyTrackr，一种自动化技术，通过分析提交级别的功耗测量来发现 Java 项目中的能耗回归缺陷。该方法通过标记统计显著的能耗峰值并将其关联到重复出现的代码模式，旨在为开发者提供一个用于持续绿色软件监控的实用工具。

数据收集 – 作者对目标 Java 项目进行仪器化，在每次提交时运行代表性的基准套件，使用高分辨率功率计测量总能耗。
统计检测 – 对于每个提交，EnergyTrackr 计算平均能耗，并对比前面提交的滑动窗口，使用双样本 t 检验（或非参数替代方法）。当 p 值低于可配置阈值（默认 0.01）时，提交会被标记。
代码变更提取 – 对标记的提交使用 Java AST 解析器进行解析。系统提取细粒度的编辑操作（add/delete/modify statements、method calls、dependency version changes）。
模式挖掘 – 在编辑操作向量上使用频繁模式挖掘（FP‑Growth），作者揭示出重复出现的 “energy‑anti‑patterns”。每个模式通过其 support（出现频率）和 confidence（与回归的关联强度）进行评分。
验证 – 对随机抽取的标记提交进行人工检查，以确认识别出的模式是否真实解释了能耗增加。

该流水线刻意保持轻量：可在普通硬件上运行，仅需一个基准脚本，并且可以作为夜间构建的一部分进行调度。

指标	数值
精确率（正确标记的能耗回归）	0.78
召回率（在所有真实回归中检测到的回归）	0.71
主要反模式	1️⃣ 循环中缺少提前退出（`return`/`break`） 2️⃣ 引入急切的集合实例化（例如 `stream().collect()`） 3️⃣ 将库升级到更新、更耗 CPU 的版本
平均检测延迟	1 次提交（通常标记的即为有问题的提交）

作者还报告称，在 62 % 的标记提交中，识别出的模式与开发者自己的事后分析解释相吻合，验证了所挖掘模式的实际相关性。