[Paper] Zer0n:AI辅助漏洞发现与区块链支持的完整性框架
发布: (2026年1月12日 GMT+8 02:27)
7 min read
原文: arXiv
Source: arXiv - 2601.07019v1
概述
本文提出了 Zer0n,一个将大型语言模型(LLMs)的推理能力与区块链的防篡改保证相结合的混合框架。通过让 LLM(Gemini 2.0 Pro)识别潜在的软件漏洞,并将其发现锚定在 Avalanche C‑Chain 上,作者旨在弥合当安全工具依赖不透明的 AI 输出时产生的“trust gap”。
关键贡献
- AI 驱动的漏洞检测:集成最先进的 LLM(Gemini 2.0 Pro),从代码和配置制品中生成基于逻辑的漏洞假设。
- 区块链支持的审计追踪:使用 Avalanche C‑Chain 存储 AI 生成发现的加密证明(哈希、Merkle 根),提供不可篡改、公开可验证的证据。
- 混合链下/链上架构:将大量 AI 推理保持在链下以提升速度,仅将轻量级完整性证明提交链上,避免完全去中心化方案的延迟。
- 实证评估:在 500 个真实世界端点上进行实验,显示约 80 % 的检测准确率,相比仅 AI 扫描器仅增加 22.9 % 的运行时开销。
- 开源原型:作者发布了最小参考实现,鼓励社区复制和扩展。
方法论
- 数据摄取 – 从目标端点收集源代码、二进制文件和配置文件,并预处理为统一的表示形式(例如抽象语法树、依赖图)。
- LLM 推理 – 将预处理后的制品通过提示模板输入 Gemini 2.0 Pro,要求模型“解释任何逻辑缺陷或不安全模式”。模型返回结构化的漏洞报告(类型、严重性、位置、理由)。
- 证明生成 – 对于每份报告,Zer0n 计算报告内容的确定性哈希,并将其打包进 Merkle 树。根哈希使用框架的私钥签名。
- 链上承诺 – 将签名的根哈希作为交易提交到 Avalanche C‑Chain。交易的回执充当不可篡改的时间戳证明,表明 AI 生成的报告在该时刻已存在。
- 验证 – 审计员或下游工具可以检索链上回执,从存储的报告重新计算哈希,并在无需信任 LLM 内部权重的情况下确认完整性。
整个工作流在普通硬件上运行;仅最终的哈希提交会产生区块链延迟(≈ 2 秒,在 Avalanche 上)。
结果与发现
| 指标 | Zer0n | AI‑only baseline |
|---|---|---|
| 检测准确率(真正例 / 总数) | 80 % | 71 % |
| 误报率 | 12 % | 15 % |
| 端到端延迟(每个端点) | ≈ 1.8 s (含 0.2 s 链上) | 1.5 s |
| 额外 CPU 开销 | 22.9 % | — |
| 审计证明存储(每 100 条报告) | 0.8 KB | N/A |
适度的开销主要来自密码哈希和交易提交;LLM 推理时间主导了两套系统。作者还进行了篡改模拟测试,表明对漏洞报告的任何事后修改都能通过哈希不匹配即时检测到。
实际影响
- 开发者工具 – IDE 插件可以嵌入 Zer0n 自动建议安全发现,同时将其记录在公共账本上,为安全团队提供不可否认的合规审计证据。
- 漏洞赏金平台 – 研究人员可以提交带有链上证明的 AI 生成漏洞声明,减少“谁先发现”的争议。
- 受监管行业 – 金融和医疗软件必须展示严格的变更控制;Zer0n 的不可变审计轨迹满足许多监管要求(例如 GDPR、NIST 800‑53)。
- 供应链安全 – 在扫描第三方库时,组织可以保留每次扫描的区块链锚定记录,使下游使用者能够验证组件在特定时间点已被审查。
- 事件响应 – 事后分析可以引用触发警报的精确 AI 推理,配合防篡改日志,提高根本原因的透明度。
限制与未来工作
- 模型不透明性仍然存在 – 虽然输出的完整性是可证明的,但 Gemini 2.0 Pro 的内部推理仍是一个黑箱;该框架未提供超出模型文本推理之外的可解释性。
- 对大规模代码库的可扩展性 – 当前原型按顺序处理端点;要实现企业级 CI 流水线,需要在集群间并行化并对链上提交进行批处理。
- 区块链成本模型 – 尽管 Avalanche 的费用较低,高频扫描仍可能产生不容忽视的交易成本;未来工作可以探索 Layer‑2 批处理或替代的提交方案(例如 zk‑SNARKs)。
- 对 LLM 的对抗性攻击 – 提示注入或数据投毒可能降低检测准确性;加强提示流水线并加入模型层面的防御是未解的研究方向。
作者建议将 Zer0n 扩展以支持多家 LLM 提供商、更丰富的证明格式(例如可验证计算),以及与现有 DevSecOps 平台更紧密的集成。
作者
- Harshil Parmar
- Pushti Vyas
- Prayers Khristi
- Priyank Panchal
论文信息
- arXiv ID: 2601.07019v1
- 分类: cs.CR, cs.AI, cs.SE
- 出版日期: 2026年1月11日
- PDF: 下载 PDF