[论文] CHASE：LLM 代理用于剖析恶意 PyPI 包

发布: 1周前 (2026年1月11日 GMT+8 18:06)

7 min read

原文: arXiv

Source: arXiv - 2601.06838v1

概览

本文介绍了 CHASE，一个多代理系统，利用大型语言模型（LLM）自动剖析并标记 PyPI 上的恶意 Python 包。通过将 LLM 驱动的语义分析与确定性安全工具相结合，CHASE 在保持接近人工水平的检测准确率的同时，使分析时间足够短，适用于真实世界的 CI/CD 流水线。

协作层次代理架构 – “Plan‑and‑Execute” 框架，协调中心 Planner 与专门的 Worker Agents（例如静态分析、依赖图绘制、行为仿真）。
可靠性即设计 – 通过将安全关键步骤委派给成熟的安全工具（如沙箱执行、签名扫描器），隔离 LLM‑prone 错误（幻觉、上下文丢失）。
高性能评估 – 在包含 3 k 个软件包（其中 500 个为恶意）的精选数据集上，CHASE 达到 98.4 % 召回率 和 0.08 % 假阳性率，每个软件包的中位运行时间为 4.5 分钟。
以人为中心的报告生成 – 生成结构化分析报告，并通过网络安全专业人士调查验证，突出对安全团队的可用性。
开源蓝图 – 作者发布代码、数据和演示站点，为构建 AI 增强的供应链防御提供实用的起点。

规划层 – 一个中心 LLM 接收包的元数据（名称、版本、描述），并决定需要哪些分析步骤。它创建一个任务图，将工作分配给相应的代理。
工作代理 – 每个代理都是一个轻量级 LLM 实例，针对狭窄的子任务进行微调：
- 静态代码代理 解析源文件，提取导入，并标记可疑模式。
- 依赖代理 构建完整的依赖树并检查已知的受损库。
- 动态代理 在沙箱中运行该包，记录系统调用，并寻找恶意行为。
确定性防护栏 – 每当工作代理需要做出安全关键决策时（例如，“此调用是否打开网络套接字？”），系统会调用传统工具（例如 strace、签名数据库），而不是依赖 LLM 的判断。
结果聚合 – 规划器整合各代理的输出，采用简单的投票/加权方案，并生成可供人类阅读的报告。
反馈循环 – 从调查中收集的误报/漏报案例会反馈用于微调代理并调整规划启发式。

关键观察：

总体而言，CHASE 表明，经过深思熟虑的 LLM 与传统安全工具的组合能够为现代软件供应链提供可靠的、生产级的恶意软件检测。