[Paper] TriCEGAR：一种基于轨迹的抽象机制用于Agentic AI

发布: 1周前 (2026年1月30日 GMT+8 22:01)

8 分钟阅读

原文: arXiv

Source: arXiv - 2601.22997v1

概述

本文介绍了 TriCEGAR，一种基于轨迹的抽象技术，能够自动从执行日志中构建一个紧凑且可验证的 agentic AI 系统模型。通过将原始生命周期事件转换为概率状态机，TriCEGAR 实现了持续保证（例如，“代理成功的概率是多少？”），而无需开发者手工制作抽象——这在以往的运行时验证方法中是一个主要障碍。

关键贡献

自动抽象：直接从代理执行轨迹生成谓词树状态抽象，消除手动、特定领域的状态设计。
在线 MDP 构建：随着新日志的到来，增量构建捕获代理随机行为的马尔可夫决策过程（MDP）。
反例驱动细化（CEGAR）：利用模型检查失败的查询自动细化抽象，确保 MDP 与观测行为保持一致。
框架原生集成：提供插件，(1) 捕获类型化生命周期事件，(2) 构建抽象，(3) 合成 MDP，(4) 运行概率模型检查以获得定量保证（例如 Pmax(success)、Pmin(failure)）。
通过运行似然进行异常检测：计算观测轨迹在学习得到的 MDP 下的似然度，将低概率执行标记为潜在的安全或性能异常。

方法论

跟踪收集 – 系统对代理的运行时进行仪表化，以发出 类型化 事件（例如 “tool‑selected”、 “observation received”、 “action executed”）。这些事件被存储为有序日志。
谓词树学习 – 从日志中，TriCEGAR 提取关于事件属性的布尔谓词（例如 tool == "search" ∧ confidence > 0.8）。它将这些谓词组织成类似决策树的结构，每个叶子对应一个抽象状态。
MDP 合成 – 随着跟踪流入，抽象状态之间的转移被计数，从而得到 MDP 边的经验概率。MDP 在线更新，保持轻量级表示。
概率模型检查 – 使用如 PRISM 等工具，对 MDP 进行定量属性查询（例如 “在 10 步内到达 success 状态的最大概率”）。
CEGAR 循环 – 如果模型检查查询失败（界限过松），系统会提取违反属性的 反例跟踪。该跟踪被送回谓词学习器，后者对相关叶节点进行划分或细化，生成更细的抽象。循环重复，直至属性在用户定义的容差范围内得到满足。
异常防护 – 计算每条新跟踪在当前 MDP 下的似然度；低于阈值的跟踪会触发警报，从而实现对意外行为的运行时监控。

结果与发现

准确性 vs. 手工抽象 – 在三个基准代理 AI 任务（网页搜索助理、代码生成机器人和自主数据管道编排器）中，TriCEGAR 达到了与手工抽象得到的概率界限相差不超过 5 %的精度，同时无需任何手动状态工程。
可扩展性 – 在线抽象和 MDP 更新的开销在每 1 k 事件批次下保持在 30 ms 以下，使其适用于生产服务中的实时监控。
细化效率 – CEGAR 循环在每个属性上平均收敛于 3–4 次迭代，仅在需要的地方自动收紧抽象。
异常检测 – 低概率轨迹（概率分布的底部 1 %）对应于注入的故障场景（例如工具失效、响应格式错误），其真阳性率为 92 %，假阳性率为 4 %。

实际意义

降低 DevOps 摩擦 – 团队可以将 TriCEGAR 插入现有的代理流水线，并在无需编写自定义抽象代码的情况下获得量化的安全/质量保证。
持续保证 – 由于 MDP 实时更新，开发者可以获得实时的概率估计（例如，“在 5 步以内完成用户请求的概率为 0.87”），从而驱动自适应限流或回退策略。
安全护栏 – 基于概率的异常检测器可以接入告警系统（PagerDuty、Slack）或自动化缓解措施（重置代理、切换到沙箱模式）。
合规监管 – 对成功/失败概率的量化界限有助于满足新兴的 AI 保障标准（例如 EU AI 法案、ISO/IEC 42001）。
工具生态系统 – 该方法兼容流行的代理框架（LangChain、AutoGPT）和模型检查后端（PRISM、Storm），便于在 CI/CD 流水线中轻松集成。

局限性与未来工作

Trace quality dependence – 抽象质量取决于记录事件的丰富程度；稀疏或噪声较多的日志可能导致状态过于粗糙，概率界限不精确。
State explosion risk – 在高度异构的环境中，谓词树可能变得庞大；当前的剪枝启发式方法较为简单，仍有改进空间。
Limited to discrete actions – 现有的 MDP 形式化假设动作集合是有限的；将其扩展到连续控制或混合系统（例如机器人）留待未来研究。
Scalability to massive fleets – 虽然单个代理的开销很低，但在成千上万的代理之间聚合模型会带来存储和计算挑战，作者计划通过层次化或联邦抽象技术来解决。

TriCEGAR 表明，自动化、基于轨迹的抽象能够将严格的概率保证引入快速发展的智能体 AI 世界，为实现更安全、更可信的自主软件开辟了道路。

作者

Roham Koohestani
Ateş Görpelioğlu
Egor Klimov
Burcu Kulahcioglu Ozkan
Maliheh Izadi

论文信息

arXiv ID: 2601.22997v1
分类: cs.AI, cs.SE
出版时间: 2026年1月30日
PDF: 下载 PDF

[Paper] TriCEGAR：一种基于轨迹的抽象机制用于Agentic AI

概述

关键贡献

方法论

结果与发现

实际意义

局限性与未来工作

作者

论文信息

相关文章

[Paper] VideoGPA：蒸馏几何先验以实现3D一致的视频生成

[论文] 共享自治范式中信念与策略学习的端到端优化

[Paper] 解耦扩散采样用于函数空间的逆问题

[Paper] FOCUS：DLLMs 知道如何驯服它们的计算瓶颈