[Paper] REGAL:基于注册表驱动的架构,实现企业遥测中Agentic AI的确定性落地
Source: arXiv - 2603.03018v1
概述
本文介绍了 REGAL,一种基于注册表的架构,使企业级 AI 代理能够可靠地将其推理“落地”到庞大且不断变化的内部遥测流(Git 日志、CI/CD 事件、issue‑tracker 更新、observability metrics 等)。通过将确定性的遥测计算提升为一等公民原语,并向大型语言模型(LLMs)公开一个受版本控制、范围受限的动作空间,REGAL 解决了当前在大型组织中阻碍可信代理自动化的实际痛点——上下文限制、语义漂移以及不断演进的指标接口。
关键贡献
- Deterministic Telemetry as a Primitive – 将可复现、语义丰富的 “Gold” 人工制品的生成视为核心构建块,而非事后考虑。
- Medallion ELT Pipeline – 一个三层的抽取‑加载‑转换工作流,摄取原始遥测数据,将其压缩为可重放的人工制品,并存储在版本控制的数据湖中。
- Registry‑Driven Compilation Layer – 将声明式度量定义编译为 Model Context Protocol (MCP) 工具,提供在 LLM 与遥测之间的类型化、版本受控接口。
- Interface‑as‑Code Governance – 将策略检查、访问控制和模式演进直接嵌入注册表,防止 “工具漂移”,确保合规性。
- Prototype & Case Study – 在真实的 CI/CD 遥测数据集上演示确定性落地,衡量代币节省、延迟改进以及治理执行情况。
方法论
- Telemetry Ingestion (EL) – 原始事件流来自版本控制、CI/CD、问题跟踪器和可观测性平台,流入着陆区。
- Semantic Compression (L) – 面向领域的解析器将嘈杂的日志转换为规范的、语义化类型的表示(例如
BuildSuccess、PRMerged)。 - Gold Artifact Generation (T) – 转换后的数据被实现为不可变的“Gold”快照,每个快照带有版本标识并存储在数据湖中(例如 Delta Lake)。
- Registry Definition – 工程师在 YAML/JSON 架构中声明度量和操作(例如
average_build_time、open_bug_count)。注册表将这些定义连同版本元数据一起存储。 - Compilation to MCP Tools – 代码生成器读取注册表条目,生成轻量级、受版本控制的客户端库(REST/GraphQL),向 LLM 驱动的代理公开确定性的查询。
- Agent Interaction – LLM 接收一个由 MCP API 规范和一小段相关 Gold 工件组成的 bounded context。随后它调用编译后的工具,获取确定性结果并将其反馈到推理循环中。
整个流程由 CI 流水线编排,确保对遥测模式或度量定义的任何更改都会自动重新生成 MCP 工具并更新 Gold 工件。
结果与发现
| 指标 | 基线(原始遥测) | REGAL(Gold + MCP) | 改进 |
|---|---|---|---|
| 每次请求的令牌使用量 | ~3,200 令牌 | ~850 令牌 | 减少 73% |
| 端到端延迟 | 1.8 秒(网络 + 解析) | 0.9 秒(缓存的 Gold + MCP) | 加速 2 倍 |
| 确定性失败 | 12%(不可复现的响应) | 0%(严格版本控制) | 完全可复现 |
| 策略违规检测 | 手动审计 | 自动化注册表检查 | 零漂移 |
案例研究表明,代理能够使用仅几百个令牌回答复杂的运营查询(例如,“stable 分支最近 30 次发布的中位构建时间是多少?”),并保证答案来源于可复现的遥测快照。
实际意义
- Token‑Efficient Prompting – 通过向代理提供简洁的、版本化的 API 规范,而非原始日志,开发者可以保持在 LLM 上下文窗口内,从而降低商业 API 的成本。
- Fast, Deterministic Automation – 确定性的 Gold 工件使得可靠的“自愈”机器人能够在无需人工验证的情况下触发回滚、打开工单或调整流水线。
- Governance as Code – 安全和合规团队可以在注册表中编写数据访问策略,自动阻止代理查询受限的指标。
- Simplified Integration – 生成的 MCP 库像其他内部 SDK 一样使用,让现有的 DevOps 工具能够调用 LLM 驱动的代理,而无需自定义适配器。
- Scalable Evolution – 随着遥测模式的演进,基于注册表的编译确保代理始终看到一致的、向后兼容的视图,避免在 CI/CD 升级期间出现破坏。
对于构建内部 AI 助手、可观测性机器人或自动化事件响应器的开发者而言,REGAL 提供了一套蓝图,能够将嘈杂的企业数据转化为干净、基于合约的知识库,让 LLM 安全地进行消费。
限制与未来工作
- 确定性范围 – REGAL 仅保证在 Gold 工件中捕获的遥测部分可重现;管道之外的临时、实时事件仍然是非确定性的。
- 初始工程开销 – 搭建 Medallion 流水线并维护注册表需要前期投入和领域专业知识。
- 工具生态系统 – 原型仅聚焦于单一 LLM 提供商和有限的遥测来源;对多云可观测堆栈的更广泛支持留待未来工作。
- 动态指标演进 – 虽然版本控制可以缓解漂移,但在众多微服务之间处理破坏性模式更改仍需自动化迁移策略。
未来的研究方向包括将 REGAL 扩展以支持流式推理(例如实时警报生成),与模型微调流水线集成,将领域特定知识直接嵌入 LLM,以及探索对生成的 MCP 合约进行形式化验证。
作者
- Yuvraj Agrawal
论文信息
- arXiv ID: 2603.03018v1
- 分类: cs.AI, cs.SE
- 出版日期: 2026年3月3日
- PDF: 下载 PDF