[Paper] REGAL:基于注册表驱动的架构,实现企业遥测中Agentic AI的确定性落地

发布: (2026年3月3日 GMT+8 22:13)
8 分钟阅读
原文: arXiv

Source: arXiv - 2603.03018v1

概述

本文介绍了 REGAL,一种基于注册表的架构,使企业级 AI 代理能够可靠地将其推理“落地”到庞大且不断变化的内部遥测流(Git 日志、CI/CD 事件、issue‑tracker 更新、observability metrics 等)。通过将确定性的遥测计算提升为一等公民原语,并向大型语言模型(LLMs)公开一个受版本控制、范围受限的动作空间,REGAL 解决了当前在大型组织中阻碍可信代理自动化的实际痛点——上下文限制、语义漂移以及不断演进的指标接口。

关键贡献

  • Deterministic Telemetry as a Primitive – 将可复现、语义丰富的 “Gold” 人工制品的生成视为核心构建块,而非事后考虑。
  • Medallion ELT Pipeline – 一个三层的抽取‑加载‑转换工作流,摄取原始遥测数据,将其压缩为可重放的人工制品,并存储在版本控制的数据湖中。
  • Registry‑Driven Compilation Layer – 将声明式度量定义编译为 Model Context Protocol (MCP) 工具,提供在 LLM 与遥测之间的类型化、版本受控接口。
  • Interface‑as‑Code Governance – 将策略检查、访问控制和模式演进直接嵌入注册表,防止 “工具漂移”,确保合规性。
  • Prototype & Case Study – 在真实的 CI/CD 遥测数据集上演示确定性落地,衡量代币节省、延迟改进以及治理执行情况。

方法论

  1. Telemetry Ingestion (EL) – 原始事件流来自版本控制、CI/CD、问题跟踪器和可观测性平台,流入着陆区。
  2. Semantic Compression (L) – 面向领域的解析器将嘈杂的日志转换为规范的、语义化类型的表示(例如 BuildSuccessPRMerged)。
  3. Gold Artifact Generation (T) – 转换后的数据被实现为不可变的“Gold”快照,每个快照带有版本标识并存储在数据湖中(例如 Delta Lake)。
  4. Registry Definition – 工程师在 YAML/JSON 架构中声明度量和操作(例如 average_build_timeopen_bug_count)。注册表将这些定义连同版本元数据一起存储。
  5. Compilation to MCP Tools – 代码生成器读取注册表条目,生成轻量级、受版本控制的客户端库(REST/GraphQL),向 LLM 驱动的代理公开确定性的查询。
  6. Agent Interaction – LLM 接收一个由 MCP API 规范和一小段相关 Gold 工件组成的 bounded context。随后它调用编译后的工具,获取确定性结果并将其反馈到推理循环中。

整个流程由 CI 流水线编排,确保对遥测模式或度量定义的任何更改都会自动重新生成 MCP 工具并更新 Gold 工件。

结果与发现

指标基线(原始遥测)REGAL(Gold + MCP)改进
每次请求的令牌使用量~3,200 令牌~850 令牌减少 73%
端到端延迟1.8 秒(网络 + 解析)0.9 秒(缓存的 Gold + MCP)加速 2 倍
确定性失败12%(不可复现的响应)0%(严格版本控制)完全可复现
策略违规检测手动审计自动化注册表检查零漂移

案例研究表明,代理能够使用仅几百个令牌回答复杂的运营查询(例如,“stable 分支最近 30 次发布的中位构建时间是多少?”),并保证答案来源于可复现的遥测快照。

实际意义

  • Token‑Efficient Prompting – 通过向代理提供简洁的、版本化的 API 规范,而非原始日志,开发者可以保持在 LLM 上下文窗口内,从而降低商业 API 的成本。
  • Fast, Deterministic Automation – 确定性的 Gold 工件使得可靠的“自愈”机器人能够在无需人工验证的情况下触发回滚、打开工单或调整流水线。
  • Governance as Code – 安全和合规团队可以在注册表中编写数据访问策略,自动阻止代理查询受限的指标。
  • Simplified Integration – 生成的 MCP 库像其他内部 SDK 一样使用,让现有的 DevOps 工具能够调用 LLM 驱动的代理,而无需自定义适配器。
  • Scalable Evolution – 随着遥测模式的演进,基于注册表的编译确保代理始终看到一致的、向后兼容的视图,避免在 CI/CD 升级期间出现破坏。

对于构建内部 AI 助手、可观测性机器人或自动化事件响应器的开发者而言,REGAL 提供了一套蓝图,能够将嘈杂的企业数据转化为干净、基于合约的知识库,让 LLM 安全地进行消费。

限制与未来工作

  • 确定性范围 – REGAL 仅保证在 Gold 工件中捕获的遥测部分可重现;管道之外的临时、实时事件仍然是非确定性的。
  • 初始工程开销 – 搭建 Medallion 流水线并维护注册表需要前期投入和领域专业知识。
  • 工具生态系统 – 原型仅聚焦于单一 LLM 提供商和有限的遥测来源;对多云可观测堆栈的更广泛支持留待未来工作。
  • 动态指标演进 – 虽然版本控制可以缓解漂移,但在众多微服务之间处理破坏性模式更改仍需自动化迁移策略。

未来的研究方向包括将 REGAL 扩展以支持流式推理(例如实时警报生成),与模型微调流水线集成,将领域特定知识直接嵌入 LLM,以及探索对生成的 MCP 合约进行形式化验证。

作者

  • Yuvraj Agrawal

论文信息

  • arXiv ID: 2603.03018v1
  • 分类: cs.AI, cs.SE
  • 出版日期: 2026年3月3日
  • PDF: 下载 PDF
0 浏览
Back to Blog

相关文章

阅读更多 »

[论文] SimpliHuMoN: 简化人体动作预测

Human motion prediction 将轨迹预测(trajectory forecasting)和人体姿态预测(human pose prediction)这两个任务结合在一起。针对这两个任务,已经开发了专门的模型……