[Paper] REGAL：基于注册表驱动的架构，实现企业遥测中Agentic AI的确定性落地

发布: 2天前 (2026年3月3日 GMT+8 22:13)

8 分钟阅读

原文: arXiv

Source: arXiv - 2603.03018v1

概述

本文介绍了 REGAL，一种基于注册表的架构，使企业级 AI 代理能够可靠地将其推理“落地”到庞大且不断变化的内部遥测流（Git 日志、CI/CD 事件、issue‑tracker 更新、observability metrics 等）。通过将确定性的遥测计算提升为一等公民原语，并向大型语言模型（LLMs）公开一个受版本控制、范围受限的动作空间，REGAL 解决了当前在大型组织中阻碍可信代理自动化的实际痛点——上下文限制、语义漂移以及不断演进的指标接口。

关键贡献

Deterministic Telemetry as a Primitive – 将可复现、语义丰富的 “Gold” 人工制品的生成视为核心构建块，而非事后考虑。
Medallion ELT Pipeline – 一个三层的抽取‑加载‑转换工作流，摄取原始遥测数据，将其压缩为可重放的人工制品，并存储在版本控制的数据湖中。
Registry‑Driven Compilation Layer – 将声明式度量定义编译为 Model Context Protocol (MCP) 工具，提供在 LLM 与遥测之间的类型化、版本受控接口。
Interface‑as‑Code Governance – 将策略检查、访问控制和模式演进直接嵌入注册表，防止 “工具漂移”，确保合规性。
Prototype & Case Study – 在真实的 CI/CD 遥测数据集上演示确定性落地，衡量代币节省、延迟改进以及治理执行情况。

方法论

Telemetry Ingestion (EL) – 原始事件流来自版本控制、CI/CD、问题跟踪器和可观测性平台，流入着陆区。
Semantic Compression (L) – 面向领域的解析器将嘈杂的日志转换为规范的、语义化类型的表示（例如 BuildSuccess、PRMerged）。
Gold Artifact Generation (T) – 转换后的数据被实现为不可变的“Gold”快照，每个快照带有版本标识并存储在数据湖中（例如 Delta Lake）。
Registry Definition – 工程师在 YAML/JSON 架构中声明度量和操作（例如 average_build_time、open_bug_count）。注册表将这些定义连同版本元数据一起存储。
Compilation to MCP Tools – 代码生成器读取注册表条目，生成轻量级、受版本控制的客户端库（REST/GraphQL），向 LLM 驱动的代理公开确定性的查询。
Agent Interaction – LLM 接收一个由 MCP API 规范和一小段相关 Gold 工件组成的 bounded context。随后它调用编译后的工具，获取确定性结果并将其反馈到推理循环中。

整个流程由 CI 流水线编排，确保对遥测模式或度量定义的任何更改都会自动重新生成 MCP 工具并更新 Gold 工件。

结果与发现

指标	基线（原始遥测）	REGAL（Gold + MCP）	改进
每次请求的令牌使用量	~3,200 令牌	~850 令牌	减少 73%
端到端延迟	1.8 秒（网络 + 解析）	0.9 秒（缓存的 Gold + MCP）	加速 2 倍
确定性失败	12%（不可复现的响应）	0%（严格版本控制）	完全可复现
策略违规检测	手动审计	自动化注册表检查	零漂移

案例研究表明，代理能够使用仅几百个令牌回答复杂的运营查询（例如，“stable 分支最近 30 次发布的中位构建时间是多少？”），并保证答案来源于可复现的遥测快照。

实际意义

Token‑Efficient Prompting – 通过向代理提供简洁的、版本化的 API 规范，而非原始日志，开发者可以保持在 LLM 上下文窗口内，从而降低商业 API 的成本。
Fast, Deterministic Automation – 确定性的 Gold 工件使得可靠的“自愈”机器人能够在无需人工验证的情况下触发回滚、打开工单或调整流水线。
Governance as Code – 安全和合规团队可以在注册表中编写数据访问策略，自动阻止代理查询受限的指标。
Simplified Integration – 生成的 MCP 库像其他内部 SDK 一样使用，让现有的 DevOps 工具能够调用 LLM 驱动的代理，而无需自定义适配器。
Scalable Evolution – 随着遥测模式的演进，基于注册表的编译确保代理始终看到一致的、向后兼容的视图，避免在 CI/CD 升级期间出现破坏。

对于构建内部 AI 助手、可观测性机器人或自动化事件响应器的开发者而言，REGAL 提供了一套蓝图，能够将嘈杂的企业数据转化为干净、基于合约的知识库，让 LLM 安全地进行消费。

限制与未来工作

确定性范围 – REGAL 仅保证在 Gold 工件中捕获的遥测部分可重现；管道之外的临时、实时事件仍然是非确定性的。
初始工程开销 – 搭建 Medallion 流水线并维护注册表需要前期投入和领域专业知识。
工具生态系统 – 原型仅聚焦于单一 LLM 提供商和有限的遥测来源；对多云可观测堆栈的更广泛支持留待未来工作。
动态指标演进 – 虽然版本控制可以缓解漂移，但在众多微服务之间处理破坏性模式更改仍需自动化迁移策略。

未来的研究方向包括将 REGAL 扩展以支持流式推理（例如实时警报生成），与模型微调流水线集成，将领域特定知识直接嵌入 LLM，以及探索对生成的 MCP 合约进行形式化验证。

作者

Yuvraj Agrawal

论文信息

arXiv ID: 2603.03018v1
分类: cs.AI, cs.SE
出版日期: 2026年3月3日
PDF: 下载 PDF

[Paper] REGAL：基于注册表驱动的架构，实现企业遥测中Agentic AI的确定性落地

概述

关键贡献

方法论

结果与发现

实际意义

限制与未来工作

作者

论文信息

相关文章

[Paper] RoboPocket：使用你的手机即时改进机器人策略

[Paper] Vibe Code Bench：评估 AI 模型在端到端 Web 应用开发中的表现

[论文] SimpliHuMoN: 简化人体动作预测

【论文】SELDON：深度 ODE 网络学习的超新星爆炸