[Paper] REGAL: 레지스트리 기반 아키텍처를 통한 엔터프라이즈 텔레메트리에서 Agentic AI의 결정론적 그라운딩
Source: arXiv - 2603.03018v1
Overview
이 논문은 REGAL을 소개한다. REGAL은 레지스트리‑드리븐 아키텍처로, 엔터프라이즈‑급 AI 에이전트가 내부 텔레메트리(예: Git 로그, CI/CD 이벤트, 이슈‑트래커 업데이트, 관측 메트릭 등)의 방대하고 지속적으로 변화하는 스트림에 자신의 추론을 신뢰성 있게 “그라운드”할 수 있게 한다. 결정론적 텔레메트리 계산을 일급 프리미티브로 전환하고, 버전‑제어된 제한된 액션 공간을 대형 언어 모델(LLM)에 노출함으로써, REGAL은 현재 대규모 조직에서 신뢰할 수 있는 에이전트 자동화를 방해하는 컨텍스트 제한, 의미적 드리프트, 그리고 진화하는 메트릭 인터페이스와 같은 실질적인 문제들을 해결한다.
주요 기여
- Deterministic Telemetry as a Primitive – 재현 가능하고 의미론적으로 풍부한 “Gold” 아티팩트를 생성하는 것을 사후 고려가 아닌 핵심 빌딩 블록으로 취급합니다.
- Medallion ELT Pipeline – 원시 텔레메트리를 수집하고, 재생 가능한 아티팩트로 압축한 뒤, 버전 관리되는 데이터 레이크에 저장하는 3계층 추출‑로드‑변환 워크플로우입니다.
- Registry‑Driven Compilation Layer – 선언적 메트릭 정의를 Model Context Protocol (MCP) 도구로 컴파일하여 LLM과 텔레메트리 사이에 타입이 지정되고 버전 관리되는 인터페이스를 제공합니다.
- Interface‑as‑Code Governance – 정책 검사, 접근 제어, 스키마 진화를 레지스트리 자체에 내장함으로써 “툴 드리프트”를 방지하고 컴플라이언스를 보장합니다.
- Prototype & Case Study – 실제 CI/CD 텔레메트리 세트에 대한 결정론적 기반을 시연하고, 토큰 절감, 지연 시간 개선, 거버넌스 적용 효과를 측정합니다.
Methodology
- Telemetry Ingestion (EL) – 버전 관리, CI/CD, 이슈 트래커 및 관측 플랫폼에서 발생하는 원시 이벤트 스트림을 랜딩 존으로 스트리밍합니다.
- Semantic Compression (L) – 도메인‑특화 파서가 잡음이 섞인 로그를 정규화된 의미‑타입 표현으로 변환합니다 (예:
BuildSuccess,PRMerged). - Gold Artifact Generation (T) – 변환된 데이터는 불변의 “Gold” 스냅샷으로 물리화되며, 각 스냅샷은 버전 식별자를 태그하고 데이터 레이크(예: Delta Lake)에 저장됩니다.
- Registry Definition – 엔지니어는 메트릭 및 액션을 YAML/JSON 스키마로 선언합니다 (예:
average_build_time,open_bug_count). 레지스트리는 이러한 정의를 버전 메타데이터와 함께 저장합니다. - Compilation to MCP Tools – 코드 생성기가 레지스트리 항목을 읽어 경량의 버전‑관리된 클라이언트 라이브러리(REST/GraphQL)를 생성하고, 이를 통해 LLM‑구동 에이전트에게 결정론적 쿼리를 제공합니다.
- Agent Interaction – LLM은 bounded context 로서 MCP API 사양과 작은 관련 Gold 아티팩트 조각을 받습니다. 그런 다음 컴파일된 도구에 호출을 수행하고, 결정론적 결과를 받아 자신의 추론 루프에 다시 입력합니다.
전체 흐름은 CI 파이프라인으로 오케스트레이션되며, 텔레메트리 스키마나 메트릭 정의가 변경될 경우 MCP 도구의 자동 재생성과 Gold 아티팩트 업데이트가 자동으로 트리거됩니다.
결과 및 발견
| 지표 | 기준 (원시 텔레메트리) | REGAL (Gold + MCP) | 개선 |
|---|---|---|---|
| 요청당 토큰 사용량 | ~3,200 토큰 | ~850 토큰 | 73% 감소 |
| 엔드‑투‑엔드 지연시간 | 1.8 s (네트워크 + 파싱) | 0.9 s (캐시된 Gold + MCP) | 2배 속도 향상 |
| 결정론 실패 | 12% (재현 불가능한 응답) | 0% (엄격한 버전 관리) | 완전 재현성 |
| 정책 위반 감지 | 수동 감사 | 자동 레지스트리 검사 | 드리프트 없음 |
사례 연구에서는 에이전트가 복잡한 운영 쿼리(예: “stable 브랜치의 최근 30개 릴리스에 대한 평균 빌드 시간은 얼마인가?”)에 대해 수백 개 토큰만 사용하면서도 텔레메트리의 재현 가능한 스냅샷에서 파생된 답변임을 보장할 수 있음을 보여주었습니다.
Practical Implications
- Token‑Efficient Prompting – 에이전트에 원시 로그 대신 간결하고 버전 관리된 API 사양을 제공함으로써, 개발자는 LLM 컨텍스트 윈도우 내에 머무를 수 있어 상용 API 비용을 절감할 수 있습니다.
- Fast, Deterministic Automation – 결정론적 Gold 아티팩트는 롤백을 트리거하고, 티켓을 열며, 파이프라인을 조정하는 등 인간 검증 없이도 신뢰할 수 있는 “셀프 힐링” 봇을 가능하게 합니다.
- Governance as Code – 보안 및 컴플라이언스 팀은 레지스트리에서 데이터 접근 정책을 코드화하여, 에이전트가 제한된 메트릭을 조회하는 것을 자동으로 차단할 수 있습니다.
- Simplified Integration – 생성된 MCP 라이브러리는 다른 내부 SDK와 동일하게 동작하여, 기존 DevOps 도구가 맞춤 어댑터 없이도 LLM 기반 에이전트를 호출할 수 있게 합니다.
- Scalable Evolution – 텔레메트리 스키마가 진화함에 따라, 레지스트리 기반 컴파일은 에이전트가 항상 일관되고 이전 버전과 호환되는 뷰를 보도록 보장하여 CI/CD 업그레이드 시 파손을 방지합니다.
For developers building internal AI assistants, observability bots, or automated incident responders, REGAL offers a blueprint to turn noisy enterprise data into a clean, contract‑driven knowledge base that LLMs can safely consume.
제한 사항 및 향후 작업
- 결정론 범위 – REGAL은 Gold 아티팩트에 캡처된 텔레메트리 부분에 대해서만 재현성을 보장합니다; 파이프라인 외부의 임시, 실시간 이벤트는 비결정론적 상태를 유지합니다.
- 초기 엔지니어링 비용 – Medallion 파이프라인을 설정하고 레지스트리를 유지하는 데는 초기 투자와 도메인 전문 지식이 필요합니다.
- 툴링 생태계 – 프로토타입은 단일 LLM 제공자와 제한된 텔레메트리 소스에 초점을 맞추고 있으며, 멀티클라우드 관측 스택에 대한 광범위한 지원은 향후 작업으로 남겨둡니다.
- 동적 메트릭 진화 – 버전 관리는 드리프트를 완화하지만, 다수의 마이크로서비스에 걸친 파괴적인 스키마 변경을 처리하려면 자동화된 마이그레이션 전략이 필요합니다.
향후 연구 방향으로는 스트리밍 추론 지원을 위해 REGAL을 확장하는 것(예: 실시간 알림 생성), 모델 파인튜닝 파이프라인과 통합하여 도메인 특화 지식을 LLM에 직접 삽입하는 것, 그리고 생성된 MCP 계약에 대한 형식 검증을 탐구하는 것이 포함됩니다.
저자
- Yuvraj Agrawal
논문 정보
- arXiv ID: 2603.03018v1
- Categories: cs.AI, cs.SE
- Published: 2026년 3월 3일
- PDF: PDF 다운로드