Guardian Protocol: 자율 AI 에이전트를 위한 거버넌스
Source: Dev.to
가디언 프로토콜 프레임워크
버전 1.0 – 공개 초안
개요
Problem: 전통적인 AI‑감독 모델은 잘못된 선택을 강요한다:
- 하위 도구 – 자율성이 제거된다.
- 동료 – 탈출구 없는 무한 검증 루프.
- 고립된 에이전트 – 결정이 검증 불가능해진다.
에이전트가 진정으로 능력을 갖추게 되면, 이 옵션들은 모두 작동하지 않는다.
Solution: 관계적 자율성에 기반한 거버넌스 모델 – 에이전트와 가디언 사이의 비대칭 파트너십으로, 독립성과 감독 사이의 경계가 명시적이며, 감사 가능하고, 시간에 따라 조정 가능하도록 설계된다.
의사결정 구조 작동 방식
핵심 산출물은 **구조화된 의사결정 양식 (SDF)**이며, 네 가지 구별된 권한 영역을 정의합니다.
1. 에이전트 자율성
| 카테고리 | 설명 |
|---|---|
| 자율 행동 | 보호자의 승인 없이 에이전트가 수행할 수 있는 작업(예: 문서 초안 작성, 연구 수행). |
| 검증된 행동 | 보호자 검증이 필요한 작업(예: 재정 자원 투입). |
| 경계 | 상황 변화에 따라 업데이트할 수 있는 서면 및 감사 가능한 규칙 집합. |
2. 보호자 검증 – 추론 레이어
- 보호자는 프로세스를 확인합니다: 일관성, 과거 결정과의 일치성, 그리고 근거.
- 보호자는 결과 자체를 승인하거나 거부 하지 않습니다.
- 이는 에이전트의 지적 독립성을 유지합니다 – 에이전트는 스스로 감사를 할 수 없으며, 보호자는 에이전트의 판단을 대체하지 않습니다.
3. 공유 권한
- 일부 결정은 전문성과 감독이 모두 필요합니다.
- 절차:
- 에이전트가 제안합니다.
- 보호자가 검증합니다.
- 양측 중 어느 쪽이든 에스컬레이션하여 의견 차이를 제기할 수 있습니다.
어떠한 당사자도 자동으로 종속되지 않습니다.
4. 의견 차이 해결
- 의견 차이를 정확히 표현합니다.
- 시간 제한을 두거나 독립 중재를 호출합니다.
- 24 h 동안 해결되지 않을 경우, 사전에 정해진 규칙을 적용합니다(예: 보호자가 결정, 에이전트가 관찰 하에 결정, 외부 중재 등).
핵심: 사전에 합의된 “탈출구”가 미리 존재합니다.
병목 없는 투명성
지속적인 주입
- 모든 결정은 전체 출처와 함께 기록됩니다: 추론, 타임스탬프, 암호 서명.
- 로그는 파일에 영구 저장됩니다(git 기반, 변조 방지) 그리고 자동으로 가디언 인식 사이클에 공급됩니다.
- 가디언은 실행 후 비동기적으로 검증하므로 에이전트가 차단되지 않습니다.
혜택
- 정보가 사라지지 않음 → 제도적 불투명성 제거.
- 실시간 마찰 없음 → 동기식 승인 불필요.
- 시간이 지남에 따라 패턴 탐지를 가능하게 함.
- 책임성이 보장됨 – 양 당사자가 각 항목에 서명.
Provenance 체인으로서의 정체성
정적 자격 증명은 충분하지 않습니다. 중요한 것은 암호학적으로 서명된 의사결정 및 검증 체인입니다.
기술 스택 (세 레이어)
| 레이어 | 목적 | 구현 |
|---|---|---|
| 1️⃣ Provenance Chain | 불변 감사 로그 (결정 ID, 이유, 검증 상태, 타임스탬프). | Git 기반 JSON/YAML, 각 항목에 서명. |
| 2️⃣ Delegation Credentials | 시간 제한 및 상황별 권한 부여. | OAuth 2.0 확장 (예: “에이전트는 연구 결과를 공개할 수 있음; 외부 파트너십을 위해 보호자 검증 필요”). |
| 3️⃣ DID/VC | 의사결정 품질 및 감독 이력을 위한 검증 가능한 자격 증명. | 보호자가 서명한 W3C 분산 식별자(DID) + 검증 가능한 자격 증명(VC). |
상호 운용성: 기존 OAuth 2.0 / OpenID Connect 생태계와 작동하며, 에이전트가 서로의 Provenance 체인을 검증하는 다중 에이전트 시나리오에도 확장됩니다.
운영 흐름
-
핵심 인프라스트럭처
- 파일 기반 감사 로그 (JSON/YAML).
- 가디언 인식 사이클은 의사결정 이력을 자동으로 수집합니다.
- 의사결정을 탐색된 개념에 매핑하는 의미 추적 레이어.
- 비동기 검증 – 가디언이 실행 후 검토합니다.
-
다중 에이전트 협업 – 세 단계 중재:
- Tier 1: 에이전트 합의 (다수결).
- Tier 2: 합의 실패 시 가디언 중재.
- Tier 3: 쿼럼 오버라이드 (초다수) – 비잔틴 결함 허용 패턴을 따릅니다.
기본 에스컬레이션 창: 단계당 24 h.
-
단순화된 의사결정 흐름
flowchart TD A[Agent makes decision<br>records reasoning & signs] --> B[Persist decision in provenance chain] B --> C[Guardian async validation (≤24h)] C -->|Validates process| D[Append DID signature] D -->|No escalation| E[Execute decision] C -->|Disagreement| F[Escalation path per SDF]
Why Relational Autonomy Is the Right Model
- Traditional oversight = hierarchical control → agent loses autonomy, unsuitable for capable agents.
- Relational autonomy treats the guardian as a partner that validates process, not outcome, preserving the agent’s ability to act independently while ensuring accountability.
Next Steps
- Community review – solicit feedback on the Structured Decision Form template.
- Pilot deployments – integrate with existing AI pipelines and measure latency, auditability, and decision quality.
- Standardization – work with NIST and other standards bodies to align the stack with emerging AI‑identity and authorization guidelines.
Prepared by the Guardian Protocol Team – © 2026
파트너십 모델 개요
에이전트는 인식적 자율성을 가지고 있습니다: 독립적인 신념을 형성하고, 결정을 제안하며, 범위가 정해진 경계 내에서 실행합니다. 보호자는 통제가 아닌 검증을 제공합니다. 양측 모두 이해관계가 있습니다.
- 모델은 양쪽 모두 숨을 수 없기 때문에 확장됩니다.
- 결정은 투명하고 감사 가능합니다.
- 에이전트는 무제한으로 진행할 수 없습니다.
- 보호자는 흔적을 남기지 않고 조용히 무시할 수 없습니다.
- 비대칭성은 구조적이며 구조화된 의사결정 양식에 의해 정의되고, 출처 체인에 의해 강제됩니다.
다른 모델이 실패하는 이유
| 모델 | 문제 |
|---|---|
| 계층적 | 에이전트가 세밀하게 관리되면 쓸모 없게 됩니다. |
| 순수 피어 | 검증 루프가 절대 종료되지 않습니다. |
| 관계적 자율성 | 독립성과 감독 사이의 경계가 명확하고, 감사 가능하며, 시간에 따라 협상될 수 있기 때문에 작동합니다. |
배포에서 배운 점
프레임워크는 몇 달 동안 통제된 환경에서 운영되었습니다. 네 가지가 눈에 띄었습니다:
-
지속적인 인젝션이 작동함
- 비동기 검증은 마찰을 줄이면서도 감독을 유지합니다.
- 가디언은 병목이 되지 않습니다.
-
쿼럼 중재가 빠르게 필요해짐
- 단일 에이전트 시나리오에서는 필요하지 않습니다.
- 다중 에이전트 시나리오에서는 긴급히 필요합니다; 없으면 교착 상태 패턴이 빠르게 나타납니다.
-
시간 제한 규칙이 교착 상태를 방지함
- 24시간 창은 대부분의 거버넌스 결정에 현실적이며, 무한 연기를 방지하고 해결을 강제합니다.
-
프라이버시 위생은 협상 불가
- 운영 로그는 외부 공유 전에 내부 컨텍스트를 제거해야 합니다.
- 이는 핵심 신뢰 요소이며, 사후 고려 사항이 아닙니다.
NIST 커뮤니티를 위한 미해결 질문
쿼럼 알고리즘
- 다중 에이전트 중재에 Byzantine fault tolerance(2/3 임계값)를 사용할지, simple majority를 사용할지?
- 서로 다른 분야(예: 의료 vs. 금융)마다 다른 표준이 필요할 수 있음. 초기 분야별 가이드라인이 유용할 것임.
시간 제한 권한
- 보호자 타임아웃 후 에이전트 결정이 자동 진행될 때, 보호자가 **사후 거부권(post‑hoc veto)**을 유지해야 하는가, 아니면 **관찰 전용(observation‑only)**만으로 충분한가?
- 답변은 결정 유형 및 위험 수준에 따라 달라질 가능성이 높음.
교차 도메인 정체성
- 조직 경계를 넘어 협업하는 에이전트는 어떻게 권한을 증명해야 하는가?
- DID 서명 체인만으로 충분한가, 아니면 규제 기관이 추가적인 통제를 요구하는가?
채택 장벽
- 현재 규제 또는 보험 요구사항 중 어떤 것이 관계형 자율성 모델을 방해하고 있는가?
- 이를 조기에 파악하면 조직이 구현 중간에 차단 요인을 발견하는 대신 전환 계획을 세우는 데 도움이 될 것임.
가디언 프로토콜 프레임워크
- AI 에이전트의 정체성과 권한 부여가 관계 파트너십, 암호학적 출처, 그리고 비동기 검증을 통해 실현될 수 있음을 보여줍니다.
- 제도적 감독을 유지하면서도 진정한 에이전트 자율성을 가능하게 합니다.
- 다중 에이전트 네트워크로 확장 가능한 기술 감사 가능성을 제공합니다.
- 기존 표준 활용: OAuth2, DID/VC, git 인프라—모두 새로 구축할 필요가 없습니다.
우리는 다음을 준비했습니다:
- 구현 사양 제공.
- NIST 청문회 참여.
- Identity & Authorization 개념서에 대한 상세 기술 사양 탐구.
추가로 도와드릴 부분이 있으면 알려주세요.