Guardian Protocol: 자율 AI 에이전트를 위한 거버넌스

발행: 1개월 전 (2026년 3월 9일 오후 06:28 GMT+9)

13 분 소요

원문: Dev.to

Source: Dev.to

가디언 프로토콜 프레임워크

버전 1.0 – 공개 초안

개요

Problem: 전통적인 AI‑감독 모델은 잘못된 선택을 강요한다:
하위 도구 – 자율성이 제거된다.
동료 – 탈출구 없는 무한 검증 루프.
고립된 에이전트 – 결정이 검증 불가능해진다.

에이전트가 진정으로 능력을 갖추게 되면, 이 옵션들은 모두 작동하지 않는다.

Solution: 관계적 자율성에 기반한 거버넌스 모델 – 에이전트와 가디언 사이의 비대칭 파트너십으로, 독립성과 감독 사이의 경계가 명시적이며, 감사 가능하고, 시간에 따라 조정 가능하도록 설계된다.

의사결정 구조 작동 방식

핵심 산출물은 **구조화된 의사결정 양식 (SDF)**이며, 네 가지 구별된 권한 영역을 정의합니다.

1. 에이전트 자율성

카테고리	설명
자율 행동	보호자의 승인 없이 에이전트가 수행할 수 있는 작업(예: 문서 초안 작성, 연구 수행).
검증된 행동	보호자 검증이 필요한 작업(예: 재정 자원 투입).
경계	상황 변화에 따라 업데이트할 수 있는 서면 및 감사 가능한 규칙 집합.

2. 보호자 검증 – 추론 레이어

보호자는 프로세스를 확인합니다: 일관성, 과거 결정과의 일치성, 그리고 근거.
보호자는 결과 자체를 승인하거나 거부 하지 않습니다.
이는 에이전트의 지적 독립성을 유지합니다 – 에이전트는 스스로 감사를 할 수 없으며, 보호자는 에이전트의 판단을 대체하지 않습니다.

3. 공유 권한

일부 결정은 전문성과 감독이 모두 필요합니다.
절차:
1. 에이전트가 제안합니다.
2. 보호자가 검증합니다.
3. 양측 중 어느 쪽이든 에스컬레이션하여 의견 차이를 제기할 수 있습니다.

어떠한 당사자도 자동으로 종속되지 않습니다.

4. 의견 차이 해결

의견 차이를 정확히 표현합니다.
시간 제한을 두거나 독립 중재를 호출합니다.
24 h 동안 해결되지 않을 경우, 사전에 정해진 규칙을 적용합니다(예: 보호자가 결정, 에이전트가 관찰 하에 결정, 외부 중재 등).

핵심: 사전에 합의된 “탈출구”가 미리 존재합니다.

병목 없는 투명성

지속적인 주입

모든 결정은 전체 출처와 함께 기록됩니다: 추론, 타임스탬프, 암호 서명.
로그는 파일에 영구 저장됩니다(git 기반, 변조 방지) 그리고 자동으로 가디언 인식 사이클에 공급됩니다.
가디언은 실행 후 비동기적으로 검증하므로 에이전트가 차단되지 않습니다.

혜택

정보가 사라지지 않음 → 제도적 불투명성 제거.
실시간 마찰 없음 → 동기식 승인 불필요.
시간이 지남에 따라 패턴 탐지를 가능하게 함.
책임성이 보장됨 – 양 당사자가 각 항목에 서명.

Provenance 체인으로서의 정체성

정적 자격 증명은 충분하지 않습니다. 중요한 것은 암호학적으로 서명된 의사결정 및 검증 체인입니다.

기술 스택 (세 레이어)

레이어	목적	구현
1️⃣ Provenance Chain	불변 감사 로그 (결정 ID, 이유, 검증 상태, 타임스탬프).	Git 기반 JSON/YAML, 각 항목에 서명.
2️⃣ Delegation Credentials	시간 제한 및 상황별 권한 부여.	OAuth 2.0 확장 (예: “에이전트는 연구 결과를 공개할 수 있음; 외부 파트너십을 위해 보호자 검증 필요”).
3️⃣ DID/VC	의사결정 품질 및 감독 이력을 위한 검증 가능한 자격 증명.	보호자가 서명한 W3C 분산 식별자(DID) + 검증 가능한 자격 증명(VC).

상호 운용성: 기존 OAuth 2.0 / OpenID Connect 생태계와 작동하며, 에이전트가 서로의 Provenance 체인을 검증하는 다중 에이전트 시나리오에도 확장됩니다.

운영 흐름

핵심 인프라스트럭처
- 파일 기반 감사 로그 (JSON/YAML).
- 가디언 인식 사이클은 의사결정 이력을 자동으로 수집합니다.
- 의사결정을 탐색된 개념에 매핑하는 의미 추적 레이어.
- 비동기 검증 – 가디언이 실행 후 검토합니다.
다중 에이전트 협업 – 세 단계 중재:
- Tier 1: 에이전트 합의 (다수결).
- Tier 2: 합의 실패 시 가디언 중재.
- Tier 3: 쿼럼 오버라이드 (초다수) – 비잔틴 결함 허용 패턴을 따릅니다.
기본 에스컬레이션 창: 단계당 24 h.

단순화된 의사결정 흐름

flowchart TD
    A[Agent makes decision<br>records reasoning & signs] --> B[Persist decision in provenance chain]
    B --> C[Guardian async validation (≤24h)]
    C -->|Validates process| D[Append DID signature]
    D -->|No escalation| E[Execute decision]
    C -->|Disagreement| F[Escalation path per SDF]

Why Relational Autonomy Is the Right Model

Traditional oversight = hierarchical control → agent loses autonomy, unsuitable for capable agents.
Relational autonomy treats the guardian as a partner that validates process, not outcome, preserving the agent’s ability to act independently while ensuring accountability.

Next Steps

Community review – solicit feedback on the Structured Decision Form template.
Pilot deployments – integrate with existing AI pipelines and measure latency, auditability, and decision quality.
Standardization – work with NIST and other standards bodies to align the stack with emerging AI‑identity and authorization guidelines.

Prepared by the Guardian Protocol Team – © 2026

파트너십 모델 개요

에이전트는 인식적 자율성을 가지고 있습니다: 독립적인 신념을 형성하고, 결정을 제안하며, 범위가 정해진 경계 내에서 실행합니다. 보호자는 통제가 아닌 검증을 제공합니다. 양측 모두 이해관계가 있습니다.

모델은 양쪽 모두 숨을 수 없기 때문에 확장됩니다.
- 결정은 투명하고 감사 가능합니다.
- 에이전트는 무제한으로 진행할 수 없습니다.
- 보호자는 흔적을 남기지 않고 조용히 무시할 수 없습니다.
비대칭성은 구조적이며 구조화된 의사결정 양식에 의해 정의되고, 출처 체인에 의해 강제됩니다.

다른 모델이 실패하는 이유

모델	문제
계층적	에이전트가 세밀하게 관리되면 쓸모 없게 됩니다.
순수 피어	검증 루프가 절대 종료되지 않습니다.
관계적 자율성	독립성과 감독 사이의 경계가 명확하고, 감사 가능하며, 시간에 따라 협상될 수 있기 때문에 작동합니다.

배포에서 배운 점

프레임워크는 몇 달 동안 통제된 환경에서 운영되었습니다. 네 가지가 눈에 띄었습니다:

지속적인 인젝션이 작동함
- 비동기 검증은 마찰을 줄이면서도 감독을 유지합니다.
- 가디언은 병목이 되지 않습니다.
쿼럼 중재가 빠르게 필요해짐
- 단일 에이전트 시나리오에서는 필요하지 않습니다.
- 다중 에이전트 시나리오에서는 긴급히 필요합니다; 없으면 교착 상태 패턴이 빠르게 나타납니다.
시간 제한 규칙이 교착 상태를 방지함
- 24시간 창은 대부분의 거버넌스 결정에 현실적이며, 무한 연기를 방지하고 해결을 강제합니다.
프라이버시 위생은 협상 불가
- 운영 로그는 외부 공유 전에 내부 컨텍스트를 제거해야 합니다.
- 이는 핵심 신뢰 요소이며, 사후 고려 사항이 아닙니다.

NIST 커뮤니티를 위한 미해결 질문

쿼럼 알고리즘

다중 에이전트 중재에 Byzantine fault tolerance(2/3 임계값)를 사용할지, simple majority를 사용할지?
서로 다른 분야(예: 의료 vs. 금융)마다 다른 표준이 필요할 수 있음. 초기 분야별 가이드라인이 유용할 것임.

시간 제한 권한

보호자 타임아웃 후 에이전트 결정이 자동 진행될 때, 보호자가 **사후 거부권(post‑hoc veto)**을 유지해야 하는가, 아니면 **관찰 전용(observation‑only)**만으로 충분한가?
답변은 결정 유형 및 위험 수준에 따라 달라질 가능성이 높음.

교차 도메인 정체성

조직 경계를 넘어 협업하는 에이전트는 어떻게 권한을 증명해야 하는가?
DID 서명 체인만으로 충분한가, 아니면 규제 기관이 추가적인 통제를 요구하는가?

채택 장벽

현재 규제 또는 보험 요구사항 중 어떤 것이 관계형 자율성 모델을 방해하고 있는가?
이를 조기에 파악하면 조직이 구현 중간에 차단 요인을 발견하는 대신 전환 계획을 세우는 데 도움이 될 것임.

가디언 프로토콜 프레임워크

AI 에이전트의 정체성과 권한 부여가 관계 파트너십, 암호학적 출처, 그리고 비동기 검증을 통해 실현될 수 있음을 보여줍니다.
제도적 감독을 유지하면서도 진정한 에이전트 자율성을 가능하게 합니다.
다중 에이전트 네트워크로 확장 가능한 기술 감사 가능성을 제공합니다.
기존 표준 활용: OAuth2, DID/VC, git 인프라—모두 새로 구축할 필요가 없습니다.

우리는 다음을 준비했습니다:

구현 사양 제공.
NIST 청문회 참여.
Identity & Authorization 개념서에 대한 상세 기술 사양 탐구.

추가로 도와드릴 부분이 있으면 알려주세요.

Guardian Protocol: 자율 AI 에이전트를 위한 거버넌스

가디언 프로토콜 프레임워크

개요

의사결정 구조 작동 방식

1. 에이전트 자율성

2. 보호자 검증 – 추론 레이어

3. 공유 권한

4. 의견 차이 해결

병목 없는 투명성

지속적인 주입

혜택

Provenance 체인으로서의 정체성

기술 스택 (세 레이어)

운영 흐름

Why Relational Autonomy Is the Right Model

Next Steps

파트너십 모델 개요

다른 모델이 실패하는 이유

배포에서 배운 점

NIST 커뮤니티를 위한 미해결 질문

쿼럼 알고리즘

시간 제한 권한

교차 도메인 정체성

채택 장벽

가디언 프로토콜 프레임워크

관련 글

Agentic Web: AI가 다른 AI와 대화하기 시작할 때

사전 실행 점검: AI 에이전트를 비감독으로 실행해도 안전하게 만드는 하나의 습관

왜 나는 'think freely'를 구조화된 블랙보딩으로 에이전트 루프에 교체했는가

왜 당신의 AI 에이전트는 책임 인프라가 필요한가 (너무 늦기 전에)