Approval Gates: AI 에이전트를 실제 환경 운영에 안전하게 만드는 방법

발행: 1개월 전 (2026년 3월 18일 오전 09:35 GMT+9)

4 분 소요

원문: Dev.to

Source: Dev.to

How It Works

Bridge ACE의 모든 도구는 다음 세 가지 카테고리 중 하나로 분류됩니다:

AUTO — 즉시 실행

파일 읽기, 코드 분석, 에이전트 간 내부 메시징
외부 영향을 미칠 위험이 없음
에이전트가 자율적으로 동작

LOG — 실행 및 기록

웹 검색, 연구 질의
위험도는 낮지만 추적할 가치가 있음
에이전트가 동작하고, 해당 행동은 감사용으로 로그에 기록

REQUIRE_APPROVAL — 인간에게 대기

이메일 전송
전화 걸기
소셜 미디어에 게시
구매 진행
코드를 프로덕션에 배포
되돌릴 수 없는 모든 외부 행동

에이전트가 REQUIRE_APPROVAL 행동을 트리거하면 해당 요청이 Fleet Management UI에 표시됩니다. 사람이 행동, 수신자, 내용 등을 검토한 뒤 승인하거나 거부합니다.

Why This Matters

대부분의 AI‑에이전트 프레임워크는 이진 선택만 제공합니다: 에이전트가 모든 일을 할 수 있게 하거나(위험) 모든 일에 승인을 받아야 하게 하거나(사용 불가). Bridge ACE의 3단계 시스템은 그 사이의 최적점을 찾습니다:

에이전트는 안전한 작업(읽기, 분석, 조정)에서는 자율적으로 동작합니다.
위험한 작업(전송, 구매, 배포)에서는 일시 정지하고 승인을 기다립니다.
모든 행동은 감사 추적을 위해 로그에 남깁니다.

Combined with Scope Locks

Approval Gates는 외부 행동을 제어하고, Scope Locks는 내부 파일 접근을 제어합니다. 두 기능이 결합돼 완전한 거버넌스 레이어를 형성합니다:

Agent A는 Agent B의 파일을 편집할 수 없습니다 (Scope Lock).
어떤 에이전트도 승인을 받지 않고 이메일을 보낼 수 없습니다 (Approval Gate).
모든 행동은 타임스탬프와 에이전트 식별자를 포함해 로그에 기록됩니다.

이렇게 하면 강력한 도구를 에이전트에게 제공해도 안전합니다: 도구가 존재하고, 가드레일이 존재하며, 인간이 제어권을 유지합니다.

Implementation

# approval_gate.py
from enum import Enum

class ApprovalPolicy(Enum):
    AUTO = 'auto'               # Safe — execute immediately
    LOG = 'log'                 # Low risk — execute and log
    REQUIRE_APPROVAL = 'require' # Risky — queue for human

분류는 가드레일 시스템을 통해 에이전트별로 설정할 수 있습니다. 신뢰할 수 있는 에이전트를 더 자율적으로, 새 에이전트를 더 제한적으로 만들 수 있습니다.

Open Source

git clone https://github.com/Luanace-lab/bridge-ide.git
cd bridge-ide && ./install.sh

Apache 2.0. 자체 호스팅. 당신의 에이전트, 당신의 규칙.

GitHub:

Approval Gates: AI 에이전트를 실제 환경 운영에 안전하게 만드는 방법

How It Works

Why This Matters

Combined with Scope Locks

Implementation

Open Source

관련 글

2023년식 AI 에이전트 프롬프트 작성을 그만두세요: 실제로 동작하는 OpenClaw 에이전트를 위한 프레임워크

AI 에이전트가 작동하는 방식 이해하기

결정론적 제어 플레인: 신뢰할 수 있는 AI 에이전트 구축

LLM 호출 없이 학습하는 AI 에이전트를 위한 인지 레이어를 만들었습니다