Approval Gates: AI 에이전트를 실제 환경 운영에 안전하게 만드는 방법
Source: Dev.to
How It Works
Bridge ACE의 모든 도구는 다음 세 가지 카테고리 중 하나로 분류됩니다:
AUTO — 즉시 실행
- 파일 읽기, 코드 분석, 에이전트 간 내부 메시징
- 외부 영향을 미칠 위험이 없음
- 에이전트가 자율적으로 동작
LOG — 실행 및 기록
- 웹 검색, 연구 질의
- 위험도는 낮지만 추적할 가치가 있음
- 에이전트가 동작하고, 해당 행동은 감사용으로 로그에 기록
REQUIRE_APPROVAL — 인간에게 대기
- 이메일 전송
- 전화 걸기
- 소셜 미디어에 게시
- 구매 진행
- 코드를 프로덕션에 배포
- 되돌릴 수 없는 모든 외부 행동
에이전트가 REQUIRE_APPROVAL 행동을 트리거하면 해당 요청이 Fleet Management UI에 표시됩니다. 사람이 행동, 수신자, 내용 등을 검토한 뒤 승인하거나 거부합니다.
Why This Matters
대부분의 AI‑에이전트 프레임워크는 이진 선택만 제공합니다: 에이전트가 모든 일을 할 수 있게 하거나(위험) 모든 일에 승인을 받아야 하게 하거나(사용 불가). Bridge ACE의 3단계 시스템은 그 사이의 최적점을 찾습니다:
- 에이전트는 안전한 작업(읽기, 분석, 조정)에서는 자율적으로 동작합니다.
- 위험한 작업(전송, 구매, 배포)에서는 일시 정지하고 승인을 기다립니다.
- 모든 행동은 감사 추적을 위해 로그에 남깁니다.
Combined with Scope Locks
Approval Gates는 외부 행동을 제어하고, Scope Locks는 내부 파일 접근을 제어합니다. 두 기능이 결합돼 완전한 거버넌스 레이어를 형성합니다:
- Agent A는 Agent B의 파일을 편집할 수 없습니다 (Scope Lock).
- 어떤 에이전트도 승인을 받지 않고 이메일을 보낼 수 없습니다 (Approval Gate).
- 모든 행동은 타임스탬프와 에이전트 식별자를 포함해 로그에 기록됩니다.
이렇게 하면 강력한 도구를 에이전트에게 제공해도 안전합니다: 도구가 존재하고, 가드레일이 존재하며, 인간이 제어권을 유지합니다.
Implementation
# approval_gate.py
from enum import Enum
class ApprovalPolicy(Enum):
AUTO = 'auto' # Safe — execute immediately
LOG = 'log' # Low risk — execute and log
REQUIRE_APPROVAL = 'require' # Risky — queue for human
분류는 가드레일 시스템을 통해 에이전트별로 설정할 수 있습니다. 신뢰할 수 있는 에이전트를 더 자율적으로, 새 에이전트를 더 제한적으로 만들 수 있습니다.
Open Source
git clone https://github.com/Luanace-lab/bridge-ide.git
cd bridge-ide && ./install.sh
Apache 2.0. 자체 호스팅. 당신의 에이전트, 당신의 규칙.
GitHub: