审批门:如何让 AI 代理在真实世界中的操作安全
Source: Dev.to
工作原理
Bridge ACE 中的每个工具都被归类为以下三类之一:
AUTO — 立即执行
- 读取文件、分析代码、代理之间的内部消息
- 不会对外部产生影响的风险
- 代理自主行动
LOG — 执行并记录
- 网络搜索、研究查询
- 风险低,但值得追踪
- 代理执行;操作会被记录以供审计
REQUIRE_APPROVAL — 交由人工审批
- 发送电子邮件
- 打电话
- 在社交媒体上发布
- 进行购买
- 将代码推送到生产环境
- 任何不可逆的外部操作
当代理触发 REQUIRE_APPROVAL 操作时,请求会出现在舰队管理 UI 中。人工审查该操作、收件人及内容,然后批准或拒绝。
为什么重要
大多数 AI 代理框架只提供二元选择:要么代理可以做所有事(危险),要么所有事都需要批准(不可用)。Bridge ACE 的三层系统找到了最佳平衡点:
- 代理在安全任务上自主工作(读取、分析、协调)。
- 代理在高风险任务上暂停并等待批准(发送、购买、部署)。
- 所有操作均被记录,形成审计轨迹。
与范围锁(Scope Locks)结合使用
审批门(Approval Gates)处理外部操作,而 Scope Locks 处理内部文件访问。两者共同构成完整的治理层:
- 代理 A 不能编辑代理 B 的文件(范围锁)。
- 任何代理在未获批准的情况下都不能发送电子邮件(审批门)。
- 每个操作都带有时间戳和代理身份记录。
这使得在赋予代理强大工具时仍然安全:工具存在,防护措施到位,且人类保持控制。
实现方式
# approval_gate.py
from enum import Enum
class ApprovalPolicy(Enum):
AUTO = 'auto' # 安全 — 立即执行
LOG = 'log' # 低风险 — 执行并记录
REQUIRE_APPROVAL = 'require' # 高风险 — 交由人工审批
分类可以通过防护系统对每个代理进行配置。你可以让受信任的代理更自主,也可以让新代理更受限制。
开源
git clone https://github.com/Luanace-lab/bridge-ide.git
cd bridge-ide && ./install.sh
Apache 2.0。自行托管。你的代理,你的规则。
GitHub: