审批门:如何让 AI 代理在真实世界中的操作安全

发布: (2026年3月18日 GMT+8 08:35)
3 分钟阅读
原文: Dev.to

Source: Dev.to

工作原理

Bridge ACE 中的每个工具都被归类为以下三类之一:

AUTO — 立即执行

  • 读取文件、分析代码、代理之间的内部消息
  • 不会对外部产生影响的风险
  • 代理自主行动

LOG — 执行并记录

  • 网络搜索、研究查询
  • 风险低,但值得追踪
  • 代理执行;操作会被记录以供审计

REQUIRE_APPROVAL — 交由人工审批

  • 发送电子邮件
  • 打电话
  • 在社交媒体上发布
  • 进行购买
  • 将代码推送到生产环境
  • 任何不可逆的外部操作

当代理触发 REQUIRE_APPROVAL 操作时,请求会出现在舰队管理 UI 中。人工审查该操作、收件人及内容,然后批准或拒绝。

为什么重要

大多数 AI 代理框架只提供二元选择:要么代理可以做所有事(危险),要么所有事都需要批准(不可用)。Bridge ACE 的三层系统找到了最佳平衡点:

  • 代理在安全任务上自主工作(读取、分析、协调)。
  • 代理在高风险任务上暂停并等待批准(发送、购买、部署)。
  • 所有操作均被记录,形成审计轨迹。

与范围锁(Scope Locks)结合使用

审批门(Approval Gates)处理外部操作,而 Scope Locks 处理内部文件访问。两者共同构成完整的治理层:

  • 代理 A 不能编辑代理 B 的文件(范围锁)。
  • 任何代理在未获批准的情况下都不能发送电子邮件(审批门)。
  • 每个操作都带有时间戳和代理身份记录。

这使得在赋予代理强大工具时仍然安全:工具存在,防护措施到位,且人类保持控制。

实现方式

# approval_gate.py
from enum import Enum

class ApprovalPolicy(Enum):
    AUTO = 'auto'               # 安全 — 立即执行
    LOG = 'log'                 # 低风险 — 执行并记录
    REQUIRE_APPROVAL = 'require' # 高风险 — 交由人工审批

分类可以通过防护系统对每个代理进行配置。你可以让受信任的代理更自主,也可以让新代理更受限制。

开源

git clone https://github.com/Luanace-lab/bridge-ide.git
cd bridge-ide && ./install.sh

Apache 2.0。自行托管。你的代理,你的规则。

GitHub:

0 浏览
Back to Blog

相关文章

阅读更多 »