审批门：如何让 AI 代理在真实世界中的操作安全

发布: 1个月前 (2026年3月18日 GMT+8 08:35)

3 分钟阅读

原文: Dev.to

Source: Dev.to

工作原理

Bridge ACE 中的每个工具都被归类为以下三类之一：

AUTO — 立即执行

读取文件、分析代码、代理之间的内部消息
不会对外部产生影响的风险
代理自主行动

LOG — 执行并记录

网络搜索、研究查询
风险低，但值得追踪
代理执行；操作会被记录以供审计

REQUIRE_APPROVAL — 交由人工审批

发送电子邮件
打电话
在社交媒体上发布
进行购买
将代码推送到生产环境
任何不可逆的外部操作

当代理触发 REQUIRE_APPROVAL 操作时，请求会出现在舰队管理 UI 中。人工审查该操作、收件人及内容，然后批准或拒绝。

为什么重要

大多数 AI 代理框架只提供二元选择：要么代理可以做所有事（危险），要么所有事都需要批准（不可用）。Bridge ACE 的三层系统找到了最佳平衡点：

代理在安全任务上自主工作（读取、分析、协调）。
代理在高风险任务上暂停并等待批准（发送、购买、部署）。
所有操作均被记录，形成审计轨迹。

与范围锁（Scope Locks）结合使用

审批门（Approval Gates）处理外部操作，而 Scope Locks 处理内部文件访问。两者共同构成完整的治理层：

代理 A 不能编辑代理 B 的文件（范围锁）。
任何代理在未获批准的情况下都不能发送电子邮件（审批门）。
每个操作都带有时间戳和代理身份记录。

这使得在赋予代理强大工具时仍然安全：工具存在，防护措施到位，且人类保持控制。

实现方式

# approval_gate.py
from enum import Enum

class ApprovalPolicy(Enum):
    AUTO = 'auto'               # 安全 — 立即执行
    LOG = 'log'                 # 低风险 — 执行并记录
    REQUIRE_APPROVAL = 'require' # 高风险 — 交由人工审批

分类可以通过防护系统对每个代理进行配置。你可以让受信任的代理更自主，也可以让新代理更受限制。

开源

git clone https://github.com/Luanace-lab/bridge-ide.git
cd bridge-ide && ./install.sh

Apache 2.0。自行托管。你的代理，你的规则。

GitHub:

审批门：如何让 AI 代理在真实世界中的操作安全

工作原理

为什么重要

与范围锁（Scope Locks）结合使用

实现方式

开源

相关文章

停止像2023年那样编写 AI Agent 提示：让你的 OpenClaw Agent 实际起作用的框架

DRM-Transformer

第16天 – 设计真正有效的 Agent Prompts

理解 AI 代理的工作原理