你的 AI agent 刚刚做了 5 件事。你能证明吗？

发布: 3天前 (2026年2月7日 GMT+8 02:02)

6 分钟阅读

原文: Dev.to

Source: Dev.to

Cover image for 你的 AI 代理刚完成了 5 件事。你能证明吗？

我过去一年一直在构建 AI 代理。上个月我意识到，我根本不知道它们在生产环境中实际做了什么。

比如，我认为我的支持代理会查找正确的文档并给出良好的答案。但当有人问“机器人为什么说 X？”时——我就在日志中 grep，想找点有用的信息。通常找不到。

这并不是一个大问题，直到我开始阅读欧盟 AI 法案。

没有人在谈论的法律

2026年8月，欧盟《人工智能法案》将全面生效。罚款最高可达3,500万欧元或全球营业额的7%。

让我感到惊讶的是：AI 代理也在适用范围内。

该法律正文中并未出现“代理”（agent）一词——它是在当前代理式 AI 热潮之前制定的。但它涵盖了“AI 系统”，而代理本质上就是 AI 系统。The Future Society 的一份报告证实了这一点：虽然该法案并未专门针对代理进行设计，但它绝对适用于代理。

难点在哪里？代理比普通 AI 更难合规。一个聊天机器人只接受输入、给出输出——就完成了。而一个代理会接受输入、调用三个 API、做出决策、更新数据库、发送电子邮件——你必须能够解释每一个步骤。

你真正需要构建的内容

我花了几周时间深入研究实际需求。以下是简要概述：

1. 记录所有内容（第 12 条）

每一次 LLM 调用、每一次工具使用、每一次决策——都要带时间戳记录。对于高风险系统，需要保存 10 年。

import { AgentGov } from "@agentgov/sdk";
import OpenAI from "openai";

const ag = new AgentGov({
  apiKey: process.env.AGENTGOV_API_KEY,
  projectId: process.env.AGENTGOV_PROJECT_ID,
});

const openai = ag.wrapOpenAI(new OpenAI());

// now every call is traced — inputs, outputs, tokens, cost

如果你使用 OpenAI Agents SDK，已有一个可以直接插入的导出器：

import { BatchTraceProcessor, setTraceProcessors } from "@openai/agents";
import { AgentGovExporter } from "@agentgov/sdk/openai-agents";

setTraceProcessors([
  new BatchTraceProcessor(
    new AgentGovExporter({
      apiKey: process.env.AGENTGOV_API_KEY!,
      projectId: process.env.AGENTGOV_PROJECT_ID!,
    })
  ),
]);

2. 告知用户这是 AI（第 50 条）

如果你的代理向客户发送邮件、与用户聊天或生成内容，必须告知用户他们正在与 AI 交互。这听起来显而易见，但很多部署都忽略了这一披露。

3. 确定你的风险等级（附件 III）

并非所有代理都需要相同的合规工作。仅用于过滤垃圾邮件的代理属于低风险，仅需满足最少要求。对求职者进行筛选或进行信用评分的代理属于高风险，必须满足完整的合规体系。你需要将使用场景映射到附件 III 的类别中。

4. 人类监督（第 14 条）

对于高风险代理，必须有人能够停止代理、覆盖其决策并了解其正在做什么。这对自主代理来说确实很难实现，因此我为任何可能产生现实后果的操作构建了审批门。

不舒服的真相

大多数人在构建代理时根本没有考虑这些问题，我以前也是。如果你只是在发布一个副项目，也许暂时无所谓——但时间不等人。

然而，如果你为一家在欧洲运营（或拥有欧洲客户）的公司构建代理，那么截止日期是真实存在的。2026 年 8 月只剩下六个月。把审计追踪 retrofitting（后装）进现有系统要比从一开始就设计好困难得多。

我之所以开始研究这个问题，是因为我自己也需要它。这项工作逐渐演变成 AgentGov——一个开源项目，结合了追踪功能和欧盟 AI 法案合规特性（风险分类、文档生成、事件追踪）。

这是我的第一个开源项目，所以我在边做边摸索。如果你对这种方法、代码或其他任何方面有反馈，我会非常感激。

如果你正在构建代理并考虑合规（或刻意不考虑），欢迎告诉我你的做法。

你的 AI agent 刚刚做了 5 件事。你能证明吗？

没有人在谈论的法律

你真正需要构建的内容

1. 记录所有内容（第 12 条）

2. 告知用户这是 AI（第 50 条）

3. 确定你的风险等级（附件 III）

4. 人类监督（第 14 条）

不舒服的真相

相关文章

也许 AI agents 终究可以成为律师

Prompt Fidelity：衡量 AI 代理实际执行你意图的程度

在 agent connectivity 与真正协作之间缺失的层

函数调用与工具模式

没有人在谈论的法律

你真正需要构建的内容

1. 记录所有内容（第 12 条）

2. 告知用户这是 AI（第 50 条）

3. 确定你的风险等级（附件 III）

4. 人类监督（第 14 条）

不舒服的真相

相关文章

也许 AI agents 终究可以成为律师

Prompt Fidelity：衡量 AI 代理实际执行你意图的程度

在 agent connectivity 与真正协作之间缺失的层

函数调用与工具模式

1. 记录所有内容（第 12 条）

2. 告知用户这是 AI（第 50 条）

3. 确定你的风险等级（附件 III）

4. 人类监督（第 14 条）