你的 AI agent 刚刚做了 5 件事。你能证明吗?

发布: (2026年2月7日 GMT+8 02:02)
6 分钟阅读
原文: Dev.to

Source: Dev.to

Cover image for 你的 AI 代理刚完成了 5 件事。你能证明吗?

我过去一年一直在构建 AI 代理。上个月我意识到,我根本不知道它们在生产环境中实际做了什么。

比如,我 认为 我的支持代理会查找正确的文档并给出良好的答案。但当有人问“机器人为什么说 X?”时——我就在日志中 grep,想找点有用的信息。通常找不到。

代理运行中

这并不是一个大问题,直到我开始阅读欧盟 AI 法案。

没有人在谈论的法律

2026年8月,欧盟《人工智能法案》将全面生效。罚款最高可达3,500万欧元或全球营业额的7%。

让我感到惊讶的是:AI 代理也在适用范围内

该法律正文中并未出现“代理”(agent)一词——它是在当前代理式 AI 热潮之前制定的。但它涵盖了“AI 系统”,而代理本质上就是 AI 系统。The Future Society 的一份报告证实了这一点:虽然该法案并未专门针对代理进行设计,但它绝对适用于代理。

难点在哪里?代理比普通 AI 更难合规。一个聊天机器人只接受输入、给出输出——就完成了。而一个代理会接受输入、调用三个 API、做出决策、更新数据库、发送电子邮件——你必须能够解释每一个步骤。

你真正需要构建的内容

我花了几周时间深入研究实际需求。以下是简要概述:

1. 记录所有内容(第 12 条)

每一次 LLM 调用、每一次工具使用、每一次决策——都要带时间戳记录。对于高风险系统,需要保存 10 年。

import { AgentGov } from "@agentgov/sdk";
import OpenAI from "openai";

const ag = new AgentGov({
  apiKey: process.env.AGENTGOV_API_KEY,
  projectId: process.env.AGENTGOV_PROJECT_ID,
});

const openai = ag.wrapOpenAI(new OpenAI());

// now every call is traced — inputs, outputs, tokens, cost

如果你使用 OpenAI Agents SDK,已有一个可以直接插入的导出器:

import { BatchTraceProcessor, setTraceProcessors } from "@openai/agents";
import { AgentGovExporter } from "@agentgov/sdk/openai-agents";

setTraceProcessors([
  new BatchTraceProcessor(
    new AgentGovExporter({
      apiKey: process.env.AGENTGOV_API_KEY!,
      projectId: process.env.AGENTGOV_PROJECT_ID!,
    })
  ),
]);

2. 告知用户这是 AI(第 50 条)

如果你的代理向客户发送邮件、与用户聊天或生成内容,必须告知用户他们正在与 AI 交互。这听起来显而易见,但很多部署都忽略了这一披露。

3. 确定你的风险等级(附件 III)

并非所有代理都需要相同的合规工作。仅用于过滤垃圾邮件的代理属于低风险,仅需满足最少要求。对求职者进行筛选或进行信用评分的代理属于高风险,必须满足完整的合规体系。你需要将使用场景映射到附件 III 的类别中。

4. 人类监督(第 14 条)

对于高风险代理,必须有人能够停止代理、覆盖其决策并了解其正在做什么。这对自主代理来说确实很难实现,因此我为任何可能产生现实后果的操作构建了审批门。

不舒服的真相

大多数人在构建代理时根本没有考虑这些问题,我以前也是。如果你只是在发布一个副项目,也许暂时无所谓——但时间不等人。

然而,如果你为一家在欧洲运营(或拥有欧洲客户)的公司构建代理,那么截止日期是真实存在的。2026 年 8 月只剩下六个月。把审计追踪 retrofitting(后装)进现有系统要比从一开始就设计好困难得多。

我之所以开始研究这个问题,是因为我自己也需要它。这项工作逐渐演变成 AgentGov——一个开源项目,结合了追踪功能和欧盟 AI 法案合规特性(风险分类、文档生成、事件追踪)。

这是我的第一个开源项目,所以我在边做边摸索。如果你对这种方法、代码或其他任何方面有反馈,我会非常感激。

如果你正在构建代理并考虑合规(或刻意不考虑),欢迎告诉我你的做法。

Back to Blog

相关文章

阅读更多 »

函数调用与工具模式

概述 本学习课程探讨函数调用和工具模式——代理如何与外部工具交互。对话捕捉了来回的…