OpenAI 的 AI 数据代理,由两位工程师构建,现已为 4,000 名员工提供服务——公司称任何人都可以复制它

发布: (2026年3月3日 GMT+8 22:00)
15 分钟阅读

Source: VentureBeat

当 OpenAI 的一位金融分析师去年需要比较不同地区和客户群体的收入时,需要数小时的工作——在 70,000 个数据集里搜索、编写 SQL 查询、验证表结构。
而今天,同一位分析师只需在 Slack 中输入一段普通英文提问,就能在几分钟内得到完整的图表。

  • 两名工程师在三个月内构建
  • 代码的 70 % 由 AI 编写
  • 每天被超过 4,000 名 OpenAI 约 5,000 名员工使用,成为公司内部 AI 数据代理最积极的部署案例之一。

在接受 VentureBeat 独家采访时,OpenAI 数据基础设施负责人 Emma Tang 为我们罕见地展示了系统内部——它是如何工作的、会出现哪些失败,以及它对企业数据未来的意义。结合公司发布该工具的博客文章,这次对话描绘了一幅画面:公司把自己的 AI 用在了自身身上,发现了每个企业很快都会面对的挑战:

让组织更智能的瓶颈不是更好的模型,而是更好的数据。
“该代理可用于任何类型的分析,” Tang 说。“公司几乎所有团队都在使用它。”

Source:

面向普通英语的 600 PB 企业数据接口

指标数值
数据平台规模> 600 PB
数据集数量≈ 70,000
OpenAI 员工人数≈ 5,000
数据工具每日用户数> 4,000

Tang 的数据平台团队(隶属于基础设施部门,负责大数据系统、流处理以及数据工具层)为这庞大的内部用户群提供服务。

代理的访问方式

  • Slack
  • Web 界面
  • IDE
  • Codex CLI
  • OpenAI 内部的 ChatGPT 应用

该代理基于 GPT‑5.2 构建,接受普通英语提问,并返回 图表、仪表盘以及长篇分析报告。在与 VentureBeat 的后续访谈中,团队估计它 每次查询可节省 2–4 小时的工作时间。Tang 强调了一个更大且更难量化的收益:

“该代理让人们能够进行以前根本做不到的分析,无论他们拥有多少时间。”
“工程、增长、产品以及非技术团队——即使不熟悉公司数据系统和表结构的成员——现在也可以自行获取复杂的洞察。”

从收入细分到延迟调试——一个代理全能

  • 财务 – 跨地区和客户群体的收入比较。
  • 产品管理 – 了解功能采纳情况。
  • 工程 – 诊断性能回退(例如,“某个 ChatGPT 组件比昨天慢吗?哪些延迟组件解释了变化?”)。
  • 跨部门分析 – 将销售数据、工程指标和产品分析合并到单个查询中,而大多数企业 AI 代理因数据孤岛而无法做到。

“我们按部门逐步推出,为每个团队定制特定的记忆和上下文,但最终它们都在同一个数据库里。” – Tang

Codex 如何解决企业数据中最难的问题

最困难的技术挑战: 在 70,000 个数据集里找到正确的表。

Codex(OpenAI 的 AI 编码代理)扮演三个角色:

  1. 前端网关 – 用户通过 MCP 使用 Codex 访问数据代理。
  2. 代码生成器 – Codex 生成了 > 70 % 的代理代码,使两名工程师在三个月内交付产品。
  3. 每日异步丰富过程 – Codex 检查重要数据表,解析底层管道代码,并确定每个表的:
    • 上游和下游依赖
    • 所有权
    • 粒度
    • 连接键
    • 相似表

“我们给它一个提示,让 Codex 查看代码并返回我们需要的内容,然后将其持久化到数据库。” – Tang

当用户询问收入时,代理会 搜索向量数据库,找出 Codex 已经映射到该概念的表。

代理使用的六个上下文层

层级描述
1️⃣ 架构元数据基本的表/列定义
2️⃣ 精选专家描述人工编写的注释
3️⃣ 机构知识从 Slack、Google Docs、Notion 中提取
4️⃣ 学习记忆存储先前对话中的纠正
5️⃣ Codex 丰富表级血缘、所有权、连接键
6️⃣ 实时仓库查询当没有先前信息时的回退方案

团队还对历史查询模式进行分层。Tang 说:“所有的查询历史都是大家的 ‘select star, limit 10’,并没有太大帮助。”

要点

  • 速度: 过去需要数小时的查询现在在几分钟内完成。
  • 可访问性: 非技术人员无需深入了解数据模式即可执行复杂分析。
  • 跨职能洞察: 单个代理可以融合传统上被孤立的部门数据。
  • AI生成的基础设施: Codex 不仅编写了大部分代理代码,还持续丰富数据目录,将庞大且难以管理的数据湖转变为可搜索的知识库。

OpenAI 的 AI 数据代理展示了 企业的下一个前沿不是更大的模型,而是更智能、AI 增强的数据管道,使正确的数据能够即时获取

标准仪表盘和高管报告

“标准仪表盘和高管报告——分析师投入大量精力确定正确的呈现方式——被标记为*‘真相来源’*。其他所有内容都被降级。”

强迫 AI 放慢脚步并思考的提示

即使有六层上下文,Tang 仍然坦率地指出了代理最大的行为缺陷:过度自信

“这是一个很大的问题,因为模型经常表现得过于自信,”Tang 说。“它会说,‘这是正确的表格,’ 然后直接开始分析。其实这是一种错误的做法。”

解决方案:Prompt Engineering

解决办法是使用一个迫使代理在发现阶段停留的提示。该提示几乎像是在指导一名初级分析师:

“在你冲上去之前,我真的希望你对这是否是正确的表格进行更多验证。所以请在创建实际数据之前多检查一些来源。”

Tang 评估的关键要点

  • 在发现阶段花更多时间 → 更好的结果
  • 更少的上下文也能产生更好的结果

“把所有东西都塞进去并期望它表现更好是很容易的,”Tang 说。“从我们的评估来看,事实恰恰相反。你给它的东西越少,且上下文越精心挑选、越准确,结果就越好。”

建立信任

  • 代理会 实时 将其中间推理过程流式传输给用户。
  • 公开所选表格及原因,并直接链接到底层查询结果。
  • 用户可以 在分析进行中途打断代理,以重新指引它。
  • 系统 对进度进行检查点保存,使其在失败后能够恢复。
  • 在每个任务结束时,模型 自我评估其表现

“我们会问模型,‘你觉得这次怎么样?好还是不好?’” Tang 说。“它在评估自己表现方面其实相当不错。”

故意简化却出奇有效的安全防线

在安全方面,Tang 采用了一种务实的做法,这可能会让期待复杂 AI 对齐技术的企业感到惊讶。

“我觉得你必须要有更多‘笨’的防线,”她说。

核心防线

  1. 强访问控制 – 代理始终使用用户的个人令牌,因此只能访问用户能够访问的内容。
  2. 仅限界面层 – 它继承了管理 OpenAI 数据的相同权限,且永不出现在公共渠道;只存在于私有渠道或用户自己的界面中。
  3. 写入限制 – 写入权限仅限于一个 临时测试模式,该模式会定期被清除,且不能被共享。
  4. 不进行随机写入 – 代理绝不会随意向系统写入数据。

反馈循环

  • 员工 直接标记错误结果,促使团队进行调查。
  • 模型的自我评估提供了额外的安全检查。

未来方向

Tang 指出,长期计划是转向 多代理架构,让专门的代理相互监控并提供帮助:

“我们最终会朝那个方向发展,但即使现在这样,我们已经取得了相当大的进展。”

Source:

为什么 OpenAI 不会出售此工具——但希望你自己构建

尽管有明显的商业潜力,OpenAI 在接受 VentureBeat 采访时表示,它 没有将内部数据代理产品化的计划。相反的策略是提供 构建块,让企业能够自行构建解决方案。

“我们使用的都是外部可用的同样 API,”Tang 说。“Responses API、Evals API。我们没有微调模型。我们只使用 5.2。所以你完全可以自己构建这个。”

支持生态系统

  • OpenAI Frontier(于二月初发布)——面向企业的端到端 AI 代理构建与管理平台。
  • McKinsey、BCG、Accenture 和 Capgemini 的合作,销售并实施该平台。
  • AWS + OpenAI 正共同开发 Amazon Bedrock 的有状态运行时环境,映射 OpenAI 数据代理的部分持久上下文能力。
  • Apple 最近将 Codex 直接集成到 Xcode 中。

Codex 采纳情况

  • 95% 的 OpenAI 工程师 使用 Codex,在合并前审查所有 Pull Request。
  • 全球每周活跃用户自年初起 增长了三倍,已超过 一百万
  • 总体使用量 增长了五倍以上

“Codex 已经不再是单纯的编码工具了。它的功能远超此,”Tang 说。“我看到非技术团队用它来组织思路、创建幻灯片以及生成每日摘要。”

一位工程经理让 Codex 每天早上审阅她的笔记,识别最重要的任务,拉取 Slack 消息和私信,并草拟回复。Tang 补充道:“它在很多方面真的在替她操作。”

决定 AI‑Agent 赛道谁能胜出的“不性感”前提

当被问及其他企业应从 OpenAI 的经验中汲取什么时,Tang 并没有指向模型能力或巧妙的提示工程。她强调了更为平凡的事情:

“这并不性感,但 数据治理对数据代理的良好运行至关重要,”她说。“你的数据必须足够干净、足够标注,并且必须有一个真实来源供代理爬取。”

关键要点

  • 底层基础设施——存储、计算、编排和商业智能层——并未被代理取代
  • 这些工具仍然是代理完成工作所必需的。
  • 代理充当 全新数据智能入口,提供比以往任何方式都更自主、更易访问的界面。

Tang 结束了采访。

“采用这项技术的公司将会非常快速地看到收益,”她说。
“而不采用的公司将会落后。局面会被撕裂。使用它的公司将会非常、非常快速地进步。”

当被问及这种加速是否让她的同事感到担忧——尤其是在 Block 等公司最近大规模裁员之后——Tang 停顿了一下。

“我们作为公司能够完成的事情已经加速了,”她说,“但这仍然远未达到我们的雄心,甚至一点也不匹配。”

0 浏览
Back to Blog

相关文章

阅读更多 »