Agents SDK 的下一次演进
Source: OpenAI Blog
介绍
我们正在为 Agents SDK 引入新功能,为开发者提供标准化的基础设施,易于上手,并且针对 OpenAI 模型进行了正确的构建:一种模型原生的框架,使代理能够在计算机上跨文件和工具工作,并提供原生沙箱执行,以安全地运行这些工作。
开发者在构建有用的代理时不仅需要最好的模型——他们还需要能够支持代理检查文件、运行命令、编写代码并在多个步骤中持续工作的系统。
现有系统的局限性
- Model‑agnostic frameworks – 灵活,但未能充分利用前沿模型的能力。
- Model‑provider SDKs – 更贴近模型,但通常缺乏对其使用情况的足够可视性。
- Managed agent APIs – 简化部署,但限制了代理的运行位置以及它们访问敏感数据的方式。
新 SDK 功能
随着本次发布,Agents SDK 框架在处理文档、文件和系统的代理方面变得更加强大。它现在包括:
- 可配置的记忆
- 沙箱感知的编排
- 类 Codex 的文件系统工具
- 与前沿代理系统中常见原语的标准化集成
该框架将执行方式与前沿模型的最佳表现方式保持一致,使代理更贴近模型的自然运行模式,并提升在复杂、长时间运行或协同任务中的可靠性和性能。
多元产品的灵活性
我们设计了 Agents SDK,以支持多样化的产品需求。开发者可以获得即插即用且灵活的工具,可根据自己的技术栈进行适配,包括:
- 自定义工具使用
- 可调节的内存设置
- 沙箱环境的选择
本地沙箱执行
更新后的 SDK 原生支持沙箱执行,使代理能够在受控的计算环境中运行,并拥有完成任务所需的文件、工具和依赖。
- 内置沙箱提供商: Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel
- 自定义沙箱: 开发者可以自行提供
清单抽象
为了使环境在不同提供商之间可移植,SDK 引入了 Manifest 抽象,用于描述代理的工作区。使用清单您可以:
- 挂载本地文件
- 定义输出目录
- 从存储提供商导入数据(AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2)
这为从原型到生产阶段塑造代理环境提供了一致的方式,并为模型提供了可预测的工作区。
耐久性和可扩展性
- 提示注入和数据泄露防护: 将 harness 与 compute 分离,使凭证不出现在模型生成代码执行的环境中。
- 持久执行: 代理状态被外部化;内置的快照和重新水化功能可以在原环境失效或过期时,在全新容器中恢复。
- 可扩展执行: 代理可以使用一个或多个沙箱,按需调用沙箱,将子代理路由到隔离环境,并在容器之间并行工作以加快执行速度。
可用性和定价
这些新的 Agents SDK 功能已通过 API 向所有客户普遍提供,并使用基于令牌和工具使用的标准 API 定价。
路线图
- 当前发布: Harness 和 sandbox 功能已在 Python 中可用。
- 即将推出: TypeScript 支持、代码模式以及针对 Python 和 TypeScript 的子代理。
- 未来计划: 扩展 sandbox 提供商支持,增加更多集成,并提供更多方式让开发者将 SDK 插入现有工具和系统。
客户反馈
“随着今天的发布,Agents SDK 框架对处理文档、文件和系统的代理变得更加强大。它现在具备可配置的内存、沙箱感知的编排、类似 Codex 的文件系统工具,以及与在前沿代理系统中日益常见的原语的标准化集成。”
“该框架还帮助开发者通过使执行方式与这些前沿模型的最佳表现方式保持一致,释放模型更大的能力,从而提升复杂任务的可靠性和性能。”
这些推荐语展示了早期采用者所观察到的实际收益。