Pacific Northwest National Laboratory 与 OpenAI 合作加速联邦许可

发布: (2026年2月26日 GMT+8 18:00)
6 分钟阅读

Source: OpenAI Blog

现代化联邦政府对关键基础设施的审批至关重要,这有助于构建更快、更安全、更具竞争力的美国经济。从能源项目和先进制造业到交通运输和供水系统,审批决定了有前景的想法能够多快转化为现实投资。然而,如今环境和技术审查往往需要数年时间,导致创新放缓、成本上升,并延迟了对社区的收益。

OpenAI and PNNL Collaboration

OpenAI 已与美国能源部的太平洋西北国家实验室(PNNL)及其 PermitAI™ 团队合作,评估编码代理是否能帮助加速联邦许可工作。PermitAI 是由 DOE 政策办公室资助的项目,已与 19 位国家环境政策法(NEPA)审查过程的主题专家合作,设计了一个基准——DraftNEPABench——用于评估 AI 在与 NEPA 工作流相关的任务(如起草环境影响声明(EIS))上的表现。

PermitAI 基准测试 (DraftNEPABench)

该基准覆盖了来自 18 个联邦机构的 NEPA 文档章节的代表性起草任务集合。专家使用 1‑5 评分尺度(1 = 严重缺陷,3 = 部分正确,5 = 完全正确)对 AI 生成的草稿在结构、清晰度、准确性和参考文献方面进行评估。对 102 项任务的平均分数按主导机构汇总。

在 102 项任务中,按主导机构分组的平均评估分数(1‑5 评分尺度)。分数综合了对结构、清晰度、准确性和参考文献的评估。

关键发现

  • 通用编码代理(例如 Codex CLI)可以将每个子章节的起草时间缩短 1 到 5 小时,大约 15 % 的整体起草工作量减少。
  • 这些代理展示了以下能力:
    • 阅读并综合数百页的技术和监管文档。
    • 在多个环境、工程和监管来源之间核实事实。
    • 起草符合高度指定的法律和技术标准的结构化报告。

这些结果表明 AI 对复杂政府工作流的支持取得了重要进展。

编码代理的能力

通过让模型访问命令‑行界面(通常用于编码任务),它们可以采用比手工启发式更通用的问题解决策略。这种方法使代理能够:

  • 浏览文件系统以检索和组织相关数据。
  • 执行推理管道,将自然语言理解与程序化数据操作相结合。
  • 生成动态输出,如基于网页的报告和交互式可视化,超越静态 PDF。

对政府工作流程的影响

  • 机构可以更高效地审查、完善和批准提案,使人工审阅者能够专注于判断、监督和复杂决策。
  • AI 增强的团队可以处理耗时的许可工作部分,加快项目开发,提升美国竞争力。
  • 基准测试突显了当前模型可以负责任地协助人类的领域,同时也阐明了它们的局限性。

限制与未来方向

  • 该基准评估了具有可用上下文的明确起草任务;但它未能捕捉真实许可决策中全部的模糊性和裁量权。
  • 错误有时源于过时的参考资料或薄弱的评估标准,这促使我们更新评分标准。
  • 在缺乏明确指示的情况下,不完整、前后不一致或过时的来源材料可能会被忽视。
  • 预计在实际部署中会结合专家反馈和迭代改进,性能有望超出基准测试结果。

Source:

展望

OpenAI 正在支持 PNNL 进一步开发和完善 PermitAI™。随着时间推移,联邦审查的基础设施项目的平均批准时间可能会从数月缩短到数周,加速开发,支持长期经济增长,并帮助美国在 Intelligence AgeSam Altman 的文章)中蓬勃发展。

0 浏览
Back to Blog

相关文章

阅读更多 »

我们与战争部的协议

与五角大楼的协议 昨天,我们与五角大楼达成了一项协议,旨在在机密环境中部署先进的AI系统,我们请求…