Pacific Northwest National Laboratory 与 OpenAI 合作加速联邦许可

发布: 3天前 (2026年2月26日 GMT+8 18:00)

6 分钟阅读

Source: OpenAI Blog

现代化联邦政府对关键基础设施的审批至关重要，这有助于构建更快、更安全、更具竞争力的美国经济。从能源项目和先进制造业到交通运输和供水系统，审批决定了有前景的想法能够多快转化为现实投资。然而，如今环境和技术审查往往需要数年时间，导致创新放缓、成本上升，并延迟了对社区的收益。

OpenAI and PNNL Collaboration

OpenAI 已与美国能源部的太平洋西北国家实验室（PNNL）及其 PermitAI™ 团队合作，评估编码代理是否能帮助加速联邦许可工作。PermitAI 是由 DOE 政策办公室资助的项目，已与 19 位国家环境政策法（NEPA）审查过程的主题专家合作，设计了一个基准——DraftNEPABench——用于评估 AI 在与 NEPA 工作流相关的任务（如起草环境影响声明（EIS））上的表现。

PermitAI 基准测试 (DraftNEPABench)

该基准覆盖了来自 18 个联邦机构的 NEPA 文档章节的代表性起草任务集合。专家使用 1‑5 评分尺度（1 = 严重缺陷，3 = 部分正确，5 = 完全正确）对 AI 生成的草稿在结构、清晰度、准确性和参考文献方面进行评估。对 102 项任务的平均分数按主导机构汇总。

在 102 项任务中，按主导机构分组的平均评估分数（1‑5 评分尺度）。分数综合了对结构、清晰度、准确性和参考文献的评估。

关键发现

通用编码代理（例如 Codex CLI）可以将每个子章节的起草时间缩短 1 到 5 小时，大约 15 % 的整体起草工作量减少。
这些代理展示了以下能力：
- 阅读并综合数百页的技术和监管文档。
- 在多个环境、工程和监管来源之间核实事实。
- 起草符合高度指定的法律和技术标准的结构化报告。

这些结果表明 AI 对复杂政府工作流的支持取得了重要进展。

编码代理的能力

通过让模型访问命令‑行界面（通常用于编码任务），它们可以采用比手工启发式更通用的问题解决策略。这种方法使代理能够：

浏览文件系统以检索和组织相关数据。
执行推理管道，将自然语言理解与程序化数据操作相结合。
生成动态输出，如基于网页的报告和交互式可视化，超越静态 PDF。

对政府工作流程的影响

机构可以更高效地审查、完善和批准提案，使人工审阅者能够专注于判断、监督和复杂决策。
AI 增强的团队可以处理耗时的许可工作部分，加快项目开发，提升美国竞争力。
基准测试突显了当前模型可以负责任地协助人类的领域，同时也阐明了它们的局限性。

限制与未来方向

该基准评估了具有可用上下文的明确起草任务；但它未能捕捉真实许可决策中全部的模糊性和裁量权。
错误有时源于过时的参考资料或薄弱的评估标准，这促使我们更新评分标准。
在缺乏明确指示的情况下，不完整、前后不一致或过时的来源材料可能会被忽视。
预计在实际部署中会结合专家反馈和迭代改进，性能有望超出基准测试结果。

Source:

展望

OpenAI 正在支持 PNNL 进一步开发和完善 PermitAI™。随着时间推移，联邦审查的基础设施项目的平均批准时间可能会从数月缩短到数周，加速开发，支持长期经济增长，并帮助美国在 Intelligence Age（Sam Altman 的文章）中蓬勃发展。

Pacific Northwest National Laboratory 与 OpenAI 合作加速联邦许可

OpenAI and PNNL Collaboration

PermitAI 基准测试 (DraftNEPABench)

关键发现

编码代理的能力

对政府工作流程的影响

限制与未来方向

展望

相关文章

我们与战争部的协议

OpenAI 与 Amazon 宣布战略合作伙伴关系

Anthropic 在美国军方将其标记为“Supply Chain Risk”后回击

切换到 Claude 而无需重新开始