OpenAI,前沿 AI 模型 GPT-5.4 公开
Source: Byline Network
演讲概述
OpenAI 发布了最新的前沿模型 GPT‑5.4。它已集成到 Microsoft Office 套件和 Google Workspace 中,能够执行复杂的文档任务。本次版本首次加入了直接操控用户设备的 “计算机使用(computer‑use)” 工具。此外,还将 ChatGPT 直接嵌入到 Microsoft Excel 中,能够使用市面金融数据提供商的数据。
OpenAI 于 6 日推出了在 ChatGPT、API、Codex 等主要产品中通用的前沿模型 GPT‑5.4。公司强调,GPT‑5.4 是将推理能力、编码性能、基于代理的工作流整合到同一模型中的最优秀、最高效的前沿模型。
性能与基准
- GDPval 基准:GPT‑5.4 在整体业务任务中有 83 % 达到或超过行业专家水平。相比 GPT‑5.2 的 71.0 % 有显著提升。
- 电子表格建模:在内部基准中评估了相当于投行初级分析师水平的工作,平均得分 87.5 %,远高于 GPT‑5.2 的 68.4 %。
- 演示文稿制作:在设计完整度、视觉多样性、图像生成利用率以及事实准确性方面都有所改进。

新功能
计算机使用能力
GPT‑5.4 设计为在 Codex 和 API 环境中,使 AI 代理能够实际操作计算机环境,跨多个应用程序执行复杂工作流。
- 通过 Playwright 等库编写计算机操作代码,并根据截图响应鼠标·键盘指令。
- 开发者可以通过消息控制行为,并根据风险容忍度指定安全策略。
GPT‑5.4 提供 Thinking 与 Pro 两个版本,Pro 版用于最复杂的任务。
多模态图像输入
- 图像输入细节级别提升,最高支持 1024 万像素 或 6000 像素(取较小值)完整识别。
- 基础级别支持 256 万像素 或 2048 像素。
这大幅提升了本地化能力、图像理解度和点击准确性。
Codex 应用案例
使用 GPT‑5.4 Codex,仅通过一个简单提示就开发了主题公园模拟游戏。

代币费用
| 模型 | 输入代币(每百万) | 输出代币(每百万) |
|---|---|---|
| GPT‑5.4 | $2.50 | $15 |
| GPT‑5.4 Pro | $30 | $180 |
- 将批处理与灵活处理结合后费用减半,优先处理费用为原来的 2 倍。
- 当输入超过 27万 2,000 代币时,费用会翻倍。
- 压缩默认值为 27万 2,000 代币,最大输出量为 12万 8,000 代币。
GPT‑5.4 支持最高 100 万代币 的上下文,适合构建计划·执行·验证长时任务的代理系统。
工具搜索与代理改进
- 引入 工具搜索(tool search) 功能,模型无需在提示中显式定义工具,即可自动发现可用工具并加入对话。
- 代理的工具调用逻辑得到优化,在推理过程中使用 API 时能够更准确、高效地判断工具选择。
这些改进有望降低代币消耗、提升缓存保持与速度,并实现成本节约。
在 ChatGPT 中的应用
ChatGPT 中提供的 GPT‑5.4 Thinking 模型会在生成答案前先给出工作计划。用户可以在生成过程中随时调整方向,无需额外对话即可快速得到期望结果。
网页深度调查能力得到加强,在需要综合多来源信息的复杂提问中,能够提供更准确、一致的回答。
Excel 用的 ChatGPT
OpenAI 以 beta 版形式发布了 Excel 插件。它将 ChatGPT 直接嵌入工作簿,可构建·更新模型、运行情景、并基于单元格·公式生成结果。
可以将道琼斯、LSEG、彭博、S&P Global 等主要金融数据提供商的数据直接整合到 ChatGPT 中。这与 Anthropic 的 Claude Co‑Work 扩展功能类似,旨在支持分析师、策略师、会计人员的工作与决策。

结论
OpenAI 通过 GPT‑5.4 让企业和专业人士能够更快、更准确地完成复杂任务,并预计基于 AI 代理的新工作方式将进一步普及。
文:Byline Network
金宇勇 记者
yong2@byline.network