OpenAI,前沿 AI 模型 GPT-5.4 公开

发布: (2026年3月6日 GMT+8 10:40)
6 分钟阅读

Source: Byline Network

演讲概述

OpenAI 发布了最新的前沿模型 GPT‑5.4。它已集成到 Microsoft Office 套件和 Google Workspace 中,能够执行复杂的文档任务。本次版本首次加入了直接操控用户设备的 “计算机使用(computer‑use)” 工具。此外,还将 ChatGPT 直接嵌入到 Microsoft Excel 中,能够使用市面金融数据提供商的数据。

OpenAI 于 6 日推出了在 ChatGPT、API、Codex 等主要产品中通用的前沿模型 GPT‑5.4。公司强调,GPT‑5.4 是将推理能力、编码性能、基于代理的工作流整合到同一模型中的最优秀、最高效的前沿模型。

性能与基准

  • GDPval 基准:GPT‑5.4 在整体业务任务中有 83 % 达到或超过行业专家水平。相比 GPT‑5.2 的 71.0 % 有显著提升。
  • 电子表格建模:在内部基准中评估了相当于投行初级分析师水平的工作,平均得分 87.5 %,远高于 GPT‑5.2 的 68.4 %。
  • 演示文稿制作:在设计完整度、视觉多样性、图像生成利用率以及事实准确性方面都有所改进。

GPT‑5.4 与 GPT‑5.2 电子表格编写对比

新功能

计算机使用能力

GPT‑5.4 设计为在 Codex 和 API 环境中,使 AI 代理能够实际操作计算机环境,跨多个应用程序执行复杂工作流。

  • 通过 Playwright 等库编写计算机操作代码,并根据截图响应鼠标·键盘指令。
  • 开发者可以通过消息控制行为,并根据风险容忍度指定安全策略。

GPT‑5.4 提供 ThinkingPro 两个版本,Pro 版用于最复杂的任务。

多模态图像输入

  • 图像输入细节级别提升,最高支持 1024 万像素6000 像素(取较小值)完整识别。
  • 基础级别支持 256 万像素2048 像素

这大幅提升了本地化能力、图像理解度和点击准确性。

Codex 应用案例

使用 GPT‑5.4 Codex,仅通过一个简单提示就开发了主题公园模拟游戏。

GPT‑5.4 Codex

代币费用

模型输入代币(每百万)输出代币(每百万)
GPT‑5.4$2.50$15
GPT‑5.4 Pro$30$180
  • 将批处理与灵活处理结合后费用减半,优先处理费用为原来的 2 倍。
  • 当输入超过 27万 2,000 代币时,费用会翻倍。
  • 压缩默认值为 27万 2,000 代币,最大输出量为 12万 8,000 代币。

GPT‑5.4 支持最高 100 万代币 的上下文,适合构建计划·执行·验证长时任务的代理系统。

工具搜索与代理改进

  • 引入 工具搜索(tool search) 功能,模型无需在提示中显式定义工具,即可自动发现可用工具并加入对话。
  • 代理的工具调用逻辑得到优化,在推理过程中使用 API 时能够更准确、高效地判断工具选择。

这些改进有望降低代币消耗、提升缓存保持与速度,并实现成本节约。

在 ChatGPT 中的应用

ChatGPT 中提供的 GPT‑5.4 Thinking 模型会在生成答案前先给出工作计划。用户可以在生成过程中随时调整方向,无需额外对话即可快速得到期望结果。

网页深度调查能力得到加强,在需要综合多来源信息的复杂提问中,能够提供更准确、一致的回答。

Excel 用的 ChatGPT

OpenAI 以 beta 版形式发布了 Excel 插件。它将 ChatGPT 直接嵌入工作簿,可构建·更新模型、运行情景、并基于单元格·公式生成结果。

可以将道琼斯、LSEG、彭博、S&P Global 等主要金融数据提供商的数据直接整合到 ChatGPT 中。这与 Anthropic 的 Claude Co‑Work 扩展功能类似,旨在支持分析师、策略师、会计人员的工作与决策。

Excel 用的 ChatGPT

结论

OpenAI 通过 GPT‑5.4 让企业和专业人士能够更快、更准确地完成复杂任务,并预计基于 AI 代理的新工作方式将进一步普及。

文:Byline Network
金宇勇 记者
yong2@byline.network

0 浏览
Back to Blog

相关文章

阅读更多 »