OpenAI，前沿 AI 模型 GPT-5.4 公开

发布: 1天前 (2026年3月6日 GMT+8 10:40)

6 分钟阅读

Source: Byline Network

演讲概述

OpenAI 发布了最新的前沿模型 GPT‑5.4。它已集成到 Microsoft Office 套件和 Google Workspace 中，能够执行复杂的文档任务。本次版本首次加入了直接操控用户设备的 “计算机使用（computer‑use）” 工具。此外，还将 ChatGPT 直接嵌入到 Microsoft Excel 中，能够使用市面金融数据提供商的数据。

OpenAI 于 6 日推出了在 ChatGPT、API、Codex 等主要产品中通用的前沿模型 GPT‑5.4。公司强调，GPT‑5.4 是将推理能力、编码性能、基于代理的工作流整合到同一模型中的最优秀、最高效的前沿模型。

性能与基准

GDPval 基准：GPT‑5.4 在整体业务任务中有 83 % 达到或超过行业专家水平。相比 GPT‑5.2 的 71.0 % 有显著提升。
电子表格建模：在内部基准中评估了相当于投行初级分析师水平的工作，平均得分 87.5 %，远高于 GPT‑5.2 的 68.4 %。
演示文稿制作：在设计完整度、视觉多样性、图像生成利用率以及事实准确性方面都有所改进。

GPT‑5.4 与 GPT‑5.2 电子表格编写对比

新功能

计算机使用能力

GPT‑5.4 设计为在 Codex 和 API 环境中，使 AI 代理能够实际操作计算机环境，跨多个应用程序执行复杂工作流。

通过 Playwright 等库编写计算机操作代码，并根据截图响应鼠标·键盘指令。
开发者可以通过消息控制行为，并根据风险容忍度指定安全策略。

GPT‑5.4 提供 Thinking 与 Pro 两个版本，Pro 版用于最复杂的任务。

多模态图像输入

图像输入细节级别提升，最高支持 1024 万像素 或 6000 像素（取较小值）完整识别。
基础级别支持 256 万像素 或 2048 像素。

这大幅提升了本地化能力、图像理解度和点击准确性。

Codex 应用案例

使用 GPT‑5.4 Codex，仅通过一个简单提示就开发了主题公园模拟游戏。

GPT‑5.4 Codex

代币费用

模型	输入代币（每百万）	输出代币（每百万）
GPT‑5.4	$2.50	$15
GPT‑5.4 Pro	$30	$180

将批处理与灵活处理结合后费用减半，优先处理费用为原来的 2 倍。
当输入超过 27万 2,000 代币时，费用会翻倍。
压缩默认值为 27万 2,000 代币，最大输出量为 12万 8,000 代币。

GPT‑5.4 支持最高 100 万代币 的上下文，适合构建计划·执行·验证长时任务的代理系统。

工具搜索与代理改进

引入 工具搜索（tool search） 功能，模型无需在提示中显式定义工具，即可自动发现可用工具并加入对话。
代理的工具调用逻辑得到优化，在推理过程中使用 API 时能够更准确、高效地判断工具选择。

这些改进有望降低代币消耗、提升缓存保持与速度，并实现成本节约。

在 ChatGPT 中的应用

ChatGPT 中提供的 GPT‑5.4 Thinking 模型会在生成答案前先给出工作计划。用户可以在生成过程中随时调整方向，无需额外对话即可快速得到期望结果。

网页深度调查能力得到加强，在需要综合多来源信息的复杂提问中，能够提供更准确、一致的回答。

Excel 用的 ChatGPT

OpenAI 以 beta 版形式发布了 Excel 插件。它将 ChatGPT 直接嵌入工作簿，可构建·更新模型、运行情景、并基于单元格·公式生成结果。

可以将道琼斯、LSEG、彭博、S&P Global 等主要金融数据提供商的数据直接整合到 ChatGPT 中。这与 Anthropic 的 Claude Co‑Work 扩展功能类似，旨在支持分析师、策略师、会计人员的工作与决策。

Excel 用的 ChatGPT

结论

OpenAI 通过 GPT‑5.4 让企业和专业人士能够更快、更准确地完成复杂任务，并预计基于 AI 代理的新工作方式将进一步普及。

文：Byline Network
金宇勇记者
yong2@byline.network

OpenAI，前沿 AI 模型 GPT-5.4 公开

演讲概述

性能与基准

新功能

计算机使用能力

多模态图像输入

Codex 应用案例

代币费用

工具搜索与代理改进

在 ChatGPT 中的应用

Excel 用的 ChatGPT

结论

相关文章

为什么你的 AI 代理需要问责基础设施（趁还来得及）

成功的企业 AI 代理使用，关键是确保‘可解释性·准确性·可控性’

OpenAI 将其 Codex 编码应用带到 Windows

什么是 Agent Skills？初学者指南