OpenAI 大幅更新 Codex 桌面应用,以使用您电脑上的所有其他应用程序、生成图像、预览网页

发布: (2026年4月17日 GMT+8 02:36)
8 分钟阅读

Source: VentureBeat

新功能?

  • 完整系统访问 – Codex 现在可以与您电脑上的任何应用交互,按需或主动显示相关信息,并按指示执行操作。
  • 后台运行(仅限 Mac) – 当您继续工作时,Codex 代理可以在后台运行,同时在其他应用中点击、启动和输入。
  • 内置网页浏览器 – 在 Codex 内直接预览前端开发。
  • 集成图像生成 – 直接管道对接 OpenAI 的 gpt‑image‑1.5 模型,在应用内创建资产(网站、演示文稿、游戏艺术等)。

“Codex 实际上可以点击应用、启动应用并在应用中输入。这适用于您机器上的任何应用。” – Andrew Ambrosino, OpenAI technical staff, Codex team (embargoed press briefing)

“这不仅仅是关于增长。它是把一个非常强大的代理交到构建者手中,而现在我们看到我们能够在整个电脑上扩展并完成更多工作。” – Thibault “Tibo” Sottiaux, Head of Codex, OpenAI

“Codex 是我们最强大的代理。它已经在您的电脑上运行,因此我们正在扩展其功能。它的使用感觉非常自然。我们会在某个时点让它变得更有意义。” – Tibo Sottiaux to VentureBeat

竞争格局

  • Anthropic的Claude – 提供 Claude Cowork 和 Claude Code 桌面视图(Mac & Windows),但 支持像 Codex 那样在所有用户应用中同时使用后台光标。

“Computer Use” – 最大的飞跃(macOS)

  • 后台交互 – Codex 能够在多个应用之间“看到、点击和输入”,无需接管整个桌面。
  • 多代理工作流 – 示例:Codex 在你继续使用其他应用时测试前端更改。

“它可以在后台使用你电脑上的应用,而不是接管整个电脑。” – Caffrey Lynch,OpenAI 开发者产品沟通

  • Windows – 核心 Codex 桌面应用仍然完全受支持,但光标级别的后台交互在发布时仅限 macOS

Source:

端到端软件开发工作区

OpenAI 正在将 Codex 扩展为统一的 SDLC 中枢。新的功能范围包括:

功能描述
Integrated Browser应用内浏览器,用于迭代前端设计;直接在 DOM 元素上发表评论并给出精确指令。
Visual Primitivesgpt‑image‑1.5 集成,用于生成/迭代模型图、游戏资产及其他视觉内容。
Expanded Sidebar为 PDF、电子表格、幻灯片提供丰富预览,并增加一个摘要面板,用于跟踪代理计划和来源。
Terminal & SSH多终端标签页;提供通过 SSH 连接远程开发箱的 α 版支持。
90+ New Plugins连接器(CircleCI、GitLab、Microsoft Suite 等)让代理能够收集上下文并在整个工具链中执行操作。

“将此版本的最简概念描述为让 Codex 与应用能够跨更大范围的表面进行协作。” – Andrew Ambrosino,Codex 应用开发负责人

演示提示

用户: “能帮我检查 Slack、Gmail、Google Calendar 和 Notion,告诉我哪些需要我关注吗?”

Codex 会扫描多个应用,汇总信息,并呈现最相关的事项。

“如果你想让 Codex 使用特定的应用,可以 @‑提及它们;如果不指定,Codex 也能自行发现要使用的应用。” – Ambrosino

持久代理 – “心跳自动化”

  • 计划工作 – Codex 可以设定未来任务并“唤醒”以继续长期工作。
  • 主动监控 – 代理可以监视 Slack 频道或 Notion 文档,并自动更新文档或 PR。

记忆(预览)

  • 记住个人偏好、之前的纠正以及收集的数据。
  • 减少每次会话中大量自定义指令的需求。

“当你使用 Codex 时,Codex 也会变得更擅长主动行为。” – Sottiaux

“每日简报”功能(预览中)

Codex 将很快提供简洁的每日简报,概括:

  • 待处理的工单或 PR
  • 即将举行的会议或日历事件
  • 受监控应用的相关更新

敬请期待完整上线。

# Daily Routine Tip
Start the day by identifying open Google Doc comments or relevant Slack context.

---

新的 “Routines” 功能

它在精神和实践上类似于 Anthropic 本周早些时候为其 Claude Code 产品推出的新 “Routines” 功能。


---

## 许可、定价与可用性

OpenAI 最近转向了更灵活的团队定价模式,包括:

- **$100 计划**  
- **按使用付费** 选项,以适应自主代理使用量的增加。  

对于个人用户,这些更新今天开始向已登录 **Codex 桌面应用** 并使用 ChatGPT 的用户推送。

### 平台可用性

- **macOS** 和 **Windows**:Codex 桌面应用在两者上均可用。  
- **功能发布分层**:

| 功能                                 | 可用性                                 |
|--------------------------------------|----------------------------------------|
| 背景计算机使用(仅 macOS)            | 仅在 macOS 上发布                       |
| 个性化(记忆/建议)                  | 即将面向企业、教育、欧盟和英国用户推出 |
| 核心软件开发生命周期更新            | 从今天起对所有桌面应用用户可用           |

## 设想:从开发者工具到面向所有人的超级应用

当被问及这些功能是否代表了 AI **“超级应用”** 的基础时,Sottiaux 确认了这一策略:

> “我们正在公开构建超级应用,并从 Codex 应用中演进它。”

### 为什么这很重要

- 开发者将大部分时间花在 **协调和上下文收集** 上,而不是编写代码。  
- 通过让 Codex 更贴近操作系统以及更广泛的开发者工具生态系统,OpenAI 正在将其定位为现代软件开发的 **中枢神经系统**。

> “我们的使命是确保通用人工智能惠及全人类,”公司在官方公告中声明。“这意味着要缩小人们想象力与实际能够构建的之间的差距。”
0 浏览
Back to Blog

相关文章

阅读更多 »

Codex(几乎)适用于所有

概述:我们正在发布 Codex 的重大更新,使其成为每周有超过 300 万开发者使用的更强大的合作伙伴,以加速……