OpenAI 大幅更新 Codex 桌面应用,以使用您电脑上的所有其他应用程序、生成图像、预览网页
Source: VentureBeat
新功能?
- 完整系统访问 – Codex 现在可以与您电脑上的任何应用交互,按需或主动显示相关信息,并按指示执行操作。
- 后台运行(仅限 Mac) – 当您继续工作时,Codex 代理可以在后台运行,同时在其他应用中点击、启动和输入。
- 内置网页浏览器 – 在 Codex 内直接预览前端开发。
- 集成图像生成 – 直接管道对接 OpenAI 的 gpt‑image‑1.5 模型,在应用内创建资产(网站、演示文稿、游戏艺术等)。
“Codex 实际上可以点击应用、启动应用并在应用中输入。这适用于您机器上的任何应用。” – Andrew Ambrosino, OpenAI technical staff, Codex team (embargoed press briefing)
“这不仅仅是关于增长。它是把一个非常强大的代理交到构建者手中,而现在我们看到我们能够在整个电脑上扩展并完成更多工作。” – Thibault “Tibo” Sottiaux, Head of Codex, OpenAI
“Codex 是我们最强大的代理。它已经在您的电脑上运行,因此我们正在扩展其功能。它的使用感觉非常自然。我们会在某个时点让它变得更有意义。” – Tibo Sottiaux to VentureBeat
竞争格局
- Anthropic的Claude – 提供 Claude Cowork 和 Claude Code 桌面视图(Mac & Windows),但 不 支持像 Codex 那样在所有用户应用中同时使用后台光标。
“Computer Use” – 最大的飞跃(macOS)
- 后台交互 – Codex 能够在多个应用之间“看到、点击和输入”,无需接管整个桌面。
- 多代理工作流 – 示例:Codex 在你继续使用其他应用时测试前端更改。
“它可以在后台使用你电脑上的应用,而不是接管整个电脑。” – Caffrey Lynch,OpenAI 开发者产品沟通
- Windows – 核心 Codex 桌面应用仍然完全受支持,但光标级别的后台交互在发布时仅限 macOS。
Source: …
端到端软件开发工作区
OpenAI 正在将 Codex 扩展为统一的 SDLC 中枢。新的功能范围包括:
| 功能 | 描述 |
|---|---|
| Integrated Browser | 应用内浏览器,用于迭代前端设计;直接在 DOM 元素上发表评论并给出精确指令。 |
| Visual Primitives | gpt‑image‑1.5 集成,用于生成/迭代模型图、游戏资产及其他视觉内容。 |
| Expanded Sidebar | 为 PDF、电子表格、幻灯片提供丰富预览,并增加一个摘要面板,用于跟踪代理计划和来源。 |
| Terminal & SSH | 多终端标签页;提供通过 SSH 连接远程开发箱的 α 版支持。 |
| 90+ New Plugins | 连接器(CircleCI、GitLab、Microsoft Suite 等)让代理能够收集上下文并在整个工具链中执行操作。 |
“将此版本的最简概念描述为让 Codex 与应用能够跨更大范围的表面进行协作。” – Andrew Ambrosino,Codex 应用开发负责人
演示提示
用户: “能帮我检查 Slack、Gmail、Google Calendar 和 Notion,告诉我哪些需要我关注吗?”
Codex 会扫描多个应用,汇总信息,并呈现最相关的事项。
“如果你想让 Codex 使用特定的应用,可以 @‑提及它们;如果不指定,Codex 也能自行发现要使用的应用。” – Ambrosino
持久代理 – “心跳自动化”
- 计划工作 – Codex 可以设定未来任务并“唤醒”以继续长期工作。
- 主动监控 – 代理可以监视 Slack 频道或 Notion 文档,并自动更新文档或 PR。
记忆(预览)
- 记住个人偏好、之前的纠正以及收集的数据。
- 减少每次会话中大量自定义指令的需求。
“当你使用 Codex 时,Codex 也会变得更擅长主动行为。” – Sottiaux
“每日简报”功能(预览中)
Codex 将很快提供简洁的每日简报,概括:
- 待处理的工单或 PR
- 即将举行的会议或日历事件
- 受监控应用的相关更新
敬请期待完整上线。
# Daily Routine Tip
Start the day by identifying open Google Doc comments or relevant Slack context.
---
新的 “Routines” 功能
它在精神和实践上类似于 Anthropic 本周早些时候为其 Claude Code 产品推出的新 “Routines” 功能。
---
## 许可、定价与可用性
OpenAI 最近转向了更灵活的团队定价模式,包括:
- **$100 计划**
- **按使用付费** 选项,以适应自主代理使用量的增加。
对于个人用户,这些更新今天开始向已登录 **Codex 桌面应用** 并使用 ChatGPT 的用户推送。
### 平台可用性
- **macOS** 和 **Windows**:Codex 桌面应用在两者上均可用。
- **功能发布分层**:
| 功能 | 可用性 |
|--------------------------------------|----------------------------------------|
| 背景计算机使用(仅 macOS) | 仅在 macOS 上发布 |
| 个性化(记忆/建议) | 即将面向企业、教育、欧盟和英国用户推出 |
| 核心软件开发生命周期更新 | 从今天起对所有桌面应用用户可用 |
## 设想:从开发者工具到面向所有人的超级应用
当被问及这些功能是否代表了 AI **“超级应用”** 的基础时,Sottiaux 确认了这一策略:
> “我们正在公开构建超级应用,并从 Codex 应用中演进它。”
### 为什么这很重要
- 开发者将大部分时间花在 **协调和上下文收集** 上,而不是编写代码。
- 通过让 Codex 更贴近操作系统以及更广泛的开发者工具生态系统,OpenAI 正在将其定位为现代软件开发的 **中枢神经系统**。
> “我们的使命是确保通用人工智能惠及全人类,”公司在官方公告中声明。“这意味着要缩小人们想象力与实际能够构建的之间的差距。”