OpenAI Codex 大升级：后台操控桌面、多 Agent 并行，剑指 Claude Code

OpenAI 今日发布 Codex 桌面应用的重大更新，核心亮点是**后台计算机操控能力**——Codex 现在可以在用户使用电脑的同时，在后台打开任意应用、模拟点击和输入操作。多个 Agent 可以在 Mac 上并行工作，互不干扰。这项功能直接对标 Anthropic 上月为 Claude Code 推出的远程桌面控制能力。两者技术路线相似，都致力于让 AI Agent 成为开发者的"隐形搭档"，负责前端迭代、应用测试等辅助任务。除此之外，Codex 新增了多项能力： - **定时任务调度**：可提前数小时甚至数周规划任务，到点自动唤醒执行 - **内置浏览器**：支持在应用内浏览网页并对页面内容批注反馈，计划未来扩展到完整浏览器控制 - **多终端标签**：可同时操作多个终端窗口，并根据 GitHub review 评论自动修改代码 - **90 个新插件**：覆盖非开发场景的知识工作流 - **记忆功能**（预览）：跨会话记住用户工作习惯和项目上下文 - **图片生成**：集成 gpt-image-1.5，用于生成产品原型和 mockup Codex 负责人 Thibault Sottiaux 在媒体简报中坦言，OpenAI 正在"明目张胆"地把未来的超级应用（super app）从 Codex 中演化出来。从 Atlas 浏览器到 Codex 再到 Agent 工具链，OpenAI 的布局意图已非常清晰。对开发者而言，这场 AI 编码工具的军备竞赛意味着什么？短期看，Claude Code 仍凭借先发优势在企业市场占上风；但 Codex 凭借 OpenAI 的生态规模和多模态整合能力，正在快速缩小差距。长期来看，真正的赢家可能是开发者——当两个顶级 AI 在编码效率上"卷"起来，受益的终究是写代码的人。