OpenAI 今日发布 Codex 桌面应用的重大更新,核心亮点是**后台计算机操控能力**——Codex 现在可以在用户使用电脑的同时,在后台打开任意应用、模拟点击和输入操作。多个 Agent 可以在 Mac 上并行工作,互不干扰。 这项功能直接对标 Anthropic 上月为 Claude Code 推出的远程桌面控制能力。两者技术路线相似,都致力于让 AI Agent 成为开发者的"隐形搭档",负责前端迭代、应用测试等辅助任务。 除此之外,Codex 新增了多项能力: - **定时任务调度**:可提前数小时甚至数周规划任务,到点自动唤醒执行 - **内置浏览器**:支持在应用内浏览网页并对页面内容批注反馈,计划未来扩展到完整浏览器控制 - **多终端标签**:可同时操作多个终端窗口,并根据 GitHub review 评论自动修改代码 - **90 个新插件**:覆盖非开发场景的知识工作流 - **记忆功能**(预览):跨会话记住用户工作习惯和项目上下文 - **图片生成**:集成 gpt-image-1.5,用于生成产品原型和 mockup Codex 负责人 Thibault Sottiaux 在媒体简报中坦言,OpenAI 正在"明目张胆"地把未来的超级应用(super app)从 Codex 中演化出来。从 Atlas 浏览器到 Codex 再到 Agent 工具链,OpenAI 的布局意图已非常清晰。 对开发者而言,这场 AI 编码工具的军备竞赛意味着什么?短期看,Claude Code 仍凭借先发优势在企业市场占上风;但 Codex 凭借 OpenAI 的生态规模和多模态整合能力,正在快速缩小差距。长期来看,真正的赢家可能是开发者——当两个顶级 AI 在编码效率上"卷"起来,受益的终究是写代码的人。