Daybreak 把网络安全 AI 拉进「产品线」：OpenAI 用 GPT-5.5-Cyber 把漏洞修补做成流水线

CyberGym 85.6% / ExploitGym 39.5% / SEC-bench Pro 69.8%——这些数字代表的不只是模型跑分，而是 OpenAI 对「网络安全 AI」给出的新定义。6 月 22 日，OpenAI 把 GPT-5.5-Cyber 从受限预览推向完整版，同时更新 Codex Security 插件，并联合 Trail of Bits、HackerOne 推出 Patch the Planet 计划，让 cURL、Go、Python 等 30 多个开源项目进入「机器速度补丁」通道。GPT-5.5-Cyber 的设计哲学很清晰：CyberGym 单模型 85.6%，比 GPT-5.5（81.8%）高 3.8 个百分点；ExploitGym 39.5% 对比 25.95%，SEC-bench Pro 69.8% 对比 63.1%——这是一份「保持通用智能的同时把 cyber 能力做厚」的答卷。OpenAI 把访问门槛设得很高：仅向已验证的防御者开放，搭配更强的监控、范围控制与人工审查，本质上是把 GPT-5.5-Cyber 视为「会犯错的助手」而不是「全自动黑客」。更值得关注的是 Codex Security 插件的更新。从 3 月云端研究预览开始，它已扫描 3000 万次 commit、跨 3 万个代码库；其中 7 万个 finding 被人工标记为已修复，50 万个由系统自动判定为已修复。这次更新把扫描、威胁建模、补丁生成、验证整合成直通车，开发者能在 Codex CLI 或桌面 App 里直接调用，让「安全审查」从一次性事件变成持续流水线。Patch the Planet 则是这套体系的最后一公里：与 cURL、Go、Python、Sigstore、pyca/cryptography 等项目合作，把模型生成的 patch 推到 maintainer 审阅流程里。这意味着开源软件供应链第一次有了一条「机器发现 + 机器修」的标准通道。OpenAI 提到的瓶颈转移更值得玩味：「过去十年瓶颈是发现漏洞，现在瓶颈是修复。」模型把发现速度提了一个数量级之后，人工修复的速度反而成了天花板。这其实和 OpenAI Codex、Anthropic Claude Code 的思路一脉相承：把 Agent 从「生成内容」推向「完成闭环」。所以 Daybreak 的信号不是「OpenAI 做了个 cyber 模型」，而是模型公司正在把「垂直工作流」作为下一个产品形态。CyberGym 上的领先，最终要兑现成「今天能多快修掉一个 Firefox 漏洞」，否则就只是评测榜单上的又一行。