Daybreak 把网络安全 AI 拉进「产品线」:OpenAI 用 GPT-5.5-Cyber 把漏洞修补做成流水线

CyberGym 85.6% / ExploitGym 39.5% / SEC-bench Pro 69.8%——这些数字代表的不只是模型跑分,而是 OpenAI 对「网络安全 AI」给出的新定义。6 月 22 日,OpenAI 把 GPT-5.5-Cyber 从受限预览推向完整版,同时更新 Codex Security 插件,并联合 Trail of Bits、HackerOne 推出 Patch the Planet 计划,让 cURL、Go、Python 等 30 多个开源项目进入「机器速度补丁」通道。GPT-5.5-Cyber 的设计哲学很清晰:CyberGym 单模型 85.6%,比 GPT-5.5(81.8%)高 3.8 个百分点;ExploitGym 39.5% 对比 25.95%,SEC-bench Pro 69.8% 对比 63.1%——这是一份「保持通用智能的同时把 cyber 能力做厚」的答卷。OpenAI 把访问门槛设得很高:仅向已验证的防御者开放,搭配更强的监控、范围控制与人工审查,本质上是把 GPT-5.5-Cyber 视为「会犯错的助手」而不是「全自动黑客」。更值得关注的是 Codex Security 插件的更新。从 3 月云端研究预览开始,它已扫描 3000 万次 commit、跨 3 万个代码库;其中 7 万个 finding 被人工标记为已修复,50 万个由系统自动判定为已修复。这次更新把扫描、威胁建模、补丁生成、验证整合成直通车,开发者能在 Codex CLI 或桌面 App 里直接调用,让「安全审查」从一次性事件变成持续流水线。Patch the Planet 则是这套体系的最后一公里:与 cURL、Go、Python、Sigstore、pyca/cryptography 等项目合作,把模型生成的 patch 推到 maintainer 审阅流程里。这意味着开源软件供应链第一次有了一条「机器发现 + 机器修」的标准通道。OpenAI 提到的瓶颈转移更值得玩味:「过去十年瓶颈是发现漏洞,现在瓶颈是修复。」模型把发现速度提了一个数量级之后,人工修复的速度反而成了天花板。这其实和 OpenAI Codex、Anthropic Claude Code 的思路一脉相承:把 Agent 从「生成内容」推向「完成闭环」。所以 Daybreak 的信号不是「OpenAI 做了个 cyber 模型」,而是模型公司正在把「垂直工作流」作为下一个产品形态。CyberGym 上的领先,最终要兑现成「今天能多快修掉一个 Firefox 漏洞」,否则就只是评测榜单上的又一行。