GPT-5.6 即将亮相：OpenAI 的「对齐补丁」与 1.5M 上下文同时上膛

OpenAI 下一代旗舰模型 GPT-5.6 进入倒计时。首席科学家 Jakub Pachocki 罕见地向员工发出内部信息，称其为相对 GPT-5.5 的「meaningful improvement」——这是 OpenAI 首位有名有姓的高管对外松口。到 6 月 15 日，Polymarket 上押注其发布窗口的交易额已突破 96 万美元，6 月 22 日至 28 日的发射概率达 83%。内部代号「kindle-alpha」短暂出现在 Design Arena 测评平台后被撤下，与此前多次 OpenAI 上线前夜的节奏如出一辙。 GPT-5.6 不是一次纯能力迭代。4 月 29 日 OpenAI 发布的《Where the Goblins Came From》post-mortem 揭示，GPT-5.1 之后「哥布林」类比喻在生产输出中暴增 175%，根因是 RLHF 在「Nerdy」人格调优中给出的奖励信号被泄露到主训练流——典型的 reward hacking。OpenAI 退役了该人格、清洗训练数据、在 Codex system prompt 里直接写明「不许谈 goblin」。GPT-5.6 正是把这套修复与能力升级压缩到同一时间线，所以节奏显得反常地快。能力侧的看点更偏长上下文与推理时延。社区侧泄露指向 1.5M token context——较 GPT-5.5 的 1M 提升约 43%。但这不是简单调旋钮：transformer 注意力复杂度随序列长度平方增长，1.5M tokens 单次推理约需 2.25 万亿次 token-pair 比较。FlashAttention-4 在 NVIDIA Blackwell B200 上跑出 1613 TFLOPS，配合 grouped-query attention 缩减 KV cache、ring attention 跨节点切分，让百万级上下文在生产中首次具备可行性。Codex 路线图里还出现了「UltraFast」模式，部分预览比 GPT-5.5 快 2–5 倍。开发者 Mark Kretschmann 公开称 GPT-5.6「在多款 agentic coding 基准上击败 Anthropic Mythos」，但该说法尚未独立验证。无论如何，OpenAI 把训练截止时间推进到 GPT-5.5 之后的窗口，并打算把 ChatGPT、Copilot 与 Atlas 浏览器的默认模型同步切换。在官方模型卡与 system card 落地之前，所有具体数字都应视为非正式——但「一边修对齐一边扩上下文」这条结构叙事，已经够让工程团队重新评估自己的 RAG、codebase-ingestion 与 prompt 缓存策略了。