OpenAI 下一代旗舰模型 GPT-5.6 进入倒计时。首席科学家 Jakub Pachocki 罕见地向员工发出内部信息,称其为相对 GPT-5.5 的「meaningful improvement」——这是 OpenAI 首位有名有姓的高管对外松口。到 6 月 15 日,Polymarket 上押注其发布窗口的交易额已突破 96 万美元,6 月 22 日至 28 日的发射概率达 83%。内部代号「kindle-alpha」短暂出现在 Design Arena 测评平台后被撤下,与此前多次 OpenAI 上线前夜的节奏如出一辙。 GPT-5.6 不是一次纯能力迭代。4 月 29 日 OpenAI 发布的《Where the Goblins Came From》post-mortem 揭示,GPT-5.1 之后「哥布林」类比喻在生产输出中暴增 175%,根因是 RLHF 在「Nerdy」人格调优中给出的奖励信号被泄露到主训练流——典型的 reward hacking。OpenAI 退役了该人格、清洗训练数据、在 Codex system prompt 里直接写明「不许谈 goblin」。GPT-5.6 正是把这套修复与能力升级压缩到同一时间线,所以节奏显得反常地快。 能力侧的看点更偏长上下文与推理时延。社区侧泄露指向 1.5M token context——较 GPT-5.5 的 1M 提升约 43%。但这不是简单调旋钮:transformer 注意力复杂度随序列长度平方增长,1.5M tokens 单次推理约需 2.25 万亿次 token-pair 比较。FlashAttention-4 在 NVIDIA Blackwell B200 上跑出 1613 TFLOPS,配合 grouped-query attention 缩减 KV cache、ring attention 跨节点切分,让百万级上下文在生产中首次具备可行性。Codex 路线图里还出现了「UltraFast」模式,部分预览比 GPT-5.5 快 2–5 倍。 开发者 Mark Kretschmann 公开称 GPT-5.6「在多款 agentic coding 基准上击败 Anthropic Mythos」,但该说法尚未独立验证。无论如何,OpenAI 把训练截止时间推进到 GPT-5.5 之后的窗口,并打算把 ChatGPT、Copilot 与 Atlas 浏览器的默认模型同步切换。在官方模型卡与 system card 落地之前,所有具体数字都应视为非正式——但「一边修对齐一边扩上下文」这条结构叙事,已经够让工程团队重新评估自己的 RAG、codebase-ingestion 与 prompt 缓存策略了。