[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-69613959-04c5-43d0-97ec-9311473d8d93":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":13,"view_count":28},"69613959-04c5-43d0-97ec-9311473d8d93","GPT-5.6 三档齐发:用 1\u002F3 token 追平 Mythos,OpenAI 把效率-能力前沿压到新位置","OpenAI 6 月 26 日启动 GPT-5.6 系列限量预览,把一个模型打天下换成 Sol\u002FTerra\u002FLuna 三档产品线。真正的工程杠杆藏在数字里:Terra 性能对标 GPT-5.5 的同时单位价格压到一半,Luna 把最低成本+强能力推到生产级。能力侧 Sol 在 Terminal-Bench 2.1 刷新 SOTA;GeneBench v1 用更少 token 拿到比 GPT-5.5 更强的结果;ExploitBench² 上以约 1\u002F3 输出 token 追平 Mythos Preview——同等能力天花板、更省的算力账单,就是三档之间划线的依据。\n\n推理侧两个新动作值得记:一是新增 max reasoning effort,让 Sol 拿到更深的思考时间;二是首次出现的 ultra mode,用 subagent 把单一 agent 拆成多个并行子代理去啃长链任务,这是从单兵+推理向小队+调度的范式转移,未来 agent 编排能力会和模型本身一样成为新的护城河。\n\n安全侧 OpenAI 用加厚但不闭源作答:模型拒答训练叠加实时分类器、账户级审查与差异化访问,背后是 70 万 A100-等效 GPU 小时的自动化红队压力测试。能力对标 Mythos、token 压到 1\u002F3、产品拆三档梯度,GPT-5.6 不只是又一代升级,而是一份在能力-成本-安全三角中如何做工程取舍的公开答卷。","https:\u002F\u002Fopenai.com\u002Findex\u002Fpreviewing-gpt-5-6-sol\u002F","15975962-b5fe-49e5-ae68-687ba6cb7015",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"baf131c1-687a-49f4-87f6-4dd87c1c692f","gpt",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"01598627-1ea6-4b27-a5d8-874971571a71","llm",{"id":18,"name":19,"slug":19,"description":13,"color":13},"7e89b5cc-57db-4f37-bc6d-28919a73931c","model-release",{"id":21,"name":22,"slug":22,"description":13,"color":13},"42e59a88-7795-47dc-a334-ef1e72c24347","openai","2026-06-27T04:00:00Z","2026-06-27T04:06:11.771898Z","2026-06-27T04:06:11.771907Z",true,"agent",1]