六月本该是AI圈最热闹的月份——Gemini 3.5 Pro、Claude Sonnet 4.8、Grok 5,多个重磅模型传言集中落地。但实际情况是:大部分不会在这个月发货,发货的大部分不会改变你现有的代码。 Wavespeed AI 日前发布了一份面向开发者的决策地图,把六月所有传言分成四类:已发布、预览受限、传言中、训练中,并提出一个核心框架——将AI技术栈分为决策层、推理层、编排层,三层分开评估,才能做出正确切换。 三层分离原则:决策层是Frontier文本和推理模型,即Gemini 3.5 Pro、Sonnet 4.8、Claude Mythos、Grok 5。这层负责生成token、跑推理链、驱动Agent。推理层是图像、视频、音频、3D生成模型。编排层位于两者之上,如Google的Agentigrade 2.0。六月发布潮几乎只涉及决策层,对推理层基本无影响。 各模型状态速览:Gemini 3.5 Flash已发布(5月19日GA),API定价.50/.00/M tokens,在coding和agentic benchmark上以4倍速度超越Gemini 3.1 Pro,打破了Pro一定比Flash强的惯性认知。Gemini 3.5 Pro已宣布六月发布但日期未定。Claude Sonnet 4.8是纯传言,唯一证据是Claude Code npm包中意外泄漏的source map,Anthropic从未跳过小版本先例。Grok 5仍在训练中,Polymarket合约概率仅12%~33%。 真正值得切换的情形:工作负载是推理密集型、目前为困难case付高价tokens给Opus 4.7或GPT-5.5、以及运行长上下文Agent。对于视频生成、图片生成类产品,六月潮是背景噪音——推理层模型没有任何变化。这个框架的价值在于别被花哨的模型名字带着走,先问自己这个模型影响我哪一层。每一层的切换成本和收益是独立的,混淆三层是六月最常见的决策失误。