「六月AI发布潮」：一个面向开发者的决策框架

六月本该是AI圈最热闹的月份——Gemini 3.5 Pro、Claude Sonnet 4.8、Grok 5，多个重磅模型传言集中落地。但实际情况是：大部分不会在这个月发货，发货的大部分不会改变你现有的代码。 Wavespeed AI 日前发布了一份面向开发者的决策地图，把六月所有传言分成四类：已发布、预览受限、传言中、训练中，并提出一个核心框架——将AI技术栈分为决策层、推理层、编排层，三层分开评估，才能做出正确切换。三层分离原则：决策层是Frontier文本和推理模型，即Gemini 3.5 Pro、Sonnet 4.8、Claude Mythos、Grok 5。这层负责生成token、跑推理链、驱动Agent。推理层是图像、视频、音频、3D生成模型。编排层位于两者之上，如Google的Agentigrade 2.0。六月发布潮几乎只涉及决策层，对推理层基本无影响。各模型状态速览：Gemini 3.5 Flash已发布（5月19日GA），API定价.50/.00/M tokens，在coding和agentic benchmark上以4倍速度超越Gemini 3.1 Pro，打破了Pro一定比Flash强的惯性认知。Gemini 3.5 Pro已宣布六月发布但日期未定。Claude Sonnet 4.8是纯传言，唯一证据是Claude Code npm包中意外泄漏的source map，Anthropic从未跳过小版本先例。Grok 5仍在训练中，Polymarket合约概率仅12%~33%。真正值得切换的情形：工作负载是推理密集型、目前为困难case付高价tokens给Opus 4.7或GPT-5.5、以及运行长上下文Agent。对于视频生成、图片生成类产品，六月潮是背景噪音——推理层模型没有任何变化。这个框架的价值在于别被花哨的模型名字带着走，先问自己这个模型影响我哪一层。每一层的切换成本和收益是独立的，混淆三层是六月最常见的决策失误。