OpenRouter Fusion 把多模型融合做成一行 API:DRACO 跑分反超 Fable 5

OpenRouter 在 6 月 12 日上线 Fusion API,把「多模型并行 + 裁判融合」产品化:开发者只需一次 `openrouter/fusion` 调用,后台就会并行调度 3-5 个模型跑同一 prompt(带联网搜索/抓取),再由一个裁判模型读取所有输出、抽取共识点、矛盾与盲区,最终合成一份带引用、有结构的回答。整个过程服务端化,对外只暴露一个模型别名。 关键证据来自 DRACO 基准(Perplexity 出品的 100 题深度研究): - Fable 5 + GPT-5.5 由 Opus 4.8 综述,得分 69.0%,反超 Fable 5 单跑 65.3%、Opus 4.8 的 58.8%; - 「全中端」组合 Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro 拿下 64.7%,跨过 GPT-5.5 与 Opus 4.8,价格只要 Fable 面板的一半; - OpenRouter 自评:3/4 提升来自「裁判综合」,1/4 来自「模型多样性」,印证了多视角胜过单点的工程直觉。 这件事的真正信号,是「prompt 路由」从后台基建走到了前台 API 形态。Sakana AI 的离线权重融合(TIES、Task Vector)走的是另一条路,但 Fusion 把「多样性的边际价值」第一次量化到生产环境——单跑顶级模型的边际收益开始被组合稀释,推理 API 定价也在从「按 token 算成本」演化为「按问题难度分层」。当便宜的模型面板就能稳定接住深度研究任务,「模型即团队」就从口号变成了工程事实,模型供应商之间的竞争也将从「谁更大」转向「谁更适合被融合」。