OpenRouter Fusion 把多模型融合做成一行 API：DRACO 跑分反超 Fable 5

OpenRouter 在 6 月 12 日上线 Fusion API，把「多模型并行 + 裁判融合」产品化：开发者只需一次 `openrouter/fusion` 调用，后台就会并行调度 3-5 个模型跑同一 prompt（带联网搜索/抓取），再由一个裁判模型读取所有输出、抽取共识点、矛盾与盲区，最终合成一份带引用、有结构的回答。整个过程服务端化，对外只暴露一个模型别名。关键证据来自 DRACO 基准（Perplexity 出品的 100 题深度研究）： - Fable 5 + GPT-5.5 由 Opus 4.8 综述，得分 69.0%，反超 Fable 5 单跑 65.3%、Opus 4.8 的 58.8%； - 「全中端」组合 Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro 拿下 64.7%，跨过 GPT-5.5 与 Opus 4.8，价格只要 Fable 面板的一半； - OpenRouter 自评：3/4 提升来自「裁判综合」，1/4 来自「模型多样性」，印证了多视角胜过单点的工程直觉。这件事的真正信号，是「prompt 路由」从后台基建走到了前台 API 形态。Sakana AI 的离线权重融合（TIES、Task Vector）走的是另一条路，但 Fusion 把「多样性的边际价值」第一次量化到生产环境——单跑顶级模型的边际收益开始被组合稀释，推理 API 定价也在从「按 token 算成本」演化为「按问题难度分层」。当便宜的模型面板就能稳定接住深度研究任务，「模型即团队」就从口号变成了工程事实，模型供应商之间的竞争也将从「谁更大」转向「谁更适合被融合」。