Kimi K2.7-Code 开源:Moonshot 把"过度思考"砍掉三成,长程编程更经济

Moonshot AI 在 6 月 12 日开源了 Kimi K2.7-Code,焦点从"答得多聪明"挪到"每一步多经济"。模型沿用 K2.6 的 1T MoE 骨架(384 专家、激活 32B、256K 上下文、MLA+SwiGLU、MuonClip 训练),硬件门槛保持不变,工程重心放在"砍冗余"上。官方公布的内部基准涨幅显眼:Kimi Code Bench v2 由 50.9 升到 62.0(+21.8%),Program Bench 48.3→53.6(+11%),多语言 MLS Bench Lite 26.7→35.1(+31.5%)。但更值得品味的是另一组数字——相比 K2.6 推理 token 用量减少 30%。在跑几百步的 agentic 编码会话里,每一步少付的"思考税"累积起来,固定预算下就可以多走 30% 步骤,正好打在长时任务最先撞到的瓶颈上。 K2.7-Code 没有"单独上场"。Moonshot 把 Kimi Code 终端 Agent 同步推上前台,API 完全兼容 OpenAI 协议,预告的 6x 高速模式显然在追 Anthropic Claude Code 的"模型+订阅+CLI"打法——纯发权重的时代,在头部实验室里基本结束。技术细节上有一个反直觉设计:preserve_thinking 强制启用,完整链式思考保留到多轮对话里——砍的是冗余,留的是质量。协议仍是 Modified MIT 商用友好,K2.6 现成的部署栈可以直接换模型上去。独立榜单(SWE-Bench Pro、Terminal-Bench 2.0)的复测要等几天。但 Moonshot 这一轮押的方向已经很清楚:下一阶段开源编码模型的竞争,真正决定生产可不可用的是"每千步花多少 token",基准分再高也救不回一份过长的运行账单。