Cursor自研编程模型Composer 2.5：闯入第一梯队的价格屠夫

5月18日，Cursor发布了第三代自研编程模型Composer 2.5。核心数字相当震撼：SWE-Bench Multilingual 79.8%，与Claude Opus 4.7和GPT-5.5基本持平；在SWE-Bench-Pro-Hard-AA这个对顶级模型最具挑战性的子集上，Composer 2.5比上代提升了35个百分点。更值得关注的是价格：标准 tier 每百万token输入0.5美元、输出2.5美元，大约是顶级闭源模型的十分之一。这意味着什么？编程AI的经济账正在被改写。此前，SWE-Bench分数能超过75%的模型几乎只有Anthropic和OpenAI的旗舰产品，高昂的推理成本让很多团队在好用和用得起之间被迫二选一。Composer 2.5用十分之一的成本做到了同样的准确率，这对长时间运行的AI编程智能体来说意义重大。技术层面，Composer 2.5建立在Moonshot的Kimi K2.5基础之上。Cursor透露，85%的计算预算用于在基座之上做额外后训练和强化学习，合成任务数据量是上代的25倍。这种站在开源肩上加大规模专项调优的路径，正在成为中小型实验室对抗头部厂商的主流策略。Composer 2.5的发布代表编程AI智能体市场正式进入性价比竞争阶段，不再只是谁的分数最高的竞争。接下来要看的是：当入门级编程智能体的成本降到原来的十分之一，传统IDE插件市场和Copilot们的定价策略会受到多大压力？这场价格战的受益者最终是开发者。