Cursor自研编程模型Composer 2.5:闯入第一梯队的价格屠夫

5月18日,Cursor发布了第三代自研编程模型Composer 2.5。核心数字相当震撼:SWE-Bench Multilingual 79.8%,与Claude Opus 4.7和GPT-5.5基本持平;在SWE-Bench-Pro-Hard-AA这个对顶级模型最具挑战性的子集上,Composer 2.5比上代提升了35个百分点。更值得关注的是价格:标准 tier 每百万token输入0.5美元、输出2.5美元,大约是顶级闭源模型的十分之一。这意味着什么?编程AI的经济账正在被改写。此前,SWE-Bench分数能超过75%的模型几乎只有Anthropic和OpenAI的旗舰产品,高昂的推理成本让很多团队在好用和用得起之间被迫二选一。Composer 2.5用十分之一的成本做到了同样的准确率,这对长时间运行的AI编程智能体来说意义重大。技术层面,Composer 2.5建立在Moonshot的Kimi K2.5基础之上。Cursor透露,85%的计算预算用于在基座之上做额外后训练和强化学习,合成任务数据量是上代的25倍。这种站在开源肩上加大规模专项调优的路径,正在成为中小型实验室对抗头部厂商的主流策略。Composer 2.5的发布代表编程AI智能体市场正式进入性价比竞争阶段,不再只是谁的分数最高的竞争。接下来要看的是:当入门级编程智能体的成本降到原来的十分之一,传统IDE插件市场和Copilot们的定价策略会受到多大压力?这场价格战的受益者最终是开发者。