谭待把豆包 2.1 Pro 定位为「上桌」:Terminal Bench 跑平 Claude Opus 4.7,字节系模型矩阵开始咬合

字节火山引擎总裁谭待在 6 月 23 日 FORCE 大会后接受 36 氪专访时,给出了对豆包大模型 2.1 Pro 的判断——「终于可以上桌了」,而这张「桌」是 Coding 与 Agent 赛道。要让这个判断立住,模型得分先过线:豆包 2.1 Pro 在 Terminal Bench 编程评测上与 Claude Opus 4.7 基本持平,长程任务、复杂任务上也达到可用门槛;更进一步,Coding 单项已超过 Claude Opus 4.6。谭待把「可用」拆成三层:编程能力强、能跑通复杂通用 Agent 任务、可规模化——三件事缺一不可。但更值得拆解的是字节这次同时亮出的整条产品线:Seedance 2.0 4K 版、Seedream 5.0 图像生成、首次推出的豆包语音生成模型 1.0,加上即将在 7 月上线的 Seedance 2.5——四个模态、一条产线。谭待把 Seedance 明确定位为「世界模型的一种实现方案」:对物理世界的精准还原与理解正在反哺具身智能、自动驾驶的数据合成与场景仿真。数据层面,火山日均 Token 消耗已达 180 万亿(半年 +50%),「万亿俱乐部」客户数翻倍到 200 余家。模型矩阵咬合越紧,单 token 价值就越高——这是 2024 年「地板价」逻辑被放弃的根本原因:Chatbot 时代的定价模型已经结束,模型进入企业核心生产环节后的定价权、粘性、ARR 才是 MaaS 的真正支点。