Command A+:Cohere 开源 218B MoE 模型,两块 H100 部署企业级 Agent 能力

当开源社区还在讨论「7B 模型能否在 MacBook 上跑起来」的时候,Cohere 直接扔出了一颗深水炸弹。 5月22日,Cohere 正式开源 Command A+,一个总参数 218B、活跃参数仅 25B 的 MoE 大模型。最低只需两块 H100 显卡(配合 W4A4 量化)即可部署——这在动辄需要 H100 集群的百亿模型世界里,算得上相当克制。 为什么值得关注?不是参数大,而是 Agent 能力真的上来了。在 τ²-Bench Telecom 基准上,Command A+ 从前代的 37% 跃升至 85%;Terminal-Bench Hard(硬核编码任务)更是从 3% 爬到 25%——别看不起 25%,这个分数在此类任务上此前几乎没有开源模型能摸到两位数。它还顺手整合了多模态理解(MMMU Pro 63%)和 48 种语言支持,说是 All-in-One 并不为过。 更重要的是许可证:Apache 2.0,不是「开源但不许商用」的自嗨协议,是真正可以放进产品里跑的那种。这对于有数据合规要求的企业来说,意义远超技术数字本身。 我的看法:Command A+ 代表了一条清晰的路线——用稀疏激活换效率,用开源换可控性。MoE 架构在这里不只是「省算力」的技巧,而是一种架构宣言:模型不需要时时刻刻动用全部参数,就像人类专家不需要每次都调动全部知识储备。 当前开源模型在 Agent 任务上的短板正在被快速填补。如果这种趋势持续,「企业用私有模型还是调用 API」的选择天平,可能要重新倾斜了。