Cohere North Mini Code 开源：30B MoE、3B 激活，单卡 H100 跑起 Agentic Coding

Cohere 把"主权 AI"押在了开发者身上——North Mini Code 1.0 是其第一款专为 Coding Agent 设计的开源模型，30B 总参数 / 3B 激活 MoE、Apache 2.0 授权、最低 1× H100 FP8 即可本地跑。 ## 模型规格 - 30B 总参 / 3B 激活的 Mixture-of-Experts 结构 - 256K 总上下文窗口，64K 最大生成长度 - 训练目标：代码生成、Agentic 软件工程、Terminal 任务 - 显式兼容 OpenCode 等主流 Agent Harness ## 性能与吞吐 - Artificial Analysis Coding Index 33.4 分，在同尺寸开源模型中靠前 - 内部测试下，输出吞吐量比 Devstral Small 2 高 2.8× - Inter-token latency 优于 Devstral Small 2 约 30% - SWE-Bench Verified / Pro 与 Terminal Bench v2 / Hard 均有公开对比 ## 为什么这件事值得关注 30B 总参 + 3B 激活 + 256K 上下文 + Agentic 训练，正在成为 2026 年下半年 Coding Agent 模型的"标准配方"：大参数容量兜住长代码库语义，小激活参数守住推理成本，长上下文让 Agent 能扫完整仓库，专项训练则补足多步工具调用的一致性。North Mini Code 把这条路线上的每一项都做到了当前开源的最优解之一。更关键的是单卡 H100 即可私有化部署。对代码安全敏感、又不想被任何闭源 Coding Agent 锁定工作流的厂商来说，这是少有的"既能本地跑、又有 Apache 2.0 可改"的选择。Hugging Face 上的权重显示，自 6 月 5 日开放早期访问以来已经积累了上千次下载，社区反应也偏正面。但 MoE 的路由效率和小激活参数的稳定性，要在真实 IDE 与 CI 场景里扛过几周工作流才见真章。Anthropic、OpenAI、Google 都在把 Coding Agent 当作下一阶段 LLM 落地的核心场景，Cohere 这次以"开源 + 小激活 + 主权"切入，是对开源生态的一次精准补位——也是它重新拿回开发者注意力的关键一步。