Mistral 3 全家桶正式开源：675B MoE 把「开放前沿」拉回牌桌，Apache 2.0 一口气打到边缘

法国 Mistral AI 今天正式发布 Mistral 3 家族，从云端旗舰到边缘小模型一口气全开源。旗舰 Mistral Large 3 采用稀疏 MoE 架构，总参数 675B、单 token 激活 41B，搭配 2.5B 视觉编码器组成原生多模态模型，256k 上下文窗口、Apache 2.0 协议，这是 Mixtral 之后 Mistral 首个 MoE 旗舰。LMArena 开源非推理赛道直接空降第二，六语言对话能力稳居同类开源第一梯队。训练侧，Large 3 从零开始用 3000 张 NVIDIA H200 训练；部署侧，Mistral 与 NVIDIA、vLLM、Red Hat 深度协同：FP8 版本可跑在单节点 B200/H200 上，NVFP4 量化版则把门槛压到单节点 8×H100 或 8×A100，Blackwell 专属 attention/MoE kernel、prefill/decode 分离推理、投机解码一应俱全。官方明确「推理版本即将到来」，把路线图直接画到了 o3 级选手的对面。边缘侧同步推出的 Ministral 3 给到 3B / 8B / 14B 三档，每个尺寸都覆盖 base、instruct、reasoning 三个变体，全部内置图像理解，Apache 2.0。Ministral 14B reasoning 在 AIME '25 拿到 85%，而 instruct 版本据说「在多数场景以少一个数量级的 token 数追平或超过同级」，把 token 经济性做成了真正的差异化。 Mistral 这次把「前沿 + 开放 + 端侧」三件事压进同一次发布，加上同时登陆 Mistral Studio、AWS Bedrock、Azure Foundry、Hugging Face、Modal、IBM watsonx、OpenRouter、Fireworks、Together、Unsloth AI 等十几家平台，NVIDIA NIM 与 AWS SageMaker 紧随其后。开源协议的边界、推理效率的下沿、硬件覆盖的宽度，这三点 Mistral 一次给齐，留给闭源前沿玩家的护城河又被削掉一层。