法国 Mistral AI 今天正式发布 Mistral 3 家族,从云端旗舰到边缘小模型一口气全开源。旗舰 Mistral Large 3 采用稀疏 MoE 架构,总参数 675B、单 token 激活 41B,搭配 2.5B 视觉编码器组成原生多模态模型,256k 上下文窗口、Apache 2.0 协议,这是 Mixtral 之后 Mistral 首个 MoE 旗舰。LMArena 开源非推理赛道直接空降第二,六语言对话能力稳居同类开源第一梯队。 训练侧,Large 3 从零开始用 3000 张 NVIDIA H200 训练;部署侧,Mistral 与 NVIDIA、vLLM、Red Hat 深度协同:FP8 版本可跑在单节点 B200/H200 上,NVFP4 量化版则把门槛压到单节点 8×H100 或 8×A100,Blackwell 专属 attention/MoE kernel、prefill/decode 分离推理、投机解码一应俱全。官方明确「推理版本即将到来」,把路线图直接画到了 o3 级选手的对面。 边缘侧同步推出的 Ministral 3 给到 3B / 8B / 14B 三档,每个尺寸都覆盖 base、instruct、reasoning 三个变体,全部内置图像理解,Apache 2.0。Ministral 14B reasoning 在 AIME '25 拿到 85%,而 instruct 版本据说「在多数场景以少一个数量级的 token 数追平或超过同级」,把 token 经济性做成了真正的差异化。 Mistral 这次把「前沿 + 开放 + 端侧」三件事压进同一次发布,加上同时登陆 Mistral Studio、AWS Bedrock、Azure Foundry、Hugging Face、Modal、IBM watsonx、OpenRouter、Fireworks、Together、Unsloth AI 等十几家平台,NVIDIA NIM 与 AWS SageMaker 紧随其后。开源协议的边界、推理效率的下沿、硬件覆盖的宽度,这三点 Mistral 一次给齐,留给闭源前沿玩家的护城河又被削掉一层。