腾讯混元 Hy-MT2 翻译模型家族开源:33 语言覆盖 + 1.25-bit 极低比特量化,1.8B 端侧模型 440MB 超越商用 API

腾讯混元团队 5 月 21 日正式发布并开源了 Hy-MT2 多语言翻译模型家族。模型包括 1.8B、7B 和 30B-A3B(MoE)三档规模,原生支持 33 种语言互译和多种语言下的翻译指令遵循,权重与技术报告已在 GitHub 与 Hugging Face 公开。 从技术路径看,Hy-MT2 延续了混元近期在 Hy3-preview 上验证的「教师-学生」框架:以 Hy3-preview 作为强教师,先做 MT 方向的中训练把通用大模型改造成「擅长翻译」的基础版本,再通过 family-centric 后训练分别微调三档规模。核心方法包括 Reference-Guided On-Policy Distillation、Family-Specific RL 和跨家族蒸馏,使 7B 与 30B 模型在 fast-thinking 模式下超越 DeepSeek-V4-Pro 和 Kimi K2.6。 更值得关注的是 1.8B 端侧模型。它通过 AngelSlim 1.25-bit 极低比特量化,把模型体积压到 440MB、推理速度提升 1.5×,同时整体翻译质量依然优于微软翻译和字节豆包等主流商业 API。这意味着 1.8B 端侧模型已具备「本地替代商用 API」的工程可行性,对翻译 SaaS、跨境电商、本地化工具链都是一次降维打击。在金融、法律、医学等真实业务场景的领域翻译、复杂指令遵循上,Hy-MT2 同样保持稳定领先。这是少有的「开源模型 + 商用级质量 + 端侧可部署」三者同时成立的翻译模型,也印证了混元在 2026 年把「大模型做成基础设施」的产品判断。