有道子曰4全面开源:27B多模态模型迈入全模态时代

网易有道近日正式发布子曰大模型4.0版本,宣布核心多模态模型与TTS引擎全面开源,标志着这家教育AI老兵正式迈入全模态时代。 子曰4多模态模型在27B参数规模上将视觉输入的数理能力提升至行业顶尖水平,在处理带图表的数学题、物理题等高难度视觉数理问题上表现惊艳。纯文本数理难题准确率达81.4%,同样达到行业领先。更值得关注的是,新模型采用精细化思维链重构方案,将推理思维链输出长度压缩了43.2%,这意味着可以用更少的Token、更短的推理路径给出答案,直接降低实际业务场景中的推理成本。 此次一同开源的还有语音合成引擎,基于语音编码器+LLM的前沿架构,支持14种语言,3秒即可完成原声克隆,克隆准确度超过97%,相似度达85%以上。跨语种克隆不会出现口音泄露问题,这在国内TTS开源方案中相当少见。 子曰团队还重构了翻译模型,引入多专家OPD模式,配合强化学习的格式奖励和语言检测机制,在提升质量的同时实现推理速度80%的提升。这对于需要高频、高并发翻译服务的产业应用场景意义重大。 从最初的虚拟人口语教练Hi Echo,到如今的子曰4全模态开源,有道在教育AI领域的积累正在转化为真正的开源竞争力。对于开发者和企业而言,这套开源方案提供了一个可直接落地的高性价比选择——既能享受开源的灵活性,又有经过场景验证的性能保障。随着多模态与语音合成的门槛进一步降低,真正的生产力变革或许就在眼前。