微信AI助手「小微」灰度内测:WeLM + DeepSeek 双模型架构,14.32亿月活的 Agent 落地实验

6月23日,微信灰度内测 AI 助手「小微」,主入口在微信首页左上角,默认语音转文字交互。这套服务的关键不是单一模型——微信自研的 WeLM 承担主要对话,部分回答会调用 DeepSeek 处理,本质是「自研主模型 + 通用底座」的混合架构。 在产品形态上,小微走「语音优先 + Agent 执行」路线。它打通小程序、聊天、朋友圈、公众号、视频号、微信小店等基础功能,可直接调用携程等小程序完成订机票、订酒店、规划行程等多步操作。在语音识别层面,即便语音转文字有听写错误,小微仍能理解真实诉求——这种带噪鲁棒性来自端到端语音 + 文本联合建模。 但 14.32 亿月活给 AI 落地带来完全不同的约束。涉及支付的环节小微都拒绝直接执行(必须手动输入密码),代发朋友圈、延时发消息、查看未读消息等「看似简单」的能力都尚未开放。这背后是数据安全、信任和监管的多重考量——超级 App 不能一次性把功能交给 AI,必须做大量「能而不做」的克制。 更值得关注的是「基模 + 专模」的混合策略。WeLM 负责微信生态内的垂类能力(朋友圈、公众号、小程序调用),DeepSeek 兜底通用知识与推理;这种「双模型路由」正在成为国内大厂 Agent 落地时的主流打法——用自研模型保住生态闭环,用开源/外采模型补全通用能力。腾讯这一次的最大不同,是把 Agent 直接装进 14.32 亿人每天打开的 App,而不是单独做一个新入口。