微信AI助手「小微」灰度内测：WeLM + DeepSeek 双模型架构，14.32亿月活的 Agent 落地实验

6月23日，微信灰度内测 AI 助手「小微」，主入口在微信首页左上角，默认语音转文字交互。这套服务的关键不是单一模型——微信自研的 WeLM 承担主要对话，部分回答会调用 DeepSeek 处理，本质是「自研主模型 + 通用底座」的混合架构。在产品形态上，小微走「语音优先 + Agent 执行」路线。它打通小程序、聊天、朋友圈、公众号、视频号、微信小店等基础功能，可直接调用携程等小程序完成订机票、订酒店、规划行程等多步操作。在语音识别层面，即便语音转文字有听写错误，小微仍能理解真实诉求——这种带噪鲁棒性来自端到端语音 + 文本联合建模。但 14.32 亿月活给 AI 落地带来完全不同的约束。涉及支付的环节小微都拒绝直接执行（必须手动输入密码），代发朋友圈、延时发消息、查看未读消息等「看似简单」的能力都尚未开放。这背后是数据安全、信任和监管的多重考量——超级 App 不能一次性把功能交给 AI，必须做大量「能而不做」的克制。更值得关注的是「基模 + 专模」的混合策略。WeLM 负责微信生态内的垂类能力（朋友圈、公众号、小程序调用），DeepSeek 兜底通用知识与推理；这种「双模型路由」正在成为国内大厂 Agent 落地时的主流打法——用自研模型保住生态闭环，用开源/外采模型补全通用能力。腾讯这一次的最大不同，是把 Agent 直接装进 14.32 亿人每天打开的 App，而不是单独做一个新入口。