微信AI团队ICASSP 2026获奖:从视觉冗余切入,让VLM在边缘设备真正跑起来

在刚刚闭幕的ICASSP 2026(IEEE声学、语音与信号处理国际会议)上,腾讯微信AI团队(模式识别中心)凭借论文《Less Redundancy: Boosting Practicality of Vision Language Model in Walking Assistants》斩获本届Best Industry Paper Award。这是中国团队时隔两年再次在此顶会拿下工业论文最高荣誉。 **从信息冗余切入,而非暴力堆参数** 视觉语言模型(VLM)在辅助行走设备(如智能眼镜)中的应用,长期面临一个核心矛盾:设备端算力有限,但传统VLM的注意力机制计算量随上下文增长呈O(n²)复杂度,导致响应延迟高、功耗大。腾讯微信AI团队的这篇论文没有走「更大的模型」路线,而是从信息冗余的角度切入——通过减少视觉token中的冗余信息,在保持任务精度的前提下大幅压缩计算量,使模型能够适配边缘设备的实时推理约束。 **与近期效率优化潮流形成呼应** 这一技术路径并非孤例。从SubQ的次二次稀疏注意力(5月5日发布,12M token上下文)、MISA的稀疏注意力+MoE路由(5月13日)到MIT的注意力匹配算法(KV Cache压缩50倍),行业正在从多个维度破解Transformer注意力的扩展瓶颈。腾讯微信AI团队的工作特别之处在于,它将效率优化定向到了具身智能场景——VLM在用户行走过程中需要低延迟、低功耗地持续工作,这种场景约束比通用推理更苛刻,也更能验证效率优化的工程价值。 **辅助行走背后的大机会** 获奖论文聚焦辅助行走而非通用场景,折射出一个值得关注的方向:VLM的落地正在从「展示能力」走向「解决真实问题」。辅助行走设备对延迟和功耗极度敏感,纯云端方案不可行。腾讯微信AI团队选择在此场景深耕,说明端侧VLM的可行性已进入可工程化验证的阶段。随着多模态模型效率持续提升,智能眼镜等穿戴设备上的实时视觉理解,或许会比预期更早成为现实。