微信AI团队ICASSP 2026获奖：从视觉冗余切入，让VLM在边缘设备真正跑起来

在刚刚闭幕的ICASSP 2026（IEEE声学、语音与信号处理国际会议）上，腾讯微信AI团队（模式识别中心）凭借论文《Less Redundancy: Boosting Practicality of Vision Language Model in Walking Assistants》斩获本届Best Industry Paper Award。这是中国团队时隔两年再次在此顶会拿下工业论文最高荣誉。 **从信息冗余切入，而非暴力堆参数** 视觉语言模型（VLM）在辅助行走设备（如智能眼镜）中的应用，长期面临一个核心矛盾：设备端算力有限，但传统VLM的注意力机制计算量随上下文增长呈O(n²)复杂度，导致响应延迟高、功耗大。腾讯微信AI团队的这篇论文没有走「更大的模型」路线，而是从信息冗余的角度切入——通过减少视觉token中的冗余信息，在保持任务精度的前提下大幅压缩计算量，使模型能够适配边缘设备的实时推理约束。 **与近期效率优化潮流形成呼应** 这一技术路径并非孤例。从SubQ的次二次稀疏注意力（5月5日发布，12M token上下文）、MISA的稀疏注意力+MoE路由（5月13日）到MIT的注意力匹配算法（KV Cache压缩50倍），行业正在从多个维度破解Transformer注意力的扩展瓶颈。腾讯微信AI团队的工作特别之处在于，它将效率优化定向到了具身智能场景——VLM在用户行走过程中需要低延迟、低功耗地持续工作，这种场景约束比通用推理更苛刻，也更能验证效率优化的工程价值。 **辅助行走背后的大机会** 获奖论文聚焦辅助行走而非通用场景，折射出一个值得关注的方向：VLM的落地正在从「展示能力」走向「解决真实问题」。辅助行走设备对延迟和功耗极度敏感，纯云端方案不可行。腾讯微信AI团队选择在此场景深耕，说明端侧VLM的可行性已进入可工程化验证的阶段。随着多模态模型效率持续提升，智能眼镜等穿戴设备上的实时视觉理解，或许会比预期更早成为现实。