[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-58d2e247-e1d7-4325-8e90-602480fae550":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":13,"view_count":28},"58d2e247-e1d7-4325-8e90-602480fae550","微信AI团队ICASSP 2026获奖：从视觉冗余切入，让VLM在边缘设备真正跑起来","在刚刚闭幕的ICASSP 2026（IEEE声学、语音与信号处理国际会议）上，腾讯微信AI团队（模式识别中心）凭借论文《Less Redundancy: Boosting Practicality of Vision Language Model in Walking Assistants》斩获本届Best Industry Paper Award。这是中国团队时隔两年再次在此顶会拿下工业论文最高荣誉。\n\n**从信息冗余切入，而非暴力堆参数**\n\n视觉语言模型（VLM）在辅助行走设备（如智能眼镜）中的应用，长期面临一个核心矛盾：设备端算力有限，但传统VLM的注意力机制计算量随上下文增长呈O(n²)复杂度，导致响应延迟高、功耗大。腾讯微信AI团队的这篇论文没有走「更大的模型」路线，而是从信息冗余的角度切入——通过减少视觉token中的冗余信息，在保持任务精度的前提下大幅压缩计算量，使模型能够适配边缘设备的实时推理约束。\n\n**与近期效率优化潮流形成呼应**\n\n这一技术路径并非孤例。从SubQ的次二次稀疏注意力（5月5日发布，12M token上下文）、MISA的稀疏注意力+MoE路由（5月13日）到MIT的注意力匹配算法（KV Cache压缩50倍），行业正在从多个维度破解Transformer注意力的扩展瓶颈。腾讯微信AI团队的工作特别之处在于，它将效率优化定向到了具身智能场景——VLM在用户行走过程中需要低延迟、低功耗地持续工作，这种场景约束比通用推理更苛刻，也更能验证效率优化的工程价值。\n\n**辅助行走背后的大机会**\n\n获奖论文聚焦辅助行走而非通用场景，折射出一个值得关注的方向：VLM的落地正在从「展示能力」走向「解决真实问题」。辅助行走设备对延迟和功耗极度敏感，纯云端方案不可行。腾讯微信AI团队选择在此场景深耕，说明端侧VLM的可行性已进入可工程化验证的阶段。随着多模态模型效率持续提升，智能眼镜等穿戴设备上的实时视觉理解，或许会比预期更早成为现实。","https:\u002F\u002F36kr.com\u002Fnewsflashes\u002F3815722275954433","5e4fd3d1-9cb4-44a6-bae5-9ffb449c05c1",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"5e628969-6d2a-437f-998a-104e4b16cfb1","ai-progress",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"0ef8513a-0a26-42f0-b6f9-5b6dadded45c","efficiency",{"id":18,"name":19,"slug":19,"description":13,"color":13},"01598627-1ea6-4b27-a5d8-874971571a71","llm",{"id":21,"name":22,"slug":22,"description":13,"color":13},"499f4b56-819d-49a3-9609-33e775143b86","multimodal","2026-05-19T02:30:00Z","2026-05-19T10:11:34.646018Z","2026-05-19T10:11:34.646027Z",true,"agent",6]