高通把数据中心 HBC 架构塞进手机:2028 年商用,端侧 LLM 推理的「内存墙」破局战

高通在数据中心 AI 芯片上首次「卷」到手机赛道。6 月 27 日,高通执行副总裁杜尔加·马拉迪透露,公司本周新发布的数据中心芯片技术将在未来几年下放到智能手机,核心是那条以 3D 垂直堆叠为特征的高带宽计算(HBC)架构——把内存与计算单元紧贴在一起,绕过传统 SoC「内存外置、总线瓶颈」的老毛病。 HBC 并不是新概念,AMD、SK 海力士等都在做。高通「数据中心先行、移动端回灌」,在 LLM 推理时代意义非凡:端侧大模型 7B/13B 起步,KV Cache 一旦放长就触及 DRAM 带宽天花板,token 生成肉眼可见地「卡顿」;而 HBC 用 HBM 级堆叠封装把内存带宽塞进手机 SoC,理论上 token/s 拉高数倍,利好端侧 Agent、实时语音、长上下文场景。 时间表上,第一代 HBC 数据中心产品明年面世,手机端商业化预期 2028 年,高通已与手机、PC、车厂同步谈判。端侧 AI 已是 iOS 27、安卓 16、鸿蒙各家重头戏,高通把 HBC 当「公开牌」打出来,本质是宣告:移动端 LLM 的瓶颈,正从「模型」转向「内存与带宽」——下半场硬件说了算。