苹果 WWDC 押注端侧 AI：蒸馏 Gemini 入局隐私计算新战场

苹果终于要在 WWDC 上正面迎击云端 AI 了。据 The Information 报道，苹果计划在 6 月的开发者大会上重点展示自研芯片驱动的本地推理能力，强调隐私保护和成本优势。这是一套与 OpenAI、Google 拼云端模型规模截然不同的路线——把大模型压缩进设备里，让 AI 在 iPhone 和 Mac 上本地运行。核心策略是与 Google 合作：苹果获许使用完整版 Google Gemini 模型训练一个蒸馏（distilled）版本，使其精简到可以在 Apple Silicon 上本地运行。苹果还在评估收购专注端侧 AI 的创业公司 Liquid AI，以加速模型压缩技术的研发。从技术上看，苹果的思路很清晰：Apple Silicon 经过 15 年迭代，在神经引擎和能效比上积累了显著优势。A 系列和 M 系列芯片可以在本地高效跑满 30B 参数级别的模型，且功耗远低于云端 GPU 集群。用蒸馏模型替代完整模型，精度损失对日常任务来说可接受，但换来了显著的延迟和隐私优势——数据根本不需要离开设备。不过这里有个微妙之处：苹果原本在 Apple Intelligence 架构中承诺所有需要云端处理的查询都由自研的 Private Cloud Compute（运行在 Apple 芯片服务器上）处理。如今 Gemini 蒸馏版上本地、完整版上 Google Cloud 的混合架构，实际上是部分放弃了自建云端 AI 的路线，转而借助 Google 的云端能力。这意味着苹果在 AI 基础设施上的投入优先级已经让位于端侧体验和隐私品牌。对行业而言，这是一个值得关注的方向信号：当 OpenAI、Google 不断追求更大的模型和更长的上下文窗口时，苹果选择了另一条路——更小、更本地、更注重隐私。这条路能否走通，取决于蒸馏模型在复杂推理任务上的表现能否持续提升。WWDC 将是验证苹果押注是否正确的第一个节点。