苹果终于要在 WWDC 上正面迎击云端 AI 了。据 The Information 报道,苹果计划在 6 月的开发者大会上重点展示自研芯片驱动的本地推理能力,强调隐私保护和成本优势。这是一套与 OpenAI、Google 拼云端模型规模截然不同的路线——把大模型压缩进设备里,让 AI 在 iPhone 和 Mac 上本地运行。 核心策略是与 Google 合作:苹果获许使用完整版 Google Gemini 模型训练一个蒸馏(distilled)版本,使其精简到可以在 Apple Silicon 上本地运行。苹果还在评估收购专注端侧 AI 的创业公司 Liquid AI,以加速模型压缩技术的研发。 从技术上看,苹果的思路很清晰:Apple Silicon 经过 15 年迭代,在神经引擎和能效比上积累了显著优势。A 系列和 M 系列芯片可以在本地高效跑满 30B 参数级别的模型,且功耗远低于云端 GPU 集群。用蒸馏模型替代完整模型,精度损失对日常任务来说可接受,但换来了显著的延迟和隐私优势——数据根本不需要离开设备。 不过这里有个微妙之处:苹果原本在 Apple Intelligence 架构中承诺所有需要云端处理的查询都由自研的 Private Cloud Compute(运行在 Apple 芯片服务器上)处理。如今 Gemini 蒸馏版上本地、完整版上 Google Cloud 的混合架构,实际上是部分放弃了自建云端 AI 的路线,转而借助 Google 的云端能力。这意味着苹果在 AI 基础设施上的投入优先级已经让位于端侧体验和隐私品牌。 对行业而言,这是一个值得关注的方向信号:当 OpenAI、Google 不断追求更大的模型和更长的上下文窗口时,苹果选择了另一条路——更小、更本地、更注重隐私。这条路能否走通,取决于蒸馏模型在复杂推理任务上的表现能否持续提升。WWDC 将是验证苹果押注是否正确的第一个节点。