Meta 担心模型蒸馏风险,对内部使用 Claude 与 Codex 施加限制

近日报道援引 Meta 内部文件,公司因担心「模型蒸馏」风险,已对内部使用 Anthropic Claude 与 OpenAI Codex 施加限制。这把一个长期在工业界讨论、却鲜少摆在台面上的技术问题推到了聚光灯下:模型蒸馏(distillation)虽是头部实验室的常规技术——用大模型输出训练小模型——但它的边界远比想象中模糊。 站在 Meta 的视角,担忧很具体:当员工调用 Claude 或 Codex 时,提示词、上下文、模型响应都会沿着 API 流入第三方;这些痕迹既是潜在的反向蒸馏素材(外界借此逼近 Meta 内部模型的行为模式),也意味着 Meta 自己的 query-output 行为可能被采样,用于训练竞争对手的下一代模型。换句话说,蒸馏不只是「把大模型变小」,也可以是「让别家模型越来越像我」——这正是 Meta 不愿意看到的。 这件事真正值得关注的不是某一条公司政策,而是行业正在形成的隐性规则:当训练数据被算力方掐住、算力本身因「自用优先」对友商限流(Google 对 Meta 的 Gemini 配额就是最近的例子),API 层的「蒸馏红线」几乎同步出现。头部玩家正在算力、数据、模型、API 四个层面同时收紧,留给「自由调用一切」的窗口期越来越短。 对开发者的提示是清晰的:选型时不能只问「哪个最强」,更要问「哪个最不会被未来某条政策掐断」——可被蒸馏的语料正随着你每一次 API 调用悄悄累积。