Meta 担心模型蒸馏风险，对内部使用 Claude 与 Codex 施加限制

近日报道援引 Meta 内部文件，公司因担心「模型蒸馏」风险，已对内部使用 Anthropic Claude 与 OpenAI Codex 施加限制。这把一个长期在工业界讨论、却鲜少摆在台面上的技术问题推到了聚光灯下：模型蒸馏（distillation）虽是头部实验室的常规技术——用大模型输出训练小模型——但它的边界远比想象中模糊。站在 Meta 的视角，担忧很具体：当员工调用 Claude 或 Codex 时，提示词、上下文、模型响应都会沿着 API 流入第三方；这些痕迹既是潜在的反向蒸馏素材（外界借此逼近 Meta 内部模型的行为模式），也意味着 Meta 自己的 query-output 行为可能被采样，用于训练竞争对手的下一代模型。换句话说，蒸馏不只是「把大模型变小」，也可以是「让别家模型越来越像我」——这正是 Meta 不愿意看到的。这件事真正值得关注的不是某一条公司政策，而是行业正在形成的隐性规则：当训练数据被算力方掐住、算力本身因「自用优先」对友商限流（Google 对 Meta 的 Gemini 配额就是最近的例子），API 层的「蒸馏红线」几乎同步出现。头部玩家正在算力、数据、模型、API 四个层面同时收紧，留给「自由调用一切」的窗口期越来越短。对开发者的提示是清晰的：选型时不能只问「哪个最强」，更要问「哪个最不会被未来某条政策掐断」——可被蒸馏的语料正随着你每一次 API 调用悄悄累积。