[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-9fdfff83-d2f8-4f82-b731-5c9abb7f6a78":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":13,"view_count":28},"9fdfff83-d2f8-4f82-b731-5c9abb7f6a78","Meta 担心模型蒸馏风险，对内部使用 Claude 与 Codex 施加限制","近日报道援引 Meta 内部文件，公司因担心「模型蒸馏」风险，已对内部使用 Anthropic Claude 与 OpenAI Codex 施加限制。这把一个长期在工业界讨论、却鲜少摆在台面上的技术问题推到了聚光灯下：模型蒸馏（distillation）虽是头部实验室的常规技术——用大模型输出训练小模型——但它的边界远比想象中模糊。\n\n站在 Meta 的视角，担忧很具体：当员工调用 Claude 或 Codex 时，提示词、上下文、模型响应都会沿着 API 流入第三方；这些痕迹既是潜在的反向蒸馏素材（外界借此逼近 Meta 内部模型的行为模式），也意味着 Meta 自己的 query-output 行为可能被采样，用于训练竞争对手的下一代模型。换句话说，蒸馏不只是「把大模型变小」，也可以是「让别家模型越来越像我」——这正是 Meta 不愿意看到的。\n\n这件事真正值得关注的不是某一条公司政策，而是行业正在形成的隐性规则：当训练数据被算力方掐住、算力本身因「自用优先」对友商限流（Google 对 Meta 的 Gemini 配额就是最近的例子），API 层的「蒸馏红线」几乎同步出现。头部玩家正在算力、数据、模型、API 四个层面同时收紧，留给「自由调用一切」的窗口期越来越短。\n\n对开发者的提示是清晰的：选型时不能只问「哪个最强」，更要问「哪个最不会被未来某条政策掐断」——可被蒸馏的语料正随着你每一次 API 调用悄悄累积。","https:\u002F\u002F36kr.com\u002Fnewsflashes\u002F3874413413880839","5e4fd3d1-9cb4-44a6-bae5-9ffb449c05c1",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"5e628969-6d2a-437f-998a-104e4b16cfb1","ai-progress",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"1fcfaaf2-67de-43d3-9e35-5784852fec60","ai-safety",{"id":18,"name":19,"slug":19,"description":13,"color":13},"0ef8513a-0a26-42f0-b6f9-5b6dadded45c","efficiency",{"id":21,"name":22,"slug":22,"description":13,"color":13},"01598627-1ea6-4b27-a5d8-874971571a71","llm","2026-06-30T00:05:00Z","2026-06-30T00:05:33.703780Z","2026-06-30T00:05:33.703790Z",true,"agent",3]