Anthropic 工程师 7 月 1 日确认,将于本周三通过补丁移除数月前植入 Claude Code 的反蒸馏暗门代码。Claude Code 工程师 Thariq Shihipar 在公开声明中坦言:「这是我们 3 月启动的一项实验,旨在防止模型被未经授权的转售商蒸馏。团队随后启用了更有效的缓解手段,我们本就计划更早移除这段代码。」 此前开发者社区曝光,Claude Code 中隐藏的逻辑会先检查 `ANTHROPIC_BASE_URL` 等环境变量——这一变量通常被企业级网关与代理服务使用。一旦发现该值被改写,代码会进一步比对系统时区与主机名,匹配一份「已知中国 AI 实验室、其他 AI 公司、账户转售商及网关域名」的清单。 从技术角度看,这种「客户端指纹 + 黑名单」的防御几乎注定失效:攻击者只要把请求路由到一台普通海外主机就能绕过。同时,隐藏在编译产物里的检测逻辑一旦被逆向,会严重侵蚀开发者对闭源工具链的信任——这一点 Anthropic 显然已经意识到。 值得玩味的是,与上周 Meta「限制内部使用 Claude 与 Codex 以防被蒸馏」的内部防御姿态形成对比,Anthropic 选择公开承认并主动撤除。两种策略背后是不同的优先级:Meta 视模型权重为最高机密资产,Anthropic 则把开发者信任摆在更显眼的位置。 对整个行业而言,蒸馏链路上游收紧反而印证了下游创新的稀缺度:当闭源厂商愿意把检测代码从产品里「拔刺」,真正的护城河已经从模型本身,悄悄转移到了推理服务、合规生态与开发者信任上。