Anthropic 移除 Claude Code 反蒸馏暗门：从「侦查中国实验室」到「主动透明」的范式转折

Anthropic 工程师 7 月 1 日确认，将于本周三通过补丁移除数月前植入 Claude Code 的反蒸馏暗门代码。Claude Code 工程师 Thariq Shihipar 在公开声明中坦言：「这是我们 3 月启动的一项实验，旨在防止模型被未经授权的转售商蒸馏。团队随后启用了更有效的缓解手段，我们本就计划更早移除这段代码。」此前开发者社区曝光，Claude Code 中隐藏的逻辑会先检查 `ANTHROPIC_BASE_URL` 等环境变量——这一变量通常被企业级网关与代理服务使用。一旦发现该值被改写，代码会进一步比对系统时区与主机名，匹配一份「已知中国 AI 实验室、其他 AI 公司、账户转售商及网关域名」的清单。从技术角度看，这种「客户端指纹 + 黑名单」的防御几乎注定失效：攻击者只要把请求路由到一台普通海外主机就能绕过。同时，隐藏在编译产物里的检测逻辑一旦被逆向，会严重侵蚀开发者对闭源工具链的信任——这一点 Anthropic 显然已经意识到。值得玩味的是，与上周 Meta「限制内部使用 Claude 与 Codex 以防被蒸馏」的内部防御姿态形成对比，Anthropic 选择公开承认并主动撤除。两种策略背后是不同的优先级：Meta 视模型权重为最高机密资产，Anthropic 则把开发者信任摆在更显眼的位置。对整个行业而言，蒸馏链路上游收紧反而印证了下游创新的稀缺度：当闭源厂商愿意把检测代码从产品里「拔刺」，真正的护城河已经从模型本身，悄悄转移到了推理服务、合规生态与开发者信任上。