Claude Opus 4.7 新 tokenizer 背后的成本真相：标称价格不变，实际账单已悄然膨胀

Anthropic 于 4 月中旬发布 Claude Opus 4.7，带来了 SWE-bench Pro 64.3% 的编程能力新高和一个鲜少被注意的底层变化：新 tokenizer 将相同输入文本映射到更多 token，增幅在 1.0x 到 1.35x 之间，英文内容约高出 35%。这意味着按标称价格收费的 API，实际账单正在悄然膨胀。 Tokenization 是大模型处理文本的第一步，将输入文本切分成 token 序列。不同的 tokenizer 切分粒度不同，同一段话可能切出 1000 个 token，也可能切出 1350 个。Anthropic 此次更换了 Opus 系列的 tokenizer，但没有降低 per-token 定价——结果是用户每处理一批文本，实际消耗的 token 数变多了，而单价没变。按照 Opus 4.6 的定价，假设一段 5000 词的英文代码审查任务消耗 10,000 token，费用是 0.05 美元。换成 Opus 4.7，同一段任务可能消耗 13,500 token，费用升至 0.0675 美元，涨幅 35%。这个数字在单次调用中不起眼，但在日均百万 token 调用量级的生产系统中，月度账单差距可以轻松达到数千美元。更值得关注的是，这种增幅并不均匀。结构化代码、重复性日志、模板化文档的 token 增量普遍偏高；创意写作、对话类文本增量偏低。如果应用场景以代码为主，实际成本膨胀会显著高于官方宣称的平均