Anthropic 于 4 月中旬发布 Claude Opus 4.7,带来了 SWE-bench Pro 64.3% 的编程能力新高和一个鲜少被注意的底层变化:新 tokenizer 将相同输入文本映射到更多 token,增幅在 1.0x 到 1.35x 之间,英文内容约高出 35%。这意味着按标称价格收费的 API,实际账单正在悄然膨胀。 Tokenization 是大模型处理文本的第一步,将输入文本切分成 token 序列。不同的 tokenizer 切分粒度不同,同一段话可能切出 1000 个 token,也可能切出 1350 个。Anthropic 此次更换了 Opus 系列的 tokenizer,但没有降低 per-token 定价——结果是用户每处理一批文本,实际消耗的 token 数变多了,而单价没变。 按照 Opus 4.6 的定价,假设一段 5000 词的英文代码审查任务消耗 10,000 token,费用是 0.05 美元。换成 Opus 4.7,同一段任务可能消耗 13,500 token,费用升至 0.0675 美元,涨幅 35%。这个数字在单次调用中不起眼,但在日均百万 token 调用量级的生产系统中,月度账单差距可以轻松达到数千美元。 更值得关注的是,这种增幅并不均匀。结构化代码、重复性日志、模板化文档的 token 增量普遍偏高;创意写作、对话类文本增量偏低。如果应用场景以代码为主,实际成本膨胀会显著高于官方宣称的平均