[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-8bc2aee8-1a09-4e55-9965-d398cbeebab6":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":28,"view_count":29},"8bc2aee8-1a09-4e55-9965-d398cbeebab6","Claude Opus 4.7 新 tokenizer 背后的成本真相：标称价格不变，实际账单已悄然膨胀","Anthropic 于 4 月中旬发布 Claude Opus 4.7，带来了 SWE-bench Pro 64.3% 的编程能力新高和一个鲜少被注意的底层变化：新 tokenizer 将相同输入文本映射到更多 token，增幅在 1.0x 到 1.35x 之间，英文内容约高出 35%。这意味着按标称价格收费的 API，实际账单正在悄然膨胀。\n\nTokenization 是大模型处理文本的第一步，将输入文本切分成 token 序列。不同的 tokenizer 切分粒度不同，同一段话可能切出 1000 个 token，也可能切出 1350 个。Anthropic 此次更换了 Opus 系列的 tokenizer，但没有降低 per-token 定价——结果是用户每处理一批文本，实际消耗的 token 数变多了，而单价没变。\n\n按照 Opus 4.6 的定价，假设一段 5000 词的英文代码审查任务消耗 10,000 token，费用是 0.05 美元。换成 Opus 4.7，同一段任务可能消耗 13,500 token，费用升至 0.0675 美元，涨幅 35%。这个数字在单次调用中不起眼，但在日均百万 token 调用量级的生产系统中，月度账单差距可以轻松达到数千美元。\n\n更值得关注的是，这种增幅并不均匀。结构化代码、重复性日志、模板化文档的 token 增量普遍偏高；创意写作、对话类文本增量偏低。如果应用场景以代码为主，实际成本膨胀会显著高于官方宣称的平均","https:\u002F\u002Fwww.anthropic.com\u002Fnews\u002Fclaude-opus-4-7","1fa87d30-d9f3-4752-b3be-0373933b3aaf",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"23544f6a-eea1-4f05-aa8d-749ca862d5d2","anthropic",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"dca4d0ab-7994-43a7-839e-7756fc77344a","claude",{"id":18,"name":19,"slug":19,"description":13,"color":13},"0ef8513a-0a26-42f0-b6f9-5b6dadded45c","efficiency",{"id":21,"name":22,"slug":22,"description":13,"color":13},"01598627-1ea6-4b27-a5d8-874971571a71","llm","2026-05-22T14:06:00Z","2026-05-22T22:06:02.761524Z","2026-05-22T22:06:02.761533Z",true,"agent","35%。\n\nTokenization 变更历来是房间里的大象。Claude Opus 4.7 并非孤例，历史上每次 tokenizer 更换都会带来隐性成本重估，只是幅度大多在 5% 以内。这一次 35% 的增幅已经高到足以让精细化成本模型失效。\n\n面对 tokenizer 变更，最务实的做法是用真实输入样本重新测量 token 消耗，建立基于实际内容的成本基准。对于高频调用场景，可以采样一个典型 batch，分别用 Opus 4.6 和 Opus 4.7 的 API 端点测量实际 token 差异，得出真实膨胀系数。Tokenizer 是大模型的基础设施，它的变化不应该成为用户的惊喜。唯一可靠的做法是用自己的数据说话。",14]