PLaMo 3.0 Prime 正式发布：PFN 把「日语实战」做成日本国产 LLM 的差异化战场

6 月 22 日，Preferred Networks（PFN）正式发布从零训练的国产生成式大模型 PLaMo 3.0 Prime。它不卷「谁更聪明」，而是把战场拉到日语业务的成本与合规上。技术上看，Prime 同步上线两个版本：Reasoning 模型应对复杂推理、专业问答与代码生成；Non-reasoning 模型面向文档摘要、客服、信息抽取等低延迟场景，二者共享一套权重族，可通过 API 切换。上下文从 β 版的 64K 扩到 256K——PFN 用 YaRN 加持续预训练实现，超过 gpt-oss-120b 的 128K、Claude Haiku 4.5 的 200K，与 Qwen3.6-27B 持平，但距 DeepSeek V4 Pro / GPT-5.5 Pro 的 1M 仍有差距。 PFN 还重新设计了日语专用 tokenizer，使日语输入 token 数更紧凑，直接压低 API 成本与长文档处理开销。定位上，PFN 把 PLaMo 摆在「同价位实用 tier」框架：开源侧对照 Qwen3.6-27B、gpt-oss-120b，闭源侧对照 GPT-5.4 mini、Claude Haiku 4.5。在 15 项日语、英语、工具调用、代码、长上下文、法律、医疗 benchmark 中，Prime 在指示跟随、对话、工具使用、医疗、代码、HELM Safety 安全评估上达到或超过对手，但在 Web 检索、长上下文、数学推理和日本法令问答上仍落后。合规侧，模型基于与日本 NICT 共享的预训练成果，使用 NICT 数据做安全对齐。部署形态除 API、亚马逊 Bedrock Marketplace、Snowflake Marketplace 外，最关键的是支持本地化部署（on-premise）。这意味着医疗电子病历、金融客户数据、政府个人信息这类不能出云的场景，第一次有了一个权重与训练数据均来自日本本土的 LLM 选项。判断：PLaMo 3.0 Prime 不会出现在全球 LLM 排行榜头条，但它揭示了一条路径——非英语国家的国产 LLM 不必硬刚「最强模型」，可以把差异化做在本地业务的成本结构与数据合规上。如果这条路被验证跑通，全球 AI 基础设施选型逻辑会从「全球最强」向「本地最适配」分化。