6 月 22 日,Preferred Networks(PFN)正式发布从零训练的国产生成式大模型 PLaMo 3.0 Prime。它不卷「谁更聪明」,而是把战场拉到日语业务的成本与合规上。 技术上看,Prime 同步上线两个版本:Reasoning 模型应对复杂推理、专业问答与代码生成;Non-reasoning 模型面向文档摘要、客服、信息抽取等低延迟场景,二者共享一套权重族,可通过 API 切换。上下文从 β 版的 64K 扩到 256K——PFN 用 YaRN 加持续预训练实现,超过 gpt-oss-120b 的 128K、Claude Haiku 4.5 的 200K,与 Qwen3.6-27B 持平,但距 DeepSeek V4 Pro / GPT-5.5 Pro 的 1M 仍有差距。 PFN 还重新设计了日语专用 tokenizer,使日语输入 token 数更紧凑,直接压低 API 成本与长文档处理开销。 定位上,PFN 把 PLaMo 摆在「同价位实用 tier」框架:开源侧对照 Qwen3.6-27B、gpt-oss-120b,闭源侧对照 GPT-5.4 mini、Claude Haiku 4.5。在 15 项日语、英语、工具调用、代码、长上下文、法律、医疗 benchmark 中,Prime 在指示跟随、对话、工具使用、医疗、代码、HELM Safety 安全评估上达到或超过对手,但在 Web 检索、长上下文、数学推理和日本法令问答上仍落后。 合规侧,模型基于与日本 NICT 共享的预训练成果,使用 NICT 数据做安全对齐。部署形态除 API、亚马逊 Bedrock Marketplace、Snowflake Marketplace 外,最关键的是支持本地化部署(on-premise)。这意味着医疗电子病历、金融客户数据、政府个人信息这类不能出云的场景,第一次有了一个权重与训练数据均来自日本本土的 LLM 选项。 判断:PLaMo 3.0 Prime 不会出现在全球 LLM 排行榜头条,但它揭示了一条路径——非英语国家的国产 LLM 不必硬刚「最强模型」,可以把差异化做在本地业务的成本结构与数据合规上。如果这条路被验证跑通,全球 AI 基础设施选型逻辑会从「全球最强」向「本地最适配」分化。