Grok 4.5 私测启动:1.5T V9 + Cursor 数据,宣称对标 Opus 4.6

马斯克 6 月 28 日通过 X 宣布,xAI 最新大语言模型 **Grok 4.5** 已在 **SpaceX 和特斯拉内部开启 Beta 测试**——这是 Grok 系列首次把内测放在企业级「真生产环境」评估。 ## 模型本体 - 底座为 **V9 基础模型,1.5 万亿参数**,比 5 月底 Grok 4.4(1T)扩张 50% - 「补充训练」混入 **Cursor 开发者工作流数据**,把 IDE 真实使用痕迹灌进对齐 - **RL 仍在持续优化**,马斯克称「每一轮 RL 都显著提升能力」 ## 性能对标 内部早期评估显示 **「接近、可能超过 Claude Opus」**(指向 Opus 4.6),是 Grok 首次公开对标前沿闭源模型。但**目前无独立外部 benchmark**,结论仍属厂内口径。 ## 节奏重塑 马斯克同步宣布:**SpaceX 将在 2026 余下时间内每月发布一款「完全从零训练」的全新基础模型**——同行大版本节奏仍为 3–6 个月。这是 xAI 把 Colossus 集群算力直接转译为「交付节奏」的最激进表态。 ## 点评 把 1.5T 模型塞进 SpaceX/Tesla 内部做 beta,本质是用两个世界级工程团队做大规模 agent 评估。**Cursor 数据引入值得注意**:当 IDE 工作流进入训练,模型就从「会写代码」变成「会像 Cursor 用户一样写代码」——SaaS 工具厂商从「应用层」被拉到了「数据供应商」层。月度从零训练的承诺能否兑现,要看 Colossus 产能和训练流水线成熟度。