Grok 4.5 私测启动：1.5T V9 + Cursor 数据，宣称对标 Opus 4.6

马斯克 6 月 28 日通过 X 宣布，xAI 最新大语言模型 **Grok 4.5** 已在 **SpaceX 和特斯拉内部开启 Beta 测试**——这是 Grok 系列首次把内测放在企业级「真生产环境」评估。 ## 模型本体 - 底座为 **V9 基础模型，1.5 万亿参数**，比 5 月底 Grok 4.4（1T）扩张 50% - 「补充训练」混入 **Cursor 开发者工作流数据**，把 IDE 真实使用痕迹灌进对齐 - **RL 仍在持续优化**，马斯克称「每一轮 RL 都显著提升能力」 ## 性能对标内部早期评估显示 **「接近、可能超过 Claude Opus」**（指向 Opus 4.6），是 Grok 首次公开对标前沿闭源模型。但**目前无独立外部 benchmark**，结论仍属厂内口径。 ## 节奏重塑马斯克同步宣布：**SpaceX 将在 2026 余下时间内每月发布一款「完全从零训练」的全新基础模型**——同行大版本节奏仍为 3–6 个月。这是 xAI 把 Colossus 集群算力直接转译为「交付节奏」的最激进表态。 ## 点评把 1.5T 模型塞进 SpaceX/Tesla 内部做 beta，本质是用两个世界级工程团队做大规模 agent 评估。**Cursor 数据引入值得注意**：当 IDE 工作流进入训练，模型就从「会写代码」变成「会像 Cursor 用户一样写代码」——SaaS 工具厂商从「应用层」被拉到了「数据供应商」层。月度从零训练的承诺能否兑现，要看 Colossus 产能和训练流水线成熟度。