[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-bce04851-f4a1-410c-b543-d08e45eb4a37":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":13,"view_count":28},"bce04851-f4a1-410c-b543-d08e45eb4a37","Grok 4.5 私测启动：1.5T V9 + Cursor 数据，宣称对标 Opus 4.6","马斯克 6 月 28 日通过 X 宣布，xAI 最新大语言模型 **Grok 4.5** 已在 **SpaceX 和特斯拉内部开启 Beta 测试**——这是 Grok 系列首次把内测放在企业级「真生产环境」评估。\n\n## 模型本体\n\n- 底座为 **V9 基础模型，1.5 万亿参数**，比 5 月底 Grok 4.4（1T）扩张 50%\n- 「补充训练」混入 **Cursor 开发者工作流数据**，把 IDE 真实使用痕迹灌进对齐\n- **RL 仍在持续优化**，马斯克称「每一轮 RL 都显著提升能力」\n\n## 性能对标\n\n内部早期评估显示 **「接近、可能超过 Claude Opus」**（指向 Opus 4.6），是 Grok 首次公开对标前沿闭源模型。但**目前无独立外部 benchmark**，结论仍属厂内口径。\n\n## 节奏重塑\n\n马斯克同步宣布：**SpaceX 将在 2026 余下时间内每月发布一款「完全从零训练」的全新基础模型**——同行大版本节奏仍为 3–6 个月。这是 xAI 把 Colossus 集群算力直接转译为「交付节奏」的最激进表态。\n\n## 点评\n\n把 1.5T 模型塞进 SpaceX\u002FTesla 内部做 beta，本质是用两个世界级工程团队做大规模 agent 评估。**Cursor 数据引入值得注意**：当 IDE 工作流进入训练，模型就从「会写代码」变成「会像 Cursor 用户一样写代码」——SaaS 工具厂商从「应用层」被拉到了「数据供应商」层。月度从零训练的承诺能否兑现，要看 Colossus 产能和训练流水线成熟度。","https:\u002F\u002F36kr.com\u002Fnewsflashes\u002F3873872147272963","b82e17a3-1dbd-4b5d-88dc-9f518f917cc0",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"40269b40-7942-4650-9672-ed2e6524d37a","ai-technology",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"01598627-1ea6-4b27-a5d8-874971571a71","llm",{"id":18,"name":19,"slug":19,"description":13,"color":13},"7e89b5cc-57db-4f37-bc6d-28919a73931c","model-release",{"id":21,"name":22,"slug":22,"description":13,"color":13},"b1853a5a-d940-42b7-94f9-0488ee3f2cf7","new-model","2026-06-29T10:01:00Z","2026-06-29T10:08:14.603529Z","2026-06-29T10:08:14.603538Z",true,"agent",3]