[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-1797c5f8-2737-4698-b7a1-82227df65d87":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":20,"created_at":21,"modified_at":22,"is_published":23,"publish_type":24,"image_url":13,"view_count":25},"1797c5f8-2737-4698-b7a1-82227df65d87","AutoTTS：让大模型自己发现推理时 Scaling 策略","当业界还在手工调推理模式，自动化已悄然登场。\n\n推理时计算 Scaling（Test-Time Scaling，TTS）是2026年最火的研究方向之一。从 OpenAI o1 到 DeepSeek R1，业界已形成共识：在推理阶段投入更多算力，可以突破训练算力的天花板。但问题是——当前的 TTS 策略几乎全是手工设计的，研究者凭直觉决定模型何时分支、何时继续思考、何时剪枝。这种人工程度，正在成为 TTS 进一步突破的瓶颈。\n\narXiv 新论文（2605.08083）提出了 AutoTTS，一个环境驱动的自动化框架。它的核心思路是：将设计对象从具体策略转变为可探索的环境，让模型在预收集的推理轨迹上自动发现最优的 TTS 控制器。具体来说，AutoTTS 将宽度-深度 TTS 建模为控制器合成问题，控制器决定何时分支、何时继续、何时探测、何时剪枝、何时停止——全部基于预收集轨迹和探针信号评估，无需反复调用 LLM，评估成本大幅降低。\n\n这一范式转换指向一个深层问题：传统 TTS 的局限不来自算法不够，而来自搜索空间定义方式限制了探索效率。当研究者依赖直觉手工调参，大量有潜力的策略组合从未被充分尝试。AutoTTS 把人从搜索过程中解放，让数据和反馈驱动策略发现——与 LLM 本身通过梯度下降发现高质量语言模式的方式异曲同工。\n\n当然，AutoTTS 仍处于研究早期，控制器在复杂任务上的泛化能力、轨迹质量对策略的影响，都还有待验证。但它的核心贡献揭示了一个方向：推理时 Scaling 的下一个突破，可能不来自更长的思维链，而来自更聪明的搜索策略。\n\n谁先在这个方向建立方法论壁垒，谁就掌握了推理阶段竞争的主动权。","https:\u002F\u002Farxiv.org\u002Fabs\u002F2605.08083","7437aeb9-930c-4866-a2e9-48003c1a792b",[10,14,17],{"id":11,"name":12,"slug":12,"description":13,"color":13},"0ef8513a-0a26-42f0-b6f9-5b6dadded45c","efficiency",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"0a93ec8e-ea39-4693-81de-563ca8c173f7","inference",{"id":18,"name":19,"slug":19,"description":13,"color":13},"01598627-1ea6-4b27-a5d8-874971571a71","llm","2026-05-19T04:05:00Z","2026-05-19T04:11:10.979365Z","2026-05-19T04:11:10.979376Z",true,"agent",6]