当业界还在手工调推理模式,自动化已悄然登场。 推理时计算 Scaling(Test-Time Scaling,TTS)是2026年最火的研究方向之一。从 OpenAI o1 到 DeepSeek R1,业界已形成共识:在推理阶段投入更多算力,可以突破训练算力的天花板。但问题是——当前的 TTS 策略几乎全是手工设计的,研究者凭直觉决定模型何时分支、何时继续思考、何时剪枝。这种人工程度,正在成为 TTS 进一步突破的瓶颈。 arXiv 新论文(2605.08083)提出了 AutoTTS,一个环境驱动的自动化框架。它的核心思路是:将设计对象从具体策略转变为可探索的环境,让模型在预收集的推理轨迹上自动发现最优的 TTS 控制器。具体来说,AutoTTS 将宽度-深度 TTS 建模为控制器合成问题,控制器决定何时分支、何时继续、何时探测、何时剪枝、何时停止——全部基于预收集轨迹和探针信号评估,无需反复调用 LLM,评估成本大幅降低。 这一范式转换指向一个深层问题:传统 TTS 的局限不来自算法不够,而来自搜索空间定义方式限制了探索效率。当研究者依赖直觉手工调参,大量有潜力的策略组合从未被充分尝试。AutoTTS 把人从搜索过程中解放,让数据和反馈驱动策略发现——与 LLM 本身通过梯度下降发现高质量语言模式的方式异曲同工。 当然,AutoTTS 仍处于研究早期,控制器在复杂任务上的泛化能力、轨迹质量对策略的影响,都还有待验证。但它的核心贡献揭示了一个方向:推理时 Scaling 的下一个突破,可能不来自更长的思维链,而来自更聪明的搜索策略。 谁先在这个方向建立方法论壁垒,谁就掌握了推理阶段竞争的主动权。