AutoTTS：让大模型自己发现推理时 Scaling 策略

当业界还在手工调推理模式，自动化已悄然登场。推理时计算 Scaling（Test-Time Scaling，TTS）是2026年最火的研究方向之一。从 OpenAI o1 到 DeepSeek R1，业界已形成共识：在推理阶段投入更多算力，可以突破训练算力的天花板。但问题是——当前的 TTS 策略几乎全是手工设计的，研究者凭直觉决定模型何时分支、何时继续思考、何时剪枝。这种人工程度，正在成为 TTS 进一步突破的瓶颈。 arXiv 新论文（2605.08083）提出了 AutoTTS，一个环境驱动的自动化框架。它的核心思路是：将设计对象从具体策略转变为可探索的环境，让模型在预收集的推理轨迹上自动发现最优的 TTS 控制器。具体来说，AutoTTS 将宽度-深度 TTS 建模为控制器合成问题，控制器决定何时分支、何时继续、何时探测、何时剪枝、何时停止——全部基于预收集轨迹和探针信号评估，无需反复调用 LLM，评估成本大幅降低。这一范式转换指向一个深层问题：传统 TTS 的局限不来自算法不够，而来自搜索空间定义方式限制了探索效率。当研究者依赖直觉手工调参，大量有潜力的策略组合从未被充分尝试。AutoTTS 把人从搜索过程中解放，让数据和反馈驱动策略发现——与 LLM 本身通过梯度下降发现高质量语言模式的方式异曲同工。当然，AutoTTS 仍处于研究早期，控制器在复杂任务上的泛化能力、轨迹质量对策略的影响，都还有待验证。但它的核心贡献揭示了一个方向：推理时 Scaling 的下一个突破，可能不来自更长的思维链，而来自更聪明的搜索策略。谁先在这个方向建立方法论壁垒，谁就掌握了推理阶段竞争的主动权。