QuasiMoTTo 把 test-time scaling 的“独立同分布”默认换成 quasi-Monte Carlo:相关采样让推理算力不再浪费

QuasiMoTTo(arXiv:2607.01179)把 test-time scaling 的“独立同分布”默认假设翻过来:用 quasi-Monte Carlo 取代伪随机数生成器,通过 inverse-CDF 把 autoregressive 采样重参数化,输出“相关但边际分布仍合法”的样本,让同等推理算力覆盖更宽输出空间,对应更高 pass@k 或更少采样数,同时验证它可作为 i.i.d. 的 drop-in 替代品用于 RL 训练。