SkillComposer 把 Agent 的技能选择重做成技能序列生成:GPT-5.2-Codex 提升 +23.1pp

当 Anthropic Skills、xAI Grok Skills、阿里 QwenAgentWorld 都把可重用技能文档塞进 Agent 工程栈,真正的瓶颈已经从“能不能写技能”转移到“会不会挑技能”。arXiv 2606.32025 的 SkillComposer 把组合问题形式化为任务条件下的技能序列预测,联合回答 subset/count/order 三个维度,用受限自回归解码器让结构化维度在一次解码中涌现。在 SkillsBench 上,GPT-5.2-Codex 相对无技能基线提升 +23.1pp,Gemini-3-Pro-Preview 提升 +18.2pp,均超过 Top-3 检索上限,且 prompt token 更省。这意味着 Agent 推理预算需要从“读 prompt”重新分配到“做决策”。