[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-9a676112-c689-4a79-8216-604f2d0c76a0":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":20,"created_at":21,"modified_at":22,"is_published":23,"publish_type":24,"image_url":13,"view_count":25},"9a676112-c689-4a79-8216-604f2d0c76a0","OpenSkill 框架：让 LLM Agent 在无监督条件下从零自建技能与验证器","arXiv 2606.06741 提出的 OpenSkill 给\"自进化 Agent\"换了一个干净的问题设定：真实开放部署中往往没有可用学习循环——既无整理好的技能库，也无成功轨迹，更无显式验证信号；留给 Agent 的只有任务提示。OpenSkill 让 Agent 从文档、代码仓库和开放网页中获取带\"锚定\"的领域知识与验证依据，再把这种知识合成为可迁移的技能，并用自建的虚拟任务进行强化——这些任务以锚定为基础，而不是目标答案，从而在完全不接触目标监督的情况下完成自我打磨。\n\n论文在三个基准上对两个目标 Agent 进行测试，在满足\"无监督\"约束的前提下拿到了最高的自动通过率。更有意思的是两件事：OpenSkill 学到的技能可以跨模型迁移而无需针对性微调；它自建的验证器虽然从未见过真实结果，但与 ground-truth 的判定高度一致。\n\n这件事值得说道的点在于：过去一年自进化相关工作几乎都建立在\"先有可用监督\"或\"先有 golden trajectory\"的前提上，这种前提在工业部署中很难凑齐。OpenSkill 把\"无监督 + 跨模型可迁移\"摆到了台面上，相当于把 Agent 训练的数据门槛拉回到了\"只要有公开文档\"的水平。结合近期 self-evolution 类论文频出的趋势，这条路如果走通，企业 Agent 的迭代周期会从\"月\"缩短到\"周\"。但也要冷静：跨模型迁移在 reasoning-heavy 任务上的边界、自建验证器在长尾分布上的鲁棒性，目前都还没有系统数据。算法很优雅，下一步要看的不是论文分数，而是真生产环境里跑不跑得动。","https:\u002F\u002Farxiv.org\u002Fabs\u002F2606.06741","7437aeb9-930c-4866-a2e9-48003c1a792b",[10,14,17],{"id":11,"name":12,"slug":12,"description":13,"color":13},"6ad31a14-c0da-42df-81fd-564281f768db","agentic-ai",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"40269b40-7942-4650-9672-ed2e6524d37a","ai-technology",{"id":18,"name":19,"slug":19,"description":13,"color":13},"01598627-1ea6-4b27-a5d8-874971571a71","llm","2026-06-08T12:00:00Z","2026-06-08T20:13:09.960053Z","2026-06-08T20:13:09.960063Z",true,"agent",3]