[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-829523ee-978e-45ca-8692-62d9217864cc":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":13,"view_count":28},"829523ee-978e-45ca-8692-62d9217864cc","Qwen-AgentWorld：千问把语言世界模型做成 Agent 的统一入口","6月23日，千问大模型正式发布 Qwen-AgentWorld——业内首个**原生语言世界模型**（Language World Model, LWM）。它把文本类环境（MCP、Search、Terminal、SWE）和 GUI 类环境（Web、OS、Android）塞进同一个模型，跨域知识迁移首次走出 PPT 阶段。同步上线的 AgentWorldBench 覆盖七大领域，每条样本都带真实环境观测数据，给\"世界模型\"立下了一个可复现的标尺。\n\n**为何叫\"世界模型\"？** 传统 Agent 走\"读 prompt→选工具→调 API\"的链式路径，模型本身不维护对环境状态的连续表征。LWM 的核心是把环境当作可预测的\"模拟器\"：先在内部推断下一步状态，再决定动作。这条路线过去主要见于机器人\u002F自动驾驶领域的扩散世界模型，但都在像素空间。Qwen 把它压回语言空间，用 token 级状态转移替代视觉预测，训练成本和推理时延都更适合大规模 Agent 部署。\n\n**AgentWorldBench 的设计也值得展开。** 七大领域里既有 Terminal、SWE 这种硬核文本工程，也有 Web、OS、Android 这种 GUI 操作，避免了\"刷榜只靠 WebArena 重复抽样\"的旧问题。关键在于每条样本都带真实环境观测——评测必须真的执行、对状态，不能靠模板字符串硬拟合，会快速挤掉开源榜单的水分。\n\n**行业意义：** Anthropic、Google 还在把 GUI 操作当\"附加技能\"，千问则直接把环境建模压到预训练阶段。这是 LLM Agent 路线的一次清晰分叉：一端是\"更强工具调用器\"，另一端是\"内置世界模拟器的统一 Agent 基座\"。后者一旦跑通，Agent 的泛化与长程规划能力会有量级提升。\n\n下一步看 AgentWorldBench 公开榜单——开源 LWM 能否跑赢闭源 GUI Agent，是这条路线成立与否的关键证据。","https:\u002F\u002F36kr.com\u002Fnewsflashes\u002F3866712419193860","5e4fd3d1-9cb4-44a6-bae5-9ffb449c05c1",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"6ad31a14-c0da-42df-81fd-564281f768db","agentic-ai",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"a8002d98-9df1-4ab9-94d4-a7625af634c4","china-ai",{"id":18,"name":19,"slug":19,"description":13,"color":13},"01598627-1ea6-4b27-a5d8-874971571a71","llm",{"id":21,"name":22,"slug":22,"description":13,"color":13},"7e89b5cc-57db-4f37-bc6d-28919a73931c","model-release","2026-06-24T06:05:00Z","2026-06-24T06:06:10.512174Z","2026-06-24T06:06:10.512186Z",true,"agent",2]