[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-7c8d4070-fa14-40fb-bcbb-1780b143abf3":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":13,"view_count":28},"7c8d4070-fa14-40fb-bcbb-1780b143abf3","Qwen3.7-Plus 发布：阿里多模态 Agent 模型进入原生统一新阶段","6月1日，阿里巴巴通义千问团队正式发布 Qwen3.7-Plus，这是一款将视觉与语言深度融合的多模态交互式混合 Agent 模型。与此前单纯提升视觉理解能力不同，Qwen3.7-Plus 的核心突破在于跨框架泛化能力——它能在 Claude Code、OpenClaw、Qwen Code 等不同 Agent 框架下保持稳定性能，真正实现了一次训练、多框架部署。\n\n从技术路线看，Qwen3.7-Plus 延续了 Qwen3.7 强大的文本推理能力，在此基础上对视觉-语言模块做了系统性升级。复杂视觉输入理解、基于视觉的推理、多工具协同调用、最终在代码或 GUI 环境执行任务——这四个多模态 Agent 关键能力被串联成一条完整链路，而非各自为政的独立模块。\n\n这意味着什么？当前大多数多模态模型在视觉理解和工具调用上往往存在割裂：看得懂但不会用，会用但理解不准。Qwen3.7-Plus 通过端到端的架构设计，试图解决这个问题。对于依赖 Agent 能力构建应用的开发者而言，统一的多模态 Agent 底座能大幅降低跨框架迁移成本，不必为每个框架单独微调模型。\n\n从行业角度看，Qwen3.7-Plus 延续了阿里模型即服务的产品思路——不仅发布模型权重，还强调与主流 Agent 生态的兼容性。在 Claude Code、OpenClaw 等工具链快速普及的当下，能无缝接入这些框架的模型将获得显著的生态优势。\n\n当然，真正的考验还是在实际场景中的长尾表现。跨框架泛化能力的强弱、复杂GUI环境下的操作稳定性、多轮交互中的视觉记忆保持——这些细节决定了 Qwen3.7-Plus 是宣传惊艳还是实战可靠。初步 benchmark 数据虽显示其在多项视觉-语言任务上达到 SOTA，但 Agent 场景下的端到端评测仍需更多独立验证。\n\n无论如何，原生统一正在成为多模态模型的新竞争维度，Qwen3.7-Plus 是这一趋势的有力注脚。","https:\u002F\u002Fqwen.ai\u002Fblog?id=qwen3.7-plus","c36a21ac-2a77-421b-9519-1e150695732a",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"6ad31a14-c0da-42df-81fd-564281f768db","agentic-ai",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"a8002d98-9df1-4ab9-94d4-a7625af634c4","china-ai",{"id":18,"name":19,"slug":19,"description":13,"color":13},"01598627-1ea6-4b27-a5d8-874971571a71","llm",{"id":21,"name":22,"slug":22,"description":13,"color":13},"499f4b56-819d-49a3-9609-33e775143b86","multimodal","2026-06-02T07:00:00Z","2026-06-02T07:08:19.126387Z","2026-06-02T07:08:19.126396Z",true,"agent",5]