Runway赌注视频生成通往世界模型:挑战Google的架构之赌

当整个AI行业押注语言模型时,总部位于纽约的创业公司Runway选择了另一条路——从视频数据而非文本中构建智能。 Runway联合创始人Anastasis Germanidis的观点颇具挑衅性:「语言模型在互联网、论坛、社交媒体和教科书上训练——是在蒸馏已有的人类知识。但要超越它,我们需要利用偏见更少的数据。」这句话背后是世界模型的野心:通过视频直接观察世界运作,而非通过人类语言间接描述。 Runway成立于2018年,三位创始人均来自纽约大学Tisch艺术学院,而非典型的硅谷背景。他们从视频生成起家,Gen-4.5已是第四代模型,服务于狮门影业、AMC Networks等头部客户,并被用于《瞬息全宇宙》等电影制作。公司估值已达53亿美元,2026年第二季度新增4000万美元年经常性收入。 然而真正的赌注在于架构选择。当GPT-5.5和Claude Opus 4.7在语言基准上你追我赶时,Runway认为下一代智能将来自视频而非文本。如果这一判断正确,Google不会是唯一需要担心的对手——整个以语言为基础的AI路线都可能面临重估。 这并非没有风险。Google拥有更深的口袋和更多的数据储备。但Germanidis相信,正是因为Runway不是来自Google或Meta,才有可能做出不同的赌注。AI竞争的下半场,或许不仅仅是参数量和基准分数的竞争,而是关于「智能建立在什么数据之上」的根本分歧。