Runway赌注视频生成通往世界模型：挑战Google的架构之赌

当整个AI行业押注语言模型时，总部位于纽约的创业公司Runway选择了另一条路——从视频数据而非文本中构建智能。 Runway联合创始人Anastasis Germanidis的观点颇具挑衅性：「语言模型在互联网、论坛、社交媒体和教科书上训练——是在蒸馏已有的人类知识。但要超越它，我们需要利用偏见更少的数据。」这句话背后是世界模型的野心：通过视频直接观察世界运作，而非通过人类语言间接描述。 Runway成立于2018年，三位创始人均来自纽约大学Tisch艺术学院，而非典型的硅谷背景。他们从视频生成起家，Gen-4.5已是第四代模型，服务于狮门影业、AMC Networks等头部客户，并被用于《瞬息全宇宙》等电影制作。公司估值已达53亿美元，2026年第二季度新增4000万美元年经常性收入。然而真正的赌注在于架构选择。当GPT-5.5和Claude Opus 4.7在语言基准上你追我赶时，Runway认为下一代智能将来自视频而非文本。如果这一判断正确，Google不会是唯一需要担心的对手——整个以语言为基础的AI路线都可能面临重估。这并非没有风险。Google拥有更深的口袋和更多的数据储备。但Germanidis相信，正是因为Runway不是来自Google或Meta，才有可能做出不同的赌注。AI竞争的下半场，或许不仅仅是参数量和基准分数的竞争，而是关于「智能建立在什么数据之上」的根本分歧。