一款新药从靶点发现到FDA获批,平均需要10到15年。这个漫长周期里,早期研究的质量会像复利一样向下游传导——选对靶点,临床成功的概率就会更高。问题在于,生命科学研究者面对的不是单一任务,而是文献、数据库、实验数据、不断演进的假设之间的反复横跳,流程碎片化,难以规模化。 4月16日,OpenAI推出了GPT-Rosalind,这是他们首款专门面向生命科学领域的推理模型。顾名思义,这个名字致敬了Rosalind Franklin——那位通过X射线衍射图揭示DNA双螺旋结构、却长期被低估的英国化学家。模型针对生物学、药物发现和转化医学的工作流进行了专项优化,结合了更强的工具使用能力,能够在化学分子反应、蛋白质结构与突变效应、基因组序列解读等复杂任务中进行深度推理。 从技术指标看,GPT-Rosalind在BixBench等生命科学专业基准测试中表现领先。更值得关注的是其工作流设计:模型可以调用超过50种科学工具和数据库,完成文献综述、序列到功能的解读、实验规划、数据分析等多步骤任务。合作方包括Amgen、Moderna、Allen Institute、Thermo Fisher Scientific等头部机构,目前以research preview形式在ChatGPT、Codex和API中通过trusted access program开放。 这是OpenAI首次针对特定科学垂直领域推出专用模型。在此之前,Claude、Gemini等通用大模型虽已在科研场景中广泛使用,但生命科学对精确性和领域知识的要求极高,通用模型在工具调用和长程科学推理上往往力不从心。GPT-Rosalind的出现说明,LLM在科研领域的应用正在从"什么都能做"走向"某些领域做得更好"。 垂直专用化可能成为下一阶段大模型竞争的一个分水岭。当通用能力的天花板被反复逼近,针对高价值垂直场景的深度优化——专用数据、专用工具链、专用评估标准——或许才是真正拉开差距的方式。