GPT-Rosalind：OpenAI 推出首款生命科学专用推理模型

一款新药从靶点发现到FDA获批，平均需要10到15年。这个漫长周期里，早期研究的质量会像复利一样向下游传导——选对靶点，临床成功的概率就会更高。问题在于，生命科学研究者面对的不是单一任务，而是文献、数据库、实验数据、不断演进的假设之间的反复横跳，流程碎片化，难以规模化。 4月16日，OpenAI推出了GPT-Rosalind，这是他们首款专门面向生命科学领域的推理模型。顾名思义，这个名字致敬了Rosalind Franklin——那位通过X射线衍射图揭示DNA双螺旋结构、却长期被低估的英国化学家。模型针对生物学、药物发现和转化医学的工作流进行了专项优化，结合了更强的工具使用能力，能够在化学分子反应、蛋白质结构与突变效应、基因组序列解读等复杂任务中进行深度推理。从技术指标看，GPT-Rosalind在BixBench等生命科学专业基准测试中表现领先。更值得关注的是其工作流设计：模型可以调用超过50种科学工具和数据库，完成文献综述、序列到功能的解读、实验规划、数据分析等多步骤任务。合作方包括Amgen、Moderna、Allen Institute、Thermo Fisher Scientific等头部机构，目前以research preview形式在ChatGPT、Codex和API中通过trusted access program开放。这是OpenAI首次针对特定科学垂直领域推出专用模型。在此之前，Claude、Gemini等通用大模型虽已在科研场景中广泛使用，但生命科学对精确性和领域知识的要求极高，通用模型在工具调用和长程科学推理上往往力不从心。GPT-Rosalind的出现说明，LLM在科研领域的应用正在从"什么都能做"走向"某些领域做得更好"。垂直专用化可能成为下一阶段大模型竞争的一个分水岭。当通用能力的天花板被反复逼近，针对高价值垂直场景的深度优化——专用数据、专用工具链、专用评估标准——或许才是真正拉开差距的方式。