OpenAI 在 6 月 3 日为 GPT-Rosalind 系列推出重大更新,核心是同步发布 LifeSciBench —— 一个由外部生命科学专家评判的端到端评测基准。与传统基准只考察单点能力不同,LifeSciBench 覆盖证据处理、分析、设计与优化、科学推理、验证与运维、转化与沟通六大工作流,更贴近真实研究流程。新版模型继承了 GPT-5.5 的 Agent 编程和工具调用能力,在药物化学、基因组学、定量生物学和湿实验排障等核心任务上取得广泛提升。OpenAI 以 trusted-access 部署结构向全球合格机构开放研究预览。这是 OpenAI 第一次把"前沿模型"与"垂直科学 AI"画等号。如果说 Claude Mythos 走的是高安全门槛的生物防御路线,GPT-Rosalind 这次的更新则更像是"为科学家造模型":评测由领域专家出题、由真实工作流驱动,回归到研究的本来面目。当通用榜单逐渐失效,垂直大模型的下一步比拼,将是能否真正得到领域专家的认可。