OpenAI生命科学研究利器GPT-Rosalind问世
2026年4月16日,OpenAI正式发布其专为生命科学研究设计的推理模型GPT-Rosalind。该系列模型针对科研工作流进行了深度优化,融合了对化学、蛋白质工程及基因组学等领域的深刻认知,并强化了工具使用能力。
在美国,一款新药从靶点发现到获批上市往往需要10至15年漫长周期。生命科学的进展不仅受制于基础学科的挑战,更因研究流程的繁琐而受阻。科研人员需在海量文献、专业数据库、实验数据及持续演化的假设间穿梭,以生成并评估创新思路。这类工作流普遍存在耗时长、碎片化且难以规模化的问题。
OpenAI坚信,先进的人工智能体系能够协助研究者更高效地完成这些工作流——不仅是提升现有工作的执行效率,更能帮助科学家开拓探索空间,发掘易被忽略的潜在关联,从而更早形成更优质的研究假设。
通过赋能证据整合、假说构建、实验设计等多步骤研究任务,该模型致力于帮助科研人员加快早期发现进程。长期来看,这些系统有望助力生命科学机构实现以往无法达成的突破,并显著提升成功率。
目前,GPT-Rosalind以研究预览形式,通过团队可信访问计划,在ChatGPT、Codex及API端向符合条件的客户开放。同时,还提供免费的生命科学研究插件,便于科学家将模型接入50余个科学工具与数据源。
性能与评估
研发团队针对GPT-Rosalind在科学发现与产业研究基础方面的多项能力展开评估。这些测试涵盖科学子领域的核心推理能力,包括化学反应机理、蛋白质结构解析、突变效应预测、分子间相互作用及DNA序列的系统发育分析等。
同时,通过检验模型解读实验结果、识别专业级模式并融合外部信息的能力,评估其能否支撑真实研究场景下的工作流,进而设计后续实验方案。此外,还测试了模型选择并运用合适计算工具、数据库及领域专属功能以增强推理的能力。综合而言,这些评估展现了模型在科学研究全流程中的进步,证明其能更有效地辅助研究者完成高难度的发现任务。
行业评估
OpenAI团队通过一系列公开基准对GPT-Rosalind展开测评。在以真实世界生物信息学与数据分析为核心的BixBench基准中,GPT-Rosalind在已公布成绩的模型中取得了领先成绩。
在LABBench2基准测试中,该测试覆盖文献检索、数据库查询、序列操作及实验方案设计等多元研究任务,GPT-Rosalind在11项任务中的6项上超越GPT-5.4。其中提升最显著的是CloningQA任务,该任务要求为分子克隆实验设计完整的DNA与酶试剂方案。
此外,团队还与基因治疗AI设计领域的先驱企业Dyno Therapeutics合作,采用未公开、无污染的序列数据,对模型进行RNA序列功能预测与生成的评估。该表现与57项AI生物领域的人类专家历史评分进行对比。在Codex应用中直接测试时,预测任务排名超越95%的人类专家,序列生成任务则达到约84%的专家水平。
这些评估为科研人员日常所依赖的证据生成、复杂数据分析及生物学结论推导等工作流,提供了具有实际价值的表现参考。
连接科学家所用的工具
科研人员可采用OpenAI团队为Codex开发的新型生命科学研究插件。该插件集成一系列模块化功能,覆盖人类遗传学、功能基因组学、蛋白质结构解析、生物化学分析、临床证据整合及公共研究发现追踪等广泛领域。
相关链接:https://github.com/openai/plugins/tree/main/plugins/life-science-research
这些功能作为协调层,协助科研人员更高效地处理宽泛、模糊且多步骤的科研问题。它们可接入50余个公共多组学数据库及文献