OpenAI赋能生命科学,推出独立模型线
大家好,我是深耕AI领域的老章
OpenAI 近日重磅发布新功能,瞄准药企、实验室及公共卫生领域——GPT-Rosalind 功能迭代
该模型线独立于ChatGPT与Sora,专门针对生命科学研究,以DNA双螺旋发现者Rosalind Franklin命名
小黑总结了此次更新的核心:生命科学不能仅靠会答题的大模型,必须整合模型、工具、数据及可复查成果
继续阅读
先梳理一下发展脉络:
定位清晰:仅面向合格组织的科研工作台,与面向大众的通用ChatGPT截然不同
具体功能包括:
听起来就像在对话框里安插了一位全职博士后
简而言之:模型能力增强、工具丰富、可信访问范围扩大
模型方面,在GPT-5.5工具使用与代码能力基础上叠加了生命科学专业增强,聚焦药物发现、药物化学与基因组学
工具方面,新增两个Codex插件作为执行层:
访问方面,研究预览扩展至全球合格组织,企业走治理审核+企业级部署,政府与公共卫生团队走专门的可信访问审批
以下图展示GPT-Rosalind工作台层级:从科研问题到模型推理,Codex执行层,最终形成可审计复查产物:
以下图展示NGS Analysis插件运行画面:左侧分子变化记录,右侧用药匹配与疗效曲线,所有产物均可追溯:
这种设计至关重要:药物研发需审计,谁、何时、用何数据、得出何结论,均需可复盘
这是我认为本次更新最值得关注的点
过往大模型评测多为“我问你答”:MMLU、GPQA、AIME等独立评分。OpenAI此次将生命科学评测改为LifeSciBench,思路大变
LifeSciBench不只考察答题,更考察能否走完完整科研工作流:证据处理、分析、设计、推理、验证、转化、沟通
文中给出demo任务:准备AAV9微型抗肌萎缩蛋白基因疗法的FDA Type B会议
想拿高分,模型须逐项质疑证据是否支持加速批准,至少需关注:
即回答需经得起FDA评审专家的质询
选取部分跑分数据:
中文产品页的“每token性能提升”更直观:GeneBench提升53.7%,MedChem Bench提升18.0%,LabWorkBench提升19.6%,LifeSciBench提升4.4%
绝对分数虽不惊人,但相比GPT-5.5同条件,token消耗更少,这对需长期大量分析的药企是真金白银的节省
以下图展示产品页的靶点优先级+基因证据可视化,展示模型如何排列多源证据:
若说模型升级是引擎更强劲,两个Codex插件则为引擎连接传动轴
Life Sciences Research Plugin覆盖方向极广:
远不止调用API:识别科研问题类型、实体识别(基因/蛋白/疾病等)、选择工具组合、交叉核查重要结论
NGS Analysis Plugin更技术化,目标是从原始测序输入开始,跑完可复现分析流
亮点在于:优先使用公开、可安装、可复现的工具及nf-core工作流,先本地检查再安装,每次运行生成带时间戳目录(含清单、验证摘要、日志、QC报告等)
我第一眼便想到:生信工程师常写的那些杂乱脚本,被OpenAI彻底“抄”了底
以下图展示bulk RNA-seq和单细胞RNA-seq工作画面,从原始数据到QC报告、UMAP全自动:
文中demo场景极具代入感:科学家拿到液体肿瘤活检,用NGS插件查ctDNA记录定位KRAS G12C,再切到Research插件查该靶点最新抑制剂及耐药机制
模型→插件→数据→可复查产物,这套组合对真实实验室意义非凡,远胜单独使用ChatGPT
中文产品页还放了一张有趣图:蛋白结合实验摘要+3D结构视图,辅助蛋白结合实验设计与分析
证据热图是亮点:将多数据源的支持/反驳信号叠加,便于研究者一眼看清证据强度
合作伙伴名单扎实:Amgen、Novo Nordisk、Thermo Fisher Scientific、Moderna、Allen Institute、Oracle Health and Life Sciences
Amgen反馈称:生命科学问题复杂、数据独特,一旦出错风险大,OpenAI能力有望加速药物交付
此话虽似商业互吹,但反映了真实需求
此处需单独说明:GPT-Rosalind不面向大众
OpenAI设定的可信访问门槛包括:
访问路径分两类:
申请入口:
国内多数老板可能用不上,但这种“不普惠”反而是该产品线最值得借鉴的设计哲学:专业模型+受控访问+行业合规,比无门槛先发更适合医疗、金融、政务
若说GPT-Rosalind是给科学家造的工作台,Rosalind Biodefense则是给公共安全造的盾牌
OpenAI逻辑直白:AI加速生物学进展,攻防同步,进攻方变强,防御方必须同步增强
Rosalind Biodefense将GPT-Rosalind提供给可信开发者、政府及公共卫生团队,重点覆盖:
初期支持组织包括Fourth Eon、SecureDNA、SecureBio、Detection、ProEquip等;政府及实验室涉及Lawrence Livermore National Laboratory、Johns Hopkins Applied Physics Laboratory、CEPI
OpenAI还将赞助这些组织的GPT-Rosalind访问并提供启动支持,用商业模型反哺公共安全,难能可贵
本次更新关键不在分数提升幅度,而在OpenAI承认了一件事:
高复杂度生命科学领域,单点答题无用,必须打包模型、工具、数据、可复查产物成完整工作流,方能进入实验室
GPT-Rosalind产品路径值得观察:
适合关注:
GPT-Rosalind单看基准提升不夸张,但LifeSciBench“考工作流”评测+Codex插件“执行+可复查产物”工程,将成专业领域模型标准范式
我个人给这套思路打90分——不只是炫技发布,更像将AI真正推进专业行业的可复用模板