Nature三连发:三大AI智能体重塑科研新范式
🔬 核心看点
· 2026年5月19日,Nature同日刊发三篇聚焦AI驱动科学发现的研究,彰显AI正深度介入科研核心流程的明确趋势。
· Robin、Co-Scientist、ERA分别聚焦假设生成、候选筛选与代码实现,覆盖科研链条中的关键节点。
· 三项成果共同指向新范式:多智能体协同、实验反馈闭环,以及“人机协作”而非“AI取代人类”。
· 尽管前景广阔,但验证深度、可解释性、跨学科泛化能力及科研公平性,仍是此类系统必须正视的现实挑战。
2026年5月19日,国际顶尖学术期刊Nature做出罕见安排:同日正式刊发三篇围绕AI驱动科学发现的突破性论文。这一举措并非单纯的选题巧合,更像是一种清晰表态——人工智能的角色,正从科研辅助工具,转变为能参与并加速核心科研流程的“伙伴”。
这三项研究分别为Robin、Co-Scientist和ERA。它们切入点各异,却共同勾勒出全新图景:未来科学研究,或许不再由人类独自完成“观察→假设→实验→分析”的闭环,而是由人类与AI分工协作完成。同期,Nature还配发题为“Why AI cannot do science without humans”的社论,为这一变革定调:核心并非替代,而是协作。
传统科学发现依赖一套相对稳定的循环:先观察现象,再提出假设,随后设计实验,最后分析结果并持续修正认知。如今,这条链路中的多个关键环节,已开始由AI系统承担,且不再局限于“辅助计算”层面,而是向更高阶的认知任务迈进。
Robin来自FutureHouse,是首个在实验生物学中真正跑通“假设生成—实验设计—结果分析—假设更新”闭环的半自主多智能体系统。它采用“lab-in-the-loop”模式,即“实验室在环”:AI负责提出方向、生成分析及迭代结论,人类则负责执行湿实验。
Robin的关键突破,在于将文献检索智能体与数据分析智能体连接,形成可持续迭代的闭环流程:生成假设、设计实验、解读结果,再据此更新假设。研究团队利用它寻找干性年龄相关性黄斑变性(dAMD,发达国家主要致盲原因)的治疗候选药物,取得了代表性成果。
在第一轮研究中,Robin筛选出候选药物Y-27632,并自主设计RNA-seq实验。分析显示,该药物可能通过上调脂质外排泵ABCA1发挥作用,这一发现也提示了新的潜在靶点。到了第二轮,Robin基于上一轮结果提出了新候选药Ripasudil。这是一种已在日本获批用于治疗青光眼的药物,但此前从未有人提出将其用于dAMD,因此构成了典型的“老药新用”。同时,系统还识别出另一个机制全新的吞噬增强剂KL001。
更具标志性的是,论文明确指出:正文中的假设、实验方向、数据分析和图表,均由Robin产出,人类研究者的职责主要是执行湿实验。这意味着,AI在此已不只是处理数据,而是开始承担“思考”与“组织科研路径”的任务。
Co-Scientist由Google DeepMind和Google Research开发,建立在Gemini模型之上。其要解决的核心问题是“高质量科学假设难以规模化生产”。相比单次生成一个想法,Co-Scientist更像一个假设工厂,其设计重点在于让大量候选想法经过竞争、批判和优化,最终保留更有价值的结果。
该系统有三项核心设计。第一,采用多智能体架构,让不同智能体分别负责提出、批评和改进假设。第二,引入“锦标赛式进化”机制,让多个假设像参赛者一样相互辩论和竞争,并通过Elo评分系统进行淘汰与晋级。第三,展示了“测试时计算扩展”的价值:研究表明,投入更多推理算力后,系统生成假设的质量可持续提升,相当于把大模型中的“规模定律”推进到了科学创意生产环节。
在急性髓系白血病(AML)的药物重定位任务中,Co-Scientist生成了一批候选药物,其中多种在体外实验中均能在临床相关浓度下有效抑制肿瘤细胞活性,例如KIRA6。这说明,它不仅能提出“听起来合理”的想法,还能在实际实验中给出具备可用性的候选结果。
ERA来自Google Research与哈佛大学,走的是另一条路径。它不直接负责生成科学假设,而是聚焦于科学研究中常被低估、却极其耗时的工程瓶颈:如何把一个想法落成可运行、可优化、可比较的代码。
ERA的方法是将大语言模型(LLM)与树搜索(Tree Search)结合,围绕特定质量指标,在庞大的可能解空间中进行自动探索和迭代,生成成千上万个代码变体,再从中筛选性能更优的方案。换句话说,它所做的不是“写一段代码”,而是把编程与算法调优本身变成一个系统化搜索问题。
在生物信息学领域,ERA在OpenProblems单细胞数据整合基准测试中发现了40种全新的分析方法,且这些方法全部超越了已知最佳人工方法,其中最优方案性能提升达14%。在流行病学领域,它还生成了14个COVID-19住院预测模型,性能超过了美国疾控中心协调的集合预测模型及其他所有单个模型。其意义在于,科学家可将更多精力从繁琐的编程与调参中解放出来,重新聚焦真正的科学问题。
虽然Robin、Co-Scientist和ERA的功能重点各异,但综合来看,会发现一些高度一致的趋势。这些趋势,才是此次Nature“三连发”真正值得关注的地方。
首先,多智能体协作正成为主流方案。这三项研究均未将能力寄托于单一模型,而是采用分工明确的多智能体架构,让不同模块承担检索、判断、批判、优化、生成等任务。这意味着,未来科研AI系统的发展方向,可能不是“一个万能模型包打天下”,而是“专业化AI小分队”协同工作。
其次,“实验室在环”正成为新的标准配置。Robin的迭代闭环如此,Co-Scientist的假设筛选亦如此。它们都不是在封闭环境中凭空输出结论,而是依赖真实实验反馈不断修正结果。换言之,真正有科研价值的AI,不是脱离实验现实的“聪明回答器”,而是能够与实验世界持续互动的系统。
再次,AI被定位为“超能伙伴”,而非完全替代者。Robin需要人类完成湿实验,Co-Scientist需要研究者筛选和判断假设,ERA也依赖科学家去评估代码结果背后的科学意义。Nature的社论同样强调,科学进步不仅依赖效率与算力,也离不开人类的判断力、同理心,以及对复杂性和混乱现实的容纳能力。
最后,也是最深层的变化在于,AI的角色正从“数据分析工具”走向“科学发现主体”。过去,AI更多用于处理已有数据、提升分析效率;现在,它开始参与提出猜想、规划验证路径、构造候选方案等更高阶任务。这种角色变化,意味着科研范式本身正在发生迁移。
当然,这并不意味着AI已能无缝接管科研。相反,正因为这三项工作足够重要,它们暴露出的边界也更值得正视。
首先是验证深度仍然有限。目前发现的候选药物,基本还停留在初步体外实验层面,距离真正的临床应用仍有相当长的路要走。科研上的“可发表结果”与“可转化成果”,中间隔着非常复杂的验证体系。
其次是可解释性问题。尤其像ERA这样的系统,虽能产出性能更强的方案,但其决策过程往往接近“黑箱”。如果一个模型给出更优代码,却不能说明为何更优,那么科学家在接受和推广这些结果时仍会面临阻力。
第三是泛化能力尚未得到充分证明。目前这些成果主要集中在生物医学相关任务中,而它们是否能同样有效地迁移到物理、化学等其他学科,仍然是一个开放问题。不同学科的数据结构、实验范式和知识表达方式差异很大,成功经验未必可直接复制。
第四是科研公平性的风险。运行这类系统通常需要高昂的计算资源与工程投入,这可能进一步拉大不同机构、不同国家之间的科研资源差距。若缺乏合理机制,AI有可能在提升科研效率的同时,也强化科研领域的“贫富分化”。
从更长远的角度看,更深度的实验设备集成、更强的跨领域迁移能力、更好的可解释性,以及与之配套的科研伦理框架,都会成为未来发展中的关键议题。
Nature在2026年5月19日的这次集中发表,更像是一个时代注脚。它表明,“人类+AI”的协作式科研,不再只是概念演示,而正在成为一种可被验证、可部署、可扩展的新范式。
这对科研工作者至少意味着两件事。其一,许多过去高度耗时、重复且探索性很强的工作,将被显著加速,科研“超能力”正逐步变得具体。其二,随着AI能力上升,人类的核心价值并未削弱,反而更加突出:提出真正重要问题的洞察力、判断研究方向价值的能力,以及将科研成果转化为人类福祉的使命感,仍是AI在可预见未来无法替代的部分。
未来的顶尖科学家,或许不再是那个掌握全部实验细节的人,而是最善于调动AI伙伴、并在关键节点做出高质量判断的人。科学发现的流水线正在重构,而人类,依然是这条新流水线中最关键的总设计师。
总结
Robin、Co-Scientist和ERA分别从假设生成、候选筛选与代码实现切入科研流程,显示AI正从辅助分析走向参与科学发现本身。真正值得关注的,不只是单点性能提升,而是“多智能体+实验反馈+人类判断”的协作范式正在成形。AI改变科研已成定局,但最终决定科学方向与价值的,仍然是人类。
(免责声明:部分文字及图片