AI科学家崛起,人类科研者如何再定义自身角色?
设置星标★关注,从此你的世界多点科学~
越来越多企业与研究机构正公开展示其借助人工智能取得的前沿科研成果。但这类‘AI科学家’系统,真能担当创新先锋与知识探索者的重任吗?倘若它们确已具备强大能力,人类科研人员又该怎样重新锚定自己在实验室中的职能、在学术成果中的署名位置?
那是2025年4月,一场重量级人工智能大会即将开幕。科学家卡尔(Carl)已向大会同行评审专家组提交了4篇论文,期待成果获得公开亮相。经双盲评审后,其中3篇成功入选。
评审专家一致认可卡尔成果质量高、创新性强——但他们并不知晓:这3篇论文实为AI生成,而‘卡尔’本身即是一套AI系统。(当然,整个写作过程仍包含不同程度的人类协作。)研发该系统的科技机构名为Autoscience Institute,宣称此模型可显著提速人工智能领域的科研进程。
短短一年间,类似卡尔的‘AI科学家’层出不穷。例如,美国非营利机构FutureHouse推出了科研智能体罗宾(Robin)与科斯莫斯(Kosmos);更早之前,日本AI初创公司Sakana AI已发布全自动科学发现平台——产品名称直称‘AI科学家’。
AI科学家由多个大型语言模型(LLM)协同构建。Autoscience Institute联合创始人埃利奥特·考恩(Eliot Cowan)指出:不同于通用聊天机器人,以卡尔为代表的AI科学家专为科研闭环设计——从生成假说、验证思路到产出成果,全程参与。此类系统可在不同层级上自主检索文献、提出猜想、设计实验、解析数据,并最终达成原创性发现;其核心目标,是借力AI提升科研效率与成果密度。
至于AI科学家是否会取代人类科研者——业界普遍持否定态度。
然而,无论替代与否,科研与AI深度融合的自动化浪潮,已悄然激起多重情绪涟漪。正如知名学者朱利安·托格利乌斯(Julian Togelius)所言:‘你很难不心生忐忑,毕竟提出假说、梳理文献这些事,本就是我们作为研究者的立身之本。’
托格利乌斯兼具计算机科学与AI研究双重背景。事实上,不少同领域的AI研究者均流露隐忧:AI科学家或挤压青年科研人才成长空间,或将大量低信度、不可靠的数据注入学术体系,进而侵蚀公众对科学发现的信任根基。
英国艾伦·图灵研究所学者大卫·莱斯利(David Leslie)则强调:‘科研是一项高度成熟、深度社会化且由人类主导的实践。传统科研方式与计算系统的运行逻辑存在根本差异——AI究竟应嵌入其中,还是另辟路径?’
过去五年,AI驱动的自动化系统已在多个领域催生重大突破。
例如,谷歌DeepMind推出的AlphaFold可高精度预测蛋白质三维构型,运算效率远超人工实验。其主创德米斯·哈萨比斯(Demis Hassabis)与约翰·江珀(John Jumper),亦因该贡献荣膺2024年诺贝尔化学奖。(详见:‘物理’和‘化学’争得面红耳赤,生命科学:‘你们聊,我先走’……2024年诺贝尔化学奖揭晓)
莱斯利曾提出‘计算弗兰肯斯坦拼接体’(computational Frankensteins)概念:将生成式AI基础设施、算法模块及其他组件深度融合,继而开发应用,尝试模拟原本必须依赖人类亲身介入的复杂社会实践——科学发现正是其典型场景之一。
仅2025年内,Sakana AI、Autoscience Institute、FutureHouse三家机构便高调发布首批AI生成的科研成果。部分隶属美国政府的科研力量也逐步接纳AI:在阿贡国家实验室、橡树岭国家实验室及劳伦斯伯克利国家实验室,科学家已建成由AI驱动的全自动材料研究平台。
这些AI系统与大语言模型类似,擅长整合海量文献、挖掘庞杂数据,从中识别潜在规律。在材料科学中,它们可辅助设计并筛选新型功能材料;在亚原子粒子物理领域,亦能助人获得突破性认知。
莱斯利指出:‘AI系统能在百万、十亿甚至万亿量级变量间建立人类无法企及的关联——单凭这一能力,就为科研开辟了前所未有的疆域。’
举例而言,FutureHouse研发的罗宾通过文献挖掘,锁定一种潜在治疗致盲性眼病的候选药物,并同步提出验证方案与数据分析流程。
无限可能的另一面,是科研“注水”风险的加剧。
正如卡内基梅隆大学计算机科学家尼哈尔·沙阿(Nihar Shah)所警示:未来或将涌现大量低质量、低原创性的AI生成论文,充斥于学术文献库。不过,沙阿对AI赋能新发现的整体前景仍持‘审慎乐观’立场。
值得一提的是,其团队曾对两款科研辅助AI模型展开压力测试:一是Sakana AI的‘AI科学家2.0’,二是AMD与约翰霍普金斯大学合作开发的‘智能体实验室’(Agent Laboratory),定位为科研助理。
测试中,‘AI科学家2.0’在某项任务中报告95%乃至100%准确率;但研究人员事先在数据集中人为注入噪声,如此结果显然失真。‘智能体实验室’亦出现同类问题:偶有虚构合成数据用于分析,却在终稿中谎称依据原始数据集完成。
为此,沙阿团队专门开发新算法,用于标记典型方法学缺陷,如‘仅选用有利数据子集进行分析’‘选择性呈现阳性结果’等。
此外,当前生成式AI系统仍面临原创能力瓶颈。
例如,有专家评估GPT-4仅能支撑渐进式科学进展;又如,《科学-免疫学》(Science Immunology)2025年刊文指出:尽管AI聊天机器人可高效整合文献,但在疫苗学领域,尚无法提出具备洞察力的新假说或实验路径。
沙阿强调,AI科学家的持续演进,并不意味着人类科研者将被边缘化。
‘即便机器能力臻至极致,人类依然拥有不可替代的发挥空间;只是当下尚难精准界定——未来人类将在科研链条的哪些环节持续发光?’
用莱斯利的话讲:科学研究从来都是‘富有人性’的事业,它依赖人类的诠释、建构、思辨与探索,常受研究者个体价值观与主观偏好影响。而旨在预测最优解的计算系统,其本质逻辑与此迥异。它所能捕捉的,不过是浩瀚科学实践冰山之一角。
‘须知,科研的复杂性不仅源于技术本身,更根植于制度结构、方法论传统与历史脉络;甚至受限于不公、偏见等社会性因素——这些力量共同决定着谁得以进入科研场域、谁被拒之门外、科学服务的对象是谁、哪些学科长期停滞不前……’
不少专家主张:AI科学家并非替代者,而是科研者的新型协作者,如同显微镜与望远镜之于早期科学家,助力人类拓展认知边界。
Sakana AI初代‘AI科学家’发布时即声明:‘人类科学家的核心价值不会削弱,反而将随技术跃迁而升级角色,在科研价值链中迈向更高阶定位。’
现实中,已有大量科研人员开始思考:未来如何与AI协同共进?其中一项焦点议题始终未变——‘如何审慎核查并验证AI产出的研究成果?’
沙阿建议:未来学术期刊与会议应强制审查科研全流程日志及生成代码,以此验证AI成果的真实性,并定位潜在方法论漏洞。
考恩表示,Autoscience Institute等机构正着力构建合乎伦理规范的AI系统,力求让AI遵循‘与人类科研人员同等严格的学术实验准则’。
值得一提的是,前文所述‘卡尔’系统已被预设多项伦理约束,包括严禁虚假署名与抄袭、确保结果可复现、规避人类受试者及敏感数据使用等。
What the Rise of AI Scientists May Mean for Human Research
《世界科学》杂志版在售中 欢迎订阅
月刊定价
15元/期
全年订阅价
180元
点击左侧图片或以下方订阅方式选购
方式一:
扫描二维码,“杂志铺”(第三方平台)订阅有折扣~
方式二:
全国各地邮局订阅 邮发代号:4-263
方式三:
机构订阅,请拨打
021-53300839;
021-53300838
推荐阅读
AI时代,我们如何实现认识方式的跃迁?
强化学习先驱萨顿:数据时代终将过时,AI将踏入社会,像人一样去体验世界
“驱逐”奥特曼的那位OpenAI创始人认为,用于AI训练的数据集已接近枯竭…
AI如何重塑科学知识生产新格局?︱科学学