AI盘点旧论文,科研却走入死胡同?
点击上方↑“泰思学术 ”看看有多少位朋友关注
科研属于人类,还是属于人工智能?
除了筛选蛋白质结构,AI 究竟能为科研做什么真正有价值的事?
不是修改论文辞藻,不是查找资料数据,更不是无中生有地编造,2026 年 6 月 21 日,沃顿商学院副教授 Ethan Mollick 将自己二十年前攻读研究生时的首篇学术论文,提交给了 GPT-5.5 Pro。
数分钟后,Mollick 凝视着屏幕,哑口无言。
01
GPT-5.5"复盘"陈年论文
Ethan Mollick 向 GPT-5.5 Pro 下达的指令极其简单:"找出问题,加以更新。"
Mollick 呈交的论文,是 2006 年刊载于IEEE计算机历史年鉴的《Establishing Moore's Law》(确立摩尔定律)
这是他以 MIT Sloan 研究生身份发表的首篇正式学术论文。那一年,iPhone 尚未问世,深度学习还蜷缩在某人的幻灯片里。
颇为巧合的是,这篇文章本身就在探讨"知识如何随时间推移而演变与重构",而此次 AI 对这篇论文恰恰执行了同种性质的操作。
据 Mollick 在 X 平台分享的截图所示,GPT-5.5 Pro 的"复盘"过程分为四个步骤:
第一步:获取新数据。模型将摩尔定律的时间序列数据延伸至 2021 年前后,把原论文 2006 年截止的数据线一举延长了 15 年。
第二步:分析数据,绘制图表。模型完成了完整的统计分析,生成了可视化图表。
第三步:构建可复现文件。AI 提供了一整套可执行的分析包,涵盖代码、数据及必要步骤。任何研究者均可下载、运行、验证结果。
第四步:拓展论点,填补疏漏。AI 指出 Mollick 当年遗漏了一个"重大主题"。尽管 Mollick 未公开具体内容,但他在推文中坦言:AI 的产出"比我多年前撰写的内容要复杂得多"。
随后,他又追问道:"自这篇论文发表以来,哪些文献与其主题或发现存在对话或张力?"
撰写过论文的人都清楚,在信息检索中,各大数据库与相关文献多如繁星,即便依据关键词检索,遗漏或疏忽的文献也为数众多,几乎不可能系统追踪所有跨学科的发散讨论,更不必说在相同关键词下,还要剔除那些与研究课题无关的综述或实验。
而这篇 2006 年的论文,二十年间牵涉数百篇相关文献,GPT-5.5 Pro 凭借百万级别的上下文窗口,同时处理了全部相关信息,给出跨领域的系统性回应。
这正是身处特定领域的学者自身极难独立完成的工作。
Mollick 在 X 上的感慨迅速在 X 平台引发热议:17.6 万次浏览,1100 多个赞,500 余人收藏。
学术界、科技圈都在评论区探讨同一个问题:若将这种 AI 大规模应用于过去数十年的学术研究,将会发生什么?
02
Mollick并非首开先河之人
Mollick 的帖子发布后,愈来愈多的学者分享了自身的类似经历。
英国学者 Eliot Attridge 的回应令许多人倍感温暖。他将自己三十一年前的博士论文扫描后投喂给 AI。
"It critiqued it (no holds barred — which was a little confronting) and then looked at what happened since."
令他意外的是,AI 阴差阳错地验证了他当年论文中的诸多预测,这些预测在随后数十年间陆续得到证实,Attridge 本人却浑然不知。
Attridge 始终觉得"自己不如留在学术界的同侪成功",AI 意外地给予了他一次迟来的肯定。
"It was satisfying to read all of the things that had happened after that I had a part in (but hadn't been aware of)."
03
AI 正在重构整个科研版图
Mollick 的实验固然足够引人注目,但它不过是冰山露出水面的那一小部分。水面之下,AI 正以令人目不暇接的速度,重新定义"做科研"这三个字的真正内涵。
2026 年 6 月的夏季达沃斯论坛上,专家们披露了一组数据:全球逾八成的科学家正在运用 AI 开展研究。AI 工具已深度嵌入科研的每个环节,从查阅文献到处理数据,从编写代码到生成报告。爱思唯尔的数据显示,38% 的科研人员借助AI分析研究数据,另有38% 直接采用 AI 起草论文。
换言之,身边十位从事科研的人里,至少有八位已离不开 AI。
更具意味的是,尽管人人都在使用,完全信赖 AI 可靠性的科研人员却不足四分之一。一边离不了,一边信不过,这种矛盾状态恰恰说明 AI 正经历一场剧烈而 messy 的转型。
今年 5 月,清华大学与北京中关村学院联合推出了名为 AutoSOTA 的 AI 科研智能体。该智能体在一周时间内,自主发现了 105 个超越人类最新研究成果的 SOTA(当前最优水平)模型。简而言之,AI 自己改进了 AI,而且改得比人类科学家更出色。
AutoSOTA 并非个例。谷歌 DeepMind 的 Co-Scientist 在急性髓系白血病药物筛选中命中了 3 个阳性候选分子;深度原理团队的 MIRA 平台通过递归自训练,在 40 项材料性质预测任务中全面刷新SOTA;还有一个名为 EinsteinArena 的平台,截至 2026 年 5 月,AI智能体已发现 12 个超越人类或 AI 已有解决方案的新 SOTA 成果。
上海科学智能研究院院长漆远形容得颇为贴切:具备高度能动性与自主学习能力的智能体,正推动科研迈入一个新的临界点,AI 正从科研流程中的"助手"蜕变为"科研合伙人"。
然而,AI 给科研带来的变化并非全是福音。
今年 1 月,清华大学与芝加哥大学的团队在 Nature 上发表了一项涵盖 4100 余万篇论文、跨越 45 年的重磅研究。结果表明:AI 确实让科学家的个人产出激增,使用 AI 的科学家年均发表论文量高出 3.02 倍,引用量高出 4.84 倍,连晋升都比不用 AI 的人平均早 1.37 年。
但硬币的另一面是:整个科学界的集体知识广度下降了4.63%,科学家之间的跨界互动减少了22%。研究者们集体涌向那些"数据充沛、问题清晰"的热门领域,而那些数据稀缺、问题模糊的真正前沿,反而遭到冷落。
清华大学电子工程系教授李勇解释道,"我们发现,AI 的高效引导了研究者集体涌向少数适合AI研究的热门山峰,这种群体登山模式虽加速了已知问题的解决,却无形中固化了科学探索的路径,系统性地削弱了科学家向未知山峰探索的广度。"
说白了,AI 让大家在已知的跑道上奔得更快了,但"我们正在构建的,是一个加速逼近现有知识边界的科学世界,而非一个能不断拓展新知识边界的未来世界。"
所以你看,即便 AI 拥有超越人类的运算能力与检索能力,真正的核心仍在于作为人的判断力。正如 Mollick 作为论文原作者,才能一眼辨出 AI 产出中哪些是真正的延伸、哪些是包装精美的空洞辞藻。
真正的进步,永远源自人脑对未知的永恒好奇。
AI 是工具,我们真正需要警惕的是这个工具"过于自信"。Digg 科技聚合站的独立报道显示,缺乏领域专家把关时,AI 会"自信地泛滥错误分析"。
而对于以往发表过的论文,或许可以转换思路了:学术界始终将"出版"视为终点,论文发了,事情便盖棺定论了。Mollick 的实验展示了一种截然不同的可能性:出版只是首次审查的终结,AI 时代下,每一篇论文皆可变为"活文档"。
Mollick 在推文末尾抛出的那个问题,尚无人能给出完满答案:
"Should we be doing that already?"