标签

AI研究员来了:AI能自己搞科研,论文直接发Workshop

发布时间:2026-03-29 10:12来源:微信阅读:8

你有没有想过这个问题:AI写代码已经很强了,那AI能不能自己搞科研、写论文?

SakanaAI 说:能,而且他们还把这件事做到了Workshop级别。

就在几天前,他们发布了 AI Scientist-v2,一个基于 Agentic Tree Search 的自动化科研发现系统。GitHub 页面显示项目已经拿到了 3400+ stars,今天又新增了 500+ stars,在 AI 圈的热度相当可观。项目地址:https://github.com/SakanaAI/AI-Scientist-v2

简单来说,就是给AI一个研究方向,它能自己设计实验、自己跑实验、自己写论文,最后产出一篇看起来还像样的学术文章。

这事儿听起来有点离谱,但看完技术细节之后,不得不说——这确实比上一代强了不少。

在说 v2 之前,先简单回顾一下背景。

AI Scientist 这个项目最早是 SakanaAI 在去年推出的,目标是让AI独立完成科研全流程。当时 v1 版本已经能生成论文,但质量普遍被认为停留在"玩具级别"——创新性不足、实验设计简单、论文结构也不够规范。

当时社区的反馈是:AI写的论文,审稿人一眼就能认出来。

v2 的野心比 v1 大得多。它不再满足于"生成一篇看起来像论文的东西",而是追求"生成的论文达到 Workshop 级别"——换句话说,至少在某些 AI 学术 Workshop 里,不会因为质量太差直接被拒。

这个目标本身就有意思。Workshop 级别不算高,但也不算低,是一个相对务实的基准线。

v2 最大的变化是引入了 Agentic Tree Search(基于智能体的树搜索)。

这个词听起来很学术,我来解释一下它的核心思想。

传统的 AI Scientist v1 在生成论文时,基本是"一条道走到黑"——给定一个假设,就开始验证,不太会回头重新审视自己的路径是否正确。

v2 引入了一个"探索-评估-回溯"的机制:

这个设计背后的逻辑是:科研探索本质上是一个树形搜索问题,从一个初始假设出发,分叉出多种可能的验证路径。v2 的做法是并行探索多条路径,然后通过评估函数筛选出最有价值的分支继续深挖。

这比 v1 的"单线思维"要合理得多。人类科学家做研究也是这样——不是一条路走到底,而是不断评估、调整、甚至推翻重来。

SakanaAI 官方给出了 v2 生成论文的评估数据:

不过有个问题:这些数字是 SakanaAI 自己给出的,目前没有第三方独立验证。而且"通过 Workshop 评审标准"这个表述本身也有一定弹性——不同 Workshop 的评审标准差异很大。

不过,从 GitHub 上公开的示例论文来看,v2 生成的论文确实比 v1 像样多了:结构更完整、相关工作部分更充分、实验部分有数据支撑。有几篇甚至让我这个看惯论文的人都觉得"不像是AI写的"。

但问题也很明显。

这个项目研究下来,有几个绕不开的问题:

问题一:创新性依然有限

AI Scientist 本质上还是在已知方法上的组合和微创新。真正推动科学进步的"范式级"创新,目前的AI还做不到。

说白了,AI现在能做的是"在已知框架里找最优解",而不是"创造一个新框架"。

问题二:实验的可靠性存疑

AI自己设计的实验,代码是自己写的,数据是自己生成的,这里面的偏差(bias)很难控制。没有人类专家的监督,AI可能会"自圆其说"——设计一些看起来像在验证假设、实际上在循环论证的实验。

问题三:论文的学术价值难以判断

AI能写出一篇结构完整的论文,但论文里的"insight"——那些真正有价值的见解——依然高度依赖训练数据的质量。如果AI只是在已有知识的范围内排列组合,那它永远无法产生超越人类当前认知边界的洞见。

问题四:伦理问题

AI独立产出的科研成果,如果最后发表,署名是谁?AI-Scientist?这在学术圈目前是完全空白的地带。

说了这么多,很多人可能会问:这跟我们有什么关系?

我的看法是,这件事的影响可能比你想象的更近。

首先,它加速了"AI辅助科研"的普及。

即使 AI Scientist-v2 还达不到顶级论文的水平,它已经能帮助研究者快速验证想法、做初步实验。对资源有限的中小实验室来说,这是一个有价值的工具。

其次,它让"AI写代码"和"AI做研究"之间的边界变得模糊。

这里有个误区:有人觉得AI能写代码、能做研究,人类就没价值了。

实际上,AI做的是"执行层面的研究",人类做的是"定义层面的研究"。AI能设计一个"颠覆现有范式"的研究方向吗?目前还不行。

第三,它提醒我们重新思考"什么是科研"。

如果AI能做大部分的数据收集、实验设计、论文写作工作,那人类研究者的核心价值在哪里?

我认为是在于:提出有意义的问题、定义研究方向、对结果进行深度解读和判断。这些目前还是人类更擅长的事情。

AI Scientist-v2 的出现,确实让"AI搞科研"这件事从科幻走进了现实。虽然还远没有达到"AI替代人类科学家"的程度,但它已经证明:在某些特定场景下,AI可以独立完成一个有价值的科研闭环。

常有人说:AI不会取代你,但会用AI的人会取代你。

对科研工作者来说,学会用这类工具,比担心被取代更重要。

至于这件事本身是好是坏,我认为它是中性的,关键看谁在用、怎么用。

感谢各位朋友的支持与关注!

如果你觉得内容对您有帮助,请不吝点赞、在看,分享给身边更多的朋友。

如果你有任何疑问或建议,欢迎在评论区留言交流。

作者:智物社 | 欢迎关注交流