标签

AI科研新突破:全自动论文生成系统问世

发布时间:2026-04-03 07:18来源:微信阅读:6

你敢相信吗?一篇完全由 AI 自主完成的学术论文,通过了人类的同行评审,被学术 Workshop 正式接收。 这不是科幻,这是 Sakana AI 团队刚刚开源的 AI-Scientist-v2 做到的事情。

AI-Scientist-v2 是一个端到端的自动化科学研究系统。给它一个研究方向,它会自己提出假设、设计实验、运行代码、分析数据、撰写论文。整个过程不需要人类介入——从 idea 到完整的 PDF 论文,全由 AI 完成。

Sakana AI 在 2024 年发布了 AI-Scientist-v1,那是第一个能自动生成论文的系统。但 v1 有一个明显限制:它依赖人类预先写好的模板。

v2 做到了彻底的突破:

●不再需要人类模板:从零开始自主生成论文结构

●跨领域泛化:不再局限于特定 ML 领域

●渐进式树搜索:用智能搜索策略探索实验空间

●实验管理 Agent:自动协调多轮实验和数据分析

AI-Scientist-v2 生成的论文,成为了第一篇完全由 AI 撰写并通过同行评审的学术 Workshop 论文。这意味着 AI 不只是辅助工具,它已经能独立完成完整的科研流程。

这是 v2 最核心的创新。传统的实验流程是线性的:提出假设 → 跑实验 → 看结果。但真实的科研充满了试错、回溯、方向调整。

AI-Scientist-v2 用树搜索来模拟这个过程:

●多分支探索:同时探索多条实验路径

●最佳优先策略(BFTS):优先展开最有希望的实验方向

●自动调试:实验失败时自动尝试修复,最多重试多次

●并行搜索:支持多个 worker 同时探索不同路径

整个系统分为三个核心阶段:

阶段一:研究构想(Ideation)

●你提供一个研究方向的 Markdown 描述

●系统用 LLM 头脑风暴,生成多个结构化的研究 idea

●每个 idea 包含假设、实验方案、相关工作分析

●通过 Semantic Scholar API 检查新颖性

●支持多轮反思和改进

阶段二:实验探索(Experimentation)

●使用树搜索自动运行实验

●每个"节点"是一次实验尝试

●失败的实验会被调试或放弃

●成功的结果会被保留并继续优化

●完成后生成可视化的实验树(HTML 格式)

阶段三:论文撰写(Writeup)

●基于实验结果自动生成完整论文

●包含摘要、引言、方法、实验、结论等完整结构

●自动搜索和添加引用文献

●生成图表和数据可视化

●最终输出 LaTeX 排版的 PDF

系统需要 Linux + NVIDIA GPU + CUDA + PyTorch:

系统支持多种大语言模型:

●OpenAI:GPT-4o、o1-preview、o3-mini

●Anthropic:Claude 3.5 Sonnet(推荐用于实验阶段)

●Google:Gemini 系列

●Amazon Bedrock:通过 AWS 调用 Claude 模型

创建一个 Markdown 文件描述你的研究方向,然后运行:

系统会生成一个 JSON 文件,包含多个结构化的研究 idea,每个都有假设、实验设计和相关工作分析。

不同阶段可以用不同的模型——实验用 Claude 3.5 Sonnet,写作用 o1,审稿用 GPT-4o,灵活组合。

bfts_config.yaml 控制搜索行为:

●num_workers:并行探索的路径数

●steps:最大探索节点数

●max_debug_depth:失败节点的最大调试次数

●num_drafts:独立搜索树的数量

●Ideation 阶段:约 $2-5(取决于生成数量)

●实验阶段:约 $15-20(使用 Claude 3.5 Sonnet)

●写作阶段:约 $5

●总成本:约 $20-30 每篇论文

对比人类科研的成本(数月时间 + 计算资源 + 人力),这个价格低得惊人。

成功率取决于基础模型的能力和idea 的复杂度:

●使用 Claude 3.5 Sonnet 作为实验模型时成功率最高

●复杂度较低的 idea 更容易成功

●v1 在有强模板时成功率更高,v2 更适合开放性探索

这个系统会执行 LLM 生成的代码,存在以下风险:

●可能使用危险的 Python 包

●可能发起不受控的网络访问

●可能创建意外的进程

强烈建议在 Docker 容器等沙箱环境中运行。

项目许可证要求:

●必须明确标注 AI 生成的论文使用了 AI Scientist

●在论文的摘要或方法部分注明:"This manuscript was autonomously generated using The AI Scientist"

简单说:如果你的研究方向有成熟的模板,用 v1 成功率更高。如果你想探索全新领域,v2 是更好的选择。

●降低科研门槛:让更多人能快速验证研究想法

●加速研究周期:从数月缩短到数小时

●探索更多可能性:树搜索能同时尝试多个方向

●辅助而非替代:研究者可以快速筛选有潜力的方向

●学术诚信:AI 生成的论文需要明确标注

●质量控制:成功率还不够高,需要人工审核

●评估标准:如何评估 AI 科研的真正贡献

●伦理边界:自动化科研的边界在哪里

AI-Scientist-v2 代表了AI 驱动科研的重要里程碑:

1.端到端自动化:从 idea 到论文,全程 AI 自主完成

2.树搜索创新:模拟真实科研的试错和迭代过程

3.跨领域泛化:不再局限于特定研究方向

4.历史性突破:第一篇通过同行评审的 AI 论文

5.开源可复现:完整代码和详细文档

项目地址:https://github.com/SakanaAI/AI-Scientist-v2

论文:https://pub.sakana.ai/ai-scientist-v2/paper

许可证:AI Scientist Source Code License

当 AI 开始自己做科研,科研本身会变成什么样?