AI科研新突破:全自动论文生成系统问世
你敢相信吗?一篇完全由 AI 自主完成的学术论文,通过了人类的同行评审,被学术 Workshop 正式接收。 这不是科幻,这是 Sakana AI 团队刚刚开源的 AI-Scientist-v2 做到的事情。
AI-Scientist-v2 是一个端到端的自动化科学研究系统。给它一个研究方向,它会自己提出假设、设计实验、运行代码、分析数据、撰写论文。整个过程不需要人类介入——从 idea 到完整的 PDF 论文,全由 AI 完成。
Sakana AI 在 2024 年发布了 AI-Scientist-v1,那是第一个能自动生成论文的系统。但 v1 有一个明显限制:它依赖人类预先写好的模板。
v2 做到了彻底的突破:
●不再需要人类模板:从零开始自主生成论文结构
●跨领域泛化:不再局限于特定 ML 领域
●渐进式树搜索:用智能搜索策略探索实验空间
●实验管理 Agent:自动协调多轮实验和数据分析
AI-Scientist-v2 生成的论文,成为了第一篇完全由 AI 撰写并通过同行评审的学术 Workshop 论文。这意味着 AI 不只是辅助工具,它已经能独立完成完整的科研流程。
这是 v2 最核心的创新。传统的实验流程是线性的:提出假设 → 跑实验 → 看结果。但真实的科研充满了试错、回溯、方向调整。
AI-Scientist-v2 用树搜索来模拟这个过程:
●多分支探索:同时探索多条实验路径
●最佳优先策略(BFTS):优先展开最有希望的实验方向
●自动调试:实验失败时自动尝试修复,最多重试多次
●并行搜索:支持多个 worker 同时探索不同路径
整个系统分为三个核心阶段:
阶段一:研究构想(Ideation)
●你提供一个研究方向的 Markdown 描述
●系统用 LLM 头脑风暴,生成多个结构化的研究 idea
●每个 idea 包含假设、实验方案、相关工作分析
●通过 Semantic Scholar API 检查新颖性
●支持多轮反思和改进
阶段二:实验探索(Experimentation)
●使用树搜索自动运行实验
●每个"节点"是一次实验尝试
●失败的实验会被调试或放弃
●成功的结果会被保留并继续优化
●完成后生成可视化的实验树(HTML 格式)
阶段三:论文撰写(Writeup)
●基于实验结果自动生成完整论文
●包含摘要、引言、方法、实验、结论等完整结构
●自动搜索和添加引用文献
●生成图表和数据可视化
●最终输出 LaTeX 排版的 PDF
系统需要 Linux + NVIDIA GPU + CUDA + PyTorch:
系统支持多种大语言模型:
●OpenAI:GPT-4o、o1-preview、o3-mini
●Anthropic:Claude 3.5 Sonnet(推荐用于实验阶段)
●Google:Gemini 系列
●Amazon Bedrock:通过 AWS 调用 Claude 模型
创建一个 Markdown 文件描述你的研究方向,然后运行:
系统会生成一个 JSON 文件,包含多个结构化的研究 idea,每个都有假设、实验设计和相关工作分析。
不同阶段可以用不同的模型——实验用 Claude 3.5 Sonnet,写作用 o1,审稿用 GPT-4o,灵活组合。
bfts_config.yaml 控制搜索行为:
●num_workers:并行探索的路径数
●steps:最大探索节点数
●max_debug_depth:失败节点的最大调试次数
●num_drafts:独立搜索树的数量
●Ideation 阶段:约 $2-5(取决于生成数量)
●实验阶段:约 $15-20(使用 Claude 3.5 Sonnet)
●写作阶段:约 $5
●总成本:约 $20-30 每篇论文
对比人类科研的成本(数月时间 + 计算资源 + 人力),这个价格低得惊人。
成功率取决于基础模型的能力和idea 的复杂度:
●使用 Claude 3.5 Sonnet 作为实验模型时成功率最高
●复杂度较低的 idea 更容易成功
●v1 在有强模板时成功率更高,v2 更适合开放性探索
这个系统会执行 LLM 生成的代码,存在以下风险:
●可能使用危险的 Python 包
●可能发起不受控的网络访问
●可能创建意外的进程
强烈建议在 Docker 容器等沙箱环境中运行。
项目许可证要求:
●必须明确标注 AI 生成的论文使用了 AI Scientist
●在论文的摘要或方法部分注明:"This manuscript was autonomously generated using The AI Scientist"
简单说:如果你的研究方向有成熟的模板,用 v1 成功率更高。如果你想探索全新领域,v2 是更好的选择。
●降低科研门槛:让更多人能快速验证研究想法
●加速研究周期:从数月缩短到数小时
●探索更多可能性:树搜索能同时尝试多个方向
●辅助而非替代:研究者可以快速筛选有潜力的方向
●学术诚信:AI 生成的论文需要明确标注
●质量控制:成功率还不够高,需要人工审核
●评估标准:如何评估 AI 科研的真正贡献
●伦理边界:自动化科研的边界在哪里
AI-Scientist-v2 代表了AI 驱动科研的重要里程碑:
1.端到端自动化:从 idea 到论文,全程 AI 自主完成
2.树搜索创新:模拟真实科研的试错和迭代过程
3.跨领域泛化:不再局限于特定研究方向
4.历史性突破:第一篇通过同行评审的 AI 论文
5.开源可复现:完整代码和详细文档
项目地址:https://github.com/SakanaAI/AI-Scientist-v2
论文:https://pub.sakana.ai/ai-scientist-v2/paper
许可证:AI Scientist Source Code License
当 AI 开始自己做科研,科研本身会变成什么样?