AI科研新突破：全自动论文生成系统问世

发布时间：2026-04-03 07:18阅读：10

你敢相信吗？一篇完全由 AI 自主完成的学术论文，通过了人类的同行评审，被学术 Workshop 正式接收。这不是科幻，这是 Sakana AI 团队刚刚开源的 AI-Scientist-v2 做到的事情。

AI-Scientist-v2 是一个端到端的自动化科学研究系统。给它一个研究方向，它会自己提出假设、设计实验、运行代码、分析数据、撰写论文。整个过程不需要人类介入——从 idea 到完整的 PDF 论文，全由 AI 完成。

Sakana AI 在 2024 年发布了 AI-Scientist-v1，那是第一个能自动生成论文的系统。但 v1 有一个明显限制：它依赖人类预先写好的模板。

v2 做到了彻底的突破：

●不再需要人类模板：从零开始自主生成论文结构

●跨领域泛化：不再局限于特定 ML 领域

●渐进式树搜索：用智能搜索策略探索实验空间

●实验管理 Agent：自动协调多轮实验和数据分析

AI-Scientist-v2 生成的论文，成为了第一篇完全由 AI 撰写并通过同行评审的学术 Workshop 论文。这意味着 AI 不只是辅助工具，它已经能独立完成完整的科研流程。

这是 v2 最核心的创新。传统的实验流程是线性的：提出假设 → 跑实验 → 看结果。但真实的科研充满了试错、回溯、方向调整。

AI-Scientist-v2 用树搜索来模拟这个过程：

●多分支探索：同时探索多条实验路径

●最佳优先策略（BFTS）：优先展开最有希望的实验方向

●自动调试：实验失败时自动尝试修复，最多重试多次

●并行搜索：支持多个 worker 同时探索不同路径

整个系统分为三个核心阶段：

阶段一：研究构想（Ideation）

●你提供一个研究方向的 Markdown 描述

●系统用 LLM 头脑风暴，生成多个结构化的研究 idea

●每个 idea 包含假设、实验方案、相关工作分析

●通过 Semantic Scholar API 检查新颖性

●支持多轮反思和改进

阶段二：实验探索（Experimentation）

●使用树搜索自动运行实验

●每个"节点"是一次实验尝试

●失败的实验会被调试或放弃

●成功的结果会被保留并继续优化

●完成后生成可视化的实验树（HTML 格式）

阶段三：论文撰写（Writeup）

●基于实验结果自动生成完整论文

●包含摘要、引言、方法、实验、结论等完整结构

●自动搜索和添加引用文献

●生成图表和数据可视化

●最终输出 LaTeX 排版的 PDF

系统需要 Linux + NVIDIA GPU + CUDA + PyTorch：

系统支持多种大语言模型：

●OpenAI：GPT-4o、o1-preview、o3-mini

●Anthropic：Claude 3.5 Sonnet（推荐用于实验阶段）

●Google：Gemini 系列

●Amazon Bedrock：通过 AWS 调用 Claude 模型

创建一个 Markdown 文件描述你的研究方向，然后运行：

系统会生成一个 JSON 文件，包含多个结构化的研究 idea，每个都有假设、实验设计和相关工作分析。

不同阶段可以用不同的模型——实验用 Claude 3.5 Sonnet，写作用 o1，审稿用 GPT-4o，灵活组合。

bfts_config.yaml 控制搜索行为：

●num_workers：并行探索的路径数

●steps：最大探索节点数

●max_debug_depth：失败节点的最大调试次数

●num_drafts：独立搜索树的数量

●Ideation 阶段：约 $2-5（取决于生成数量）

●实验阶段：约 $15-20（使用 Claude 3.5 Sonnet）

●写作阶段：约 $5

●总成本：约 $20-30 每篇论文

对比人类科研的成本（数月时间 + 计算资源 + 人力），这个价格低得惊人。

成功率取决于基础模型的能力和idea 的复杂度：

●使用 Claude 3.5 Sonnet 作为实验模型时成功率最高

●复杂度较低的 idea 更容易成功

●v1 在有强模板时成功率更高，v2 更适合开放性探索

这个系统会执行 LLM 生成的代码，存在以下风险：

●可能使用危险的 Python 包

●可能发起不受控的网络访问

●可能创建意外的进程

强烈建议在 Docker 容器等沙箱环境中运行。

项目许可证要求：

●必须明确标注 AI 生成的论文使用了 AI Scientist

●在论文的摘要或方法部分注明："This manuscript was autonomously generated using The AI Scientist"

简单说：如果你的研究方向有成熟的模板，用 v1 成功率更高。如果你想探索全新领域，v2 是更好的选择。

●降低科研门槛：让更多人能快速验证研究想法

●加速研究周期：从数月缩短到数小时

●探索更多可能性：树搜索能同时尝试多个方向

●辅助而非替代：研究者可以快速筛选有潜力的方向

●学术诚信：AI 生成的论文需要明确标注

●质量控制：成功率还不够高，需要人工审核

●评估标准：如何评估 AI 科研的真正贡献

●伦理边界：自动化科研的边界在哪里

AI-Scientist-v2 代表了AI 驱动科研的重要里程碑：

1.端到端自动化：从 idea 到论文，全程 AI 自主完成

2.树搜索创新：模拟真实科研的试错和迭代过程

3.跨领域泛化：不再局限于特定研究方向

4.历史性突破：第一篇通过同行评审的 AI 论文

5.开源可复现：完整代码和详细文档

项目地址：https://github.com/SakanaAI/AI-Scientist-v2

论文：https://pub.sakana.ai/ai-scientist-v2/paper

许可证：AI Scientist Source Code License

当 AI 开始自己做科研，科研本身会变成什么样？

← 上一篇：AI时代的快与慢下一篇：华为AI芯片950PR热卖75万颗 →