Adaption推出AutoScientist:开启AI自我进化新纪元
北京时间5月13日,AI研究实验室Adaption正式推出了名为AutoScientist的全新工具。与常规AI应用不同,AutoScientist不直接执行具体任务,而是赋予AI模型自主优化训练数据及参数的能力——简言之,它让AI掌握了"自我迭代"的技能。Adaption联合创始人兼CEO莎拉·胡克(Sara Hooker)曾担任AI独角兽Cohere的研究副总裁,她将AutoScientist定义为一种"推动数据与模型同步演进的全新范式"。
长期以来,AI模型的训练一直是一项高度集中且成本昂贵的工程。
传统的模型微调(Fine-tuning)模式,本质上依赖研究员人工构建数据集、设定学习率等超参数,随后交由模型"消化"。这一过程不仅需要大量人力介入,且数据质量与模型架构的优化往往割裂进行。莎拉·胡克指出,这种"分步实施"的训练方式存在根本弊端:当数据发生变化时,模型未必能及时调整至最佳学习路径。
AutoScientist旨在攻克这一难题。其核心突破在于数据与模型的双向协同进化:系统不仅能生成训练数据,还能同步探索何种数据组合及训练方式,能使模型在特定任务中表现卓越。正如胡克所言:"它同时优化数据源与学习方法,本质上是让模型自行发掘'最佳学习策略'。"
AutoScientist基于Adaption此前发布的数据产品Adaptive Data构建——后者致力于持续打造高质量训练集,前者则将这些数据转化为模型持续进化的核心动力。
Adaption在产品发布资料中宣称,AutoScientist在多种模型架构上实现了胜率(Win-rate)超100%的提升。Win-rate通常衡量新方法相对于基准方法的相对涨幅,100%的提升即意味着性能翻倍。
然而,鉴于AutoScientist专注于特定任务优化而非通用基准测试,传统的SWE-Bench(软件工程测试)或ARC-AGI等主流评测标准并不完全适用。Adaption目前仅展示了部分对比数据,尚待第三方独立验证。
莎拉·胡克对此表现得相当自信——Adaption将免费开放AutoScientist供用户试用30天,任何人都可直接体验。这种"先体验后决策"的策略,某种程度上也是以实际效果为证。
过去数年间,AI领域的主流叙事聚焦于"更大模型、更强算力"。在缩放定律(Scaling Law)的驱动下,GPT-4、Claude、Gemini等大模型相继问世,但这些模型的训练仍沿袭传统范式:人工设计数据、人工预定义架构、超参数依赖经验或贝叶斯优化。
AutoScientist开辟了一条截然不同的路径:实现训练流程本身的自动化。
若数据与模型能联合优化,训练将不再依赖顶级实验室的庞大团队与算力资源。这意味着,初创企业、高校科研组乃至个人开发者,均有望以更低成本训练出达到"前沿水准"的专用模型。胡克表示:"代码生成解锁了众多任务,AutoScientist亦将在多领域释放创新潜力——且不仅限于科技巨头。"
从技术哲学视角审视,这也是AI发展史上一次微妙却关键的转向:AI从被训练的对象,开始拥有参与自我改进的能力。
Adaption成立于近年,是新一轮AI研究热潮中涌现的"新生代"实验室之一。与OpenAI、Anthropic等估值数百亿美元的巨头不同,Adaption选择了一条更垂直的技术路线:专注于提升训练效率并推动其民主化。
CEO莎拉·胡克在加入Adaption前,曾担任Cohere的AI研究副总裁,该公司估值曾超22亿美元。胡克本人在AI学术界影响力显著,其关于模型泛化、鲁棒性等主题的研究被广泛引用。她的加入使Adaption自创立之初便确立了明确的技术判断:下一代AI的竞争,不仅是模型参数的博弈,更是训练方法的较量。
值得注意的是,AutoScientist目前仍处于早期阶段:
此外,AI自我优化能力的增强也伴随潜在风险——当模型能够"自主改进"时,如何确保改进方向与人类意图一致、如何防止优化目标出现"奖励黑客"(Reward Hacking)现象,将是未来必须应对的课题。
AutoScientist的问世,呼应了近期AI领域日益清晰的一个趋势:研究工具的自动化。
从AI生成代码(Code Generation)、AI合成数据(Synthetic Data),再到AI生成训练策略(AutoML的进阶版),AI正逐层渗透至训练流水线的每个环节。AutoScientist将这种渗透推向了最深层次——即数据与模型的共同进化本身。
若这一方向被证实有效,其影响将堪比一次"训练范式"的迁移:AI研发将从"手工技艺"迈向"自动化工业",从"集中式大模型"转向"分布式专业模型"。
这并非一蹴而就之事,但AutoScientist已迈出了值得瞩目的一步。
📚 相关阅读
主编手记:AutoScientist的创新之处不在于模型架构的新突破,而在于训练过程自动化的思路。这种"让AI优化AI"的路径,与我们此前报道的多项AI Agent化趋势一脉相承——AI正从执行任务的工具,转变为参与自身进化的主体。值得关注的是,这是否会成为小实验室挑战大厂的新赛道?
声明:本文素材