AI自我进化的边界实验
2026年2月,一场持续228小时的全球直播中,一个名为FARS的AI研究系统从零开始自主提出244个假设、完成100篇学术论文,成果全部公开。平均每2小时17分产出一篇,总成本约10.4万美元。
“如果AI做AI研究的水平达到了人类水准,那么它其他所有能力的提升斜率都会变得极高。”毫无疑问,日行迹智能(Analemma)对AI自动化科研的前沿探索,会进入AI”元认知”的简史。公司创始人、CEO,复旦大学计算与智能创新学院校友孙天祥主导了这一进程,三年前,他是国内首个类ChatGPT语言模型MOSS的主要开发者,当时在复旦教授邱锡鹏和黄萱菁门下读博士。
但他已经意识到更极致的优雅结构,往往惊人的简洁而命中关键,这在今天是AI4AI:本质是让AI成为自己的研究者。这个递归的尽头是什么?可能是AGI,也可能是一台永远在自我改进、撬动无限知识的机器,它的进化速度与物理算力有关,而不受限于人类的认知边界。
时钟拨回大语言模型(LLM)时代,这是令AI研究风起云涌的技术奇点。现在,人们站在巨人肩上眺望下一个范式变革。
2022年11月,OpenAI发布ChatGPT,两个月后月活破亿——TikTok花了九个月,Instagram花了两年半。硅谷创业市场瞬间火爆,风投资本极速转向,科技界公认的大模型军备竞赛正式开启。
此时还是学生的孙天祥,是大模型的早期玩家。他回忆道,2022年的EMNLP(自然语言处理领域的顶级国际会议)上仅有寥寥几篇论文标题中包含“Large Language Model”,他是其中一篇的作者。
2023年2月,MOSS上线,5月开源,成为国内首个开源的对话式大语言模型。上线首日,主页被数千万用户刷屏。作为MOSS首个版本的开发者,孙天祥已经在思考更“meta”的问题,在2022年他首次提出Language-Model-as-a-Service (LMaaS) 的概念,并针对该场景提出了“黑箱调优”(Black-Box Tuning)的解决方案。
上图为LMaaS,下图为Black-Box Tuning