杨植麟展望AI研发新纪元
3月25日,月之暗面创始人杨植麟在2026中关村论坛年会全体会议上发表演讲。
杨植麟表示,大模型的核心在于将能源转化为智能,规模化是AI发展的关键基础,但规模化并非简单增加算力与能源,而是以提升效率为核心。为此,Kimi从三个方面制定规模化策略:Token(词元)效率、长上下文处理和Agent(智能体)集群,在有限资源中实现智能最大化。
杨植麟指出,有效数据量是有限的,提高Token效率意味着采用更优网络架构与优化器,从相同数据中学习更多智能。同时,Kimi通过自主研发的Kimi Linear架构扩展长上下文能力,使模型在更长输入下获得更低损失函数,支持更长输出与更复杂任务执行。在Kimi最新发布的旗舰模型K2.5中,首次引入了Agent集群技术,突破单一智能体效率限制。
杨植麟还详细介绍了大模型训练的三个阶段演变。他提到,三年前,行业主要依赖互联网自然数据,结合少量人工标注,通过标注判断内容是否符合价值观与偏好。到了2025年,行业更加注重大规模强化学习系统,由人工挑选高质量任务,任务定义仍由人完成,再通过强化学习提升模型效果,编程、数学等领域的性能提升主要来自这一路径。
而在未来几年内,人工智能的研究与开发方式将发生重大变革,越来越多的研究工作将由AI主导。未来每个研究员将拥有海量的Token,AI将自动合成新任务、构建新环境、定义最优奖励函数,甚至自主探索全新网络架构。在这种趋势下,整个AI领域的研发速度将进一步加快。