标签

王怀民谈开源AI:开放推动文明持续演进

发布时间:2026-04-10 20:16来源:微信阅读:14

理解开源人工智能

2026年3月27日,在北京市人工智能协会承办的2026中关村论坛年会“人工智能主题日”AI开源前沿论坛上,中国科学院院士、中国计算机学会开源发展技术委员会主任王怀民受邀出席,并发表了题为《理解开源人工智能》的主旨演讲。他结合深厚的学术积累以及多年亲历开源运动的实践经验,系统解读了开源的历史脉络与本质内涵,同时对中国开源人工智能的未来路径提出了独到思考。

一、国产大模型正在带动全球开源生态

王怀民从今年政府工作报告的开篇内容谈起:报告在总结2025年成绩时,明确指出人工智能大模型正在引领全球开源生态发展。支撑这一结论的关键数据在于:全年中国大模型在全球开源社区中的下载量持续位居前列;与此同时,这些被下载并部署的大模型在互联网提供token服务的访问量,到2025年末同样跃居全球第一。

王怀民表示,这一成果振奋人心,但也引发我们继续思考:所谓人工智能开源,是否只是开放大模型的权重或参数?中国人工智能与开源创新究竟该走怎样的发展道路?这正是他此次演讲重点讨论的核心问题。

二、开源体现了文明演进的历史规律

王怀民把开源放在人类文明史的宏大背景中来观察,提出了一个基础性判断:开放和资源共享始终是人类文明发展的基本逻辑,凡是保持开放的事物,往往都得以传承,并深刻塑造了文明演进的轨迹。

他将这一过程概括为四个历史阶段:

语言文字出现之后——人类把对世界的认知记录在石头、泥板、竹简和纸张之上,知识才得以更有效地传播,由此展开了延续数千年的文明历程。

科学与技术革命之后——学术发表成为这一时期开源的重要表现形式。出版业与学术发表的结合,在保护原创知识产权的同时,也有效激励了更多人投身科学创造。

通用计算机发明之后——软件成为文明传播的新型载体,而源代码的开放进一步推动了信息时代的深层变革。

深度学习兴起之后——模型、训练数据等AI资源的开放,正以前所未有的规模汇聚人类群体智能,并深刻影响文明未来的发展方向。

在王怀民看来,这四个阶段虽然形式不同,但内在本质是一致的:开放能够更有效地激发并汇聚人类群体智能资源。无论是语言文字、学术论文、软件源代码,还是今天的大语言模型参数与训练数据集,其核心意义都在这里。

三、软件开源的亲历:映照一代人的职业轨迹

王怀民还用个人经历让开源精神变得更加具体而鲜活。他表示,对于语言文字和科学革命,人们更多是从历史角度间接感知;但对他这一代人而言,软件开源的崛起正好完整地发生在个人职业成长与生命体验的周期之中。

1969年贝尔实验室开放UNIX操作系统源代码时,他还在读小学;自由软件理念提出时,他开始攻读研究生;而当Linux在互联网时代广泛传播时,他已经成为计算机软件领域的研究人员。Linux所展现出的开源社区组织能力,令他深受震动——这种去中心化、自下而上的创新组织方式,与传统软件工程中依赖企业化垂直强制管理的模式形成鲜明对比,却孕育出更为强大的创新能力。

王怀民还引用了一组直观数据进行说明:按照Google统计,全球图书数字化的数据总量约为23TB,而人类迄今产生的软件源代码若按数据量计算,已经达到PB级,二者相差整整三个数量级。这一数字背后,正体现了开源软件在汇聚人类群体智能方面取得的巨大成就。GitHub目前大约拥有3.97亿个开源仓库,开发语言超过700种,用户规模达到1.7亿。

四、从软件开源迈向AI开源:变化与恒定并存

王怀民指出,软件开源是人工智能开源的重要根基,但AI开源的技术栈已经出现根本性变化——开源对象不再局限于源代码,而是扩展到模型、数据、训练过程等一整套要素;随着世界模型、智能体等新方向不断出现,AI开源的边界未来还会继续外延。

不过在他看来,有四点始终没有改变:

一是面对不确定性时代挑战的创新模式依然具有吸引力;二是激发创新者与社区活力的方式依旧有效;三是冲击既有行业垄断格局的重要创新路径依然成立;四是落实“阳光”安全策略的创新机制依然有效。

五、中国开源十年进程:由深度参与迈向蓄力引领

王怀民回顾了中国参与开源运动的一系列关键节点:

2016年,中国科学院和中国工程院先后发布人工智能战略研究报告;2020年,开放原子开源基金会成立,OpenEuler、OpenHarmony等重要开源项目由此落地生根;2021年,“中国计算机学会开源发展技术委员会(CCF开源发展技术委员会)”成立,“魔搭社区(ModelScope)”也在同年上线;2025年,DeepSeek开源优化算子,Qwen、智谱、Kimi、MiniMax等模型带动全球开源生态发展;到2026年,中国开源大模型在Hugging Face等平台上的下载量占比持续保持领先。

王怀民强调,“十五五”规划已明确提出“推进开源体系建设、完善开源运行机制”,这意味着中国已经进入深度融入国际开源社区并蓄势引领的良好阶段。

六、现实挑战与众智FlagOS的任务担当

王怀民坦言,在广泛推进芯片适配与多种形态开源模型实践的过程中,当前基础软件栈中仍有一个关键环节尚未形成开源替代方案——CUDA。英伟达CUDA生态的闭源属性,长期以来限制了国产芯片开源生态的发展建设。

因此,他在演讲中特别提到,智源研究院将在本次论坛正式发布众智FlagOS开源软件,目标是补齐这一关键开源环节的空白,为人工智能开源技术栈提供完整的国产化选择。

结语

王怀民用三句话结束了演讲,也表达了他对行业的期待:

开源是当今世界最富活力的科技创新范式;开源为中国高质量发展带来了机遇,也带来了挑战;中国需要建设具有全球影响力的开源基础设施。

在他看来,面对充满不确定性的智能泛在计算新时代,开源创新应成为引领者的优先路径。众智FlagOS有望成为中国开源基础设施版图中的关键组成部分,而这项探索能否成功,也关系到中国能否在全球AI开源格局中真正实现从“跟跑”走向“引领”。