聚焦智源大会：AI从语言理解迈向物理世界预测

发布时间：2026-06-15 05:54阅读：2

6月12日，北京中关村国际创新中心。上午9点未到，场馆入口已排起队伍。有人翻看手机中智源大会的议程，有人与同伴低声交流"世界模型"的最新进展。两日、25个分论坛、200余场演讲——这是第八届北京智源大会的规模。但真正吸引这批人从各地赶来的，不是规模本身，而是一个愈发明确的信号：AI正在经历一场范式层面的转变。

从"预测下一个词元"到"预测下一个物理状态"——开幕式上，智源研究院院长王仲远话音刚落，台下便一片手机举起拍照。若你尚未关注这场大会，接下来的内容将让你一次性理解：它为何重要，释放了什么信号，以及它在中国AI版图中的位置。

一、这场大会究竟说了什么

先给智源大会一个定位：它是中国AI领域学术气息最浓厚的年度盛会，由北京智源人工智能研究院主办，自2019年首届至今已连续举办八届，历届汇聚12位图灵奖得主及千余位顶尖专家，累计注册参会超60万人次。与那些更偏向商业发布或行业论坛的活动不同，智源大会坚持"学术内行"定位——来的不是来参观的，是来切磋的。今年大会的核心议题可归纳为一个递进式三段论：大模型如何认知世界、如何进入物理世界、如何安全地进入。

具体而言，六大核心议题贯穿全场：

1. 世界模型——从语言到物理的范式转变

2. 具身智能——让AI拥有"身体"

3. AI自进化——系统能否自我迭代

4. 智算基础设施——多元芯片如何共存

5. AI安全——从模型安全到系统安全

6. AI+科学——从辅助工具到自主研究

二、重磅发布：五款"悟界"模型与一个新范式

今年大会最核心的发布，是智源研究院推出的"悟界"系列基座大模型。先说背景。智源此前的"悟道"系列专注于大语言模型，"道"指向方法论与路径探索。今年的"悟界"则往前迈了一步——"界"代表虚实世界边界，核心命题从"理解语言"跃升到"理解物理世界"。

五款模型各有指向：

悟界·Physis-v0.1——全球首个通用世界基座模型，支持50余种复杂物理场景的长程推理，以物理隐空间表征替代像素预测，具备物理一致性与动作因果性。这是本届大会最重磅的首发，直接指向"预测下一物理状态"的新范式。

悟界·RoboBrain Orca——具身大脑模型，实现"想、看、动"三位一体，以"预测下一物理状态"为核心，提升具身智能的少样本与跨场景泛化能力。

悟界·Emu3.5——统一学习文本、图像与视频的多模态模型，内置时空与物理规律建模能力，相关成果已登刊《自然》（Nature）正刊。

悟界·Brainμ1.0——全球首个多模态神经科学大模型，可跨物种编码脑信号，同步发布万亿级AI-Ready数据平台BrainToken，相关论文被《科学》（Science）收录。

悟界·OpenComplex2.5——AI驱动药物发现模型，覆盖口袋识别、反向筛选、结构预测、亲和力预测四大制药关键步骤。

除"悟界"系列外，大会还有几项值得标注的首发：

ForgeTrain：号称全球首个完全由AI编写并反超人工实现的生产级训练框架，清华大学"水木学者"博士后李宇轩发布，迈向"AI制造AI"Level 4。

FlagOS 2.1：智源牵头研发的开源智算系统，已支持18家芯片厂商的32款芯片、600余个算子，覆盖90%以上主流开源大模型的多芯片部署需求。配套发布高速镜像版本FlagRelease Express与开源集成测试平台FlagCICD。

BAAI Cardiac Agent：全球首个心脏磁共振辅助诊断智能体，诊断精确度AUC值超过0.93。

智源×安贞医院战略合作签约：AI+医疗进入深水区。

智源-面壁联合加速器发布：终端智能体生态加速。

三、谁来了：从图灵奖得主到40余位CEO

今年大会的嘉宾阵容堪称"顶配"。

图灵奖得主：

Whitfield Diffie（2015年图灵奖得主，现代数字安全体系奠基人），演讲主题：Security For AI Agents, Security Against AI Agents；

Andrew Barto（2024年图灵奖得主，强化学习奠基人），演讲主题：Rediscovering Reinforcement Learning

全体大会重量级对话：

王坚（之江实验室主任、阿里云创始人）与黄铁军（智源研究院理事长）进行播客对谈"总有人比时代早十年"

朱军（清华大学教授/生数科技创始人）、刘知远（清华大学教授/面壁智能联合创始人）、安波（南洋理工大学教授）、罗福莉（小米集团MiMo负责人）参与"重构世界——中国大模型巅峰对话"

40余位AI企业CEO/CTO级嘉宾，涵盖：

具身智能赛道——银河通用王鹤、星动纪元陈建宇、千寻智能高阳、智平方郭彦东、破壳机器人许华哲、蚂蚁灵波科技朱兴、光轮智能谢晨、灵心巧手夏华夏、它石智航丁文超、星海图赵行

大模型与算力——面壁智能李大海、潞晨科技尤洋、摩尔线程陈志/徐伟、清微智能李彬、昆仑芯漆维、无问芯穹夏立雪

医疗与行业——数坤科技毛新生、讯飞医疗刘聪/王静、医渡科技李林峰、百度智能云殷大伟、理想汽车谢炎

AI安全——瑞莱智慧田天、奇安信刘岩、安远AI谢旻希

国际学术嘉宾：

斯坦福大学教授Andreas Tolias、奥地利格拉茨科技大学Wolfgang Maass、Meta资深研究科学家刘泽春、英伟达研究院科学家张少坤、MIT AI安全研究员Stephen Casper、新南威尔士大学Toby Walsh等。

参会企业覆盖：

腾讯、百度、字节跳动、阿里、蚂蚁集团、华为、科大讯飞、小米、理想汽车、中国移动、中国钢研、昇腾计算、摩尔线程等。

四、黄铁军的闭幕词：一条主线贯穿

6月13日下午，智源研究院理事长黄铁军的闭幕演讲题目是《智能之路——吾道一以贯之》。

"吾道一以贯之"——他用这几个字回应了外界的一个反复追问：从悟道到悟界，从大模型到具身智能，智源究竟有没有一条主线？

答案是肯定的。大语言模型→多模态大模型→世界模型，这是智源始终如一的技术延续路径。

关于"世界模型"究竟意味着什么，黄铁军在大会期间有一个很清晰的区分：VLA（视觉语言动作模型）和VLM（视觉语言模型）适用于特定场景下的任务，企业用成熟技术快速落地是合理的。但世界模型追求的是通用化——让机器人像人类一样在任何场景下解决问题。

他对世界模型做了一个类比：纯数字模型（游戏、视频生成）不是世界模型，因为它们不需要物理正确。真正的世界模型必须具备多传感器输入，在尽可能多的物理输入情况下对未来做出精准推测，类似自动驾驶的逻辑——观察当前状态，推想未来十几秒会发生什么。

关于数据瓶颈，他给出的解法也很务实：不是建数据工厂、不是派机器人采集，而是"边干活边采"——工人戴智能眼镜正常工作，数据同步完成，零成本或低成本获得第一视角数据。

五、定义这场盛会：中国AI的"NeurIPS时刻"

若用一句话定义智源大会，它正成为中国AI领域最接近NeurIPS气质的学术盛会——不只是"开会"，更是一个年度节点，标记技术范式的转向与共识的形成。

回看技术未收敛时期，类似定位的大会在国内外都能找到对标：

国际对标：

NeurIPS（神经信息处理系统大会）：创办于1987年，2012年AlexNet论文在该大会发表，成为深度学习革命的标志性事件。此后每年，NeurIPS都是全球AI研究者"对齐认知"的节点——2017年Attention论文、2020年扩散模型论文，都率先在这里引发讨论。

ICML（国际机器学习大会）：创办于2012年，与NeurIPS并列为AI领域两大顶会。2014年GAN论文、2021年对比学习论文均在此首发。ICML更偏向理论方法，NeurIPS更偏向系统与应用。

ICRA（国际机器人与自动化大会）：创办于1984年，具身智能和机器人领域最权威的学术大会。近年来随着人形机器人热潮，ICLA参会人数持续攀升。

国内对标：

世界人工智能大会（WAIC）：2018年创办，由上海市政府主办，定位偏政策与产业，规格高但学术浓度不及智源大会。

中关村论坛：综合性科技论坛，AI只是板块之一，覆盖面广但深度有限。

相比之下，智源大会的独特性在于：学术浓度最高、前沿方向最集中、首发成果最硬核。它不是博览会，也不是政策宣导平台——它是研究者之间的年度"过招场"。

标志性事件时期的简要对比：

从"预测下一个词"到"预测下一个物理状态"——若未来回看，2026年的智源大会可能就是那个分水岭。

六、为什么你应该关注

若你是创业者，智源大会释放的信号是：世界模型和具身智能不再是学术概念，而是正在成形的产业赛道。从RoboBrain Orca到Physis-v0.1，从银河通用到千寻智能，这条从"理解"到"行动"的链路正在被快速填充。

若你是投资人，FlagOS 2.1背后"18家芯片厂商、32款芯片"的适配数据说明一件事：算力基础设施的多元化已是既成事实，押注单一芯片路线的风险正在增大。

若你是技术从业者，ForgeTrain的"AI写AI"和FlagScale Agent的"训推无人驾驶"意味着：训练框架本身的自动化程度正在跃升，这是基础设施层面的范式变化。

若你只是对AI感兴趣的普通人，黄铁军那句"急着把AI送上货架的人不少，谁来负责思考尚未被命名的未来"值得细品。当一个领域从技术收敛走向范式切换，最稀缺的永远不是落地速度，而是方向感。智源大会提供的，正是这种方向感。

← 上一篇：AI生成的意外效果下一篇：Cadence AI 荣膺 L5 级认证，全球首款全自主虚拟芯片工程师问世 →