标签

聚焦智源大会:AI从语言理解迈向物理世界预测

发布时间:2026-06-15 05:54阅读:2

6月12日,北京中关村国际创新中心。上午9点未到,场馆入口已排起队伍。有人翻看手机中智源大会的议程,有人与同伴低声交流"世界模型"的最新进展。两日、25个分论坛、200余场演讲——这是第八届北京智源大会的规模。但真正吸引这批人从各地赶来的,不是规模本身,而是一个愈发明确的信号:AI正在经历一场范式层面的转变。

从"预测下一个词元"到"预测下一个物理状态"——开幕式上,智源研究院院长王仲远话音刚落,台下便一片手机举起拍照。若你尚未关注这场大会,接下来的内容将让你一次性理解:它为何重要,释放了什么信号,以及它在中国AI版图中的位置。

一、这场大会究竟说了什么

先给智源大会一个定位:它是中国AI领域学术气息最浓厚的年度盛会,由北京智源人工智能研究院主办,自2019年首届至今已连续举办八届,历届汇聚12位图灵奖得主及千余位顶尖专家,累计注册参会超60万人次。与那些更偏向商业发布或行业论坛的活动不同,智源大会坚持"学术内行"定位——来的不是来参观的,是来切磋的。今年大会的核心议题可归纳为一个递进式三段论:大模型如何认知世界、如何进入物理世界、如何安全地进入。

具体而言,六大核心议题贯穿全场:

1. 世界模型——从语言到物理的范式转变

2. 具身智能——让AI拥有"身体"

3. AI自进化——系统能否自我迭代

4. 智算基础设施——多元芯片如何共存

5. AI安全——从模型安全到系统安全

6. AI+科学——从辅助工具到自主研究

二、重磅发布:五款"悟界"模型与一个新范式

今年大会最核心的发布,是智源研究院推出的"悟界"系列基座大模型。先说背景。智源此前的"悟道"系列专注于大语言模型,"道"指向方法论与路径探索。今年的"悟界"则往前迈了一步——"界"代表虚实世界边界,核心命题从"理解语言"跃升到"理解物理世界"。

五款模型各有指向:

悟界·Physis-v0.1——全球首个通用世界基座模型,支持50余种复杂物理场景的长程推理,以物理隐空间表征替代像素预测,具备物理一致性与动作因果性。这是本届大会最重磅的首发,直接指向"预测下一物理状态"的新范式。

悟界·RoboBrain Orca——具身大脑模型,实现"想、看、动"三位一体,以"预测下一物理状态"为核心,提升具身智能的少样本与跨场景泛化能力。

悟界·Emu3.5——统一学习文本、图像与视频的多模态模型,内置时空与物理规律建模能力,相关成果已登刊《自然》(Nature)正刊。

悟界·Brainμ1.0——全球首个多模态神经科学大模型,可跨物种编码脑信号,同步发布万亿级AI-Ready数据平台BrainToken,相关论文被《科学》(Science)收录。

悟界·OpenComplex2.5——AI驱动药物发现模型,覆盖口袋识别、反向筛选、结构预测、亲和力预测四大制药关键步骤。

除"悟界"系列外,大会还有几项值得标注的首发:

ForgeTrain:号称全球首个完全由AI编写并反超人工实现的生产级训练框架,清华大学"水木学者"博士后李宇轩发布,迈向"AI制造AI"Level 4。

FlagOS 2.1:智源牵头研发的开源智算系统,已支持18家芯片厂商的32款芯片、600余个算子,覆盖90%以上主流开源大模型的多芯片部署需求。配套发布高速镜像版本FlagRelease Express与开源集成测试平台FlagCICD。

BAAI Cardiac Agent:全球首个心脏磁共振辅助诊断智能体,诊断精确度AUC值超过0.93。

智源×安贞医院战略合作签约:AI+医疗进入深水区。

智源-面壁联合加速器发布:终端智能体生态加速。

三、谁来了:从图灵奖得主到40余位CEO

今年大会的嘉宾阵容堪称"顶配"。

图灵奖得主:

Whitfield Diffie(2015年图灵奖得主,现代数字安全体系奠基人),演讲主题:Security For AI Agents, Security Against AI Agents;

Andrew Barto(2024年图灵奖得主,强化学习奠基人),演讲主题:Rediscovering Reinforcement Learning

全体大会重量级对话:

王坚(之江实验室主任、阿里云创始人)与黄铁军(智源研究院理事长)进行播客对谈"总有人比时代早十年"

朱军(清华大学教授/生数科技创始人)、刘知远(清华大学教授/面壁智能联合创始人)、安波(南洋理工大学教授)、罗福莉(小米集团MiMo负责人)参与"重构世界——中国大模型巅峰对话"

40余位AI企业CEO/CTO级嘉宾,涵盖:

具身智能赛道——银河通用王鹤、星动纪元陈建宇、千寻智能高阳、智平方郭彦东、破壳机器人许华哲、蚂蚁灵波科技朱兴、光轮智能谢晨、灵心巧手夏华夏、它石智航丁文超、星海图赵行

大模型与算力——面壁智能李大海、潞晨科技尤洋、摩尔线程陈志/徐伟、清微智能李彬、昆仑芯漆维、无问芯穹夏立雪

医疗与行业——数坤科技毛新生、讯飞医疗刘聪/王静、医渡科技李林峰、百度智能云殷大伟、理想汽车谢炎

AI安全——瑞莱智慧田天、奇安信刘岩、安远AI谢旻希

国际学术嘉宾:

斯坦福大学教授Andreas Tolias、奥地利格拉茨科技大学Wolfgang Maass、Meta资深研究科学家刘泽春、英伟达研究院科学家张少坤、MIT AI安全研究员Stephen Casper、新南威尔士大学Toby Walsh等。

参会企业覆盖:

腾讯、百度、字节跳动、阿里、蚂蚁集团、华为、科大讯飞、小米、理想汽车、中国移动、中国钢研、昇腾计算、摩尔线程等。

四、黄铁军的闭幕词:一条主线贯穿

6月13日下午,智源研究院理事长黄铁军的闭幕演讲题目是《智能之路——吾道一以贯之》。

"吾道一以贯之"——他用这几个字回应了外界的一个反复追问:从悟道到悟界,从大模型到具身智能,智源究竟有没有一条主线?

答案是肯定的。大语言模型→多模态大模型→世界模型,这是智源始终如一的技术延续路径。

关于"世界模型"究竟意味着什么,黄铁军在大会期间有一个很清晰的区分:VLA(视觉语言动作模型)和VLM(视觉语言模型)适用于特定场景下的任务,企业用成熟技术快速落地是合理的。但世界模型追求的是通用化——让机器人像人类一样在任何场景下解决问题。

他对世界模型做了一个类比:纯数字模型(游戏、视频生成)不是世界模型,因为它们不需要物理正确。真正的世界模型必须具备多传感器输入,在尽可能多的物理输入情况下对未来做出精准推测,类似自动驾驶的逻辑——观察当前状态,推想未来十几秒会发生什么。

关于数据瓶颈,他给出的解法也很务实:不是建数据工厂、不是派机器人采集,而是"边干活边采"——工人戴智能眼镜正常工作,数据同步完成,零成本或低成本获得第一视角数据。

五、定义这场盛会:中国AI的"NeurIPS时刻"

若用一句话定义智源大会,它正成为中国AI领域最接近NeurIPS气质的学术盛会——不只是"开会",更是一个年度节点,标记技术范式的转向与共识的形成。

回看技术未收敛时期,类似定位的大会在国内外都能找到对标:

国际对标:

NeurIPS(神经信息处理系统大会):创办于1987年,2012年AlexNet论文在该大会发表,成为深度学习革命的标志性事件。此后每年,NeurIPS都是全球AI研究者"对齐认知"的节点——2017年Attention论文、2020年扩散模型论文,都率先在这里引发讨论。

ICML(国际机器学习大会):创办于2012年,与NeurIPS并列为AI领域两大顶会。2014年GAN论文、2021年对比学习论文均在此首发。ICML更偏向理论方法,NeurIPS更偏向系统与应用。

ICRA(国际机器人与自动化大会):创办于1984年,具身智能和机器人领域最权威的学术大会。近年来随着人形机器人热潮,ICLA参会人数持续攀升。

国内对标:

世界人工智能大会(WAIC):2018年创办,由上海市政府主办,定位偏政策与产业,规格高但学术浓度不及智源大会。

中关村论坛:综合性科技论坛,AI只是板块之一,覆盖面广但深度有限。

相比之下,智源大会的独特性在于:学术浓度最高、前沿方向最集中、首发成果最硬核。它不是博览会,也不是政策宣导平台——它是研究者之间的年度"过招场"。

标志性事件时期的简要对比:

从"预测下一个词"到"预测下一个物理状态"——若未来回看,2026年的智源大会可能就是那个分水岭。

六、为什么你应该关注

若你是创业者,智源大会释放的信号是:世界模型和具身智能不再是学术概念,而是正在成形的产业赛道。从RoboBrain Orca到Physis-v0.1,从银河通用到千寻智能,这条从"理解"到"行动"的链路正在被快速填充。

若你是投资人,FlagOS 2.1背后"18家芯片厂商、32款芯片"的适配数据说明一件事:算力基础设施的多元化已是既成事实,押注单一芯片路线的风险正在增大。

若你是技术从业者,ForgeTrain的"AI写AI"和FlagScale Agent的"训推无人驾驶"意味着:训练框架本身的自动化程度正在跃升,这是基础设施层面的范式变化。

若你只是对AI感兴趣的普通人,黄铁军那句"急着把AI送上货架的人不少,谁来负责思考尚未被命名的未来"值得细品。当一个领域从技术收敛走向范式切换,最稀缺的永远不是落地速度,而是方向感。智源大会提供的,正是这种方向感。