标签

于骞:自动驾驶是通往物理AI的核心入口

发布时间:2026-04-26 21:40来源:微信阅读:6

作者 / Robo小曹

过去两年里,科技圈似乎被「缩放定律狂热」所笼罩——仿佛只要无休止地堆叠算力与数据,通往通用物理人工智能的大门就会自动打开。

然而在自动驾驶行业,这种「蛮干」的逻辑遭遇了现实世界的「物理壁垒」。当依赖数据的传统路径触及极限,无论是无人驾驶还是具身智能的下半场,注定归属于真正尊重并洞察世界规律的物理人工智能。

4月24日,北京车展首日,轻舟智航发布了轻舟物理AI模型,并宣布将战略重心从「无人驾驶」全面转向更宏大的「通用物理AI」。

访谈中,轻舟智航联合创始人、董事长兼CEO于骞,以及CTO李栋,剖析了行业转向物理AI的必要性,阐述了世界模型与强化学习统一架构的构想,以及L4跨越量产门槛所需厘清的运营成本账目。

自动驾驶是物理AI的关键切入点

“去年,当所有人都热衷于VLA时,我们却鲜少提及。轻舟对技术的判断极为审慎,不会见什么新概念就盲目跟风。”

如此审慎的轻舟,却在今年突然提出全面转向物理AI,尽管这一领域尚未显示出明确的成熟迹象。

在轻舟的技术架构里,VLA仅是其中一环,真正的核心依然是底层对物理规律的认知。因此,尽管VLA异常火爆,也面临难以突破的天花板;而尽管物理AI尚处于起步阶段,却有可能引领自动驾驶走向最终形态。

“目前,物理AI在学术界尚未达成共识,更遑论工程应用。它距离质的飞跃可能仍需一两项重大技术突破,但即便如此,该领域已有大量值得深入挖掘的研究工作。”

于骞认为,物理AI融入普通人生活的方式目前难以预测——就像ChatGPT出现之前,没人能想象AI会以「对话」的形式落地。

“ChatGPT的启示在于:它用最纯粹的对话交互,在缺乏流量和商业化的起点上,强行开启了大语言模型的通道;DeepMind的路径同样值得参考——它从游戏切入,追求的从来不是某一局胜负,而是人类所有游戏背后的底层逻辑。”

于骞借此表明,自动驾驶将成为物理AI的下一个关键入口。他的理由十分直接:如果连四个轮子的机器人都无法驾驭、非接触式交互都无法做好,要在更广阔的范围内实现接触式物理智能,挑战只会更加严峻。

自动驾驶数据:物理AI的「助燃剂」

目前,自动驾驶领域的世界模型已进入应用阶段;而在机器人操作领域,世界模型整体仍处于研究阶段:虽然简单或特定动作的生成已有突破,但泛化动作的生成依然面临巨大挑战。

李栋指出,在机器人等领域,本体数据极其匮乏。由于不同机器人的自由度差异显著,数据高度异构。如何有效利用海量互联网视频数据学习物理空间知识,至今仍是业界前沿的科研难题。

相比之下,自动驾驶领域具备天然优势:数据质量高、规模大,且包含本体驾驶数据。基于此,轻舟训练世界模型的价值体现在两方面:其一,有效补充自动驾驶场景的稀缺数据,持续提升模型性能;其二,模型积累的对物理世界与几何空间的理解能力具备通用性,可作为向更广泛领域迁移的基础。

因此,自动驾驶不仅是世界模型最早实现工程落地的领域,更将成为向物理世界更广泛场景延伸的基石——随着数据与能力的持续积累,其对物理世界与几何空间的理解将逐步向操作类机器人等高自由度场景迁移扩展。

VLA即将被抛弃吗?

今年大家发现,过去一直「嘴上挂VLA」的企业,都不再提这个词了,具身智能界也都在探讨VLA的上限,那么它是否会被取代?

于骞解释道,VLA更多应用于端侧,它能利用语言和人类经验进行推理,与世界模型并不冲突。

李栋表示,VLA的语言和理解能力不可或缺,能为系统加分。但在现阶段物理AI中,它并非最核心的部分。

“当前最大的瓶颈不在于系统不理解人类语言,而在于它对物理世界的理解。未来,如果模型理解了物理世界的材质、运动规律和各类体验,反过来也会对高层级语言和深度思考提出需求。”由此可见,仅靠VLA或仅依赖世界模型都行不通。

在车展发布会上,轻舟展示了基于「世界模型+强化学习」统一架构的物理AI模型。

据介绍,该模型由云端世界模型+车端世界行为模型构成,可实现推理更强、决策更优、泛化更广三大升级。

其中,云端世界模型扮演「造物主」角色:利用自然语言指令生成极端驾驶场景,批量制造真实路测中罕见的长尾案例,用于大模型持续训练。

车端世界模型则是「执行者」,它是封装的VLA与在线世界模型。采用世界模型+强化学习统一架构,将多模态感知与实时轨迹生成深度耦合,完成从预测到决策的实时闭环。

李栋表示,轻舟世界模型的核心在于云端与车端的联合训练,而非先训练世界模型再单独训练车载模型。若采用后者,世界模型虽能覆盖90%的常规场景,却往往在剩余10%的边缘场景上存在盲区——而这恰恰是车载模型最难处理的部分。因此,两者必须协同设计、共同训练,才能相互补足。

训练完成后,该模型具备多端部署能力——既可在云端运行,也可经轻量化适配后部署至车端。

于骞补充说,这并非简单的蒸馏关系:“模型学习目标是物理世界的整体概率分布,蒸馏只是将这一分布应用于具体场景的一种方式。轻舟希望模型掌握完整的世界分布本身,而非局部近似——获得整体分布后,再灵活适配至不同的下游应用。”

「内存和带宽并非最大痛点」

在此架构下,「轻舟乘风MAX」辅助驾驶解决方案,基于500TOPS车端算力平台,即可对标上千TOPS的城市NOA体验。

李栋指出,轻舟始终坚持用国产芯片实现越级体验:“客观来说,早期国产芯片因供应链不完善,成熟度与海外芯片有差距,挑战重重。但经过几代迭代,已日趋稳定。轻舟正是凭借持续的技术创新,付出远超使用海外芯片的努力,最终实现了真正的越级体验。”

在这些挑战中,业界普遍视为核心痛点的内存和带宽,对轻舟来说反而不那么困扰。

“部署大模型时,最卡的不是内存和带宽,而是模型对环境的真正理解能力。”李栋表示:“我们在内存和带宽方面做了大量优化……最近确实在Thor芯片上遇到了带宽挑战,但通过一些技术手段解决了。”

在于骞和李栋看来,一切解决方案都源于那句被视为口头禅的「革自己的命」。只有这样,才能做出极致性价比又好用的系统。

他们认为,今年轻舟已将100-200TOPS高速NOA方案做成行业主流,明年相信500TOPS方案也会成为城市NOA标配。

L4 的终极账目

如今,轻舟的L2和L4共用同一底层架构。

“无论是L2还是L4,我们的底层技术高度一致,只是产品形态不同。底层技术能力越强,扩展新应用的边际成本就越低。”

于骞表示,底层能力就像「AI超级工厂」,只要足够强,就能适配任何车辆,解决任何场景。

基于此,轻舟在Robovan上看到了机会。于骞认为,进入2026年,无人物流竞争的不只是速度,更是服务、性能、综合降本,以及最根本的安全底线与可持续运营能力。

“L4减去L2,得出的就是安全运营。所以我们关注的是模型能支撑怎样的运营成本?成本边际效益是否足够低?当它的驾驶能力特别强,比如一个人能看1,000辆车,L4就能很好地运营。”

他透露,轻舟去年的运营水平是百台车级别,而今年将直接跃升至大几千台车规模,单车安全接管里程已达千公里级。

在无人物流赛道,轻舟更是将这种边际效益发挥到极致。于骞指出:通过复用L2乘用车的底层技术架构与成熟供应链,轻舟实现了同线路运营成本直降50%的商业闭环。

如今,轻舟已宣布将战略重心从无人驾驶全面升级至更广阔的通用物理AI。自动驾驶积累的世界模型能力、几何理解能力与海量本体数据,将成为其未来拓展新赛道的核心弹药,也为其拓展了巨大的可能性和想象空间。

相关阅读:

轻舟智航D轮融资1亿美元!加码「世界模型+RL」路线的物理AI研发