物理AI:超越大模型的下一个产业浪潮
过去三年,资本市场热议的焦点一直是大模型。
从ChatGPT到DeepSeek,从训练算力到推理算力,从光模块到PCB,整条AI产业链都聚焦于"数字世界中的智能"这一命题。
然而拉长时间维度,一个更为宏大的叙事正在浮现。大模型解决的是信息世界的问题,而物理AI要解决的则是现实世界的问题。
这或许才是人工智能真正实现产业化的终极形态。
根据中泰证券最新研报,物理AI(Physical AI)是能够感知、理解并在真实物理世界执行复杂任务的AI系统,其核心应用场景涵盖人形机器人、智能驾驶和工业机器人。
通俗来说:ChatGPT擅长思考。而物理AI不仅能思考,还能行动。
它能够驾驶汽车、搬运货物、拧紧螺丝、打理家务,甚至未来可能像人类一样完成绝大多数体力劳动。
这意味着,AI正在从数字世界渗透到真实世界。这是一场从"软件革命"向"物理革命"的深刻跨越。
物理AI为何至关重要?
生成式AI最大的短板在于,它始终局限于屏幕之中。
无论多么智能,它也只是回答问题。但人类社会创造价值的主要部分,实际上发生在现实世界。
工厂生产、物流运输、家庭服务、城市管理、医疗护理……这些场景不仅需要认知能力,更需要行动能力。
而物理AI的核心价值,正是实现:
感知 → 理解 → 决策 → 执行
最终构建完整闭环。从这个维度看,物理AI更像是人工智能发展的进阶阶段。
研报指出,物理AI正是人工智能从虚拟智能迈向具身智能的核心桥梁。
大模型之后,三大基础模型正在融合
当前物理AI的底层架构,正朝着三类模型融合的方向演进:
第一类是VLM(视觉语言模型)。
负责环境理解和逻辑推理及任务规划,相当于机器人的"大脑"。
第二类是VLA(视觉语言动作模型)。
负责将语言和视觉信息直接转化为动作指令,相当于"小脑和神经系统"。
第三类是世界模型(World Model)。
负责模拟真实世界,生成训练数据,相当于机器人的"梦境工厂"。
未来最强大的机器人,很可能就是:世界模型 + VLM + VLA三位一体。
世界模型构建世界。VLM理解世界。VLA改变世界。
这与当下的大模型竞争已截然不同。
真正的竞争焦点正从参数规模转向现实世界数据。
英伟达真正追求的,不只是销售GPU
许多人都认为GPU是英伟达最大的护城河。
但深入物理AI产业链后,你会发现黄仁勋的野心远不止于此。
英伟达已构建起完整生态:Omniverse数字孪生平台;Isaac机器人仿真平台;Cosmos世界模型;GR00T机器人基础模型;GPU训练芯片;推理芯片
形成了从训练到部署的全栈体系。
黄仁勋曾多次表明一个愿景:成为机器人时代的Android。
也就是说,未来无论谁生产机器人,都可能需要使用英伟达的软件平台和基础模型。
一旦这一战略成功,英伟达获得的将不仅是芯片利润。
而是整个机器人生态的主导权。
智能驾驶,或许是物理AI最先爆发的场景
许多投资者将自动驾驶和机器人分开审视。
实际上,它们正在快速融合。因为汽车本质上也是机器人。只是拥有四个轮子。
当前行业已从传统规则驱动,升级到端到端大模型,并开始向VLA和世界模型方向演进。
理想、小鹏、华为、小米、蔚来等企业均在VLA路线上布局。
尤其值得关注的是:同一套模型未来既可控制汽车,也可控制机器人。
这意味着:未来自动驾驶积累的数据、算法和算力,很可能成为人形机器人发展的基础设施。
因此,智能驾驶实际上是物理AI率先落地的先锋军。
人形机器人真正的护城河,不是硬件
市场一直在热议电机、减速器、丝杠等硬件。
但未来决定机器人竞争格局的,未必是这些硬件。
而是数据。
谁掌握最多真实场景数据。
谁就掌握最强模型。
谁掌握最强模型。
谁就掌握最大市场。
Figure、Tesla、智元机器人、宇树科技都在加速部署机器人,以获取更多真实世界数据。
这里会形成一个强劲的飞轮:机器人部署增加,产生更多数据,模型持续优化,机器人能力提升,部署规模扩大,获得更多数据
这种飞轮一旦形成,行业集中度将迅速提高。
未来机器人行业可能出现类似当前互联网平台的赢家通吃格局。
市场忽视了最赚钱的一层
如果说机器人是舞台中央的明星。
那么工具层就是卖铲子的人。
也是当前最被低估的方向。
研报特别强调:仿真平台可能是物理AI时代最核心的基础设施。
原因很明确。
真实机器人训练成本极高。
一个机器人跌倒一次,可能损失数万元。
因此绝大多数训练必须先在虚拟世界完成。
这就需要高精度仿真平台。
包括:物理引擎、渲染引擎、数字孪生系统、生成式数据平台
这些能力共同构成机器人训练场。
英伟达Omniverse和Isaac目前处于领先地位。
国内则出现了智元Genie Sim、索辰科技开物平台、五一视界51Sim等参与者。
许多投资者盯着机器人本体。
但真正有可能持续收取"平台税"的,或许是这些工具层企业。
物理AI带来的投资机会在哪里?
如果将产业链拆解看,未来受益方向主要集中在三个层面。
第一层是基础模型。
包括世界模型、VLA、机器人操作系统。
第二层是智能终端。
包括人形机器人、自动驾驶汽车、工业机器人。
第三层则是工具层。
包括仿真平台、数字孪生、工业软件和CAE软件。
而从产业成熟度来看,工具层和智能驾驶的商业化进展,可能会快于人形机器人。
这也是当前市场预期差最大的方向。
结语
2023年市场热议的是"大模型"。2024年热议的是"AI应用"。2025年热议的是"推理算力"。
而站在2026年向后展望,一个新的时代正在开启。
过去的AI只是理解世界。未来的AI将进入世界。
当机器人开始学会开门、端茶、驾驶、搬运、制造时,人工智能才真正完成从数字生命到物理生命的跃迁。
这就是物理AI。
它不是机器人行业的一个分支。
而可能是继互联网、移动互联网、生成式AI之后,下一个十年最大的产业浪潮。
参考研报:中泰证券《在时间的折痕处——物理AI》