物理AI崛起:机器开始推开现实之门
过去十八个月里,全球最聪明的一群人都沉浸在一场空前热闹的“文字竞赛”中。大语言模型学会了写诗、写代码、通过律师考试,甚至还流露出一种让人不安的共情感。
投资者们为此押上了数千亿美元,硅谷的用电曲线几乎一路陡升。
但就在这股喧嚣抵达高点时,一种更安静、却可能更具颠覆性的变化正在发生。它的标志不是论文,也不是发布会,而是一扇被推开的门。
去年年底,一家中国初创企业放出了一段视频:一只接入AI系统的机械臂,第一次尝试打开一扇弹簧门。这并非预先写好的动作——因为它从没见过这扇门。
它必须理解“铰链”的物理关系,判断门的重量和弹簧阻力,实时调整机械臂的力量与角度。前面连续失败了三次后,第四次终于成功。
这个看起来微不足道的动作,实际上意味着一个时代的起点。人工智能正在从数字空间伸出手,准备触碰真实世界。人们把它称为“物理AI”。
思考与行动的鸿沟
要弄明白这场变化的分量,不妨设想一个场景。让当今最强的大语言模型——假设是GPT-5,或者更强的系统——替你泡一杯咖啡。
它会很快生成一份几乎完美的操作清单:取豆、研磨、烧水、冲泡、过滤。语言得体,步骤完整,甚至可能还会加上一句“请慢用”。
可这份说明书,对屋子里的一台机器人来说毫无用处。
它并不知道“取豆”意味着识别咖啡豆包装的材质,估算摩擦力,避免豆子撒得到处都是;“研磨”需要理解研磨机的结构,判断旋钮转动的方向和力度;“烧水”则涉及对液体晃动的实时感知与控制。
现实世界里,到处都是数字模型很难捕捉的细节:材质的触感、流体的变化、难以预测的摩擦。
过去十年的AI革命,本质上是一场关于信息的革命——理解、生成并操控符号。
它取得了耀眼的成功。但数字AI始终停留在一个封闭空间里:输入文本,输出文本。现实世界的混乱、不确定性以及物理规律,被它几乎完整地排除在外。
物理AI要跨过去的,正是这道从思考到行动的鸿沟。它的核心不再是“知道了什么”,而是“做到什么”。它要求系统在毫秒之间完成感知、推理、决策与执行的完整闭环。
一辆自动驾驶汽车的传感器捕捉到的画面,不再只是给人看的图像,而是机器理解世界,并决定下一秒方向盘该转多少的依据。
机器人手臂上的触觉传感器数据,也不是要被存档的日志,而是实时调整夹爪力度、避免捏碎一颗番茄的指令。
这标志着人工智能一次根本性的能力跃迁。
闭环的威力
物理AI真正强大的地方,在于数据闭环和商业闭环之间形成的正反馈飞轮。这和纯软件产品完全不同。
数字AI如果写错一首诗,用户最多耸耸肩,再试一次,损失几乎为零。但物理AI一旦没能识别前方行人,代价可能就是生命。
这种严苛要求,反而变成了一种很难复制的优势:物理AI每一次行动都会生成独一无二、价值极高的数据,而这些数据又会被拿去训练更强的模型。
更强的模型意味着更安全的产品,更安全的产品带来更大的销量,更大的销量又会产出更多数据。
这种循环在自动驾驶领域已经非常清楚。特斯拉凭借数百万辆行驶在路上的汽车,积累了竞争对手难以匹敌的真实驾驶数据。Momenta CEO曹旭东最近在北京车展上的说法也印证了这一点。
他提到,智能驾驶行业的规模效应“比芯片行业更明显”——软件边际成本为零,而每增加一个客户,系统不仅成本在下降,性能也在提升。
“对主机厂而言,先发优势非常强,”曹旭东说,“海外OEM的采购周期可能长达五到七年。一旦进入,几乎很难被撼动。”
这也解释了为什么他预测,全球智驾供应商最终大概率只会剩下三到四家。这不是技术本身决定的,而是物理现实决定的——规模决定谁能继续留在牌桌上。
谁拿得到门票
不过,智驾本身只是开场。
曹旭东的定义很直接:自动驾驶是“物理AI的序章”。它之所以重要,是因为它是目前唯一一个已经同时跑通数据闭环和商业闭环的物理AI领域。这意味着现金流。而现金流,在他看来,就是“门票”。
“物理AI是有门票的,”他说,“而这张门票就是你的现金流业务。不管怎样,你都必须有一个现金流业务来支撑物理AI研发。”
门票的价格高得惊人:百亿甚至千亿美元级别的投入。这不是夸张的说法。要训练一个能在物理世界安全运行的基础模型,需要海量真实世界数据、巨大的仿真算力,以及最关键的——在真实环境里不断试错的成本。
这和在海量文本语料上训练语言模型,完全不是一个量级。
因此,Momenta的战略逻辑非常清晰,也很冷静:用已经盈利或即将盈利的智能驾驶业务,去支撑机器人技术研发。赚今天的钱,买明天的门票。
这并不是某一家公司的单独选择,而是一条行业生存法则。那些没有现金流支撑的物理AI公司,无论技术多惊艳,最终都会在通向终点的路上被淘汰。
新世界的轮廓
当物理AI真正成熟时,世界会变成什么样?
首先是汽车。它不再只是交通工具,而会成为移动的物理AI终端。2025到2035年之间,全球预计将出厂1.45亿台物理AI设备,其中自动驾驶汽车是最大的单一品类。
汽车竞争的维度将从马力、内饰,转向算力、传感器,以及数据闭环能力。传统汽车巨头面对的,不再只是造车新势力,而是必须适应物理AI的新商业逻辑。
接下来是工厂。今天的大多数工业机器人其实是“看不见的重复者”——它们被围栏隔开,只能执行预设轨迹。物
理AI会让它们真正“睁开眼睛”,去处理动态变化的任务:识别散落零件、操作柔性材料,并与人类安全协作。MarketsandMarkets预测,到2032年,全球物理AI市场规模将达到1524亿美元,年复合增长率超过47%。
然后是家庭。人形机器人的终极承诺——一个能叠衣服、打扫卫生、做饭的通用家用机器人——将在物理AI基础上变得可实现。这可能也是增长最快的细分赛道,年复合增长率高达73%。
还有一个更深层的变化:实现“人智溢出”。正如蒸汽机溢出了体力,物理AI也将开始溢出一部分人类智能。技术不再只是思考的工具,而会成为行动的伙伴。人类的智能第一次拥有了体外延伸的行动能力。
中国的时刻
在这场转变中,中国的分量不容忽视。原因不只是技术和资本,更在于场景。
中国拥有全球最完整的制造业体系,也拥有最丰富的工业应用场景。当美国企业可能还在为算法突破欢呼时,中国公司已经在工厂车间里用物理AI解决一个具体的分拣问题。
这种“场景驱动”的迭代方式,在物理AI竞争中可能是一种被低估的优势。Momenta的路径选择——扎根于