物理AI崛起：机器开始推开现实之门

发布时间：2026-04-27 09:18阅读：12

过去十八个月里，全球最聪明的一群人都沉浸在一场空前热闹的“文字竞赛”中。大语言模型学会了写诗、写代码、通过律师考试，甚至还流露出一种让人不安的共情感。

投资者们为此押上了数千亿美元，硅谷的用电曲线几乎一路陡升。

但就在这股喧嚣抵达高点时，一种更安静、却可能更具颠覆性的变化正在发生。它的标志不是论文，也不是发布会，而是一扇被推开的门。

去年年底，一家中国初创企业放出了一段视频：一只接入AI系统的机械臂，第一次尝试打开一扇弹簧门。这并非预先写好的动作——因为它从没见过这扇门。

它必须理解“铰链”的物理关系，判断门的重量和弹簧阻力，实时调整机械臂的力量与角度。前面连续失败了三次后，第四次终于成功。

这个看起来微不足道的动作，实际上意味着一个时代的起点。人工智能正在从数字空间伸出手，准备触碰真实世界。人们把它称为“物理AI”。

思考与行动的鸿沟

要弄明白这场变化的分量，不妨设想一个场景。让当今最强的大语言模型——假设是GPT-5，或者更强的系统——替你泡一杯咖啡。

它会很快生成一份几乎完美的操作清单：取豆、研磨、烧水、冲泡、过滤。语言得体，步骤完整，甚至可能还会加上一句“请慢用”。

可这份说明书，对屋子里的一台机器人来说毫无用处。

它并不知道“取豆”意味着识别咖啡豆包装的材质，估算摩擦力，避免豆子撒得到处都是；“研磨”需要理解研磨机的结构，判断旋钮转动的方向和力度；“烧水”则涉及对液体晃动的实时感知与控制。

现实世界里，到处都是数字模型很难捕捉的细节：材质的触感、流体的变化、难以预测的摩擦。

过去十年的AI革命，本质上是一场关于信息的革命——理解、生成并操控符号。

它取得了耀眼的成功。但数字AI始终停留在一个封闭空间里：输入文本，输出文本。现实世界的混乱、不确定性以及物理规律，被它几乎完整地排除在外。

物理AI要跨过去的，正是这道从思考到行动的鸿沟。它的核心不再是“知道了什么”，而是“做到什么”。它要求系统在毫秒之间完成感知、推理、决策与执行的完整闭环。

一辆自动驾驶汽车的传感器捕捉到的画面，不再只是给人看的图像，而是机器理解世界，并决定下一秒方向盘该转多少的依据。

机器人手臂上的触觉传感器数据，也不是要被存档的日志，而是实时调整夹爪力度、避免捏碎一颗番茄的指令。

这标志着人工智能一次根本性的能力跃迁。

闭环的威力

物理AI真正强大的地方，在于数据闭环和商业闭环之间形成的正反馈飞轮。这和纯软件产品完全不同。

数字AI如果写错一首诗，用户最多耸耸肩，再试一次，损失几乎为零。但物理AI一旦没能识别前方行人，代价可能就是生命。

这种严苛要求，反而变成了一种很难复制的优势：物理AI每一次行动都会生成独一无二、价值极高的数据，而这些数据又会被拿去训练更强的模型。

更强的模型意味着更安全的产品，更安全的产品带来更大的销量，更大的销量又会产出更多数据。

这种循环在自动驾驶领域已经非常清楚。特斯拉凭借数百万辆行驶在路上的汽车，积累了竞争对手难以匹敌的真实驾驶数据。Momenta CEO曹旭东最近在北京车展上的说法也印证了这一点。

他提到，智能驾驶行业的规模效应“比芯片行业更明显”——软件边际成本为零，而每增加一个客户，系统不仅成本在下降，性能也在提升。

“对主机厂而言，先发优势非常强，”曹旭东说，“海外OEM的采购周期可能长达五到七年。一旦进入，几乎很难被撼动。”

这也解释了为什么他预测，全球智驾供应商最终大概率只会剩下三到四家。这不是技术本身决定的，而是物理现实决定的——规模决定谁能继续留在牌桌上。

谁拿得到门票

不过，智驾本身只是开场。

曹旭东的定义很直接：自动驾驶是“物理AI的序章”。它之所以重要，是因为它是目前唯一一个已经同时跑通数据闭环和商业闭环的物理AI领域。这意味着现金流。而现金流，在他看来，就是“门票”。

“物理AI是有门票的，”他说，“而这张门票就是你的现金流业务。不管怎样，你都必须有一个现金流业务来支撑物理AI研发。”

门票的价格高得惊人：百亿甚至千亿美元级别的投入。这不是夸张的说法。要训练一个能在物理世界安全运行的基础模型，需要海量真实世界数据、巨大的仿真算力，以及最关键的——在真实环境里不断试错的成本。

这和在海量文本语料上训练语言模型，完全不是一个量级。

因此，Momenta的战略逻辑非常清晰，也很冷静：用已经盈利或即将盈利的智能驾驶业务，去支撑机器人技术研发。赚今天的钱，买明天的门票。

这并不是某一家公司的单独选择，而是一条行业生存法则。那些没有现金流支撑的物理AI公司，无论技术多惊艳，最终都会在通向终点的路上被淘汰。

新世界的轮廓

当物理AI真正成熟时，世界会变成什么样？

首先是汽车。它不再只是交通工具，而会成为移动的物理AI终端。2025到2035年之间，全球预计将出厂1.45亿台物理AI设备，其中自动驾驶汽车是最大的单一品类。

汽车竞争的维度将从马力、内饰，转向算力、传感器，以及数据闭环能力。传统汽车巨头面对的，不再只是造车新势力，而是必须适应物理AI的新商业逻辑。

接下来是工厂。今天的大多数工业机器人其实是“看不见的重复者”——它们被围栏隔开，只能执行预设轨迹。物

理AI会让它们真正“睁开眼睛”，去处理动态变化的任务：识别散落零件、操作柔性材料，并与人类安全协作。MarketsandMarkets预测，到2032年，全球物理AI市场规模将达到1524亿美元，年复合增长率超过47%。

然后是家庭。人形机器人的终极承诺——一个能叠衣服、打扫卫生、做饭的通用家用机器人——将在物理AI基础上变得可实现。这可能也是增长最快的细分赛道，年复合增长率高达73%。

还有一个更深层的变化：实现“人智溢出”。正如蒸汽机溢出了体力，物理AI也将开始溢出一部分人类智能。技术不再只是思考的工具，而会成为行动的伙伴。人类的智能第一次拥有了体外延伸的行动能力。

中国的时刻

在这场转变中，中国的分量不容忽视。原因不只是技术和资本，更在于场景。

中国拥有全球最完整的制造业体系，也拥有最丰富的工业应用场景。当美国企业可能还在为算法突破欢呼时，中国公司已经在工厂车间里用物理AI解决一个具体的分拣问题。

这种“场景驱动”的迭代方式，在物理AI竞争中可能是一种被低估的优势。Momenta的路径选择——扎根于

← 上一篇：AI赋能商会聚力企业新增长下一篇：AI驱动科学仪器跃迁 →