AI新纪元:物理智能崛起,李飞飞与杨立昆的万亿赛道对决
赢渔产融 点击蓝字
关注
过去两年,全球投资界的热点几乎都集中在大语言模型上。ChatGPT、Claude、DeepSeek——它们擅长创作、编程和解答,但都有一个共同短板:被困在数字界面中。
物理智能,就是让AI突破云端限制,具备实体形态,能感知、理解并改变真实环境。
它不再是“对话”,而是“执行”;不再是“提供答案”,而是“处理任务”。这是一次从“数字智慧”向“实体智慧”的深刻转型。
2025年全球物理智能市场规模估计为380亿美元,预计2030年将跃升至3000亿美元,年复合增长率超50%。人形机器人、自动驾驶、AI PC、AI眼镜四大领域正同步兴起。
当前动态:从“表演”走向“实际应用”
2025年全球人形机器人出货量达1.8万台,同比增长5倍。国内宇树科技2025年人形机器人出货超5500台,海外Optimus计划2026年启动量产,目标2030年产量100万台。
人形机器人正从“实验室演示”迈向“工业场景实用”的关键阶段。优先进入搬运、巡检等工业领域。先应用于工厂、再拓展至家庭,是业界普遍认同的落地顺序。
下一个焦点在“智能”——不是硬件,是模型能力
人形机器人的核心竞争已从“关节电机、灵巧手、传感器”转向“大脑”的智慧程度。机器人AI模型能力决定其智能水平,AI大模型+数据+算力,是下一轮商业化的决胜点。
工业场景对“失误”的容忍度极低,要求机器人在复杂动态环境中独立决策。模型能力是当前最大障碍,也是最大投资机遇。
自动驾驶高速发展,比预期更快
如果说物理智能有一个“最大应用领域”,那就是自动驾驶。它比人形机器人更早进入商业验证期。
年初在美国测试FSD,全程无需干预,红绿灯、掉头、进出主路——系统处理得比熟练驾驶员还平稳。特斯拉FSD监督版正式进入中国,标志着全球最大汽车市场步入自动驾驶竞争新纪元。
百度萝卜快跑等已实现出行服务运营,累计完成2000万次服务。
三大推动力:
政策推动:全国多个城市开放无人驾驶商业运营区,L3/L4路权逐渐放宽
成本降低:车载激光雷达、摄像头方案快速普及,单车智能驾驶硬件成本两年下降40%
AI数据循环加速:自动驾驶每多行驶一公里,模型就更智能,形成“行驶越多、驾驶越稳”的良性循环
为何需要AI PC?
智能代理时代来临后,越来越多任务需在本地处理。云端推理存在延迟、隐私隐患和网络依赖。本地算力、低延迟、保护隐私的AI PC成为必要选择。
2026年是AI PC爆发起始年
联想、戴尔等主流PC厂商已全面投入AI PC。英伟达正式推出AIPC芯片N1,联合微软、Arm,构建Win+Arm+CUDA生态,挑战传统Wintel联盟。
黄仁勋表示:“AI PC不只是一台运行AI软件的电脑,它是为AI时代全新设计的个人计算平台。”
硬件趋势:NPU算力突破100TOPS,支持更大型参数模型在本地运行。软件趋势:个人智能代理Agent、本地知识库深度整合,以AI PC为代表的端侧AI成为家庭、个人的智能中心。
从“手机+AI”到“眼镜+AI”
AI眼镜预示着下一代交互变革。过去是手机+AI,未来是眼镜+AI。
AI眼镜将摄像头捕捉的影像通过AI大模型实时解析,实现实时语音、文字互动,成为AI的随身入口。它让AI不再是一个需主动打开的应用,而是持续在线的“自然交互界面”。
出货量快速攀升
2025年全球AI眼镜出货870万副,同比增长3倍以上。Meta-RayBan、小米眼镜、Rokid、夸克眼镜是主要参与者。预计2027年出货量将突破3000万副。
无论是人形机器人、自动驾驶,还是AI PC、AI眼镜,底层共享同一套技术框架:
物理智能需要理解现实世界。传感器(摄像头、激光雷达、IMU)和AI视觉模型(VLA、世界模型)共同构成感知层。
VLA模型让AI不仅“看见”障碍物,还能“领会”其行为意图。世界模型则让AI能够预判未来几秒将发生什么。
物理智能的决策不是“生成下一句话”,而是“规划下一步动作”。它需要理解物理法则、考虑安全边界、做出可执行决策。
分层架构(规则+AI)和端到端架构(纯神经网络)两条路线并行。前者更可控,后者更贴近人类。
物理智能必须驱动物理实体——车轮、机械臂、屏幕显示、语音输出。
实时性要求从“秒级”降至“毫秒级”。自动驾驶的制动响应、机器人的碰撞规避、AR眼镜的SLAM定位——每一毫秒都关乎安全。
在物理智能的赛道上,两条技术路径正同步推进,它们代表了AI理解物理世界的两种不同方式。
李飞飞的目标是用AI“绘制”出无限接近真实世界的三维场景,核心是感知与重建。
她创办的World Labs正利用“实时帧模型”构建可交互的3D世界,最新一轮融资10亿美元,成立不到两年估值超50亿美元。李飞飞坦言:“仅靠语言不足以构建通用人工智能。人类大量智能是非语言的,AI必须获得空间智能。”
落地场景指向智能座舱(如车载虚拟环境、交互界面),类似理想、小鹏正在探索的“云端世界模型”。
杨立昆的目标不是“描绘世界”,而是让AI理解物理规律、进行推理、指导行动,核心是认知与决策。
他创立的AMI Labs完成10.3亿美元种子轮融资,创下欧洲AI领域种子轮融资规模纪录,计算机视觉领域顶尖学者谢赛宁以首席科学官身份加入。
杨立昆认为,当前大语言模型本质上是“复现逻辑”——在模仿训练数据的统计规律。但真正的智能需要“预测逻辑”——在行动前预判行为的物理后果。他的JEPA架构不是在像素空间预测下一帧画面,而是在抽象的表征空间预测物理规律。
落地场景直指智能驾驶,相当于华为、蔚来在推进的“车端行为世界模型”。
两人共识却非常明确:大语言模型只是智能的一环,必须完成对物理世界的认知与推理,才能迈向真正的AGI。
英伟达在2025年CES上发布的物理AI世界基础模型平台Cosmos,已将“感知-预测-行动”的闭环能力整合在一起。浙商证券判断,物理AI当前需要世界模型+VLA共同实现,世界模型负责物理直觉和决策推演,VLA负责语义理解和任务规划。
主线一:世界模型与物理AI算法层——下一代AI的“大脑”
李飞飞和杨立昆的10亿美元级融资表明,资本正在重仓“AI理解物理世界”的能力。我们建议关注有世界模型能力的公司。一级市场方面,World Labs、AMI Labs、Momenta、飞渡科技、虚时科技(Intime AI)、凌迪科技等正成为资本追逐的标的。
主线二:核心硬件层——确定性最高的“卖铲人”
无论谁最终胜出,传感器、芯片、执行器都会持续放量。黄仁勋认为物理AI将重塑50万亿美元产业,Coatue Management预计物理AI市场规模至少可达6万亿美元,较数字AI高出约50%。
主线三:垂直应用层——商业化最快的场景
自动驾驶已率先跑通商业闭环,浙商证券判断是物理AI最先商业化的场景。工业软件是物理AI训练、验证、部署的控制台,CAE仿真、数字孪生、工业控制、能源调度等场景为物理AI提供物理底座和数据环境。
杨立昆和李飞飞都在用10亿美元级别的融资,押注同一个方向:让AI理解物理世界。
黄仁勋说:“物理AI的ChatGPT时刻已经到来。”
大模型解决了“理解”的问题,物理AI正在解决“行动”的问题。从屏幕里的文字到现实世界中的动作,从回答问题到解决问题——这是AI产业的下一场范式革命。
而对于投资人而言,最大的不确定性不在于技术能不能做成,而在于谁先做成。正如一位投资人所说:“资本押注的是企业能否跑通‘数据—模型—场景’飞轮。若企业能率先在真实场景中完成规模化部署,就可以形成先发优势。”
.end.