AI新纪元：物理智能崛起，李飞飞与杨立昆的万亿赛道对决

发布时间：2026-06-27 11:23阅读：2

赢渔产融点击蓝字

关注

过去两年，全球投资界的热点几乎都集中在大语言模型上。ChatGPT、Claude、DeepSeek——它们擅长创作、编程和解答，但都有一个共同短板：被困在数字界面中。

物理智能，就是让AI突破云端限制，具备实体形态，能感知、理解并改变真实环境。

它不再是“对话”，而是“执行”；不再是“提供答案”，而是“处理任务”。这是一次从“数字智慧”向“实体智慧”的深刻转型。

2025年全球物理智能市场规模估计为380亿美元，预计2030年将跃升至3000亿美元，年复合增长率超50%。人形机器人、自动驾驶、AI PC、AI眼镜四大领域正同步兴起。

当前动态：从“表演”走向“实际应用”

2025年全球人形机器人出货量达1.8万台，同比增长5倍。国内宇树科技2025年人形机器人出货超5500台，海外Optimus计划2026年启动量产，目标2030年产量100万台。

人形机器人正从“实验室演示”迈向“工业场景实用”的关键阶段。优先进入搬运、巡检等工业领域。先应用于工厂、再拓展至家庭，是业界普遍认同的落地顺序。

下一个焦点在“智能”——不是硬件，是模型能力

人形机器人的核心竞争已从“关节电机、灵巧手、传感器”转向“大脑”的智慧程度。机器人AI模型能力决定其智能水平，AI大模型+数据+算力，是下一轮商业化的决胜点。

工业场景对“失误”的容忍度极低，要求机器人在复杂动态环境中独立决策。模型能力是当前最大障碍，也是最大投资机遇。

自动驾驶高速发展，比预期更快

如果说物理智能有一个“最大应用领域”，那就是自动驾驶。它比人形机器人更早进入商业验证期。

年初在美国测试FSD，全程无需干预，红绿灯、掉头、进出主路——系统处理得比熟练驾驶员还平稳。特斯拉FSD监督版正式进入中国，标志着全球最大汽车市场步入自动驾驶竞争新纪元。

百度萝卜快跑等已实现出行服务运营，累计完成2000万次服务。

三大推动力：

政策推动：全国多个城市开放无人驾驶商业运营区，L3/L4路权逐渐放宽

成本降低：车载激光雷达、摄像头方案快速普及，单车智能驾驶硬件成本两年下降40%

AI数据循环加速：自动驾驶每多行驶一公里，模型就更智能，形成“行驶越多、驾驶越稳”的良性循环

为何需要AI PC？

智能代理时代来临后，越来越多任务需在本地处理。云端推理存在延迟、隐私隐患和网络依赖。本地算力、低延迟、保护隐私的AI PC成为必要选择。

2026年是AI PC爆发起始年

联想、戴尔等主流PC厂商已全面投入AI PC。英伟达正式推出AIPC芯片N1，联合微软、Arm，构建Win+Arm+CUDA生态，挑战传统Wintel联盟。

黄仁勋表示：“AI PC不只是一台运行AI软件的电脑，它是为AI时代全新设计的个人计算平台。”

硬件趋势：NPU算力突破100TOPS，支持更大型参数模型在本地运行。软件趋势：个人智能代理Agent、本地知识库深度整合，以AI PC为代表的端侧AI成为家庭、个人的智能中心。

从“手机+AI”到“眼镜+AI”

AI眼镜预示着下一代交互变革。过去是手机+AI，未来是眼镜+AI。

AI眼镜将摄像头捕捉的影像通过AI大模型实时解析，实现实时语音、文字互动，成为AI的随身入口。它让AI不再是一个需主动打开的应用，而是持续在线的“自然交互界面”。

出货量快速攀升

2025年全球AI眼镜出货870万副，同比增长3倍以上。Meta-RayBan、小米眼镜、Rokid、夸克眼镜是主要参与者。预计2027年出货量将突破3000万副。

无论是人形机器人、自动驾驶，还是AI PC、AI眼镜，底层共享同一套技术框架：

物理智能需要理解现实世界。传感器（摄像头、激光雷达、IMU）和AI视觉模型（VLA、世界模型）共同构成感知层。

VLA模型让AI不仅“看见”障碍物，还能“领会”其行为意图。世界模型则让AI能够预判未来几秒将发生什么。

物理智能的决策不是“生成下一句话”，而是“规划下一步动作”。它需要理解物理法则、考虑安全边界、做出可执行决策。

分层架构（规则+AI）和端到端架构（纯神经网络）两条路线并行。前者更可控，后者更贴近人类。

物理智能必须驱动物理实体——车轮、机械臂、屏幕显示、语音输出。

实时性要求从“秒级”降至“毫秒级”。自动驾驶的制动响应、机器人的碰撞规避、AR眼镜的SLAM定位——每一毫秒都关乎安全。

在物理智能的赛道上，两条技术路径正同步推进，它们代表了AI理解物理世界的两种不同方式。

李飞飞的目标是用AI“绘制”出无限接近真实世界的三维场景，核心是感知与重建。

她创办的World Labs正利用“实时帧模型”构建可交互的3D世界，最新一轮融资10亿美元，成立不到两年估值超50亿美元。李飞飞坦言：“仅靠语言不足以构建通用人工智能。人类大量智能是非语言的，AI必须获得空间智能。”

落地场景指向智能座舱（如车载虚拟环境、交互界面），类似理想、小鹏正在探索的“云端世界模型”。

杨立昆的目标不是“描绘世界”，而是让AI理解物理规律、进行推理、指导行动，核心是认知与决策。

他创立的AMI Labs完成10.3亿美元种子轮融资，创下欧洲AI领域种子轮融资规模纪录，计算机视觉领域顶尖学者谢赛宁以首席科学官身份加入。

杨立昆认为，当前大语言模型本质上是“复现逻辑”——在模仿训练数据的统计规律。但真正的智能需要“预测逻辑”——在行动前预判行为的物理后果。他的JEPA架构不是在像素空间预测下一帧画面，而是在抽象的表征空间预测物理规律。

落地场景直指智能驾驶，相当于华为、蔚来在推进的“车端行为世界模型”。

两人共识却非常明确：大语言模型只是智能的一环，必须完成对物理世界的认知与推理，才能迈向真正的AGI。

英伟达在2025年CES上发布的物理AI世界基础模型平台Cosmos，已将“感知-预测-行动”的闭环能力整合在一起。浙商证券判断，物理AI当前需要世界模型+VLA共同实现，世界模型负责物理直觉和决策推演，VLA负责语义理解和任务规划。

主线一：世界模型与物理AI算法层——下一代AI的“大脑”

李飞飞和杨立昆的10亿美元级融资表明，资本正在重仓“AI理解物理世界”的能力。我们建议关注有世界模型能力的公司。一级市场方面，World Labs、AMI Labs、Momenta、飞渡科技、虚时科技（Intime AI）、凌迪科技等正成为资本追逐的标的。

主线二：核心硬件层——确定性最高的“卖铲人”

无论谁最终胜出，传感器、芯片、执行器都会持续放量。黄仁勋认为物理AI将重塑50万亿美元产业，Coatue Management预计物理AI市场规模至少可达6万亿美元，较数字AI高出约50%。

主线三：垂直应用层——商业化最快的场景

自动驾驶已率先跑通商业闭环，浙商证券判断是物理AI最先商业化的场景。工业软件是物理AI训练、验证、部署的控制台，CAE仿真、数字孪生、工业控制、能源调度等场景为物理AI提供物理底座和数据环境。

杨立昆和李飞飞都在用10亿美元级别的融资，押注同一个方向：让AI理解物理世界。

黄仁勋说：“物理AI的ChatGPT时刻已经到来。”

大模型解决了“理解”的问题，物理AI正在解决“行动”的问题。从屏幕里的文字到现实世界中的动作，从回答问题到解决问题——这是AI产业的下一场范式革命。

而对于投资人而言，最大的不确定性不在于技术能不能做成，而在于谁先做成。正如一位投资人所说：“资本押注的是企业能否跑通‘数据—模型—场景’飞轮。若企业能率先在真实场景中完成规模化部署，就可以形成先发优势。”

.end.

← 上一篇：AI视频销售流程剖析：为何内容表现持续恶化下一篇：小番茄的 AI 蜕变：半小时从入门到精通 →