华人AI科学家苏昊归国，执掌复旦通用物理智能研究院

发布时间：2026-04-25 12:00阅读：11

AI领域人物 | 感知他们推动世界的努力

2009年，普林斯顿大学发布了名为ImageNet的数据库。该库收集了超过1400万张已标注的图像，分为20000多个类别。

后续发展你可能已知：2012年，多伦多大学的AlexNet模型借助ImageNet训练，成功将图像识别准确率提升10个百分点。自此，深度学习成为AI的主流方向。许多人将ImageNet称为“点燃此次AI革命的导火索”。

这个数据库的团队中，有一位中国留学生，名叫苏昊。

2026年4月18日，复旦大学在中国三维视觉大会上公布：苏昊正式加入复旦，担任浩清特聘教授，并主导建设通用物理智能研究院。

北航高等理工学院首届毕业生

苏昊于2002年进入北京航空航天大学计算机系，成为北航高等理工学院的首批学员。本科阶段，他师从中国科学院院士、北航前校长李未教授，研究方向是数理逻辑与自动定理证明——一个“让计算机自行证明数学定理”的领域，与如今热门的AI相距甚远，但更接近数学本质。

2005年，李未教授推荐他前往微软亚洲研究院实习。在那里，他跟随过三位导师：孙剑（后成为旷视首席科学家）、沈向洋（后任微软全球执行副总裁）、周明（后任微软亚研副院长）。

2008年，沈向洋推荐他去普林斯顿和斯坦福——跟随一位名叫李飞飞的教授，参与一个当时不被看好的数据库项目。

ImageNet的岁月

那几年，李飞飞整个团队都在做一件繁琐的工作：将互联网上抓取的成千上万张图片逐张添加标签。

一张狗的照片标注“狗”、一张帆船标注“帆船”、一把勺子标注“勺子”。最终，他们完成了1400万张图片、20000多个类别的标注。

2009年该数据库正式发布，业内许多人认为“标注这么多图片有何用”。直到2012年AlexNet利用它训练出破纪录的模型，AI界才意识到：没有这个数据库，深度学习无法起步。

苏昊是ImageNet早期的核心贡献者之一。2008至2012年期间，他的名字频繁出现在ImageNet相关论文中。

为AI增添第三个维度

博士阶段，苏昊进入斯坦福计算机系，师从三维几何领域的权威Leonidas Guibas教授。

他随后完成了两项工作，都围绕同一个问题：AI已能理解二维图像，如何让它理解三维世界？

2015年，他构建了ShapeNet——一个包含300多万个3D模型、3135个类别的数据库。业内称之为“3D版的ImageNet”，如今几乎所有三维视觉研究者都使用过它。

2017年，他推出了PointNet——全球首个能直接处理三维点云数据的深度学习模型。在此之前，顶级AI会议中与三维视觉相关的论文不足10%。PointNet出现后，这一数字飙升至70%。

今天，你用iPhone拍摄深度照片、特斯拉识别路面障碍、工厂机械臂抓取零件——这些背后都在运用PointNet的技术路线。

UCSD的八年与“具身智能”

2018年博士毕业后，苏昊前往加州大学圣地亚哥分校（UCSD）担任助理教授。他在UCSD工作了八年。

这八年的核心主题是：具身智能。

如今的ChatGPT能写代码、能聊天，但它只存在于屏幕中。将AI放入机器人身体，让它用这个身体去抓杯子、切菜、开门、行走——这件事远比写代码困难。真实物理世界有摩擦、遮挡和各种意外，与屏幕内完全不同。

要训练机器人，不能直接用真实机器人（成本高、速度慢、易损坏），必须在计算机中模拟。苏昊在UCSD开发了名为SAPIEN的物理仿真平台，如今全球机器人研究者都在使用。他还制作了ManiSkill——一个专门让AI学习机械臂操作的训练场地。

到2026年，苏昊在Google Scholar上的论文引用量超过14万次。在研究具身智能的华人学者中，他的引用量位居第一。2024年，ICRA（国际机器人与自动化会议）将最佳论文奖授予他。2025年，他担任CVPR程序委员会主席——这是全球计算机视觉领域最高级别的会议。

归国

2024年，苏昊在美国联合创立了具身AI公司Hillbot，担任首席技术官。该公司专注于制造能在家庭和工厂中自主完成任务的轮式机器人。

2026年4月，他回到了中国。

复旦大学授予他浩清特聘教授，并专门为他新设通用物理智能研究院，苏昊担任首任院长。研究院不设传统院系，依托复旦智能机器人与先进制造创新学院。

用他自己的话来说，这个研究院的目标是“语言之外的另一半AI”：

“人工智能可以分为两大板块，一半在语言空间，已取得显著进展；另一半在物理世界，是真正与我们的物理世界交互，其中仍有大量基础科学问题有待解决。”