华人AI科学家苏昊归国,执掌复旦通用物理智能研究院
AI领域人物 | 感知他们推动世界的努力
2009年,普林斯顿大学发布了名为ImageNet的数据库。该库收集了超过1400万张已标注的图像,分为20000多个类别。
后续发展你可能已知:2012年,多伦多大学的AlexNet模型借助ImageNet训练,成功将图像识别准确率提升10个百分点。自此,深度学习成为AI的主流方向。许多人将ImageNet称为“点燃此次AI革命的导火索”。
这个数据库的团队中,有一位中国留学生,名叫苏昊。
2026年4月18日,复旦大学在中国三维视觉大会上公布:苏昊正式加入复旦,担任浩清特聘教授,并主导建设通用物理智能研究院。
北航高等理工学院首届毕业生
苏昊于2002年进入北京航空航天大学计算机系,成为北航高等理工学院的首批学员。本科阶段,他师从中国科学院院士、北航前校长李未教授,研究方向是数理逻辑与自动定理证明——一个“让计算机自行证明数学定理”的领域,与如今热门的AI相距甚远,但更接近数学本质。
2005年,李未教授推荐他前往微软亚洲研究院实习。在那里,他跟随过三位导师:孙剑(后成为旷视首席科学家)、沈向洋(后任微软全球执行副总裁)、周明(后任微软亚研副院长)。
2008年,沈向洋推荐他去普林斯顿和斯坦福——跟随一位名叫李飞飞的教授,参与一个当时不被看好的数据库项目。
ImageNet的岁月
那几年,李飞飞整个团队都在做一件繁琐的工作:将互联网上抓取的成千上万张图片逐张添加标签。
一张狗的照片标注“狗”、一张帆船标注“帆船”、一把勺子标注“勺子”。最终,他们完成了1400万张图片、20000多个类别的标注。
2009年该数据库正式发布,业内许多人认为“标注这么多图片有何用”。直到2012年AlexNet利用它训练出破纪录的模型,AI界才意识到:没有这个数据库,深度学习无法起步。
苏昊是ImageNet早期的核心贡献者之一。2008至2012年期间,他的名字频繁出现在ImageNet相关论文中。
为AI增添第三个维度
博士阶段,苏昊进入斯坦福计算机系,师从三维几何领域的权威Leonidas Guibas教授。
他随后完成了两项工作,都围绕同一个问题:AI已能理解二维图像,如何让它理解三维世界?
2015年,他构建了ShapeNet——一个包含300多万个3D模型、3135个类别的数据库。业内称之为“3D版的ImageNet”,如今几乎所有三维视觉研究者都使用过它。
2017年,他推出了PointNet——全球首个能直接处理三维点云数据的深度学习模型。在此之前,顶级AI会议中与三维视觉相关的论文不足10%。PointNet出现后,这一数字飙升至70%。
今天,你用iPhone拍摄深度照片、特斯拉识别路面障碍、工厂机械臂抓取零件——这些背后都在运用PointNet的技术路线。
UCSD的八年与“具身智能”
2018年博士毕业后,苏昊前往加州大学圣地亚哥分校(UCSD)担任助理教授。他在UCSD工作了八年。
这八年的核心主题是:具身智能。
如今的ChatGPT能写代码、能聊天,但它只存在于屏幕中。将AI放入机器人身体,让它用这个身体去抓杯子、切菜、开门、行走——这件事远比写代码困难。真实物理世界有摩擦、遮挡和各种意外,与屏幕内完全不同。
要训练机器人,不能直接用真实机器人(成本高、速度慢、易损坏),必须在计算机中模拟。苏昊在UCSD开发了名为SAPIEN的物理仿真平台,如今全球机器人研究者都在使用。他还制作了ManiSkill——一个专门让AI学习机械臂操作的训练场地。
到2026年,苏昊在Google Scholar上的论文引用量超过14万次。在研究具身智能的华人学者中,他的引用量位居第一。2024年,ICRA(国际机器人与自动化会议)将最佳论文奖授予他。2025年,他担任CVPR程序委员会主席——这是全球计算机视觉领域最高级别的会议。
归国
2024年,苏昊在美国联合创立了具身AI公司Hillbot,担任首席技术官。该公司专注于制造能在家庭和工厂中自主完成任务的轮式机器人。
2026年4月,他回到了中国。
复旦大学授予他浩清特聘教授,并专门为他新设通用物理智能研究院,苏昊担任首任院长。研究院不设传统院系,依托复旦智能机器人与先进制造创新学院。
用他自己的话来说,这个研究院的目标是“语言之外的另一半AI”:
“人工智能可以分为两大板块,一半在语言空间,已取得显著进展;另一半在物理世界,是真正与我们的物理世界交互,其中仍有大量基础科学问题有待解决。”