复旦铁三角重磅亮相:STI-WM 模型重塑物理 AI 新路径
新智元讯
当下,通用人工智能的角逐已从虚拟数字领域全面延伸至实体物理世界,具身智能与机器人大脑已成为 AGI 赛道决胜的关键高地。
目前业内主流的 VLA 视觉语言动作模型、通用世界模型及视频推演方案,普遍面临空间感知精度欠缺、物理逻辑约束匮乏、长时序规划能力不足、真机部署鲁棒性差等诸多瓶颈,难以支撑机器人实现真正的自主感知、推理、决策与稳定交互。
正值物理 AI 产业快速演进的关键时刻,深耕世界动作模型底层技术五载的复旦系科创企业眸深智能,正式发布 STI-WM 时空一体世界动作模型(Spatiotemporally Integrated World Model)。
作为专为机器人原生打造的通用具身大脑,该模型以时空一体化建模、物理一致性约束及端到端原生融合为核心,彻底突破传统模型的技术壁垒,开辟了物理世界 AGI 落地的最优技术路径。
眸深智能的技术突破,源自其深厚的学术积淀与全栈工程实力。
公司核心班底源自复旦大学深度学习实验室,构建了集学术科研、工程落地、产业商业化于一体的顶级团队架构:
由复旦大学未来信息创新学院教授、深度学习实验室主任陈涛坐镇科研底层,
原英特尔中国首席科学家张益民博士联袂来自英伟达的技术负责人掌舵工程化落地,
95 后复旦连续创业者穆泽林主导商业化布局,组成了实力雄厚的「复旦铁三角」核心阵容。
团队超九成核心研发人员毕业于复旦大学,汇聚百余名校硕博精英,自 2021 年行业风口未起之时,便前瞻性布局世界模型、三维感知、时序动作生成三大底层核心技术,持续深耕技术攻坚。
多年来,团队屡获多项全球顶尖赛事冠军与顶级学术荣誉:
推出全球首个人形动作生成大模型 MotionGPT、三维世界模型 HL3DWM;
斩获 ICCV 2023 全球三维目标识别冠军、CVPR 2024 三维密集语义推理冠军,荣获 IJCAI 2025 杰出论文奖,是近五年国内唯一获此殊荣的具身智能团队,团队技术负责人亦入选 2025 年中国具身智能新秀 EAI 榜单 20 强。
其原创技术成果被英伟达 DAIR 等国际顶尖实验室引用,学术创新与工程落地能力稳居全球第一梯队。
当前行业多数方案仍沿用通用世界模型加 VLA 拼接的改良模式,存在模态割裂、信息损耗严重、缺乏真实物理世界约束等问题,仅能实现「视觉合理」,无法适配机器人真机落地的真实需求。
眸深智能从 AGI 本质出发,率先确立世界动作模型原生融合路线:
机器人与物理世界的一切交互,终将落脚于动作,
唯有精准理解时空演化规律、恪守物理逻辑、实现端到端原生映射,方能真正解决机器人泛化性差、落地难的行业顽疾。
早在 2022 年,团队便创新性提出全球首个影空间语言 - 动作端到端映射 MLD 模型,成果发表于 CVPR 2023,该核心思路在 2025 年 5 月被英伟达 DAIR 实验室核心工作引用验证。
历经五年迭代,团队已完成七代动作模型技术更新,在多模态端到端融合、高精度动作生成、时序逻辑推演领域积累深厚,动作精度、推理速度、任务泛化性持续领跑行业。
(眸深大脑全自主抓取与自主修正)
不同于行业依托大语言模型二次改造的适配性方案,STI-WM 时空一体世界动作模型是完全面向机器人长时序规划、在线闭环控制、真实物理交互打造的原生具身智能框架,实现空间结构、时间演化、物理一致性、执行鲁棒性四维一体化统一。
模型可兼容 RGB 图像、深度点云、机器人本体多模态感知输入,将复杂环境信息统一编码为紧凑高效的时空潜在世界状态,上层支撑百秒级长时程任务推演与全局轨迹规划,下层输出精准可控的精细化动作片段。
同时依托实时环境观测动态纠偏、在线重规划,构建出「理解世界—推演未来—规划动作—执行纠错」的完整物理智能闭环。
相较于 Dreamer 系列偏重环境预测、忽视真机控制的通用世界模型,LWM、PWM 等时空割裂的抽象动作模型,以及仅追求视觉逼真、无视物理可行性的视频生成模型,STI‑WM 跳出纯视觉推演误区,以三维几何约束、动力学校验、真机闭环执行为核心,彻底解决传统模型信息失真、泛化薄弱、落地困难的核心痛点,让机器人真正做到看懂三维空间、遵守物理规则、自主规划任务、稳定闭环执行。
(眸深 STI-WM1.0 时空一体世界动作模型架构)
依托五年全链路自研积淀,STI‑WM 构建起行业难以复刻的技术优势:
(眸深「一脑多形」跨本体通用大脑)
凭借底层架构原创创新、全栈自研技术壁垒、可落地的商业化能力,眸深智能迎来高速发展期,半年内完成五轮融资,3 亿元 Pre-A 轮融资获 5 倍超额认购,获得国家级投资平台、头部产业资本、券商机构的高度认可。
商业化落地同步驶入快车道,公司已与宇树科技、禾川科技、颐家养老等行业头部企业达成深度合作,技术落地覆盖工业制造、居家康养、商业服务等多元真实场景。
目前,眸深智能已与近十家上市公司达成战略合作,其中包含五家以上千亿级产业龙头,未来三年预计可锁定 10 亿元订单支撑,技术产业化速度远超行业平均水平。
(眸深智能与居家养老头部企业颐家战略合作)
当下,AGI 竞争正式进入物理智能新时代,以世界动作模型为核心的原生具身大脑,已然成为通用机器人的核心底座。
未来,眸深智能将持续迭代 STI‑WM 模型体系,全面赋能人形机器人、四足机器人、工业机械臂、服务机器人等全品类硬件,加速通用具身智能的规模化落地,推动中国原生物理 AI 技术领跑全球,开启物理世界 AGI 全新纪元。