洞悉全球技术变革 紧抓具身智能战略机遇
具身智能是指人工智能借助物理载体与周遭环境展开即时互动,达成感知、认知、决策及执行相融合的智能体系,包含人形机器人、仿生机器人及环境嵌入式系统等多元形态。眼下,具身智能在与外界的持续交互中不断进化,其认知决策水准及实体应用效能均实现大幅跃升,正迅猛向着更高自主性、跨场景应用的通用智能迈进。精准洞悉具身智能全球技术革新动向,主动迎接深层考验,对在全新一轮产业更迭中夺取先机、掌握主动权至关重要。
在北京人形机器人创新中心具身智能机器人数据与训练基地大厅门口,人形机器人做出“比心”姿势。新华社记者 王婧嫱摄
全球具身智能技术演进呈现五大趋势
如今,全球具身智能技术正展现加速迭代趋势,感知交互、决策认知、控制执行、虚实数据交融与系统集成五大维度齐头并进,正驱动具身智能从科研实验室迈向规模化商业落地。
一是世界模型内化,感知交互升级。在世界模型与多模态感知技术助推下,具身智能对物理世界的理解及交互水平大幅攀升,完成由“刺激—反应”至“推演式决策”、由数据重组至规律洞察的范式跨越。Meta发布V-JEPA2世界模型,能预判各类行为后果,并按目标进行优劣排序,行动精准度显著提高。北京大学提出MLA多感官语言动作模型架构,引入全量多感官模态,借由整合异构信号给出更稳健的决策支撑。
二是端到端成主流,决策范式变革。具身智能“大脑+小脑”分层决策架构已趋于成熟,应用愈发普及;端到端模型则依靠广覆盖、低延迟、高自主及强协同的特性,在具身智能迈向通用泛化的探寻中展露极大潜能。Google DeepMind的Gemini Robotics依托端到端VLA架构,跨本体泛化表现优异;国内越疆自研的DOBOT-VLA模型整合视觉、语言、控制能力,经实景强化学习调优,搭载该模型的人形机器人ATOM已于2025年实现量产,可胜任行走、动态平衡及精密装配等繁复任务。
三是柔性材料革新,自愈能力凸显。材料变革正促使具身智能由“刚性执行末端”朝“智能适应本体”转变。类肤触觉传感器与电子皮肤让具身智能具备高灵敏度的环境感知力,仿生柔性构造赋予其类似生命体爬行、翻滚、蠕动等多模态运动本领,有效适配并延展了应用场景。自修复材料达成主动自愈突破,本体受创后可在光照、热力触发下完成化学键的可逆重构,集损伤侦测、定位及自愈功能于一身,极大增强了具身智能在极端恶劣环境下的耐久度与可靠性,确保长期自主运行。
四是虚实数据融通,统一数据规范。真机数据获取代价高、体量小,对未知环境泛化能力欠佳,已成具身智能进化瓶颈。生成式数据源自大模型构建的仿真环境,规模大、结构化优,能以低成本填补数据鸿沟,叠加物理规律约束与混合数据范式,并经真机数据校准,可明显缩减虚实差距。国内企业51Sim依托英伟达平台积淀端到端辅助驾驶场景及合成数据,成功运用于港口、矿山等繁杂场景的机器人训练。“穹顶—DOME”平台统一数据接口与格式规范,击碎数据孤岛,打造产业通用语言,有力促进跨场景互操作与高质量数据供给。
五是达成异构协同,夯实安全基石。软硬件解耦与模块化整合,正驱动具身智能操作系统加速实现跨本体适配与异构协同。OpenRMF架构统一机器人“交通规则”与“沟通语言”,达成异构机群的协同作业;OpenMind公司推出的OM1支持主流大模型API即插即用与跨本体开发。系统集成夯实工程底座,安全可信守牢底线约束。对抗训练、差分隐私等隐私计算技术能在不暴露原始数据的情况下达成跨机构协作,为具身智能规模化应用构筑主动安全的纵深防御体系。
多管齐下提升我国具身智能竞争力
现阶段,我国具身智能身处技术攻坚、产业导入与生态培育协同推进的关键期。核心硬件国产化加快,大模型性能显著增强,国产算力可高效支撑复杂模型,部分领域已初具应用雏形。然而,伴随国际角逐日趋白热化,具身智能面临的深层挑战亦不容小觑。
一是核心零部件自主可控水平亟需提升,伺服电机、减速器、高端传感器对外依赖度较高,能源系统续航短板明显,全栈自研能力尚存不足;二是标准体系与产业生态仍待完备,硬件接口、通信协议、软件兼容标准缺乏统一,数据孤岛状况普遍,开源社区声量有限,高质量交互数据供给匮乏;三是安全治理体系尚需健全,自主系统事故责任归属难以厘清,敏感数据持续收集易诱发数据外泄及隐私侵权等隐患,跨机构协作互信机制亟待完善。
直面上述挑战,我国应紧抓发展窗口期,以自主创新为内核、标准建设为推手、安全治理为底线,加速孵化具身智能产业生态,为培育新质生产力、构筑科技强国注入澎湃动能。
一是加强战略科技力量部署,筑牢自主创新底座。依托新型举国体制,强化全国重点实验室等在具身智能领域的战略科技力量效用,聚焦“信息—物理—认知”三域融合大模型、端到端决策架构、仿生柔性材料等前沿赛道开展有组织科研。深化企业主导的产学研交融,扶持科技领军企业牵头打造创新联合体,汇聚优势资源攻克伺服电机、减速器、行星滚柱丝杠等核心零部件国产化阻碍,打通“基础研究—技术开发—产业应用”全链条,从源头破除产业发展藩篱。
二是打造开放协同的产业生态,以高标准驱动高质量发展。加速出台跨行业硬件接口、通信协议与软件兼容标准,推进操作系统、中间件等基础软件自主可控。探索设立高层级数据汇聚与治理主体,制定多模态数据采集与标注准则,搭建面向智能制造、高危作业等核心场景的仿真基准与数据开放平台,消除数据流通壁垒。大力扶植本土开源生态,鼓励高校、科研院所及企业共建算法算力共享体系,降低研发门槛,提速技术迭代,以高水平标准化与开源化驱动产业提质升级。
三是完善安全治理体系,夯实可信发展底座。构建涵盖算法、数据、物理安全的分级防护机制,厘清生产、使用、算法供给、监管各方权责边界。前瞻探索事故责任认定、跨机构协作互信等治理规则,规范具身导航、群体协同等行为的安全与伦理准则。探索包容审慎的监管模式,推行全生命周期安全伦理评估,构建主动安全的纵深防御体系,为具身智能规模化落地、长效稳健发展提供制度保障。
(作者/郑君倢 黄 宁)
