标签

中国AI具身智能发展报告2026

发布时间:2026-06-09 22:28来源:微信阅读:2

100页PDF

《中国人工智能系列白皮书—具身智能(2026版)》

从战略规划到实践应用,全方位多场景解决策略

该报告由中国人工智能学会发布,全面介绍了具身智能的定义本质、演进历程、跨学科属性、虚实融合现状、核心技术框架、数据资源与平台、产业应用及前景展望。具身智能是指智能主体借助实体载体与外部环境交互来实现智能化的理论与方法,涉及环境感知、记忆推理、对话交流、自主学习、决策规划、行为执行等综合技术,具备涉身性、情境性、主动性与交互性等特征,被视作人工智能迈向物理空间的重要关键。

在核心技术层面,报告深入分析了具身感知(主动感知与探索、多模态感知、动态环境自适应、模型轻量化)、具身推理(语义理解与目标分析、原子动作分解、反思与调整)、具身操作(VLA模型三大技术路径:VLM+动作模型、VGM+动作模型、VLM+Latent+Action)、具身导航(端到端强化学习、模块化学习、免训练方法)、强化学习、具身交互(具身对话、人机在环交互)、群体具身智能、具身世界模型、具身大模型(跨模态感知与表征学习、智能决策规划、动态运动控制)及具身智能安全(语音攻击、越狱后门攻击、幻觉问题、导航与操作安全、人机交互安全)十大重点技术。其中,VLA模型正从视觉-语言-动作模式向世界-动作模型(WAM)模式演进,后者通过构建可交互的物理环境模拟器使智能体拥有预测未来状态、评估动作结果的能力。

在数据集与平台部分,报告整理了真机数据、仿真数据、互联网视频数据三大