标签

数据工程体系建设提速具身智能产业布局

发布时间:2026-06-02 09:20来源:新华网阅读:9

北京讯 《中国证券报》1日发布报道《国家数据局:以完善的数据工程驱动具身智能发展》。据国家数据局5月31日披露,国家数据局局长刘烈宏在2026世界智能产业博览会致辞中强调,高质量数据集是具身智能"感知-决策-执行"的核心支撑,需通过系统性数据工程建设推动具身智能产业升级。

今年上半年,高质量数据集相关政策密集出台,产业生态体系正在加速成型。业内人士分析,高质量数据集建设正从"鼓励建设"向"规范建设、试点推进、系统实施"转变,产业发展有望进入快车道。

以应用场景拉动数据供给

"2026年是'数据要素价值释放年',国家数据局将出台《关于推进行业高质量数据集建设行动的实施方案》,围绕基础扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大方向,对接人工智能赋能产业发展需求,以应用场景拉动数据供给、以数据驱动产业智能化转型,助力各行业'数据飞轮'高效运转。"刘烈宏表示。

关于数据赋能人工智能创新,刘烈宏指出,高质量数据集是制造业智能化转型的关键资源和创新动力。要将实际生产线、设备运行、质量检测等数据进行全面采集、整合与利用,有效支撑行业大模型和智能体把握工业逻辑、适应工业场景、改进工业流程。要加强对行业高质量数据集的投入,促进数据、模型、装备、场景深度融合。

高质量数据集是具身智能"感知-决策-执行"的核心支撑。刘烈宏强调,具身智能在真实环境中的自主适应与任务执行能力,需要依托视觉、触觉、音频等多源高质量训练数据,应通过完善的数据工程驱动具身智能发展,深化系统性实践探索。

高质量数据集是AI for Science快速发展的关键保障。刘烈宏表示,科学研究对数据准确性、规范性、可信性要求更高,高质量数据集不仅是支撑科学领域模型训练、规律发现和成果验证的基础底座,更是推动基础研究走向产业应用、实现AI for Science真正落地的关键保障。

今年上半年,高质量数据集领域新动作不断。4月15日,国家数据局发布《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》,面向社会公开征求意见。工业和信息化部、国家数据局近日联合印发《关于联合实施2026年"模数共振"行动的通知》,推动人工智能模型与数据资源协同互促、同频共振,明确到2026年底,基本形成"数据-模型-场景应用"良性循环,推动人工智能高水平赋能新型工业化。

平台建设方面,4月29日,国家数据集管理服务平台上线并启动试运行,提供覆盖数据集全生命周期的公共服务。截至5月31日,已认证机构516家,发布数据集1350个,涵盖农业、工业制造、交通、文旅等重点领域。

截至今年一季度,全国已建成高质量数据集超过11.6万个,总体量超过960PB。截至今年3月,我国日均词元(Token)调用量已超过140万亿。

多地推进高质量数据集建设

今年上半年,多地积极响应,提出高质量数据集建设规划。

山东省大数据局发布的《山东省行业高质量数据集建设专项行动方案》明确,到2026年底,在工业制造、交通运输等16个重点行业领域分别建成2个左右专业化数据集;到2027年底,累计建成50个高质量数据集,并提出加强公共数据供给、加快企业数据开发、加强数据供需对接、发展数据标注产业等具体措施。此外,为深入落实国家关于国有企业数据效能提升的相关部署,广东省政务服务和数据管理局联合广东省国资委日前正式启动广东省国企高质量数据质效提升行动。

长江证券计算机行业首席分析师宗建树认为,当前我国大模型产业持续高速发展,数据集作为训练和优化大模型的基础资源,其质量和多样性直接影响到大模型的性能和效果。高质量数据集作为人工智能产业化落地的关键生产资料,有望成为连接行业场景、模型训练、智能体应用和数据价值释放的核心枢纽。高质量数据集建设已逐步从"倡导建设"迈向"按标准建设、按机制试点、按体系推进",产业发展有望进一步提速。

计世资讯研究报告指出,高质量数据集的规模化建设,将进一步带动高质量行业数据集构建与服务、行业知识图谱与智能体知识库、合成数据生成与数据隐私保护平台三个百亿级软件细分赛道的快速增长,为我国软件产业发展注入新的增长动力。