刘烈宏智博会发声:AI决胜关键不在模型而在数据质量
近期,国家数据局局长刘烈宏在2026世界智能产业博览会上揭示了一个关键趋势:未来人工智能的角逐焦点,正由“比拼模型”逐渐转向“较量数据”。
尽管大众目光多聚焦于大模型、智能体及机器人,但此次发言释放的更深信号是——国家已将“高质量数据集构建”提升至战略高度。
今日,让我们用通俗语言解析这一动向。
为何当下格外重视高质量数据集?
回顾过去两年,舆论焦点多集中于大模型。
从ChatGPT到各类行业专属模型,众多企业陷入参数、算力及模型能力的内卷。
然而随着产业演进,业界愈发认清一个现实:即便模型再强大,若缺乏优质数据,其效能也无法释放。
这好比一名优等生,若教材内容全是谬误,最终所学成果必然偏差。
因此,行业现已形成共识:制约AI天花板的因素,除模型外,更在于数据。
这正是刘烈宏在发言中反复提及高质量数据集的原因。
毕竟,数据已成为人工智能时代最核心的基础资源之一。
为何制造业对此最为迫切?
发言中特别强调了先进制造业。
不少人误以为制造业引入AI,仅是部署几台机器人或上线若干系统。
事实上,情况远非如此简单。
真正的工业智能化,需依托海量真实数据作为支撑。
例如:
设备运行数据
产品质量数据
工艺流程数据
生产管理数据
故障维修数据
这些数据的积累越完备,AI对生产逻辑的理解就越深入。
未来众多工业大模型,依赖的并非互联网公开信息,而是工厂每日产生的真实业务数据。
谁掌握高质量工业数据,谁便更易训练出真正懂行的模型。
这也是国家推动行业高质量数据集建设的核心动因。
机器人同样为何离不开数据?
此次发言中还有一个关键术语:具身智能。
通俗来说,即能进入现实场景作业的机器人。
例如:
工业机器人
服务机器人
家庭机器人
无人设备
许多人认为机器人主要依赖硬件。
实则,机器人面临的最大挑战在于“训练”。
机器人如何识别物体?
如何研判环境?
如何执行动作?
这一切背后均需海量数据支撑。
视觉、语音、动作及触觉数据越丰富,机器人便越智能。
故而未来机器人产业的演进,本质上是数据能力的竞争。
国家正引领新的发展方向
此次发言还透露一个重要信息:国家数据局将发布《关于推进行业高质量数据集建设行动的实施方案》。
从公开信息来看,未来将重点围绕六大方向推进:
强基扩容
标注攻坚
提质增效
应用赋能
管理服务
价值释放
用一句话概括:不仅要收集数据,更要让数据切实产生价值。
因为数据若仅存于数据库而缺乏流通与应用,本身无法创造价值。
唯有融入产业、嵌入场景、进入AI训练环节,数据方能真正转化为生产力。
数据产业迎来新机遇
细察近年来国家数据局的举措,可发现明显趋势。
从数据资源化迈向数据资产化;
从数据入表延伸至数据交易;
从可信数据空间拓展至模数共振;
直至如今的高质量数据集建设。
所有政策均指向同一目标:释放数据价值。
往昔,许多企业视数据为业务副产品。
未来,越来越多企业将意识到:数据本身就是资产。
甚至可能成为企业最关键的资产之一。
尤其在制造业、医疗、能源、交通及金融等领域,谁能率先完成数据治理并构建高质量数据集,谁便更有机会在AI时代抢占先机。
总 结
此次刘烈宏在天津的演讲,表面探讨的是数据集建设。
但深层含义在于:国家正推动人工智能的发展逻辑发生转变。
过去人们关注模型有多强大。
未来人们更在乎数据有多优质。
因为真正决定AI能走多远的,除算法与算力外,还有源源不断的高质量数据。
对企业而言,下一阶段最需深思的问题或许非“是否要做AI”,而是:自身手中的数据,能否成为AI时代的新生产力。