标签

提升人工智能数据供给效能

发布时间:2026-04-10 11:10来源:微信阅读:5

近日,全球首个专注于推动数据发展与治理的国际组织——世界数据组织在北京宣告成立。作为人工智能发展的核心要素,数据好比引擎的燃料,其供应能力直接制约着AI的发展速度与品质。伴随人工智能产业模式由“模型为王”向“数据为王”的演变,数据供应水平不仅影响产业发展,更关乎国家未来的战略地位。如何充分挖掘数据潜力,以此驱动数字经济腾飞,已成为亟待解决的焦点。

近年来,我国在培育数据要素市场方面硕果累累,数据资源规模优势日益凸显,并逐步转化为产业竞争力。然而,中文语料库的匮乏正成为制约我国AI应用创新的一大瓶颈。中文语料供给不足,不仅可能引发语义偏差,阻碍AI效能提升,还潜藏着文化误读与意识形态风险。在单边主义与保护主义抬头的背景下,我国AI创新可能面临更严峻的数据“短板”危机。展望“十五五”,强化面向AI的高效数据供给,将有助于利用资源优势,抢占未来科技制高点。

做大数据供给的“蓄水池”。构建高效供给体系的关键在于持续扩大数据规模并丰富类型。当前,我国数据供给存在显著的结构性失衡:互联网娱乐类数据相对过剩,而产业应用与科技创新所需的高价值数据却严重匮乏。因此,需进一步推动公共数据的开放与授权运营,拓宽物联网等数据接口,激发行业数据共享,促进社会数据汇聚,从而拓展数据供给的广度与深度。

夯实数据质量“压舱石”。数据质量是实现价值的前提,高质量数据不仅要求准确、完整且合规,更需具备场景适配性和知识密度。由于数据加工能力薄弱,大量数据时效性差、价值被低估,导致海量数据“出生即死亡”。为提升数据加工能力并保障供给质量,必须加强数据资源规划管理,建立健全数据标注规范及数据集质量评估标准。

疏通数据流通“快车道”。目前,大量数据长期被禁锢在政府、高校、科研机构及企业的“数据孤岛”中。据报告显示,2023年数据交易中需求端远超供给端,成交率仅为17.9%。提升流通效率、消除壁垒,需依靠技术创新与制度创新“双轮驱动”。一方面,隐私计算技术为解决数据安全与流通矛盾提供了新思路,可信数据空间和区块链技术则为确权与流通提供了保障。另一方面,制度创新将为数据流通“松绑提速”。

营造数据供给“新生态”。充分发挥AI威力,需对接大模型实际需求,整合政社资源,打通数据采集、开发、流通及利用全链条,构建共享共赢生态。推动数据标注提质增效,针对开发周期长、成本高的问题,利用创新技术优化配置。建立行业数据联盟,实现共建复用。发挥市场导向,完善定价与收益分配机制,创新开发利用方式,优化运营模式,提升投入产出比,凝聚全社会合力,共同培育高效的数据供给生态。