标签

做大数据规模不是终点,词元经济重在提质

发布时间:2026-05-11 09:12来源:科技日报阅读:6

最近,“词元”在网络上十分火爆,关于“词元经济”的讨论也持续升温。近期发布的《全国数据资源调查报告(2025年)》指出,2025年全国年度数据生产总量达到52.26泽字节(ZB),全球占比超过27%;词元调用量约为21100万亿,呈现出指数级增长态势。

所谓的词元,是人工智能大模型处理信息的基本单位。它可以是单个汉字、标点符号,或者一个词组片段。无论是我们向AI提问,还是AI生成的文字、图片或视频,都离不开词元的调用与运算。所谓词元经济,就是指在人工智能领域,围绕词元的生产、调用、分发及结算所衍生出的新型经济模式。

可以说,词元已然成为人工智能产业发展的“风向标”。词元调用量的持续增长,充分体现了我国人工智能产业的繁荣景象。“养龙虾”的火爆全网,让人切实体会到AI不仅能“聊天”,还能“干活”;DeepSeek-V4预览版正式上线并开源,核心性能指标达到国内外领先水平;豆包大模型公布了付费方案,尝试在免费版基础上增加增值服务,为国产大模型“变现”开启了商业想象……

目前,我国词元经济虽方兴未艾,但也面临不少挑战。例如,在高端制造、金融投资等对精度和可靠性要求极高的专业领域,从词元数据质量到模型推理过程,国产AI大模型的性能还有待提升;“数据孤岛”现象依然存在,公共数据开发应用尚处初级阶段,高质量数据集匮乏,数据要素流通仍需打破壁垒;利用AI生成虚假信息、侵犯版权及肖像权等乱象频发,急需监管手段为其“套上缰绳”;AI大模型的商业模式仍在探索中,清晰且可持续的盈利模式仍待市场检验。

要充分激活词元经济活力,关键在于锁定制约词元价值释放的瓶颈,精准施策、协同推进,打造健康的词元经济生态。比如,攻克核心算法等技术短板,助力国产大模型在更多实际场景中“落地”;打破“数据孤岛”,推动数据要素高效“流动”;完善人工智能和数据安全领域的法规政策,为词元的生成、流转及交易划定“红线”;打通大模型商业价值闭环,培育“模型即服务”“智能体即服务”等新业态,实现技术创新与商业模式创新的“双向奔赴”。

促进词元经济健康发展,不应仅满足于规模的快速扩张,更应注重发展质量和效益的整体提升。只有系统解决词元经济发展中的痛点,充分释放数据要素的价值潜能,才能夯实我国人工智能产业高质量发展的基础。(文/刘园园)