标签

做大数据规模不是终点,词元经济重在提质

最近,“词元”在网络上十分火爆,关于“词元经济”的讨论也持续升温。近期发布的《全国数据资源调查报告(2025年)》指出,2025年全国年度数据生产总量达到52.26泽字节(ZB),全球占比超过27%;词元调用量约为21100万亿,呈现出指数级增长态势。 所谓的词元,是人工智能大模型处理信息的基本单位。它可以是单个汉字、标点符号,或者一个词组片段。无论是我们向AI提问,还是AI生成的文字、图片或视频,都离不开词元的调用与运算。所谓词元经济,就是指在人工智能领域,围绕词元的生产、调用、分发及结算所衍生出的新型

2026-05-11 09:12:49  |  5 阅读

IP Strategy Holdings力推Numo应用,意在扩充AI合规训练数据

IP Strategy Holdings, Inc.对外发布消息称,Poseidon打造的消费者端应用Numo已开启抢先体验。该软件的核心目标在于经由授权方式采集现实世界的数据,进而扩充人工智能(AI)系统的训练数据集,以此来回应行业对于高质量数据日益迫切的需求。 眼下,人工智能领域的数据供给正遭遇瓶颈。新一代AI系统的研发极度依赖能够映射人类真实语言、行为及交互的数据,而这类高质量数据很难直接从开放互联网上获取。针对这一行业难题,Numo应用让用户能够利用移动设备执行简易任务来贡献数据,初期项目主要侧重

2026-05-08 21:32:44  |  5 阅读