标签

面向人工智能的公共语料库:概念、就绪框架与发展路径

《电子政务》2026年第4期引用格式:人工智能就绪的公共语料库:概念、框架与路径郑磊 杨涛一、研究背景以大规模语言模型为代表的生成式人工智能正在引发一场深刻的范式变革。在此过程中,数据资源正成为驱动智能涌现、决定模型认知边界的关键基础。大语言模型的性能遵循“缩放定律”,其能力高低很大程度上取决于训练数据的质量、规模、多样性以及语义深度。然而,当前全球人工智能发展正面临日益严峻的“数据瓶颈”。一方面,语料数据的供给与需求之间形成了显著的“剪刀差”。互联网上高质量公开数据的自然增长速度,已远远跟不上大模型训练

2026-04-24 21:55:36  |  5 阅读