孙茂松:大语言模型如何重塑知识创造方式
大语言模型与知识创造革新
孙茂松
知识创造离不开两个核心要素:知识的生成与知识的扩散。这两者相互依存:高质量的知识为广泛传播提供基础,而有效的传播又能通过教育熏陶,在人们运用所学解决实际问题的过程中催生出更多优质知识。纵观历史长河,这一过程循环往复、生生不息,持续充实着人类的认知体系。
在漫长的发展历程中,知识的创造与拓展长期带有少数"智者"的深刻烙印。随着时代进步,"智者群体"虽会逐步壮大,但在整个人口中仍属少数。进入现代特别是互联网时代,这一格局发生了剧烈转变,普通民众可以借助信息技术为知识创造贡献力量。知识传播方式的演变更是令人惊叹:从文字出现前以声音为媒介的口耳相传,到数千年前以泥板、莎草纸、羊皮卷、甲骨、竹简、绢帛等为载体的手抄文本,再到千年前尤其是近数百年来以纸张为媒介的书籍印刷,百余年来以广播、电影、电视为媒介的模拟及数字内容创作,直至近30年来以互联网和社交网络为媒介的跨模态数字内容生产,知识创造以其范式不断更迭所释放的巨大能量推动着人类文明向前发展。回望历史,无论是造纸术、印刷术,还是模拟和数字通信、互联网等技术,无一不是当时的重大科技创新。科技的每次重大突破,都会带来知识创造的范式创新。
近年来蓬勃发展的基于语言大模型的生成式人工智能,必然会引发知识创造的又一次范式转型。与以往所有知识创造范式中人类始终是唯一主体不同,这次史无前例地新增了一个全新"主体"——机器。传播模式中涉及的主体,现在既可以是人类,也可以是机器,两者相互交织,形成了极为复杂的多重关系。众所周知,语言大模型具备强大的文本生成能力,同时拥有较好的开放式语言理解能力。机器能够实现这一点,是千百年来前所未有的突破。向量表征、自注意力机制、强化学习、思维链等一系列令人目眩的技术创新,加上大参数、大数据、大算力的强力支撑,以及复杂系统涌现效应的"神奇"作用,多种要素的交汇融合催生了这一奇迹。语言大模型在学习掌握人类语言的同时,还将海量语料中蕴含的丰富世界知识和逻辑推理能力,以参数化的方式整合进模型中。《人类简史》的作者尤瓦尔·赫拉利曾指出:"人类文明建立在语言之上。由于人工智能已经突破了语言障碍,它现在可以开始创造文化。"事态的发展似乎正在验证这一论断。今年初,被称为"龙虾"的OpenClaw开源智能体框架风靡全球,其核心驱动力正是语言大模型出色的理解与生成能力。语言大模型堪称OpenClaw的"智慧中枢",在一定程度上形成了人工智能的"操作系统",可用来构建并执行各类"技能",以完成包括知识创造在内的多种任务。这为人工智能在经济文化社会等领域的广泛应用,创造了难得的发展契机。
但同时必须认识到,语言大模型远未达到完美境界。从本质上讲,它属于概率模型,在语言理解方面无法像人类那样精准可靠;在语言生成方面,会出现与生俱来的"幻觉"现象,即产生虚假信息。换言之,OpenClaw的"智慧中枢"时常会出现偏差,更棘手的是,何时出现偏差、出现怎样的偏差,难以预判。其结果是当我们赋予OpenClaw执行"动作"的权力时,它无法保证不出错,犹如在"瓷器店里抓老鼠",即便万分小心,打破一两件瓷器也在所难免,也就是说,OpenClaw天然存在安全风险。此外,训练语言大模型所使用的互联网语料中,往往夹杂着人类的各种偏见与错误认识,致使模型同样存在偏见与错误。一项抽样调查表明,截至2026年3月,互联网上由人工智能生成的文章数量与人类撰写的文章数量大致相当。尽管这项调查较为初步,存在采样规模有限等缺陷,但仍然在一定程度上反映了一种现象:如今互联网上不少文章出自机器之手,而我们可能浑然不知,无意识地受其影响。这一进程尚处于初始阶段,如果不加以必要治理,今后必将愈演愈烈,甚至可能涉及意识形态安全、责任伦理、学术不端和知识产权等问题。生成式人工智能在进行知识创造时,从真实性、可靠性、安全性等多个维度对我们提出了新的挑战。
这其中还会衍生出一些更为深层次的问题。例如,语言大模型是通过海量文本训练而成的,可以说是汇总、融合了所有人的知识,性能领先的大模型有望获得最广泛人群的青睐和使用,于是它似乎成为了唯一的"智者",在"人人贡献模型,模型服务人人"的闭环迭代中,互联网时代"多对多"的传播模式反而可能倒退至过去印刷时代与电视时代"1对多"的传播模式,只不过此时的"1"已变成了机器,而非人类。另外,语言大模型倾向于生成概率意义上"共识"较强的内容,而容易忽略具有个性特质的内容,导致知识创造出现某种平庸化、同质化趋势。有研究显示,生成式人工智能可以提升个体创造力,却降低了"新颖"内容的集体多样性。这个看似矛盾的结论,其实不难理解。
知识创造创新中面临的这类普遍性问题,促使我们必须深入思考:第一,在知识创造与传播进程中,如何妥善处理人与机器的关系?毋庸置疑,在这个进程中人类始终应占据主导地位。生成式人工智能应成为人类的得力助手和可靠伙伴,但绝不能"喧宾夺主",人类是当然的主体和核心。第二,在人机共存的基本条件下,如何更积极地发挥人类在知识创造中的主观能动性?第三,生成式人工智能可加速知识发现与整合,以及无处不在、无远弗届的知识传播,如何在此基础上有效重构知识创造新范式,使其与时俱进?第四,生成式人工智能降低了知识创造门槛,如何以此为契机更好地调动和挖掘大众知识创造能力,与专家知识创造形成互补?
总体而言,语言大模型乃至生成式多模态大模型的迅猛发展,为知识创造创新带来了前所未有的机遇和挑战。面对技术迭代引发的深刻变革,应始终高扬人类的主体性,在人与机器协同中探索知识创造的创新之路,让生成式人工智能真正成为人类文明进步的加速器。