大模型时代知识创造的新变革
作者简介:孙茂松,清华大学人工智能研究院常务副院长,计算机科学与技术系教授
知识创造与两个核心环节紧密相连:知识的生成与知识的扩散。两者相互促进:高质量的知识是广泛传播的源泉,而有效的传播通过知识的“教化”功能,在人们运用所学解决实际问题的过程中催生更多优质知识。自古至今,这一过程“循环往复,始终延续”,持续充实着人类的知识积累。
在漫长的历史进程中,知识的创造与拓展,长期带有少数“智者”留下的深刻印记。随着时代进步,“智者群体”的规模会逐步扩大,但在整个人口中相对仍属少数。进入现代特别是互联网时代,这一状况发生了剧烈转变,普通大众可以借助互联网技术为知识创造贡献力量。知识传播方式的演变更加引人注目,从文字出现前以声音为媒介的口耳相传,数千年前以泥板、莎草纸、羊皮卷、甲骨、竹简、绢帛等为介质的书写传播,到一千多年前尤其是近几百年来以纸张为载体的书籍印刷,百余年来以广播、电影、电视为媒介的模拟及数字内容生产,再到近三十年来以互联网和社交网络为平台的跨模态数字内容生产,知识创造凭借其范式的持续更替所释放的巨大能量推动着人类文明前行。纵观历史,无论是造纸术、印刷术,还是模拟和数字通信、互联网等,无一不是当时的重大科技发明。科技的每次重大突破,都推动了知识创造的范式创新。
近年来兴起的以语言大模型为基础的生成式人工智能,必然会引发知识创造的又一次范式转变。与此前所有知识创造范式中人类始终是唯一主体不同,这次破天荒地增加了一个全新的“主体”——机器。传播模式中所涉及的主体,现在既可以是人,也可以是机器,并且两者相互交织,形成了极为复杂的多重关系。众所周知,语言大模型具备强大的语言生成能力,同时拥有良好的开放式语言理解能力。机器能够实现这一点,是千百年来从未有过的局面。向量表示、自注意力机制、强化学习、思维链等一系列令人瞩目的技术创新,加上大参数、大数据、大算力的强力支撑,以及复杂系统涌现机制的“奇妙”作用,多种要素的汇聚成就了这一奇迹。语言大模型在基本掌握人类语言的同时,还把海量语料中蕴含的丰富世界知识和逻辑推理能力,以参数化的方式整合到模型中。《人类简史》的作者尤瓦尔·赫拉利曾指出:“人类文明建立在语言之上。由于人工智能已经攻克了语言,它现在可以开始创造文化。”事态的发展似乎正在验证这一判断。今年初,被称为“龙虾”的OpenClaw开源智能体框架风靡全球,其核心驱动力正是语言大模型出色的理解和生成能力。语言大模型可以说是OpenClaw的“大脑”,某种意义上形成了人工智能的“操作系统”,可用来构建并运行各类“技能”,以完成包括知识创造在内的各种任务。这为人工智能在经济文化社会等领域的广泛应用,提供了难得的发展契机。
但同时也要看到,语言大模型远非完美。本质上它是概率模型,在语言理解上,无法保证如人类一般精准可靠;在语言生成上,会出现“与生俱来”的“幻觉”现象,即生成虚假信息。换言之,OpenClaw的“大脑”时不时会犯迷糊,更棘手的是,何时犯迷糊、犯怎样的迷糊,难以预料。其结果是当我们将“行动”的权力赋予OpenClaw时,它无法保证不出错,就好像在“瓷器店里抓老鼠”,即使十分谨慎,打碎一两件瓷器也在所难免,也就是说,OpenClaw天然存在安全隐患。此外,训练语言大模型使用的互联网语料中,往往夹杂人类的各种偏见与谬误,致使模型也存在偏见与谬误。一项随机抽样调查显示,截至2026年3月,互联网上由人工智能生成的文章数量与人类撰写的文章数量基本相当。尽管这个调查比较初步,存在采样规模过小等不足,但还是能从侧面反映出一种现象:现如今互联网上的文章不少是机器写的,我们却可能浑然不觉,无意识地受其影响。这个进程尚处于刚刚开始的阶段,如果不加以必要治理,今后会愈演愈烈,甚至会涉及意识形态安全、责任伦理、学术不端和知识产权等问题。生成式人工智能在进行知识创造时,从真实性、可靠性、安全性等诸多角度对我们提出了新的挑战。
这里面还会产生一些更为深刻的问题。例如,语言大模型是通过海量文本训练出来的,可以说是汇聚、融合了所有人的知识,性能顶尖的大模型有望获得最广泛人群的青睐和使用,于是它仿佛成了唯一的“智者”,在“人人为模型,模型为人人”的闭环迭代中,互联网时代“多对多”的传播模式反而有可能退回到过去印刷时代与电视时代“1对多”的传播模式,只不过此时的“1”已变成了机器,而不再是人了。此外,语言大模型会倾向于生成概率意义上“共识”较大的内容,而容易忽视具有个性禀赋的内容,导致知识创造出现某种平庸化、同质化倾向。有研究表明,生成式人工智能可以提升个体创造力,却降低了“新颖”内容的集体多样性。这个似乎有些矛盾的结论,其实是不难理解的。
知识创造创新中面临的这类带有普遍性的问题,促使我们必须深入思考:第一,在知识创造与传播进程中,如何处理好人和机器的关系?毫无疑问,在这个进程中人始终应占据主导地位。生成式人工智能应成为人类的好助手、好伙伴,但绝不能“反客为主”,人是必然的主体和核心。第二,在人机共存的基本条件下,如何更积极地发挥人在知识创造中的主观能动性?第三,生成式人工智能可加速知识发现与整合,以及无时不在、无远弗届的知识传播,如何在此基础上有效重构知识创造新范式,使其与时、与世俱进?第四,生成式人工智能降低了知识创造门槛,如何以此为契机更好调动和挖掘大众知识生产能力,与专家知识创造形成互补?
总的来看,语言大模型乃至生成式多模态大模型的快速发展,给知识创造创新带来前所未有的机遇和挑战。面对技术迭代引发的深刻变革,应始终高扬人的主体性,在人与机器协同中探索知识创造的创新之路,让生成式人工智能真正成为人类文明进步的加速器。