生成式AI如何重塑知识创新
生成式AI如何重塑知识创新
孙茂松清华大学人工智能研究院常务副院长、计算机科学与技术系长聘教授
知识的生产与两大核心环节紧密相连:知识的创造与知识的扩散。二者互为因果:优质的知识是高效传播的源泉,而高效的传播又能借助知识的“教化”功能,在人们运用所学解决各类问题的生产与生活实践中孕育出更多高质量知识。纵观古今,这一过程“环复转运,终始无端”,不断充实着人类的知识宝库。
在漫长的历史长河中,知识的生产与拓展,长期带有少数“智者”留下的深刻烙印。随着时代前行,“智者群”的规模虽逐渐扩大,但在整个人群中仍属少数。进入现代社会,尤其是互联网时代,这一局面发生了剧变,普通大众得以借助互联网信息技术为知识生产贡献力量。知识传播模式的演变更是令人惊叹:从文字诞生前以语音为载体的口耳相传,到数千年前以泥板、莎草纸、羊皮卷、甲骨、竹简、绢帛等为载体的文本手抄,再到一千多年前尤其是近几百年以纸张为载体的图书印刷,百余年来以广播、电影、电视为载体的模拟及数字内容生产,直至近三十年以互联网和社交网络为载体的跨模态数字内容生产,知识生产凭借其范式持续更替所激发的巨大能量,推动着人类文明不断前行。回溯历史,无论是造纸术、印刷术,还是模拟与数字通信、互联网等,无一不是当时的重大科技发明。科技的每一次重大飞跃,都促成了知识生产范式的又一次创新。
近年来蓬勃兴起的以语言大模型为基础的生成式人工智能,无疑将引发知识生产的又一次范式革命。与以往所有知识生产范式中人类始终是唯一主体不同,此次破天荒地引入了一个全新的“主体”——机器。传播模式中所涉及的主体,现在既可以是人,也可以是机器,且两者相互交织,构成了极其复杂的多重关系。众所周知,语言大模型拥有强大的语言生成能力,同时也具备较佳的开放式语言理解能力。机器能够达成这一点,是千百年来从未有过的局面。向量表征、自注意力机制、强化学习、思维链等一系列令人目不暇接的技术创新,加之超大参数、海量数据、超强算力的强力支撑,以及复杂系统涌现机理的“玄妙”作用,多种要素的风云际会造就了这一奇迹。语言大模型在基本掌握人类语言的同时,还将海量语料中蕴含的万千世界知识及逻辑推理能力,以参数化的形式整合进模型之中。《人类简史》的作者尤瓦尔·赫拉利曾指出:“人类文化基于语言。而因为人工智能已经破解了语言,它现在可以开始创造文化。”事态的发展似乎正在印证这一判断。今年年初,被称为“龙虾”的OpenClaw开源智能体框架风靡全球,其核心驱动力正是语言大模型卓越的理解与生成能力。语言大模型可谓是OpenClaw的“大脑”,在某种意义上构成了人工智能的“操作系统”,可用于构建并运行各类“技能”,以完成包括知识生产在内的各项任务。这为人工智能在经济、文化、社会等领域的推广应用,提供了难得的发展机遇。
但同时也必须看到,语言大模型远非完美。本质上它属于概率模型,在语言理解上,无法保证如人类般精准可靠;在语言生成上,会出现“与生俱来”的“幻觉”现象,即生成虚假信息。换言之,OpenClaw的“大脑”时不时会犯糊涂,更棘手的是,何时犯糊涂、犯何种糊涂,难以预料。其结果是,当我们将“动作”的权力赋予OpenClaw时,它无法保证不出错,就好比在“瓷器店里捉老鼠”,即便万分小心,打碎一两件瓷器也在所难免,也就是说,OpenClaw天然存在安全隐患。此外,训练语言大模型所使用的互联网语料中,往往掺杂着人类的各种偏见与谬误,致使模型也存在偏见与谬误。一项随机抽样调研显示,截至2026年3月,互联网上由人工智能生成的文章数量与人类撰写的文章数量基本持平。尽管这项调研尚显初步,存在采样规模过小等不足,但仍能从侧面反映出一种现象:如今互联网上的文章不少是机器所写,我们却可能浑然不觉,无意识地受其影响。这一进程尚处于起步阶段,若不予以必要治理,今后将愈演愈烈,甚至可能波及意识形态安全、责任伦理、学术不端和知识产权等问题。生成式人工智能在进行知识生产时,从真实性、可靠性、安全性等诸多角度向我们提出了全新挑战。
这其中还会衍生出一些更为深刻的问题。例如,语言大模型是通过海量文本训练而成的,可谓汇总、融通了全人类的知识,性能顶尖的大模型有望获得最广泛人群的青睐与使用,于是它仿佛成了唯一的“智者”,在“人人为模型,模型为人人”的闭环迭代中,互联网时代“多对多”的传播模式反而有可能退回到过去印刷时代与电视时代“1对多”的传播模式,只不过此时的“1”已变成了机器,而不再是人了。此外,语言大模型倾向于生成概率意义上“共识”较大的内容,而容易忽视具有个性禀赋的内容,导致知识生产出现某种平庸化、同质化倾向。有研究表明,生成式人工智能虽能提升个体创造力,却降低了“新颖”内容的集体多样性。这个看似矛盾的结论,其实不难理解。
知识生产创新中面临的此类具有普遍性的问题,促使我们必须深入思考:第一,在知识生产与传播进程中,如何妥善处理人与机器的关系?毋庸置疑,在这一进程中人始终应占据主导地位。生成式人工智能应成为人类的好助手、好伙伴,但绝不能“反客为主”,人当然是主体和核心。第二,在人机共存的基本条件下,如何更积极地发挥人在知识生产中的主观能动性?第三,生成式人工智能可加速知识发现与整合,以及无时不在、无远弗届的知识传播,如何在此基础上有效重构知识生产新范式,使其与时、与世俱进?第四,生成式人工智能降低了知识生产门槛,如何以此为契机更好地调动和挖掘大众知识生产能力,与专家知识生产形成互补?
总体而言,语言大模型乃至生成式多模态大模型的迅猛发展,给知识生产创新带来了前所未有的机遇与挑战。面对技术迭代引发的深刻变革,应始终高扬人的主体性,在人与机器的协同中探索知识生产的创新之路,让生成式人工智能真正成为人类文明进步的加速器。