孙茂松:生成式AI与知识生产创新
关注我们,获取更多资讯
生成式AI与知识生产创新
孙茂松,清华大学人工智能研究院常务副院长及计算机系长聘教授
知识生产与知识的产生、传播这两个关键环节密不可分。二者相辅相成:优质知识是传播的动力源泉,而优质的传播又能通过知识的“教化”作用,在人们利用所学解决各类问题的生产和生活实践中,催生出更多优质的知识。古往今来,上述过程“环复转运,终始无端”,不断丰富着人类的知识宝库。
在漫长的历史演进中,知识的生产与拓展,长期带有少数“智者”留下的鲜明印记。随着时代的发展,“智者群”的数量会渐次扩大,但在整个人群里相对来说仍是少数。进入现代社会特别是互联网时代,这种状况发生了急剧变化,普罗大众可以依托互联网信息技术对知识的生产作出贡献。知识传播模式的演进更是令人叹为观止,从文字产生前以语音为知识载体的口口相传,数千年前以泥板、莎草纸、羊皮卷、甲骨、竹简、绢帛等为载体的文本手抄,到1000多年前尤其是数百年来以纸张为载体的图书印刷,百余年来以广播、电影、电视为载体的模拟及数字内容生产,再到近30年来以互联网和社交网络为载体的跨模态数字内容生产,知识生产以其范式持续更替所引发的巨大能量推动着人类文明进步。纵观历史,无论是造纸术、印刷术,还是模拟和数字通信、互联网等,无一不是当时的重大科技发明。科技的一次次重大进步,促成了知识生产的一次次范式创新。
近年来,基于语言大模型的生成式AI将引发知识生产范式的又一次变革。与以往人类是唯一主体不同,这次机器成为了新主体。传播主体由单一的人变为人与机器的复杂交织。大模型具备强大的生成与理解能力,得益于向量表征、自注意力机制等技术及大数据的支撑。它整合了海量知识。赫拉利认为AI破解语言即可创造文化。OpenClaw框架利用大模型作为“大脑”和“操作系统”,能完成包括知识生产在内的任务,提供了广阔的应用前景。
然而,大模型并不完美。作为概率模型,它存在理解不精准和“幻觉”(生成虚假信息)的问题。这带来了安全隐患。此外,训练数据中的偏见也会影响模型。研究表明AI生成内容占比正迅速增加。若不加治理,将引发意识形态、伦理、学术不端等问题,对知识生产构成新挑战。
此外,大模型可能成为唯一的“智者”,导致传播模式从“多对多”退回“1对多”的集中化。同时,它倾向于生成“共识”内容,忽视个性,导致知识生产平庸化、同质化,降低了集体多样性。
面对这些问题,我们需要思考:第一,人机关系中,人应保持主导地位,AI是好助手而非主宰。第二,如何激发人在人机共存下的主观能动性。第三,如何利用AI加速知识发现,重构新范式。第四,如何利用AI降低门槛,调动大众知识生产能力,与专家互补。
总体而言,生成式AI带来了前所未有的机遇与挑战。我们应坚持人的主体性,在人与机器协同中探索创新之路,让AI成为人类文明进步的加速器。