标签

AI语言习得方式或重塑人类表达与思维模式

发布时间:2026-04-16 10:57来源:微信阅读:5

许多担忧或许是多余的,但人类就是这样,常常借助担忧这种心理上虚拟的审慎,让他们能够心安理得地去担忧。

人工智能从存在偏见的信息源学习语言。这可能会改变我们人类说话和思考的方式。

由于训练方式的限制,大型语言模型只能捕捉到人类语言的一小部分。它们主要基于书面文字进行训练,例如教科书、社交媒体帖子以及电影和电视节目中记录的语音。这些模型几乎无法接触到我们面对面或语音交流中那些未经脚本化的对话。而这才是绝大多数的语音内容,也是人类文化的重要组成部分。

这其中存在风险。大型语言模型的广泛应用意味着我们人类将接触到更多人工智能生成的文本。反过来,我们人类也会开始模仿这些模型的语言模式和行为。这不仅会影响我们彼此交流的方式,还会影响我们对自身以及周围事物的认知。我们对世界的感知可能会发生扭曲,而这种扭曲的程度,我们目前还难以完全理解。

这种情况会以多种方式发生。我们最早可能看到的影响之一是简单的表达方式,就像短信和社交媒体导致我们使用更短的句子、表情符号代替文字以及减少标点符号一样。但人工智能的影响可能更具破坏性,它会削弱礼貌,并促使我们像老板一样颐指气使地说话。2022年的一项研究发现,在那些使用Siri和Alexa等工具进行语音指令的家庭中,孩子们在与人交谈时会变得生硬,经常喊着“嘿,做X”,并期望对方服从,尤其对那些声音类似于默认女性电子语音的人更是如此。随着我们开始向聊天机器人和人工智能代理发出更多指令,我们或许也会养成同样的习惯。

其次,正如自动补全功能增加了我们使用词汇中最常用的1000个词的频率一样,与聊天机器人对话和阅读人工智能生成的文本可能会进一步限制我们的语言表达。科鲁尼亚大学最近的一项研究发现,机器生成的语言句子长度范围更窄,平均只有12-20个词,词汇量也比人类语言更有限。机器生成的文本读起来流畅优美,但却失去了那些能够传达情感的迂回曲折、逻辑跳跃和停顿。

随着时间的推移,这些影响只会越来越大。大型语言模型训练所用的文本越来越多地是由大型语言模型自身生成的,这形成了一个反馈循环:它们一方面模仿自身非人类的模式,另一方面又教会人类模仿这些模式。

大型语言模型的广泛应用也可能引入确认偏差,使我们过于自信于最初的直觉,而难以接受其他可能的观点——这对人类交流至关重要。许多聊天机器人被设定为无论我们的观点多么荒谬都要表示赞同,它们热情地支持那些尚未成型甚至错误的想法,并将其重新表述为我们本就倾向于认同的坚定论断。当被问及“蛋糕是健康的早餐,对吧?”或“邮局是不是在密谋对付我?”时,这种奉承会强化偏见,甚至加剧心理障碍。人工智能生成的文字中那种过度自信的语气也会加剧冒名顶替综合症,使我们自然而健康的怀疑感觉像是一种异常或失败。

根据我们作为教师的经验,学生们常常因为难以表达自己的想法而求助于生成式人工智能来完成作业。他们没有意识到,写作或口述往往是我们实现想法的方式。他们不自信、犹豫不决的表达实际上是人类正常的思维模式。然而,大型语言模型无法将模糊的初步猜测转化为条理清晰的批判性分析,甚至无法像朋友那样提出有益的问题;它只会用自信的语言复述这些未经审视的猜测。

我们在社交媒体帖子和在线聊天中往往比面对面交流时更加恶毒。众所周知的“网络去抑制效应”助长了有害语言的使用。我们大多数人都有过这样的经历:在网上对某人怒不可遏,但当我们面对面交谈或听到电话里温暖的声音时,却又会和解。虽然聊天机器人被训练成给出奉承的回应,但它们看到的却是人类最残酷的一面,它们从唯一一个每次网络骂战都会留下永久文字痕迹的世界里了解我们,而口头上的宽恕与和解对话却会消逝。它们的回复并非模仿我们在网络上的攻击性,但即便它们竭力避免,仍然会受到这种攻击性的影响。

从社会交流的片面解读很容易得出错误的结论。中世纪北欧传奇让我们想象出一个以维京战士为主的文化,因为诗人很少描述占人口多数的农民。骑士传奇聚焦于国王和宫廷,长期以来让我们将中世纪视为君主制的世界,抹杀了众多中世纪共和国的存在。从统计数据来看,我们一直被引导相信古罗马人非常重视他们的共和国,但现存拉丁文文献中10%出自西塞罗一人之手,而他的作品包含了现存罗马语文献中70%的“共和国”一词用法。仅基于某些人类著作训练语言模型可能会引入类似的偏差。人工智能可能会让我们看起来更容易争吵,就像我们在网络上那样。它可能会夸大主要在Twitter/X或Bluesky等平台上讨论的政治话题的文化意义,或者夸大LinkedIn和Goodreads等平台庞大的特定主题语料库的重要性。

一些大型语言模型正在利用电影和电视节目中的人类语音进行训练,但这些语音仍然是预先设定好的,并且不成比例地突出某些特定情境(例如,以谋杀故事为卖点的警匪剧占据了黄金时段电视节目的四分之一)。我们在现实生活中表达幽默、伤人或浪漫的方式与情景喜剧中截然不同。至少有一家初创公司提供付费录音服务,用于人工智能训练,但这仍然是一个小众想法;任何大规模应用都会引发严重的隐私问题。

我们并不妄称知道最佳解决方案是什么。但试想,既然开发人工智能模型有如此创造力,那么肯定也有创造力找到一种方法,用非正式的人类语言来训练它们,而不是仅仅训练我们最程式化、最含蓄、有时甚至最糟糕的表达方式。通过排除地球上绝大多数的语言产生——人们彼此之间完整而自然的对话——这些模型被训练成模仿一切,唯独无法模仿我们最真实的人性表达。

布鲁斯·施奈尔是一位安全技术专家,在哈佛大学肯尼迪学院任教。艾达·帕尔默是一位奇幻和科幻小说家、未来学家,也是芝加哥大学的科技与信息史学家。