探究人机思考边界:维特根斯坦与神经科学的洞见
理解的幻觉
斯蒂芬妮·申
去年,当我阅读石黑一雄的《长日将尽》时,我深切体会到文字之外的丰富内涵。
小说以主人公史蒂文斯的视角展开,刻画了一个极度自律、全身心投入事业却忽视了个人情感乃至道德准则的人物。
然而,作为读者,我却能全然感知他未曾言说的思绪,以及他长期压抑和否认的情感。
读完后,我仍旧沉浸其中,无法自拔。我相信,任何人在阅读能引发共鸣的作品时,都会有类似的体验。
我们对语言的领悟,远不止于字面意思的解读。它需要我们调动自身的情感、感受、过往经历及想象力。
从创作角度而言,将故事用恰当的语言呈现,是一项艰辛且漫长的过程。石黑一雄曾为自己设定了四周的“创作低谷期”,每周一至周六,从早九点工作到晚十点半。
尽管他凭借努力和专注构思出了小说的框架,但初稿充斥着“拙劣的句子、生硬的对话、毫无进展的场景”。
他花费了更多时间进行打磨,最终历时两年才得以出版。
石黑一雄的创作历程,恰恰反映了我们内在思考或感受与外在语言表达之间存在的天然鸿沟,这是我们在尝试沟通自身体验时普遍面临的挑战。
另一位作家迈克尔·波兰在《卫报》上的一篇文章中,对此进行了精妙的阐述:
我曾一直认为,我的意识流主要以内心独白或偶尔的对话形式呈现,毕竟我是一名作家,理应是文字。但事实证明,我许多所谓的“思想”——这些轻飘飘的思维痕迹的委婉说法——实际上是前语言阶段的,常常以图像、感觉或概念的形式出现,而词语则像是附带品,是迟来的尝试,试图将这些难以捉摸的意义丝线转化为更具体、更易于分享的内容。
相比之下,如今的生成式大型语言模型(LLM),如ChatGPT、Claude和Grok,能够即时产出文本。它们依赖于人类收集、整理并预处理的海量文本数据,将其转化为数值表示。它们通过对每个词语的统计概率预测,以流畅的语法进行回应,而无需真正的思考或理解。
然而,人类常常被它们流畅、看似自信的回答所蒙蔽,误以为LLM的输出源于真实的人类意识。更进一步,许多人担忧甚至害怕LLM在不久的将来会发展出意识。
要深刻理解这种“理解的幻觉”,我们需要更深入地认识语言的本质以及人脑如何处理语言。
本文将深入探讨路德维希·维特根斯坦的语言哲学以及当代神经科学的最新见解。通过这些,我们将清晰地辨析大型语言模型与人类大脑之间的根本差异,更重要的是,能够以更清晰的预期和更坚实的认知来审视这些系统,了解它们的能与不能。
20世纪初,路德维希·维特根斯坦,一位原本学习机械工程的学者,在剑桥跟随著名数学家兼哲学家伯特兰·罗素学习后,转向了哲学领域。
罗素立刻识别出维特根斯坦是一位“充满激情、深刻、强烈且极具天赋”的天才。
罗素的判断是准确的。维特根斯坦因其独特且深刻的思考而备受推崇,他的思想完全超越了当时的哲学传统,无论是在他之前还是之后。
他32岁时出版的第一部哲学著作是一本仅75页的《逻辑哲学论》。之后,他选择成为一名教师,在奥地利一个偏远的乡村任教了大约六年。
随后,他重返剑桥,担任哲学教授。他的第二部重要著作《哲学探究》在他1951年去世后才得以出版,书中他对语言的本质及其运作方式提出了极为精辟的见解。
他的核心论点在于,语言的意义是通过人们在日常生活中使用的表达方式,通过他们共享的语境和实践活动来体现的。
他认为语言本质上是模糊的、界限不清的。它无法提供一个概念的绝对定义。例如,何为“椅子”?牛津词典将其定义为“供单人使用的独立座椅,通常带有靠背和四条腿”。
但豆袋椅算椅子吗?那没有腿、但有人坐的石头呢?它们都可以被视为单人座椅,但缺乏腿。沙发椅算椅子吗?它有靠背和四条腿,但最多可供三人使用。
“椅子”的真正含义,只有在赋予了足够的背景和具体情境时才能被清晰理解。而定义只有在明确了具体目的时才能变得清晰。维特根斯坦在书中也阐述了“游戏”的定义:
69. 我们该如何向别人解释什么是游戏?我想我们会给他描述各种游戏,并可能加上一句:“这些以及类似的事物就叫做‘游戏’。”然后我们自己就知道了更多吗?
难道只是我们无法准确地告诉别人什么是游戏吗?——但这并非无知。我们不知道边界,因为根本就没有划定界限。
再次强调,我们可以划定界限——为了特定的目的。这是否是让概念变得可用的必要条件?绝非如此!除非是为了那个特定的目的。
他进一步指出,我们通过将词语与相似的实例进行关联来思考或理解词语,维特根斯坦称之为“家族相似性”,即这些相似之处常常相互重叠:
66–67.…我们看到的是一个复杂的相似和交织的网络:大事与小事的相似。我想不到比“家族相似”更能形容这些相似点的词了;
因为家庭成员之间存在着各种各样的相似之处——体型、五官、肤色、步态、性情等等——它们以同样的方式相互重叠交织。——我必须说:“游戏”就是一个家族。
这就是为什么像美德、正义、善良或美这类概念,自柏拉图时代以来,经过两千多年的争论,至今仍未得到明确的解决。
维特根斯坦认为,这些任务之所以不可能完成,是因为“是什么”的根本问题被剥离了语境,而哲学家们却一直在寻找那个实际上并不存在的绝对定义。
基于此,维特根斯坦将语言比作“游戏”,其含义取决于使用者——无论是文本的创造者还是接收者——如何“玩”这些游戏。
来自不同背景和教育程度的人们,在不同的社会文化环境中,玩这些游戏的方式各不相同。这就是为什么人们常常陷入无休止且毫无结果的争论,互相打断——因为他们实际上在玩不同的游戏,尽管他们使用了相同的语言。
更重要的是,维特根斯坦指出,我们是通过日常的“生命形式”来玩弄语言游戏的,这些形式通过我们的手势、面部表情、情感、感觉和行为来中介。
换句话说,语言游戏涉及到超越词语和句子的、具身化的人类活动。
维特根斯坦深入探究了人类的心智,发现许多时候,语言缺乏描述或区分心理状态的词汇。一个例子是“咖啡的香气”:
610. 描述咖啡的香气!——为什么做不到?是我们缺乏恰当的词语吗?那么,哪些词语是不够的呢?——但我们是从哪里获得这样的描述,毕竟它是可能的呢?你是否曾感受到缺乏这样的描述?你是否尝试过描述香气但未成功?
你可能会惊讶地发现,我们缺乏许多气味的恰当词汇。我们通常的做法是用事物的名称来定义它,或者借用其他词义,比如鲜艳、干燥、辛辣等。
然而,咖啡爱好者们基于自身的经验,能够理解“咖啡的香气”这一说法。同一个词唤起了不同层次的理解和个体化的心理状态。
维特根斯坦还证实了,我们大多数时候并非通过语言来思考。他指出,在我们说出“我希望/期待/相信……”
这样的话之前,心中已存在一种感觉,它远不如最终被赋予的句子那样具体。正如他所言:
2.102. 我的想法是:相信是一种心态。这种现象持续存在;而且这与在句子中表达的过程无关。
维特根斯坦远远超前于他所处的时代,他揭示了语言所制造的幻觉。他在《哲学探究》中指出,语言缺乏固定、精确的内在结构。
句子的准确性和顺序,使人类产生了对语言深刻的错觉,让哲学家们相信他们能够发现语言本身的潜在本质和隐藏秩序,而实际上这些根本就不存在。
从这个角度看,任何基于语言本身的学科,例如哲学,都无法像科学那样带来对世界的全新发现,而是致力于澄清我们语言自身的运作方式。
正如维特根斯坦所说:“一部哲学著作本质上由阐释构成”,“哲学不产生‘哲学命题’,而是对命题的澄清”。
它的任务不是推动理论,而是消除语言中可能出现的混淆。
鉴于此,当今大型语言模型(LLM)的流畅性,恰恰放大了维特根斯坦所警示的幻觉。
这些系统完全在语言的内部运作,生成看似有意义的句子,因为它们完美地契合了各种语言模式和规则。
1861年,法国外科医生兼人类学家保罗·布罗卡观察到,他的两名中风患者失去了说话能力,只能发出结巴的单音节词,尽管他们仍能理解听到的和读到的语言。
多年后进行尸检时,布罗卡发现两人的大脑在额叶左下方回的同一区域均遭受了中风损伤,该区域后来被命名为布罗卡区。
十二年后,26岁的德国神经学家兼精神科医生卡尔·韦尼克观察到一名中风患者,他无法理解口语或书面语言,但能够流利地说话,并且听力正常。
患者去世后,韦尼克在大脑的颞叶左上方回后部、靠近听觉皮层的位置发现了一个病变。该区域后来被称为韦尼克区,负责语言的理解,位于布罗卡区的言语生成上游。
韦尼克还提出,这两个区域必须通过神经通路相连,才能实现协调的交流。
这条通路后来被确认为弓状束,通过该通路,韦尼克区处理的意图意义被传递到布罗卡区,以正确的顺序和句法组合词汇。最后句子的发出则由运动皮层执行,运动皮层再指挥声带肌肉。
现代神经科学结合了病灶研究和对正常受试者进行的影像学研究,揭示了更为复杂的情况。首先,在语言相关的处理中发现了额外的大脑区域。
例如,顶叶的角回和缘上回(如图所示)对语言理解也至关重要。其次,许多区域不仅参与语言功能,还涉及非语言功能,如记忆提取、空间处理和社会互动。
此外,顶叶皮层的初级视觉皮层负责字母和符号的首次视觉处理,而位于颞叶韦尼克区旁边的初级听觉皮层则处理语言的声音,包括音高、音色和节奏。
简而言之,现代研究表明,语言功能高度分布在颞叶、顶叶和额叶,并且与其他非语言功能交织在一起。
“意义”并非只存储在大脑的某个特定区域。它涉及一个动态激活的多功能网络,这些网络参与语言的生成和理解。
这奇异地印证了维特根斯坦的观点:“语言的意义在于日常的使用。”
“语言的使用”,包括说话、书写和阅读,深深植根于我们的日常活动和体验之中。
正如维特根斯坦所指出的,词语或句子的含义必须在特定的语境中被解读,而其中许多语境是我们与现实世界互动中的非语言方面。
维特根斯坦的语言哲学以及我们对大脑处理语言方式的理解,使我们能够从三个方面得出关于大型语言模型(LLM)的结论:
它们缺乏原创性和创造力,它们制造了意义和理解的幻觉,以及人类对正确使用LLM的最终责任。
正如我们所见,语言只是人类意识和经验中的一小部分。我们在解释语言以表达它之前,就已经确定了自己的意图。
基于维特根斯坦的理论,人类作为具身化的主体参与语言游戏,拥有真实的理解,同时能够从新体验中带来新思想。我们拥有语言真正的创造力和原创性。
相反,大型语言模型只是模仿语言游戏,但并非真正体验语言游戏,因为它们缺乏具身感知、本能、情感和意图。
它们被限制在纯粹由人类文本构成的空间内。因此,它们无法创造出超越人类产物的新词汇,也无法表达复杂感受和情感的原创表达。它们只能复制或模仿已有的、人类创造的产物。
例如,人类通过亲身经历疼痛学会了“痛苦”这个词。LLM则是通过阅读文本中“痛苦”一词的用法来学习。人类通过想象自己闻过的味道来理解咖啡的香气;LLM却无法理解那种感受。
此外,科学家们获得新发现,并非仅仅通过阅读研究论文。他们需要先观察物理世界,与之互动,然后设计实验和设备,接着收集真实世界的数据,最后验证现实世界中的关系,而这些都是大型语言模型(LLM)无法做到的。
人类理解的一个副产品是,我们倾向于将自己的想法和感受投射到他人身上。正如亚当·斯密在《道德情感论》中所述:
“通过想象,我们会将自己置于他的境地……我们仿佛进入了他的身体,并在某种程度上与他融为一体。”
虽然这种心理投射是我们对他人的同理心基础,但我们都知道,它可以轻易地延伸到动物和物体,当然,也适用于那些能够完美模仿人类语言的机器。
此外,正如维特根斯坦所指出的,我们对语言的理解根植于作为共享人类活动的生命形式。
所以当我们说“计算机在思考”时,我们实际上是将语言游戏推向了其原始语境之外,同时还伴随着一种错觉,认为机器与我们一样拥有内在状态。
LLM还会制造出拥有“个性”的假象,但这些所谓的“人格”并非真实存在,而是AI公司训练出的语言风格。正是我们自身的理解能力,制造了LLM通过感知到的“个性”来传达意义的幻觉。
此外,LLM在生成输出时,并不会形成信念或任何目标。它们对真理没有判断和动机。它们的结论是基于文本中词语共现、关联和延续的统计追踪模式。
这就是为什么它们会默认产生幻觉,正如OpenAI在其一篇论文中所述:“大型语言模型有时会在不确定时进行猜测,生成看似合理但错误的陈述,而不是承认不确定性。”
因此,它们的输出是不可信的,即使以流畅自信的方式呈现,也可能包含事实错误。
LLM的优势在于它们能够吸收和处理海量信息,其信息量远超个人一生所能承受的范围。根据维特根斯坦的观点,大型语言模型只是另一种语言游戏。而人类必须学会如何恰当地“玩”这场游戏。
人类的思维和理解体现在一个远超语言压缩范围的现实世界中。大型语言模型只了解人类已经弄清楚的事实,而那只是现实的一小部分。
真理和意义源于人类与现实世界的互动。一旦我们认识到这一点,LLM就不再构成威胁,而仅仅是一个可供利用的工具。
它们本质上与计算器或飞机无异,后者能够比人类更高效地完成特定任务,但它们仍然是受人类控制的工具。
我们不应将它们与人类相提并论,而应专注于确定如何在适当的场景下、以正确的预期来最佳地使用它们。
例如,我们可以利用大型语言模型来协助头脑风暴、收集多元观点、识别数据模式或总结大量信息。
但我们必须始终用自己的判断和专业知识来审查和核实其结果。更重要的是,我们必须注入自己原创的思考和经验。
总而言之,当我们阅读《长日将尽》这样的优秀小说时,我们正在理解一个永远无法完全被文字所描绘的世界。
正如路德维希·维特根斯坦提醒我们的,语言的意义源于其在人类生活中的实际运用。清晰地认识到这一点,将促使我们运用自身的智慧和创造力来使用大型语言模型,而不是将它们误认为具有思考能力的大脑。
“语言可能成为思考者与现实之间的障碍。这就是为什么真正的创造力往往始于语言的终点。” ——亚瑟·科斯特勒,《创造的行为》
发表于《ILLUMINATION》
我专注于数据、科学以及与人类心智相关的议题;
技术高管,神经科学博士;
https://stephanieshen.substack.com/