AI与人脑天差地别,但这恰恰有其价值
大脑惊人的细胞多样性和网络复杂性或许能为改进人工智能提供思路。
1943年,两位神经科学家在试图描述人类神经系统如何运作时,意外地奠定了人工智能的基础。在他们的数学框架中,关于细胞系统如何编码和处理信息,沃伦·麦卡洛克和沃尔特·皮茨认为,每个脑细胞,或者说神经元,都可以被视为一个逻辑装置:它要么开启,要么关闭。他们写道,由这种“全或无”的神经元组成的网络,可以通过真假语句执行简单的计算。
“从某种意义上说,他们实际上是在描述第一个人工神经网络,”托马索·波焦说道。他是麻省理工学院的教授,也是计算神经科学的创始人之一。
曾经,大脑是人工神经网络的模型;现在,神经网络成了大脑的模型。
McCulloch 和 Pitts 的框架为许多构成最强大人工智能系统的神经网络奠定了基础。这些旨在识别数据模式的算法,在处理复杂任务方面已经变得如此出色,以至于它们的产物看起来与人类惊人地相似。ChatGPT 的文本如此口语化和个性化,以至于有些人爱上了它。图像生成器可以创建出极其逼真的图片,让人难以分辨真假。深度学习算法正在解决困扰人类数十年的科学难题。这些系统的能力也是人工智能词汇如此丰富,并包含诸多源自人类思维的语言(例如智能、学习和幻觉)的原因之一。
但问题在于:科学史学家马修·科布表示,麦卡洛克和皮茨最初的框架“完全是垃圾”。曼彻斯特大学的教授,著有《 大脑的概念:神经科学的过去与未来》一书。“神经系统根本不是这样连接的。”
即使是最笼统的比较——生物智能和人工智能都是通过处理多层网络节点的信息来学习——它们的相似之处也会很快瓦解。
列奥·科扎奇科夫表示,人工神经网络是“巨大的简化”。他是IBM研究院的博士后研究员,即将领导布朗大学的计算神经科学实验室。“当你观察一个真实的生物神经元的图像时,你会发现它极其复杂。” 这些极其复杂的神经元种类繁多,彼此之间形成数千个连接,构成密集而错综复杂的网络,其行为受到一系列在精确时间尺度上释放的分子的控制。
我们庞大的神经系统由多个细胞构成,它产生我们的感觉、思想、意识和智力——所有构成我们自身的要素。许多过程似乎瞬间且同时展开,由这个器官精心协调。这个器官历经数亿年的进化,从远古海洋中发现的碎片中逐渐塑造而成,最终形成了一个信息存储和处理系统,甚至能够提出关于自身存在的根本性问题。
“(大脑)是已知宇宙中最复杂的活性物质,”克里斯托夫·科赫说道。西雅图艾伦脑科学研究所的一位神经科学家说:“人们一直把大脑比作最先进的机器。”
但从电话交换机、无线电管到超级计算机、神经网络,没有任何一种机器能够与之媲美。
科学史学家马修·科布说,神经系统与人工神经网络截然不同。“它们的连接方式完全不一样。”——Chris Schmauch
人工神经网络会丢失大脑神经元的多样性和网络复杂性。但计算神经科学家——既是脑科学专家又是计算机专家——认为这没关系。尽管这两个系统沿着不同的进化路径分化,但计算机科学家和神经科学家仍然可以通过比较它们来学习很多东西。融入生物学策略可以提高人工神经网络的效率和效能。反过来,后者可以成为理解人脑的模型。
托马斯·纳塞拉里斯表示,人工智能“并非是在重塑人类生物学”。明尼苏达大学的一位神经科学家表示,他的目标是“发现通往智能的新途径”。希望通过这种方式,我们能够更深入地了解我们自身。
电子“大脑”
1958年,在“人工智能”一词于达特茅斯学院的一次数学和计算机科学研讨会上被提出两年后,美国海军公布了《纽约时报》所报道的成果。被称为能够自我学习的“电子‘大脑’”。
这台被称为“感知器”的计算机并不算特别先进。它只能读取一种简单的代码——卡片上打出的一系列孔——并预测下一个孔会出现在左边还是右边,用二进制输出0或1表示。感知器通过一系列节点(也称为神经元)进行这些计算。但它们只是名义上的神经元。
“神经元远不止是节点:它们是活细胞……拥有DNA、细胞器和特殊结构,”麦克·沙因说道。悉尼大学的系统神经生物学家。
数千根轴突(蓝色)连接到一个神经元(白色);两个细胞在称为突触(绿色)的连接处相遇。——利希特曼实验室(哈佛大学)和谷歌研究院。
在你的大脑中,860亿个神经元以复杂的网络相互交流。它们通过将被称为神经递质的分子释放到细胞间的空隙中,并用称为树突的“手臂”接收这些分子来进行沟通。这些分子可以抑制神经元的活动,也可以激活它,从而引发一股强烈的电流沿着其长长的尾部(轴突)流动。这股电流随后会触发细胞另一端的轴突末梢,将新一波分子传递给网络中的下一个神经元。
大脑内外的所有神经元都共享这种基本机制,但几乎所有其他特征都因神经元类型而异,甚至同一种类型的单个神经元也各不相同。“没有两个神经元看起来是完全一样的;它们完全不同,”Shine说道。有些神经元会兴奋其他神经元;有些则会抑制它们。有些神经元很长——例如,某些触觉神经元的轴突从脊髓底部延伸到大脚趾——而另一些则相对较小,紧密地位于大脑内部。它们不仅能以二进制代码(即是否放电)传递信息,还能以模拟信号传递信息,即以具有不同模式、强度和频率的复杂信号交响曲的形式传递信息。它们发送不同的神经递质来编码不同的信息;有些神经元则通过电流进行交流。当然,神经元的功能也千差万别:调节情绪、促进食物在肠道中的移动、存储和提取记忆、控制手部运动等等。
大脑是已知宇宙中最复杂的活性物质。——克里斯托夫·科赫,艾伦脑科学研究所
即使是动物王国中最简单的脑组织也具备这种复杂性。例如,蛆虫体内有一个神经元,当它们的身体过度伸展时,这个神经元会发出信号。它有130个输入和200个输出。“它的作用就是告诉它们,‘嘿,我伸展过度了,’”科布说道。蛆虫的身体伸展得越厉害,这个神经元的放电频率就越高。他解释说,这样一来,它就包含了一种频率编码。“它不是在说,‘哦,我正在被拉伸’,而是在说,‘我被拉伸了[多少]次’。”这是模拟信号,而不是二进制信号。
相比之下,波焦说,人工神经元是“生物神经元的简化版”。例如,感知器的神经元接收信息,分析信息,然后输出最终结果——1 或 0。从这个意义上讲,它们和生物神经元一样,要么激活,要么不激活。但相似之处也仅限于此。
感知器与之前的计算机相比,其卓越之处在于它能够学习。这是人类历史上第一次,一台并非由组织构成,而是由导线和电路组成的机器,展现出此前只有生物学才具备的能力。而它的学习能力本身也源于神经科学。1949年,心理学家唐纳德·赫布指出,大脑中的神经通路在使用时会得到加强,不使用时则会减弱,这一观点通常被概括为“同时激活的神经元会相互连接”。换句话说,大脑的学习很大程度上是通过调整神经元之间的连接来实现的。
在感知器中,这意味着为每个连接分配一个“权重”——一个决定输入对最终输出重要性的数值。神经网络通过根据预测的准确性调整权重来学习。因此,感知器是“第一台能够产生原创想法的机器”,正如其创造者所说。
1958 年,计算机科学家弗兰克·罗森布拉特(左图左侧)公布了感知器(右图),他称之为“第一台能够产生原创想法的机器”。它是第一个神经网络。——康奈尔大学珍稀手稿收藏部
然而,感知器的人工智能学习并未获得成功。当时,计算能力有限,无法将机器学习发展到超越这种简单模型的程度,而且缺乏支持其发展的资金。“感知器方法被忽视了,计算机科学本身变成了编程,”波吉奥说道。编程意味着直升机式管理。算法不会学习;它们被告知该做什么。随着计算机科学家们专注于编写越来越详细的指令,而忽略了那些能够自我学习的系统,人工智能的寒冬来临了。
但神经科学研究并未放缓,反而加速发展。接下来的几十年揭示了人脑不同区域,尤其是视觉皮层的运作方式——这些生物学线索后来被计算机科学家所利用。
网络复杂性
在感知器问世前后,数学家奥利弗·塞尔弗里奇提出了一个解释大脑视觉系统运作方式的框架。在他的“群魔乱舞模型”中,一群尖叫的恶魔代表着神经元的放电:当一个恶魔识别出一个视觉特征时,它就会尖叫(神经元就会放电)。例如,当屏幕上出现字母“A”时,第一组恶魔会识别出字母的左上角,然后尖叫着告诉下一组恶魔,后者准备识别更大的图案,例如字母顶端左上角与右上角相连。如果它们确实看到了这样的图案,这些恶魔就会尖叫着告诉最后一个恶魔,而最后一个恶魔——正如你可能已经猜到的——在看到完整的“A”时也会尖叫。通过这种方式,尖叫的恶魔可以处理输入信息并识别出字母“A”。
蛆虫对外部世界的了解程度,是电脑无法比拟的。——马修·科布,曼彻斯特大学
事实证明,我们脑海中的这种尖叫声是真实存在的。不久之后,神经科学家大卫·休伯尔和托斯滕·维塞尔通过对猫的视觉皮层进行探测,发现视觉系统通过多层神经元传递信号,这些神经元能够对越来越复杂的细节做出反应,从线条到模糊的形状再到完整的图像。这一发现为他们赢得了1981年诺贝尔生理学或医学奖。
如今,视觉系统是人脑中最容易理解的网络之一,而Hubel和Wiesel提出的模型的简化版本是现代神经网络识别图像中物体的核心。这类算法被称为卷积神经网络,它首先检测图像中的边缘和简单形状,然后通过多层人工神经元来识别更大的形状或图案,例如耳朵或人脸。
大脑由许多这样的神经网络构成,它们接收并处理信息流,通过反馈回路相互作用,并不断调整连接。这些网络使大脑成为卓越的多任务处理机器,在其100万亿个连接上执行着令人眼花缭乱的各种功能。信息,以光子、声波、气味分子等形式存在,被感觉神经元捕获,然后由其他神经元层进行分析。这些分析触发神经网络快速触发特定序列,从而调取记忆并将信息置于特定情境中。如果大脑认为某个经历值得保留,就会将其存储为记忆。
与此同时,大脑也在与肠道沟通,评估饥饿感,并解读阳光信号,协调体内几乎每个细胞的昼夜节律。前一秒它还在做白日梦,下一秒就指挥你的手拂去肩膀上的蜘蛛。它在为明天做计划,也在回顾昨天,同时还在调节体温、血压、炎症和心跳。当我们睡觉时,大脑会切换到另一种模式——将图像组合成梦境,巩固记忆,进行一些日常维护工作,并指挥许多我们无法理解的活动。
即使是小鼠视觉皮层的一立方毫米也包含着数千个细胞组成的密集丛林,正如 MICrONS合作项目的重建结果所示。——艾伦研究所
这些过程发生在各种尺度上,从单个神经元到局部网络,再到覆盖整个大脑甚至整个身体的网络。神经系统不断变化的动态变化得益于神经调节剂,它们是一类作用较慢、分布更广泛于大脑区域的神经递质。斯里坎斯·拉马斯瓦米称它们为“大脑中的主开关”。他是纽卡斯尔大学神经回路实验室的负责人。
神经调节剂由某些神经元末端复杂的树突释放,使大脑能够在几秒到几分钟内适应新的情况。例如,压力期间皮质醇的释放会使身体做好行动准备。这套系统非常精细:研究表明,同一树突不同分支释放的分子可以影响动物的行为,例如老鼠是奔跑还是停止。
“你根本不知道该把这些信号放到神经网络的哪个位置,”Shine说道。“神经科学中隐藏着许多复杂的概念,现代神经网络由于其结构不同,根本无法触及这些概念。”
至关重要的是,人工神经网络并非像大脑中的神经元那样由物理连接构成。这种网络是抽象的,存在于数学和计算的世界中,以算法的形式被编程到硅芯片中。米切尔·奥斯特罗表示,它“基本上就是线性代数”,外加一些其他的非线性计算。麻省理工学院计算神经科学研究生。
即使要达到一个生物神经元的复杂程度,现代深度神经网络也需要五到八层节点。但将人工神经网络扩展到两层以上却花费了数十年时间。在更深的网络中,确定网络应该调整哪些权重才能最大限度地减少预测误差变得更加困难。20世纪80年代,计算机科学家保罗·沃博斯提出了一种名为反向传播的创新算法,解决了这个问题。
1986年,被誉为人工智能之父的杰弗里·辛顿(Geoffrey Hinton)——他获得了2024年诺贝尔物理学奖——提出了人工智能理论。因为他在机器学习领域的工作——他的同事们撰写了一篇颇具影响力的论文。关于如何使用反向传播算法训练神经网络。这个想法虽然并非直接源于神经科学,但却成为深化神经网络并提升其学习能力的关键。
上世纪90年代,计算机科学家终于将神经网络加深到三层。但直到2010年代,计算机科学家学会构建算法结构,以便在更小的芯片上同时运行更快的计算,神经网络才加深到几十层甚至几百层。
斯里坎斯·拉马斯瓦米表示,人工智能“没有像人脑那样进行推理的能力”。他的团队正致力于编写人工智能算法,使其能够像人脑一样产生动态的网络效应。——蓝脑计划/洛桑联邦理工学院
这些进步催生了如今强大的神经网络,它们在某些任务上甚至超越了人脑。它们可以接受数十亿张图像或文字的训练,而这对于人类来说,即使穷尽一生也无法分析完。它们在国际象棋和围棋等游戏中击败了人类世界冠军。它们能够以极高的准确度预测世界上几乎所有已知蛋白质的结构。它们甚至可以用简·奥斯汀的风格写一篇关于麦当劳的短篇小说。
然而,科布表示,尽管这些能力令人印象深刻,但算法并不像我们一样“知道”事物。“它们什么都不理解。”它们主要通过识别训练数据中的模式来学习;为此,它们通常需要海量数据进行训练。
与此同时,即使是动物王国中最简单的神经系统也拥有知识。“蛆虫对外部世界的了解程度,是任何电脑都无法比拟的,”科布说道。而且,不同的蛆虫之间也存在差异,因为它们都是通过与环境互动并从中获取信息来学习的。他说,除了向机器输入一系列事实之外,我们不知道如何赋予机器知识。
人工神经网络比赋予它们名称的原始系统更简单,也更缺乏动态性。它们在设计用于完成特定任务(例如识别物体或回答提示)方面表现出色。但拉马斯瓦米表示,它们“无法像人脑那样进行推理”。“我认为,添加生物学细节将对实现这一点起到至关重要的作用。”
而这正是他想做的。
注入生物学
由于生物机制经过进化磨砺,已被证明在大脑中运作良好,一些研究人员认为,通过回归其灵感并更好地模拟某些神经生物学特征,可以改进人工神经网络。拉马斯瓦米表示,这种受大脑启发的计算方法,也称为神经形态计算,并不需要化学反应。相反,它可以将分子概念抽象为可在电路中运行的算法等价物。
他的团队发现,在人工神经元的行为方式中引入一些多样性,可以提高神经网络的性能。例如,在2024年发表于科学预印本网站arxiv.org的初步研究中,他的团队发现,通过编程使人工神经元以不同的频率放电,可以提高神经网络的性能。他们提高了系统的学习能力。拉马斯瓦米也在研究生物神经系统中观察到的网络效应。今年,他的团队提出理论,设计神经网络时,应包含神经调节剂所提供的信息。这将提高他们像大脑一样持续学习的能力。
马蒂亚·加佐拉和他的团队正在将生物神经元连接到人工神经元上,以试图提高计算机处理信息的能力。——Mattia Gazzola
其他研究人员也致力于捕捉神经元群体中存在的复杂动态——但他们并不想将这些信息转化为算法,而是想用生物学的原生语言来表达。核工程师马蒂亚·加佐拉(Mattia Gazzola)他和他在伊利诺伊大学厄巴纳-香槟分校的团队正在将生物神经元连接到人工组件上,以提高计算机的信息处理能力。他表示,生物网络能够演化出新的计算动态,因为它们由神经元构成,而神经元天生就能编码恰到好处的信息量。
“我们认为这是开启创造力、好奇心和学习能力的关键,”加佐拉说。“这些都是生物智能的标志,我们到处都能发现它们,不仅在人类身上……甚至在一些简单的生物身上也能发现。”
其他神经形态学研究的重点在于提高人工神经网络的效率——而大脑在这方面遥遥领先。拉马斯瓦米表示,大脑“极其节能”。它的运行功率约为20瓦,大约是普通LED灯泡的两倍。“神经网络绝不可能仅靠20瓦的功率运行,”他说道。
曾经,大脑是人工神经网络的模型;现在,神经网络成了大脑的模型。
然而,由于大脑的训练方式不同,比较人工神经网络和生物神经网络的能耗并非易事。我们应该把数亿年的进化历程,还是一个人一生的学习经历,都算作训练?这又需要多少能量?IBM研究员科扎奇科夫表示:“关于如何进行比较,业内还有更多争论。我们是在拿苹果和橘子做比较吗?”
尽管存在诸多细微差别,但人工神经网络的能耗问题仍然令许多人担忧。目前,为了提升计算能力而不断扩大网络规模的趋势,将持续加剧其能源需求,直到更高效的芯片和工艺被发明出来。在算法中加入过多的生物学细节会显著消耗计算能力、能源和其他资源。“我们需要找到一个合适的平衡点,在这个平衡点上,这种程度的细节处理才是真正有用的,”拉马斯瓦米说道。
然而,对大多数计算机科学家来说,大脑并非他们关注的重点。但对许多神经科学家而言,人工智能却是。
模型系统
人工智能已经开始影响生物学研究,在某些情况下甚至加速了生物学的发展。研究人员可以利用蛋白质和基因组等生物数据训练神经网络,希望计算机能够帮助他们设计新型的功能性生物产品。此外,他们还可以利用人工智能来研究大脑本身。
“我们正进入一个激动人心的时代,”珍妮尔·费瑟说道。他是弗拉蒂隆研究所计算神经科学中心的研究员,即将领导卡内基梅隆大学的一个实验室。“我们现在正迈向一个可以利用这些模型来了解大脑新知识的阶段。”
曾经,大脑是人工神经网络的模型,而现在,神经网络反过来成了大脑的模型。费瑟表示,尽管存在诸多差异,但如今的人工智能算法比以往任何模型都更接近真实大脑的某些部分。此外,还有其他优势。神经科学家通常研究动物来试图了解人类神经生物学。但算法无需喂养、饲养或维持生命。而且,神经网络在写作、解决数学问题和下棋方面都比啮齿动物更胜一筹。
麻省理工学院的认知神经科学家埃夫·费多连科(Ev Fedorenko)致力于寻找人工神经网络与人脑之间的相似之处。——Alexandra Sokhina
一系列研究表明,尽管人工神经网络和生物神经网络的架构截然不同,但它们的行为方式可能相似。在2024年发表于biorxiv.org的一篇预印本中,Ev Fedorenko指出……在麻省理工学院研究语言和大脑的她和她的团队发现,不同神经网络的活动存在差异。人工神经网络和人脑可以相互模仿,并模拟大脑的活动,这被称为“表征的普遍性”。在另一项研究中,他们发现人工神经网络和人脑都能处理句子。费多连科说,它们与大脑有一些相似之处,这一点“确实令人兴奋”。
但鉴于神经网络和大脑都接近“黑箱”,很难找到它们之间的相似之处:从外部很难了解神经网络或大脑内部的运作机制。纳塞拉里斯说,从这个意义上讲,将两者进行比较就像“近视眼带领近视眼”。尽管如此,比较我们这两个最智能的网络系统,即使它们之间存在诸多差异,也仍然大有裨益,几乎不会有任何损失。他说:“将人类与人工智能进行比较永远不会失去意义”,就像我们永远不会厌倦比较动物和人类的思维一样。
但它们并不相同——而且可能永远也不会相同。“(神经网络)现在在很多方面都与真正的大脑有很大的不同,所以我认为,将它们视为一个完全不同的信息处理对象实际上更合理,”系统神经生物学家沙因说,“它本身就非常有趣。”
如果你问 ChatGPT-4:“你和人脑相似吗?”它会将你的文字转换成数字,然后通过成千上万个节点进行处理——一次、两次、甚至更多次。每次处理后,它都会预测接下来应该回复你的最佳词语。
是也不是,它可能会写东西。有时候,就像大脑一样,它也需要一些反馈。“你觉得我像大脑,还是更像别的东西?”