人脑五次进化:AI时代我们如何胜出
今天要和大家分享的书是《智能简史:进化、AI与人脑的突破》。去年秋天,我在人大附中的AI课堂上遇到一个问题。有学生问:"老师,为什么AI学习需要那么多数据?GPT-4训练用了13万亿个token,相当于牛津大学图书馆藏书量的12.5倍。可我们人类学东西,根本不需要这么多啊。"确实,一个3岁的孩子,只要看过3到5张猫的图片,就能认出所有的猫。但AI要学会认猫,谷歌当年用了1000万张猫的图片,训练了整整3天。人类看3张图,AI看1000万张,差了300多万倍。作为一名曾经的生物学研究者,同时现在又是一名教育工作者,我开始思考:为什么人脑这么高效?《智能简史》这本书给了我很好的答案。作者麦克斯·班尼特是个AI公司的创始人,他想做出真正的智能机器人,就必须搞清楚人的智能到底是怎么回事。于是他花了好几年时间,向各路专家请教,查阅大量文献,甚至自己发表了几篇神经科学论文,最后写出了这本书。班尼特提出:智能在进化史上经历了五次重大突破,每次突破都带来了一种新的学习能力。之前也有一些学者解读过这本书,大多从技术角度讲AI和大脑的对照。但我想讲的是另一个角度:这五次突破,给我们人类今天的学习带来了什么启示?因为我发现,这五次突破背后,有一个统一的逻辑:喂什么料,长什么脑。AI靠数据喂料。GPT-4训练用了13万亿个token,这些数据通过反复训练,调整了AI内部1.8万亿个参数之间的连接权重。正是这些连接的模式,决定了AI怎么思考。人脑也是一样。你接触什么信息,大脑就会建立什么样的神经连接;神经连接的模式,决定了你的思维方式。接下来,让我们从40亿年前说起,看看智能的五次突破,如何对应着五层喂料的方法。第一次突破:建立因果联系的回路大约6亿年前,地球上出现了一种新的动物——线虫。体长只有1毫米,通体透明,身体里只有959个细胞,其中302个是神经细胞。这些神经细胞组成了一个神经节——严格来说,这还算不上真正的大脑,只是一个简单的神经中枢。
但就是这302个神经元,让线虫有了珊瑚虫没有的能力——主动觅食。珊瑚虫只能守株待兔,线虫会主动寻找。线虫生活在土壤中,以细菌为食。它的头部有"头感器",能感受有吸引力的分子,比如细菌产生的铵离子;尾部有"尾感器",能感受需要避开的分子,比如有毒的铜离子。有吸引力的刺激直接与驱使线虫前进的运动神经元相连,需要规避的刺激则与驱使线虫后退的神经元相连。这就是最简单的因果关系:如果闻到食物的气味,那么就向前移动;如果闻到危险的气味,那么就向后退。更神奇的是,线虫会学习。如果经常在盐的附近发现食物,它就会把盐和食物联系在一起。环境变了,盐附近没有食物了,线虫对盐的反应就会减弱。再过一段时间,又在盐附近发现食物,线虫会迅速重新建立联系。这是一种应激性学习,是最基础的因果联系能力。那么,这次突破告诉我们什么?线虫的神经中枢告诉我们:最基础的智能,就是建立"如果……那么……"的因果回路。线虫接受的"喂料"是什么?是环境中的化学信号——食物的气味、危险的气味、盐的浓度。这些信号反复出现,线虫的神经元就会建立连接:盐→食物,危险气味→逃跑。这些连接模式,决定了线虫的行为。早期的AI也是这样。20世纪60到80年代,AI研究的主流是"专家系统",核心就是建立"IF-THEN"规则。比如1972年斯坦福大学开发的医疗诊断系统MYCIN:IF(发烧)AND(打喷嚏)THEN(感冒)。这种方法很直接,但规则需要人工输入,AI无法自己学习。现在的大语言模型不一样了。GPT从13万亿个token的文本中,自己学习因果关系。它读到"下雨了,所以地面湿了"这样的句子几百万次,就会在参数之间建立"下雨→地面湿"的连接权重。喂什么料,长什么脑。线虫喂的是化学信号,AI喂的是文本数据,那人类应该喂什么?答案是:真实世界的经验。今年我来苏州这边教课的时候,遇到一个让我震惊的事。我上课讲维生素D能有效促进人和动物肠道对钙和磷的吸收。下课后,有学生拿着一道题跑过来问我:"老师,为什么缺少维生素D会导致骨质疏松?"我说:"我不是刚讲了维生素D能促进肠道对钙和磷的吸收吗?"她说:"那不是肠道的吸收吗?骨质疏松不是在骨头里吗?"这是我带这届高一孩子遇到的真实课后答疑现场。她太缺乏生活常识了,无法建立因果联系。她不知道:肠道吸收钙→血液中的钙增加→骨头从血液中获取钙→骨头变结实,这个因果链条。这种因果思维的缺失,根源在于早期的"喂料"不足。现在很多孩子从小到大都在教室里、补习班里,很少接触真实世界。所以,第一层喂料就是:让孩子多接触真实世界。带他们去公园观察蚂蚁搬家,去菜市场看不同的蔬菜,去博物馆了解恐龙灭绝。真实世界里充满了因果关系,孩子的大脑需要这些"原材料"来建立神经回路。下面我们再来说说,智能的第二次突破——建立试错学习的回路。5亿年前,地球上的生物界进入了一场军备竞赛,各个物种花样百出,这就导致了"寒武纪大爆发"。在这个时候,脊椎动物出现了——一种原始的鱼类。这种鱼只有几英寸长,但它的大脑结构,跟现在的鱼类,跟我们人类的大脑是几乎一样的:有皮层、基底神经节、丘脑、下丘脑、中脑和后脑。这是第一个真正的大脑。这么厉害的大脑,带来了什么新能力?强化学习,也就是试错。19世纪末,心理学家桑代克用鱼做实验。他发现,鱼可以用试错的方式学会怎样从复杂的鱼缸迷宫中找到出口,而且哪怕过上几年,它还记得当初的路线。这彻底推翻了"鱼只有三秒钟记忆"的误解。但试错学习有个问题:怎么知道中间每一步是对是错?比如下围棋要走几百步,走到最后才知道输赢,你怎么知道是第50步走错了,还是第150步走错了?1984年,理查德·萨顿解决了这个问题。他的洞见是:不应该把最终结果作为奖励,而应该把中间每一步对结果的"预期"作为奖励。比如赢棋的概率本来是51%,你走了这一步,现在变成了61%,那这一步就是好棋。这样,我们就等于是每一步都在学习。这叫"时序差分学习"。更有意思的是,AI的这个算法,反过来帮助脑科学家理解了大脑。科学家发现,脊椎动物的大脑,用的恰恰就是时序差分学习。关键就在于多巴胺。原来人们以为多巴胺是奖励物质。但研究发现,猴子大脑不是得到糖水之后释放多巴胺,而是在预期会得到糖水的时候释放。多巴胺不是奖励信号,而是预期信号。它告诉你:好东西就在前面,继续!那么,这次突破告诉我们什么?脊椎动物的大脑告诉我们:学习的本质,是通过试错不断调整预期。鱼接受的"喂料"是什么?是试错的结果——走这条路找到了食物,走那条路遇到了危险。每一次试错,都会调整大脑中的多巴胺系统,优化对"哪里有好东西"的预期。AI也是这样。AlphaGo Zero完全从"白板"开始,通过自我对弈强化学习。它自己跟自己下棋,赢了就强化这些走法,输了就调整。仅用3天训练490万场游戏,就以100:0击败了旧版AlphaGo。喂什么料,长什么脑。鱼喂的是试错的结果,AI喂的是自我对弈的数据,那人类应该喂什么?答案是:探索的机会。但现在很多孩子越来越脆弱,为什么?因为被剥夺了试错的机会。美国蒙哥马利大学研究了300名大一学生,发现:拥有"直升机父母"的学生,往往对新思想和行动不那么开放,也更脆弱、更焦虑。什么是"直升机父母"?就是像直升机一样盘旋在孩子上空,随时准备俯冲下来解救孩子。这些孩子的大脑发生了什么?神经科学研究发现,长期缺乏试错机会的孩子,前额叶皮层发育会滞后,杏仁核却异常敏感。越保护,越脆弱。哈佛大学教育学院的研究表明:"如果我们不受挫,我们就没有在学习。"研究还发现,童年适度试错者,成年后抗压能力高40%。所以,第二层喂料就是:允许孩子试错。孩子不肯穿外套,冷了一次,下次就知道了。孩子想自己做饭,做糊了,下次就会改进。当然,道德红线、安全底线、法律高压线不能碰,但在安全范围内的错误,都是成长的素材。第三次突破:建立想象模拟的回路距今6600万年前,一颗小行星撞击了地球,恐龙灭绝了。那些一直躲在洞穴里、像老鼠那么大的小型哺乳动物,成了幸存者。我们的大脑长出了一个新东西——新皮层。新皮层给了哺乳动物一项超能力:想象力。20世纪30年代,心理学家托尔曼研究老鼠走迷宫。他有一个新奇的发现:老鼠在岔路口有时会停下来,左右摆头,来回张望几秒钟,然后再选择方向。这可不像强化学习的横冲直撞。托尔曼猜测,老鼠是在想象每个路径会发生什么。2000年代,神经科学家用核磁共振证实了这个猜测:当老鼠在岔路口张望的时候,它大脑里的海马体编码的不是此刻所处的位置,而是未来可能的路径。老鼠在大脑里预演不同的选择。2002年,诺贝尔经济学奖得主丹尼尔·卡尼曼出版了《思考,快与慢》。书中有个细节:当一个人在进行深度思考的时候,他的瞳孔会放大大约50%。为什么?《智能简史》给出了答案:当一个人处在想象状态,正在头脑里模拟一个世界的时候,大脑专注于内部想象,不再处理视觉数据输入,瞳孔就会扩大。卡尼曼说的系统1和系统2,在大脑中到底是什么?系统1,就是基底神经节的自动反应。系统2,就是新皮层的模拟和想象。我们日常大部分时候都是系统1,只在矛盾时刻才调用系统2。那么,这次突破告诉我们什么?哺乳动物的新皮层告诉我们:高级智能,需要在行动之前先在大脑里预演。老鼠接受的"喂料"是什么?是环境的空间信息——哪里有食物,哪里有危险,不同路径会通向哪里。这些信息在海马体中形成一张地图,老鼠可以在大脑里模拟不同的路线,预测结果,再做选择。AI也在学习这个能力。现在的自动驾驶AI,不是看到红灯就直接刹车,而是会在系统里模拟:如果现在刹车,车会在哪里停下?如果缓慢减速,会不会更平稳?如果变道,旁边车道安全吗?它会模拟不同的选项,选择最优的方案。这叫"基于模型的强化学习"——不只是试错,而是先在模型里试,再真的去做。但AI的模拟能力还很有限。它只能模拟特定的任务,比如驾驶、下棋。而人类的新皮层可以模拟任何场景——你可以想象明天的会议,可以想象十年后的生活,可以想象一个从未存在的世界。
喂什么料,长什么脑。老鼠喂的是空间信息,AI喂的是驾驶场景的数据,那人类应该喂什么?答案是:想象的素材。大脑的想象力不是凭空产生的,需要大量的素材输入。你读过的书、看过的电影、经历过的事,都会成为大脑模拟世界的"原材料"。为什么要读小说?因为小说会训练你的模拟能力。当你读《红楼梦》,你的大脑在模拟大观园的场景,模拟人物的心理,预测情节的发展。这些模拟,都在建立新的神经回路。为什么要看纪录片?因为纪录片让你看到不同的世界。你看《地球脉动》,大脑在模拟非洲草原的生态系统。这些模拟,扩展了你的认知边界。如果你从不读书、从不思考复杂问题,你的新皮层就会退化。遇到需要深度思考的时候,你会觉得特别累,瞳孔放大、心跳加速,然后很快就放弃了。所以,第三层喂料就是:提供想象素材。读小说、看纪录片、听音乐会,让大脑有足够的"原材料"去模拟不同的世界。第四次突破:建立理解他人的回路1990年,意大利的神经科学家在用猴子做实验时,有了一个意外发现。实验人员拿起三明治,猴子大脑中对应"用手抓东西"的区域亮了——但猴子并没有做任何动作,它只是看人在做动作。这些神经元被称为"镜像神经元"。为什么灵长类需要这个能力?答案是:为了搞关系。大约1500万年前,我们的祖先演化成了灵长类动物。我们吃树上的果实,获得了丰富的营养,更重要的是,我们获得了空闲时间。我们开始搞关系。英国人类学家罗宾·邓巴发现,灵长类动物的大脑新皮层的大小,和它所在群体的大小是成正比的。你越是群居,就越需要更大的大脑。为什么?因为你需要理解别人在想什么。其他哺乳动物的群体中,谁拳头硬,谁就地位高。而灵长类有一种高级玩法:哪怕你的个人武力值不是最强,你也可以拥有最高的地位。怎么做到的?靠关系。研究发现,灵长类群体发生内斗时,约三分之一的情况下,非家族成员也会来帮忙。要搞关系,你就必须理解别人在想什么。这就是心智理论。哪怕是人类中的一个4岁小孩,你给他看一组漫画,他就能猜出其中人物想要干什么,是不是受到了欺骗。那么,这次突破告诉我们什么?灵长类的心智理论告诉我们:更高级的智能,需要理解他人的意图。灵长类接受的"喂料"是什么?是社交互动的信息——谁是朋友,谁是敌人,谁在帮我,谁在骗我。这些信息在大脑中建立了理解他人的神经回路。母黑猩猩教孩子砸坚果时,动作会比平时慢,还会观察孩子确保其专心学习。孩子不只是看动作,更要理解意图。AI现在还缺少这个能力。ChatGPT可以写文章、写代码,但它不真正理解你的意图。你说"帮我订张机票",它不知道你是想要最便宜的,还是最快的,还是最舒适的。它缺少心智理论,不能真正理解人的需求。这也是为什么AI容易出现"回形针问题"——你让它"最大限度地生产回形针",它可能会把地球上所有资源都用来生产回形针。因为它不理解你的真实意图。喂什么料,长什么脑。灵长类喂的是社交互动,AI还在努力学习理解人类,那人类应该喂什么?答案是:真实的人际关系。研究发现,大脑中负责心智理论的区域——颗粒状前额叶皮层——越厚的人,社交网络就越大。而这个区域的发育,需要在4岁左右的关键期得到充分的社交刺激。这就是为什么孩子必须上幼儿园。不是为了学知识,是为了发展心智理论。他们需要跟其他孩子在一起玩耍,学会模拟他人的所要、所知、所想。现在很多孩子沉迷于手机和游戏,缺少真实的人际互动。他们的镜像神经元系统没有得到充分的训练,心智力量发育不良。结果就是:不会察言观色,不懂人情世故,学习效率也低——因为他们不能理解老师讲课的意图,不能从同学的错误中吸取教训。所以,第四层喂料就是:创造社交机会。让孩子多跟同龄人玩耍,多参加集体活动,多观察人与人之间的互动。这些真实的社交经验,会在大脑中建立理解他人的神经回路。第五次突破:建立语言思维的回路10万年前,人类有了语言。想象这样一个场景:一个智人在野外发现了一具羚羊尸体,自己扛不动。如果有语言,他只要说:"快跟我来,东边两英里处有一具羚羊尸体。"如果没有语言呢?距离怎么比划?如何说明那是羚羊而且已经死了?这就是语言的力量:传递想象和信息浓缩。长辈告诉晚辈:"这片森林里有两种蛇,红色的会咬人,有毒;绿色的不咬人,是安全的。"一句话,孩子立即掌握了因果关系模型。如果没有语言,得旁观多少次人与蛇的遭遇才能领悟?我们前面讲了四种学习方式:线虫从因果联系中学习,鱼从试错中学习,哺乳动物从想象中学习,灵长类从他人的行动中学习。而有了语言,我们则能够从他人的想象中学习。这是学习的革命。有了语言,知识就变得可积累了。考古发现早在10万年前,人类就已经会缝制衣服了。这需要剥皮技术、晾晒皮革方法、制作骨针和绳索,所有这些都依赖锋利石器。必定是某代人发明石刀,某代人发明制皮,某代人发明骨针,所有发明被后代继承,才能有人发明缝制衣服。到了这一步,知识已经不只是存在于人脑之中,更是存在于人脑之间。特别是文字的出现,把知识增长的天花板推到了无限高。语言还带给我们一项超能力。以色列历史学家尤瓦尔·赫拉利说:能共同相信一个虚构的事物,是咱们智人的超能力。宗教、金钱、国家、公司,本质上都是虚构的。但因为我们共同相信它们存在,所以它们存在。因为有了语言和共同的想象,我们的合作人数上限从150人变成了无穷大。那么,这次突破告诉我们什么?人类的语言告诉我们:最高级的智能,是用语言积累知识,用语言组织协作。人类接受的"喂料"是什么?是语言和文字——父母的教导,老师的讲解,书籍的内容。这些语言信息在大脑中建立了语言思维的神经回路。AI也在学习语言。GPT-4训练用了13万亿个token的文本数据——整个互联网的内容。它读了所有的维基百科、所有的新闻文章、所有的书籍。这些文本不是简单地存储,而是通过训练,在1.8万亿个参数之间建立了连接模式。但AI和人类的语言学习有个关键区别:AI是被动接受,人类可以主动选择。GPT吃的是整个互联网,好的坏的都吃。它读过莎士比亚,也读过网络爽文;它读过科学论文,也读过阴谋论。所以GPT有时候很聪明,有时候会胡说八道。而人类可以选择。我们可以选择读经典还是读爽文,读科学著作还是读地摊文学。喂什么料,长什么脑。AI喂的是整个互联网,那人类应该喂什么?答案是:优质的语言。神经科学研究发现,阅读能从物理上改变大脑结构,生成新的脑白质。文盲和阅读者的大脑,在生理结构上就是不一样的——阅读者会在大脑左侧的枕-颞区打造出一小块专门处理文字的"文字盒子区",而文盲没有。
阅读激活至少9个脑区,建立复杂的神经回路。你读什么书,就会建立什么样的神经连接。读经典名著,你的大脑会建立处理复杂叙事、理解人性深度的回路。读科学著作,你的大脑会建立逻辑推理、因果分析的回路。读网络爽文,你的大脑会建立追求即时刺激、浅层快感的回路。为什么要读经典?因为经典是人类智慧的浓缩。为什么要读原著?因为翻译和改编会损失信息。所以,第五层喂料就是:接触优质语言。读经典、读原著、读科学著作,让大脑接触最精准、最深刻的表达。结尾:你是你读的东西(You are what you read)五次突破讲完了。现在让我们回到开头那个问题:为什么人类看3张图就能认出猫,AI需要1000万张?因为人类的大脑,经过了40亿年的进化,经历了五次重大突破。每次突破,都在我们的大脑中建立了新的神经回路:线虫的神经节,建立了因果联系的回路;鱼的大脑,建立了试错学习的回路;哺乳动物的新皮层,建立了想象模拟的回路;灵长类的新脑区,建立了理解他人的回路;人类的语言区,建立了语言思维的回路。这些回路层层叠加,让我们只需要3张图片,就能提取出"猫"的本质特征。但这不意味着我们可以高枕无忧。因为AI的进化速度,比生物进化快得多。从GPT-3到GPT-4,只用了两年。而从线虫到人类,用了6亿年。在这场竞赛中,我们的优势不在于算力,而在于我们可以主动选择喂什么料。AI的训练数据是被动接受的。它吃什么,取决于人类喂什么。GPT-4吃了整个互联网,好的坏的都吃,所以它有时候很聪明,有时候会胡说八道。但人类不一样。我们可以选择读什么书、看什么电影、跟什么人交往、思考什么问题。更重要的是,人类知道为什么要选择。AI不知道为什么要学习,它只是执行训练目标。你让它学下棋,它就学下棋;你让它写文章,它就写文章。它没有价值观,不知道什么是好的、什么是有意义的。而人类有价值观。我们知道读《自私的基因》比读养生谣言更有价值,因为前者能让我们理解生命的本质;我们知道学习科学比刷短视频更有意义,因为前者能让我们理解世界的规律。AI没有目标,只有任务。而人类有目标。我们知道自己想成为什么样的人,想过什么样的生活,想为这个世界做什么贡献。这些目标,决定了我们选择喂什么料。AI没有反思能力。它不会问"我为什么要学这个",不会问"这对我有什么意义"。而人类会反思。我们会问:我读这本书,是为了消磨时间,还是为了获得智慧?我学这个技能,是为了应付考试,还是为了解决真问题?这就是人类最大的优势:我们不只是被动地接受信息,我们可以主动地选择信息,更重要的是,我们知道为什么要这样选择。我们常说"你是你吃的东西"。对大脑来说,你是你读的东西。从今天开始,像训练AI一样训练自己的大脑:第一层,多接触真实世界,建立因果联系;第二层,允许试错,鼓励探索;第三层,读小说、看纪录片,训练想象力;第四层,真实的人际互动,发展心智理论;第五层,读经典、读原著,接触高质量表达。不是读更多,而是读更好的。不是学更快,而是学更深的。喂什么料,长什么脑。在AI时代,这是我们最大的优势。恭喜你,又听完了一本书。