人脑五次进化：AI时代我们如何胜出

发布时间：2026-05-23 09:42阅读：10

今天要和大家分享的书是《智能简史：进化、AI与人脑的突破》。去年秋天，我在人大附中的AI课堂上遇到一个问题。有学生问："老师，为什么AI学习需要那么多数据？GPT-4训练用了13万亿个token，相当于牛津大学图书馆藏书量的12.5倍。可我们人类学东西，根本不需要这么多啊。"确实，一个3岁的孩子，只要看过3到5张猫的图片，就能认出所有的猫。但AI要学会认猫，谷歌当年用了1000万张猫的图片，训练了整整3天。人类看3张图，AI看1000万张，差了300多万倍。作为一名曾经的生物学研究者，同时现在又是一名教育工作者，我开始思考：为什么人脑这么高效？《智能简史》这本书给了我很好的答案。作者麦克斯·班尼特是个AI公司的创始人，他想做出真正的智能机器人，就必须搞清楚人的智能到底是怎么回事。于是他花了好几年时间，向各路专家请教，查阅大量文献，甚至自己发表了几篇神经科学论文，最后写出了这本书。班尼特提出：智能在进化史上经历了五次重大突破，每次突破都带来了一种新的学习能力。之前也有一些学者解读过这本书，大多从技术角度讲AI和大脑的对照。但我想讲的是另一个角度：这五次突破，给我们人类今天的学习带来了什么启示？因为我发现，这五次突破背后，有一个统一的逻辑：喂什么料，长什么脑。AI靠数据喂料。GPT-4训练用了13万亿个token，这些数据通过反复训练，调整了AI内部1.8万亿个参数之间的连接权重。正是这些连接的模式，决定了AI怎么思考。人脑也是一样。你接触什么信息，大脑就会建立什么样的神经连接；神经连接的模式，决定了你的思维方式。接下来，让我们从40亿年前说起，看看智能的五次突破，如何对应着五层喂料的方法。第一次突破：建立因果联系的回路大约6亿年前，地球上出现了一种新的动物——线虫。体长只有1毫米，通体透明，身体里只有959个细胞，其中302个是神经细胞。这些神经细胞组成了一个神经节——严格来说，这还算不上真正的大脑，只是一个简单的神经中枢。

但就是这302个神经元，让线虫有了珊瑚虫没有的能力——主动觅食。珊瑚虫只能守株待兔，线虫会主动寻找。线虫生活在土壤中，以细菌为食。它的头部有"头感器"，能感受有吸引力的分子，比如细菌产生的铵离子；尾部有"尾感器"，能感受需要避开的分子，比如有毒的铜离子。有吸引力的刺激直接与驱使线虫前进的运动神经元相连，需要规避的刺激则与驱使线虫后退的神经元相连。这就是最简单的因果关系：如果闻到食物的气味，那么就向前移动；如果闻到危险的气味，那么就向后退。更神奇的是，线虫会学习。如果经常在盐的附近发现食物，它就会把盐和食物联系在一起。环境变了，盐附近没有食物了，线虫对盐的反应就会减弱。再过一段时间，又在盐附近发现食物，线虫会迅速重新建立联系。这是一种应激性学习，是最基础的因果联系能力。那么，这次突破告诉我们什么？线虫的神经中枢告诉我们：最基础的智能，就是建立"如果……那么……"的因果回路。线虫接受的"喂料"是什么？是环境中的化学信号——食物的气味、危险的气味、盐的浓度。这些信号反复出现，线虫的神经元就会建立连接：盐→食物，危险气味→逃跑。这些连接模式，决定了线虫的行为。早期的AI也是这样。20世纪60到80年代，AI研究的主流是"专家系统"，核心就是建立"IF-THEN"规则。比如1972年斯坦福大学开发的医疗诊断系统MYCIN：IF（发烧）AND（打喷嚏）THEN（感冒）。这种方法很直接，但规则需要人工输入，AI无法自己学习。现在的大语言模型不一样了。GPT从13万亿个token的文本中，自己学习因果关系。它读到"下雨了，所以地面湿了"这样的句子几百万次，就会在参数之间建立"下雨→地面湿"的连接权重。喂什么料，长什么脑。线虫喂的是化学信号，AI喂的是文本数据，那人类应该喂什么？答案是：真实世界的经验。今年我来苏州这边教课的时候，遇到一个让我震惊的事。我上课讲维生素D能有效促进人和动物肠道对钙和磷的吸收。下课后，有学生拿着一道题跑过来问我："老师，为什么缺少维生素D会导致骨质疏松？"我说："我不是刚讲了维生素D能促进肠道对钙和磷的吸收吗？"她说："那不是肠道的吸收吗？骨质疏松不是在骨头里吗？"这是我带这届高一孩子遇到的真实课后答疑现场。她太缺乏生活常识了，无法建立因果联系。她不知道：肠道吸收钙→血液中的钙增加→骨头从血液中获取钙→骨头变结实，这个因果链条。这种因果思维的缺失，根源在于早期的"喂料"不足。现在很多孩子从小到大都在教室里、补习班里，很少接触真实世界。所以，第一层喂料就是：让孩子多接触真实世界。带他们去公园观察蚂蚁搬家，去菜市场看不同的蔬菜，去博物馆了解恐龙灭绝。真实世界里充满了因果关系，孩子的大脑需要这些"原材料"来建立神经回路。下面我们再来说说，智能的第二次突破——建立试错学习的回路。5亿年前，地球上的生物界进入了一场军备竞赛，各个物种花样百出，这就导致了"寒武纪大爆发"。在这个时候，脊椎动物出现了——一种原始的鱼类。这种鱼只有几英寸长，但它的大脑结构，跟现在的鱼类，跟我们人类的大脑是几乎一样的：有皮层、基底神经节、丘脑、下丘脑、中脑和后脑。这是第一个真正的大脑。这么厉害的大脑，带来了什么新能力？强化学习，也就是试错。19世纪末，心理学家桑代克用鱼做实验。他发现，鱼可以用试错的方式学会怎样从复杂的鱼缸迷宫中找到出口，而且哪怕过上几年，它还记得当初的路线。这彻底推翻了"鱼只有三秒钟记忆"的误解。但试错学习有个问题：怎么知道中间每一步是对是错？比如下围棋要走几百步，走到最后才知道输赢，你怎么知道是第50步走错了，还是第150步走错了？1984年，理查德·萨顿解决了这个问题。他的洞见是：不应该把最终结果作为奖励，而应该把中间每一步对结果的"预期"作为奖励。比如赢棋的概率本来是51%，你走了这一步，现在变成了61%，那这一步就是好棋。这样，我们就等于是每一步都在学习。这叫"时序差分学习"。更有意思的是，AI的这个算法，反过来帮助脑科学家理解了大脑。科学家发现，脊椎动物的大脑，用的恰恰就是时序差分学习。关键就在于多巴胺。原来人们以为多巴胺是奖励物质。但研究发现，猴子大脑不是得到糖水之后释放多巴胺，而是在预期会得到糖水的时候释放。多巴胺不是奖励信号，而是预期信号。它告诉你：好东西就在前面，继续！那么，这次突破告诉我们什么？脊椎动物的大脑告诉我们：学习的本质，是通过试错不断调整预期。鱼接受的"喂料"是什么？是试错的结果——走这条路找到了食物，走那条路遇到了危险。每一次试错，都会调整大脑中的多巴胺系统，优化对"哪里有好东西"的预期。AI也是这样。AlphaGo Zero完全从"白板"开始，通过自我对弈强化学习。它自己跟自己下棋，赢了就强化这些走法，输了就调整。仅用3天训练490万场游戏，就以100:0击败了旧版AlphaGo。喂什么料，长什么脑。鱼喂的是试错的结果，AI喂的是自我对弈的数据，那人类应该喂什么？答案是：探索的机会。但现在很多孩子越来越脆弱，为什么？因为被剥夺了试错的机会。美国蒙哥马利大学研究了300名大一学生，发现：拥有"直升机父母"的学生，往往对新思想和行动不那么开放，也更脆弱、更焦虑。什么是"直升机父母"？就是像直升机一样盘旋在孩子上空，随时准备俯冲下来解救孩子。这些孩子的大脑发生了什么？神经科学研究发现，长期缺乏试错机会的孩子，前额叶皮层发育会滞后，杏仁核却异常敏感。越保护，越脆弱。哈佛大学教育学院的研究表明："如果我们不受挫，我们就没有在学习。"研究还发现，童年适度试错者，成年后抗压能力高40%。所以，第二层喂料就是：允许孩子试错。孩子不肯穿外套，冷了一次，下次就知道了。孩子想自己做饭，做糊了，下次就会改进。当然，道德红线、安全底线、法律高压线不能碰，但在安全范围内的错误，都是成长的素材。第三次突破：建立想象模拟的回路距今6600万年前，一颗小行星撞击了地球，恐龙灭绝了。那些一直躲在洞穴里、像老鼠那么大的小型哺乳动物，成了幸存者。我们的大脑长出了一个新东西——新皮层。新皮层给了哺乳动物一项超能力：想象力。20世纪30年代，心理学家托尔曼研究老鼠走迷宫。他有一个新奇的发现：老鼠在岔路口有时会停下来，左右摆头，来回张望几秒钟，然后再选择方向。这可不像强化学习的横冲直撞。托尔曼猜测，老鼠是在想象每个路径会发生什么。2000年代，神经科学家用核磁共振证实了这个猜测：当老鼠在岔路口张望的时候，它大脑里的海马体编码的不是此刻所处的位置，而是未来可能的路径。老鼠在大脑里预演不同的选择。2002年，诺贝尔经济学奖得主丹尼尔·卡尼曼出版了《思考，快与慢》。书中有个细节：当一个人在进行深度思考的时候，他的瞳孔会放大大约50%。为什么？《智能简史》给出了答案：当一个人处在想象状态，正在头脑里模拟一个世界的时候，大脑专注于内部想象，不再处理视觉数据输入，瞳孔就会扩大。卡尼曼说的系统1和系统2，在大脑中到底是什么？系统1，就是基底神经节的自动反应。系统2，就是新皮层的模拟和想象。我们日常大部分时候都是系统1，只在矛盾时刻才调用系统2。那么，这次突破告诉我们什么？哺乳动物的新皮层告诉我们：高级智能，需要在行动之前先在大脑里预演。老鼠接受的"喂料"是什么？是环境的空间信息——哪里有食物，哪里有危险，不同路径会通向哪里。这些信息在海马体中形成一张地图，老鼠可以在大脑里模拟不同的路线，预测结果，再做选择。AI也在学习这个能力。现在的自动驾驶AI，不是看到红灯就直接刹车，而是会在系统里模拟：如果现在刹车，车会在哪里停下？如果缓慢减速，会不会更平稳？如果变道，旁边车道安全吗？它会模拟不同的选项，选择最优的方案。这叫"基于模型的强化学习"——不只是试错，而是先在模型里试，再真的去做。但AI的模拟能力还很有限。它只能模拟特定的任务，比如驾驶、下棋。而人类的新皮层可以模拟任何场景——你可以想象明天的会议，可以想象十年后的生活，可以想象一个从未存在的世界。

喂什么料，长什么脑。老鼠喂的是空间信息，AI喂的是驾驶场景的数据，那人类应该喂什么？答案是：想象的素材。大脑的想象力不是凭空产生的，需要大量的素材输入。你读过的书、看过的电影、经历过的事，都会成为大脑模拟世界的"原材料"。为什么要读小说？因为小说会训练你的模拟能力。当你读《红楼梦》，你的大脑在模拟大观园的场景，模拟人物的心理，预测情节的发展。这些模拟，都在建立新的神经回路。为什么要看纪录片？因为纪录片让你看到不同的世界。你看《地球脉动》，大脑在模拟非洲草原的生态系统。这些模拟，扩展了你的认知边界。如果你从不读书、从不思考复杂问题，你的新皮层就会退化。遇到需要深度思考的时候，你会觉得特别累，瞳孔放大、心跳加速，然后很快就放弃了。所以，第三层喂料就是：提供想象素材。读小说、看纪录片、听音乐会，让大脑有足够的"原材料"去模拟不同的世界。第四次突破：建立理解他人的回路1990年，意大利的神经科学家在用猴子做实验时，有了一个意外发现。实验人员拿起三明治，猴子大脑中对应"用手抓东西"的区域亮了——但猴子并没有做任何动作，它只是看人在做动作。这些神经元被称为"镜像神经元"。为什么灵长类需要这个能力？答案是：为了搞关系。大约1500万年前，我们的祖先演化成了灵长类动物。我们吃树上的果实，获得了丰富的营养，更重要的是，我们获得了空闲时间。我们开始搞关系。英国人类学家罗宾·邓巴发现，灵长类动物的大脑新皮层的大小，和它所在群体的大小是成正比的。你越是群居，就越需要更大的大脑。为什么？因为你需要理解别人在想什么。其他哺乳动物的群体中，谁拳头硬，谁就地位高。而灵长类有一种高级玩法：哪怕你的个人武力值不是最强，你也可以拥有最高的地位。怎么做到的？靠关系。研究发现，灵长类群体发生内斗时，约三分之一的情况下，非家族成员也会来帮忙。要搞关系，你就必须理解别人在想什么。这就是心智理论。哪怕是人类中的一个4岁小孩，你给他看一组漫画，他就能猜出其中人物想要干什么，是不是受到了欺骗。那么，这次突破告诉我们什么？灵长类的心智理论告诉我们：更高级的智能，需要理解他人的意图。灵长类接受的"喂料"是什么？是社交互动的信息——谁是朋友，谁是敌人，谁在帮我，谁在骗我。这些信息在大脑中建立了理解他人的神经回路。母黑猩猩教孩子砸坚果时，动作会比平时慢，还会观察孩子确保其专心学习。孩子不只是看动作，更要理解意图。AI现在还缺少这个能力。ChatGPT可以写文章、写代码，但它不真正理解你的意图。你说"帮我订张机票"，它不知道你是想要最便宜的，还是最快的，还是最舒适的。它缺少心智理论，不能真正理解人的需求。这也是为什么AI容易出现"回形针问题"——你让它"最大限度地生产回形针"，它可能会把地球上所有资源都用来生产回形针。因为它不理解你的真实意图。喂什么料，长什么脑。灵长类喂的是社交互动，AI还在努力学习理解人类，那人类应该喂什么？答案是：真实的人际关系。研究发现，大脑中负责心智理论的区域——颗粒状前额叶皮层——越厚的人，社交网络就越大。而这个区域的发育，需要在4岁左右的关键期得到充分的社交刺激。这就是为什么孩子必须上幼儿园。不是为了学知识，是为了发展心智理论。他们需要跟其他孩子在一起玩耍，学会模拟他人的所要、所知、所想。现在很多孩子沉迷于手机和游戏，缺少真实的人际互动。他们的镜像神经元系统没有得到充分的训练，心智力量发育不良。结果就是：不会察言观色，不懂人情世故，学习效率也低——因为他们不能理解老师讲课的意图，不能从同学的错误中吸取教训。所以，第四层喂料就是：创造社交机会。让孩子多跟同龄人玩耍，多参加集体活动，多观察人与人之间的互动。这些真实的社交经验，会在大脑中建立理解他人的神经回路。第五次突破：建立语言思维的回路10万年前，人类有了语言。想象这样一个场景：一个智人在野外发现了一具羚羊尸体，自己扛不动。如果有语言，他只要说："快跟我来，东边两英里处有一具羚羊尸体。"如果没有语言呢？距离怎么比划？如何说明那是羚羊而且已经死了？这就是语言的力量：传递想象和信息浓缩。长辈告诉晚辈："这片森林里有两种蛇，红色的会咬人，有毒；绿色的不咬人，是安全的。"一句话，孩子立即掌握了因果关系模型。如果没有语言，得旁观多少次人与蛇的遭遇才能领悟？我们前面讲了四种学习方式：线虫从因果联系中学习，鱼从试错中学习，哺乳动物从想象中学习，灵长类从他人的行动中学习。而有了语言，我们则能够从他人的想象中学习。这是学习的革命。有了语言，知识就变得可积累了。考古发现早在10万年前，人类就已经会缝制衣服了。这需要剥皮技术、晾晒皮革方法、制作骨针和绳索，所有这些都依赖锋利石器。必定是某代人发明石刀，某代人发明制皮，某代人发明骨针，所有发明被后代继承，才能有人发明缝制衣服。到了这一步，知识已经不只是存在于人脑之中，更是存在于人脑之间。特别是文字的出现，把知识增长的天花板推到了无限高。语言还带给我们一项超能力。以色列历史学家尤瓦尔·赫拉利说：能共同相信一个虚构的事物，是咱们智人的超能力。宗教、金钱、国家、公司，本质上都是虚构的。但因为我们共同相信它们存在，所以它们存在。因为有了语言和共同的想象，我们的合作人数上限从150人变成了无穷大。那么，这次突破告诉我们什么？人类的语言告诉我们：最高级的智能，是用语言积累知识，用语言组织协作。人类接受的"喂料"是什么？是语言和文字——父母的教导，老师的讲解，书籍的内容。这些语言信息在大脑中建立了语言思维的神经回路。AI也在学习语言。GPT-4训练用了13万亿个token的文本数据——整个互联网的内容。它读了所有的维基百科、所有的新闻文章、所有的书籍。这些文本不是简单地存储，而是通过训练，在1.8万亿个参数之间建立了连接模式。但AI和人类的语言学习有个关键区别：AI是被动接受，人类可以主动选择。GPT吃的是整个互联网，好的坏的都吃。它读过莎士比亚，也读过网络爽文；它读过科学论文，也读过阴谋论。所以GPT有时候很聪明，有时候会胡说八道。而人类可以选择。我们可以选择读经典还是读爽文，读科学著作还是读地摊文学。喂什么料，长什么脑。AI喂的是整个互联网，那人类应该喂什么？答案是：优质的语言。神经科学研究发现，阅读能从物理上改变大脑结构，生成新的脑白质。文盲和阅读者的大脑，在生理结构上就是不一样的——阅读者会在大脑左侧的枕-颞区打造出一小块专门处理文字的"文字盒子区"，而文盲没有。

阅读激活至少9个脑区，建立复杂的神经回路。你读什么书，就会建立什么样的神经连接。读经典名著，你的大脑会建立处理复杂叙事、理解人性深度的回路。读科学著作，你的大脑会建立逻辑推理、因果分析的回路。读网络爽文，你的大脑会建立追求即时刺激、浅层快感的回路。为什么要读经典？因为经典是人类智慧的浓缩。为什么要读原著？因为翻译和改编会损失信息。所以，第五层喂料就是：接触优质语言。读经典、读原著、读科学著作，让大脑接触最精准、最深刻的表达。结尾：你是你读的东西（You are what you read）五次突破讲完了。现在让我们回到开头那个问题：为什么人类看3张图就能认出猫，AI需要1000万张？因为人类的大脑，经过了40亿年的进化，经历了五次重大突破。每次突破，都在我们的大脑中建立了新的神经回路：线虫的神经节，建立了因果联系的回路；鱼的大脑，建立了试错学习的回路；哺乳动物的新皮层，建立了想象模拟的回路；灵长类的新脑区，建立了理解他人的回路；人类的语言区，建立了语言思维的回路。这些回路层层叠加，让我们只需要3张图片，就能提取出"猫"的本质特征。但这不意味着我们可以高枕无忧。因为AI的进化速度，比生物进化快得多。从GPT-3到GPT-4，只用了两年。而从线虫到人类，用了6亿年。在这场竞赛中，我们的优势不在于算力，而在于我们可以主动选择喂什么料。AI的训练数据是被动接受的。它吃什么，取决于人类喂什么。GPT-4吃了整个互联网，好的坏的都吃，所以它有时候很聪明，有时候会胡说八道。但人类不一样。我们可以选择读什么书、看什么电影、跟什么人交往、思考什么问题。更重要的是，人类知道为什么要选择。AI不知道为什么要学习，它只是执行训练目标。你让它学下棋，它就学下棋；你让它写文章，它就写文章。它没有价值观，不知道什么是好的、什么是有意义的。而人类有价值观。我们知道读《自私的基因》比读养生谣言更有价值，因为前者能让我们理解生命的本质；我们知道学习科学比刷短视频更有意义，因为前者能让我们理解世界的规律。AI没有目标，只有任务。而人类有目标。我们知道自己想成为什么样的人，想过什么样的生活，想为这个世界做什么贡献。这些目标，决定了我们选择喂什么料。AI没有反思能力。它不会问"我为什么要学这个"，不会问"这对我有什么意义"。而人类会反思。我们会问：我读这本书，是为了消磨时间，还是为了获得智慧？我学这个技能，是为了应付考试，还是为了解决真问题？这就是人类最大的优势：我们不只是被动地接受信息，我们可以主动地选择信息，更重要的是，我们知道为什么要这样选择。我们常说"你是你吃的东西"。对大脑来说，你是你读的东西。从今天开始，像训练AI一样训练自己的大脑：第一层，多接触真实世界，建立因果联系；第二层，允许试错，鼓励探索；第三层，读小说、看纪录片，训练想象力；第四层，真实的人际互动，发展心智理论；第五层，读经典、读原著，接触高质量表达。不是读更多，而是读更好的。不是学更快，而是学更深的。喂什么料，长什么脑。在AI时代，这是我们最大的优势。恭喜你，又听完了一本书。

← 上一篇：掌握与AI高效沟通的方法下一篇：智能驱动下的SEO优化实战攻略 →