AI三大流派与七十年起伏史

发布时间：2026-07-05 22:05阅读：2

1956 年，美国达特茅斯学院，一群科学家聚在一起开了一个会。

这个会的名字叫"达特茅斯夏季研讨会"，去的都是当时最聪明的人。会上他们提出了一个概念——人工智能。

能到什么程度呢？他们当时就敢预测：机器会在 20 年内代替人类做所有工作。

70 年过去了，这个预言没实现。但这场会议确实成了 AI 的"出生证明"。

有意思的是，从那天起，做 AI 的科学家们就分成了三个学派。直到今天，这三个学派还在互相影响。理解了他们，你就理解了 AI 的半部历史。

学派一：符号主义 —— 让电脑"讲道理"

符号主义的核心思想很简单：把知识写成规则，让机器按规则推理。

举个例子。你告诉计算机两件事：

计算机自动推出："苏格拉底会死"。

是不是很像你中学学的三段论？

符号主义的做法包含两套系统：一套叫知识库，专门存事实（"苏格拉底是人""人都会死"）；另一套叫推理机，专门负责在这些事实之间做逻辑推导。你可以理解为：

这套逻辑在数学证明、法律推理这些领域非常好用——因为它们天生就是靠规则运转的。80 年代红极一时的专家系统，就是请各领域的专家把知识一条条写成规则，然后塞给计算机去执行诊断。

但问题很快就暴露了。

你试试用这种方法教会电脑识别一只猫？你需要先定义什么是猫：有毛、四条腿、会喵喵叫、喜欢睡懒觉……你会发现根本定义不完。就算勉强定义了，换一只没有尾巴的猫、一只正在打滚的猫、一只在暗光下的猫——你之前写的规则很可能全部失效。

世界上大部分知识，是很难用规则写清楚的。

更根本的质疑来自哲学家塞尔（John Searle）在 1980 年提出的一个思想实验——中文屋。

想象你被关在一个房间里，屋里有一本厚厚的规则手册（全是中文）。屋外的人递进来一张纸条，上面写着一些符号。你对照规则手册，找到对应操作，写下另外一些符号递出去。你完全不知道自己写了什么——但屋外的人觉得你在用中文流利对话。

这个实验想说的是：按规则操作不等于真正理解。

今天的 AI 领域，符号主义不再是主角。但它的遗产无处不在——你手机里那个"系统检测到异常交易"的短信提醒，就是规则系统在干活；你在知乎搜一个问题，知识图谱帮你把相关内容串起来，底下也有符号主义的影子。

联结主义不写规则。它的思路是完全不同的方向：模仿大脑。

人脑有大约 860 亿个神经元。每个神经元做的事不能说复杂——它接收来自其他神经元的信号，累计到一定程度，就"激活"一下，把信号传下去。

联结主义做的是搭建一个人工神经网络——把成千上万个简单的计算单元（也叫"人工神经元"）一层层地连起来：

每个神经元的运作方式极其简单：

这里的"权重"是关键。每个连接都有权重，你可以把它理解为神经元对这个输入的"重视程度"。权重越大，这个信号对当前神经元的影响就越大。

所谓"学习"，就是不断调整这成千上万个权重的数值。

一开始所有权重都是随机的，网络输出的结果一塌糊涂。但每做错一次，它就根据错误的方向微调一点点权重——把贡献了错误答案的连接权重调低，把能导向正确答案的权重调高。

经过几万、几十万次的调整，所有权重稳定在了一个能让输出尽量正确的数值上。这时候，"学习"就完成了。

你可能会问：为什么要"多层"？只一层不行吗？

答案是不行。一层网络只能学到非常简单的模式——就像你只能用一条直线去区分猫和狗，肯定分不干净。而有了多层之后，每一层可以学到不同层次的"特征"——

层数越多，能学到的模式越复杂。这就是"深度"学习的"深度"二字的由来。

你今天用到的几乎所有 AI——相册人脸识别、语音转文字、输入法预测、短视频推荐、ChatGPT——背后都是这个逻辑。它不是在学习知识，它是在把输入转化成输出的一路上，把数万个旋钮调到了最佳位置。

打个比方：

行为主义和前两个学派完全不同。它不写规则（符号主义），不研究大脑结构（联结主义）。它的灵感来自驯兽师。

驯海豚跳过火圈的时候，驯兽师怎么做的？他不会跟海豚讲道理，也不会研究海豚的神经元。他做的只有一件事：设好目标，然后根据结果给反馈。

行为主义把同样的逻辑搬到了计算机上。一个叫"智能体"的程序被放到一个"环境"里，在每个时刻，智能体做出一个动作，环境给它一个反馈——正向的（奖励）或负向的（惩罚）。智能体的目标只有一个：最大化它获得的累计奖励。

这个过程可以抽象成循环：

但这里有一个核心矛盾：探索 vs 利用。

如果智能体每次都选当前看起来最优的动作（利用），它可能永远发现不了更好的策略。但如果它总是尝试新动作（探索），又可能一直在踩坑，得不到足够的奖励。一个好的强化学习算法，必须在两者之间找到平衡。

探索阶段是"探索新的行为可能性"；利用阶段是"利用已知的经验知识"，这不正是你自己在学习和决策时的状态吗？

最有名的例子是 AlphaGo。它自己跟自己下了几千万盘棋——一开始瞎下，遇到赢的局面就获得正反馈，输的局面就负反馈。经过足够多的对局，它的"智能体"自学成才，悟出了很多人类棋手几千年都没想过的走法。

2016 年它赢了李世石。赛后，有职业棋手说：AlphaGo 下出的某一步，按照人类几千年的围棋理论是"错棋"，但事后分析——那是全局最优解。

行为主义不关心你是不是"理解"了规则，它只关心结果。

今天强化学习主要用于那些有明确"输赢"标准的场景——游戏 AI、自动驾驶（在模拟器里反复试错）、机器人控制、甚至短视频推荐系统里的部分机制（你的每一次停留或划走，都是一个奖励信号）。

讲完三个学派，你可能会产生一个疑问：

既然联结主义看起来这么厉害，为什么现在才火起来？1956 年就有人提出来了，中间那几十年在干嘛？

好问题。

这三个学派并不是平起平坐、和平共处的。在 AI 将近 70 年的历史里，它们轮流坐庄，经历了两次大起大落。

达特茅斯会议之后的近二十年，AI 世界基本是符号主义的天下。

那时候科学家们信心爆棚——用逻辑和规则解决问题，听起来多靠谱。他们做出了不少成果：能证明数学定理的"逻辑理论家"、能诊断疾病的专家系统、能下棋的程序。

当时的人有多乐观？1965 年，AI 先驱司马贺（Herbert Simon）甚至预测："20 年内，机器将能完成人类能做的任何工作。"

结果呢？被打脸了。

问题就出在我们前面说的——规则根本写不完。一个专家系统需要人类专家把几千条规则一条条敲进去，换个领域就得重新写一套。更致命的是，当时的计算机算力太弱，稍微复杂一点的推理就跑不动了。

到了 1974 年，各国政府发现投了大笔钱却没看到什么实用成果，纷纷削减 AI 研究经费。AI 迎来了第一个冬天。

80 年代初，两件事让 AI 回暖。

一是专家系统开始商用——比如当时一个叫 RI（XCON）的系统，能为计算机公司自动配置硬件方案，一年省几千万美元。企业开始愿意掏钱了。

二是联结主义这边出现了一个关键突破——反向传播算法（BP 算法）。简单说，就是让神经网络学会"如果错了，应该怎么改"。这给神经网络的训练提供了理论基础。

看起来形势一片大好。日本甚至启动了一个雄心勃勃的"第五代计算机计划"，想造出能和人对话、能推理的超级计算机。

但好景不长。

专家系统虽然有用，但维护成本极高——规则得不断更新，越写越多，越写越乱。而当时的神经网络受限于算力和数据量，只能解决一些非常简单的玩具问题，远达不到实用水平。

更关键的是，日本那个声势浩大的五代机计划，搞了十来年，没搞出来。

1990 年前后，政府再次大规模削减 AI 投入。第二个冬天来了。

这次冬天比上一次更长。一直到 2006 年，AI 在学术界几乎是个冷门方向——学计算机的优等生都去做数据库、做网络了，很少有人愿意碰 AI。

转机出现在几个关键节点上。

2006 年，杰弗里·辛顿（Geoffrey Hinton）发表了深度学习相关的重要论文，提出了一种更有效的神经网络训练方法。他给这个方法起了个新名字——深度学习，意思是神经网络的"层数"可以更深、更厚、更复杂。

2007 年，李飞飞团队开始构建 ImageNet——一个有一千多万张标注图片的巨型数据集。在这之前，做计算机视觉的人只有几千张图片可用，数据根本不够喂饱神经网络。

2012 年，辛顿的学生们在 ImageNet 图像识别大赛上用深度学习一举夺冠，准确率碾压了所有传统方法。从此，学术界和工业界的目光一下子转了过来。

接下来的故事你大概在新闻里都见过了——

到今天，深度学习（联结主义）已经成了 AI 的绝对主流。你手机上所有"智能"功能——相册人脸识别、语音转文字、输入法预测、短视频推荐——背后都是它。

回顾这三个回合，每一次高歌猛进之后跌入低谷，撞上的墙都不一样：

所以你现在用的 AI，不是什么天才灵光一现的产物。它是三个学派、两轮寒冬、将近七十年的积累，踩在无数失败走到今天的。

说到这里，你可能已经发现一件事：我们平时在新闻里看到的那些听起来很厉害的 AI 名词——其实都能归到这三个学派里。

你以后再看到 AI 新闻，可以多问自己一句：这是哪一种"智能"？

是写规则写出来的、是神经网络练出来的、还是在海量试错中自己摸索出来的？这个问题一问，你就可以快速判断这项技术的优点在哪、局限在哪。

用一个例子来说明这件事：

你手机键盘的输入法预测——它是怎么猜出你下一个词的？

如果让符号主义来做这件事，你需要先写一套完整的语法规则，再把汉语词典、成语词典、甚至方言口语句式全部编成可执行的逻辑代码。工作量无限大，而且永远有例外。

我们正在用的输入法，用的是联结主义的方式。它读过几十亿条中文语料，摸清了汉语的统计规律——"我"后面出现概率最高的词是"是"；"不"后面最常见的搭配是"知道"和"能"。它根本不知道自己在打中文，它只是知道这些概率。

所以你看：同一个问题，三个学派给出的解法完全不同，效果也天差地别。

← 上一篇：2026年AI训练师与电商师就业前景深度对比，谁更值得选？下一篇：AI美图 | 生活故事：暮色鸢尾的凝望 →