AI三大流派与七十年起伏史
1956 年,美国达特茅斯学院,一群科学家聚在一起开了一个会。
这个会的名字叫"达特茅斯夏季研讨会",去的都是当时最聪明的人。会上他们提出了一个概念——人工智能。
能到什么程度呢?他们当时就敢预测:机器会在 20 年内代替人类做所有工作。
70 年过去了,这个预言没实现。但这场会议确实成了 AI 的"出生证明"。
有意思的是,从那天起,做 AI 的科学家们就分成了三个学派。直到今天,这三个学派还在互相影响。理解了他们,你就理解了 AI 的半部历史。
学派一:符号主义 —— 让电脑"讲道理"
符号主义的核心思想很简单:把知识写成规则,让机器按规则推理。
举个例子。你告诉计算机两件事:
计算机自动推出:"苏格拉底会死"。
是不是很像你中学学的三段论?
符号主义的做法包含两套系统:一套叫知识库,专门存事实("苏格拉底是人""人都会死");另一套叫推理机,专门负责在这些事实之间做逻辑推导。你可以理解为:
这套逻辑在数学证明、法律推理这些领域非常好用——因为它们天生就是靠规则运转的。80 年代红极一时的专家系统,就是请各领域的专家把知识一条条写成规则,然后塞给计算机去执行诊断。
但问题很快就暴露了。
你试试用这种方法教会电脑识别一只猫?你需要先定义什么是猫:有毛、四条腿、会喵喵叫、喜欢睡懒觉……你会发现根本定义不完。就算勉强定义了,换一只没有尾巴的猫、一只正在打滚的猫、一只在暗光下的猫——你之前写的规则很可能全部失效。
世界上大部分知识,是很难用规则写清楚的。
更根本的质疑来自哲学家塞尔(John Searle)在 1980 年提出的一个思想实验——中文屋。
想象你被关在一个房间里,屋里有一本厚厚的规则手册(全是中文)。屋外的人递进来一张纸条,上面写着一些符号。你对照规则手册,找到对应操作,写下另外一些符号递出去。你完全不知道自己写了什么——但屋外的人觉得你在用中文流利对话。
这个实验想说的是:按规则操作不等于真正理解。
今天的 AI 领域,符号主义不再是主角。但它的遗产无处不在——你手机里那个"系统检测到异常交易"的短信提醒,就是规则系统在干活;你在知乎搜一个问题,知识图谱帮你把相关内容串起来,底下也有符号主义的影子。
联结主义不写规则。它的思路是完全不同的方向:模仿大脑。
人脑有大约 860 亿个神经元。每个神经元做的事不能说复杂——它接收来自其他神经元的信号,累计到一定程度,就"激活"一下,把信号传下去。
联结主义做的是搭建一个人工神经网络——把成千上万个简单的计算单元(也叫"人工神经元")一层层地连起来:
每个神经元的运作方式极其简单:
这里的"权重"是关键。每个连接都有权重,你可以把它理解为神经元对这个输入的"重视程度"。权重越大,这个信号对当前神经元的影响就越大。
所谓"学习",就是不断调整这成千上万个权重的数值。
一开始所有权重都是随机的,网络输出的结果一塌糊涂。但每做错一次,它就根据错误的方向微调一点点权重——把贡献了错误答案的连接权重调低,把能导向正确答案的权重调高。
经过几万、几十万次的调整,所有权重稳定在了一个能让输出尽量正确的数值上。这时候,"学习"就完成了。
你可能会问:为什么要"多层"?只一层不行吗?
答案是不行。一层网络只能学到非常简单的模式——就像你只能用一条直线去区分猫和狗,肯定分不干净。而有了多层之后,每一层可以学到不同层次的"特征"——
层数越多,能学到的模式越复杂。这就是"深度"学习的"深度"二字的由来。
你今天用到的几乎所有 AI——相册人脸识别、语音转文字、输入法预测、短视频推荐、ChatGPT——背后都是这个逻辑。它不是在学习知识,它是在把输入转化成输出的一路上,把数万个旋钮调到了最佳位置。
打个比方:
行为主义和前两个学派完全不同。它不写规则(符号主义),不研究大脑结构(联结主义)。它的灵感来自驯兽师。
驯海豚跳过火圈的时候,驯兽师怎么做的?他不会跟海豚讲道理,也不会研究海豚的神经元。他做的只有一件事:设好目标,然后根据结果给反馈。
行为主义把同样的逻辑搬到了计算机上。一个叫"智能体"的程序被放到一个"环境"里,在每个时刻,智能体做出一个动作,环境给它一个反馈——正向的(奖励)或负向的(惩罚)。智能体的目标只有一个:最大化它获得的累计奖励。
这个过程可以抽象成循环:
但这里有一个核心矛盾:探索 vs 利用。
如果智能体每次都选当前看起来最优的动作(利用),它可能永远发现不了更好的策略。但如果它总是尝试新动作(探索),又可能一直在踩坑,得不到足够的奖励。一个好的强化学习算法,必须在两者之间找到平衡。
探索阶段是"探索新的行为可能性";利用阶段是"利用已知的经验知识",这不正是你自己在学习和决策时的状态吗?
最有名的例子是 AlphaGo。它自己跟自己下了几千万盘棋——一开始瞎下,遇到赢的局面就获得正反馈,输的局面就负反馈。经过足够多的对局,它的"智能体"自学成才,悟出了很多人类棋手几千年都没想过的走法。
2016 年它赢了李世石。赛后,有职业棋手说:AlphaGo 下出的某一步,按照人类几千年的围棋理论是"错棋",但事后分析——那是全局最优解。
行为主义不关心你是不是"理解"了规则,它只关心结果。
今天强化学习主要用于那些有明确"输赢"标准的场景——游戏 AI、自动驾驶(在模拟器里反复试错)、机器人控制、甚至短视频推荐系统里的部分机制(你的每一次停留或划走,都是一个奖励信号)。
讲完三个学派,你可能会产生一个疑问:
既然联结主义看起来这么厉害,为什么现在才火起来?1956 年就有人提出来了,中间那几十年在干嘛?
好问题。
这三个学派并不是平起平坐、和平共处的。在 AI 将近 70 年的历史里,它们轮流坐庄,经历了两次大起大落。
达特茅斯会议之后的近二十年,AI 世界基本是符号主义的天下。
那时候科学家们信心爆棚——用逻辑和规则解决问题,听起来多靠谱。他们做出了不少成果:能证明数学定理的"逻辑理论家"、能诊断疾病的专家系统、能下棋的程序。
当时的人有多乐观?1965 年,AI 先驱司马贺(Herbert Simon)甚至预测:"20 年内,机器将能完成人类能做的任何工作。"
结果呢?被打脸了。
问题就出在我们前面说的——规则根本写不完。一个专家系统需要人类专家把几千条规则一条条敲进去,换个领域就得重新写一套。更致命的是,当时的计算机算力太弱,稍微复杂一点的推理就跑不动了。
到了 1974 年,各国政府发现投了大笔钱却没看到什么实用成果,纷纷削减 AI 研究经费。AI 迎来了第一个冬天。
80 年代初,两件事让 AI 回暖。
一是专家系统开始商用——比如当时一个叫 RI(XCON)的系统,能为计算机公司自动配置硬件方案,一年省几千万美元。企业开始愿意掏钱了。
二是联结主义这边出现了一个关键突破——反向传播算法(BP 算法)。简单说,就是让神经网络学会"如果错了,应该怎么改"。这给神经网络的训练提供了理论基础。
看起来形势一片大好。日本甚至启动了一个雄心勃勃的"第五代计算机计划",想造出能和人对话、能推理的超级计算机。
但好景不长。
专家系统虽然有用,但维护成本极高——规则得不断更新,越写越多,越写越乱。而当时的神经网络受限于算力和数据量,只能解决一些非常简单的玩具问题,远达不到实用水平。
更关键的是,日本那个声势浩大的五代机计划,搞了十来年,没搞出来。
1990 年前后,政府再次大规模削减 AI 投入。第二个冬天来了。
这次冬天比上一次更长。一直到 2006 年,AI 在学术界几乎是个冷门方向——学计算机的优等生都去做数据库、做网络了,很少有人愿意碰 AI。
转机出现在几个关键节点上。
2006 年,杰弗里·辛顿(Geoffrey Hinton)发表了深度学习相关的重要论文,提出了一种更有效的神经网络训练方法。他给这个方法起了个新名字——深度学习,意思是神经网络的"层数"可以更深、更厚、更复杂。
2007 年,李飞飞团队开始构建 ImageNet——一个有一千多万张标注图片的巨型数据集。在这之前,做计算机视觉的人只有几千张图片可用,数据根本不够喂饱神经网络。
2012 年,辛顿的学生们在 ImageNet 图像识别大赛上用深度学习一举夺冠,准确率碾压了所有传统方法。从此,学术界和工业界的目光一下子转了过来。
接下来的故事你大概在新闻里都见过了——
到今天,深度学习(联结主义)已经成了 AI 的绝对主流。你手机上所有"智能"功能——相册人脸识别、语音转文字、输入法预测、短视频推荐——背后都是它。
回顾这三个回合,每一次高歌猛进之后跌入低谷,撞上的墙都不一样:
所以你现在用的 AI,不是什么天才灵光一现的产物。它是三个学派、两轮寒冬、将近七十年的积累,踩在无数失败走到今天的。
说到这里,你可能已经发现一件事:我们平时在新闻里看到的那些听起来很厉害的 AI 名词——其实都能归到这三个学派里。
你以后再看到 AI 新闻,可以多问自己一句:这是哪一种"智能"?
是写规则写出来的、是神经网络练出来的、还是在海量试错中自己摸索出来的?这个问题一问,你就可以快速判断这项技术的优点在哪、局限在哪。
用一个例子来说明这件事:
你手机键盘的输入法预测——它是怎么猜出你下一个词的?
如果让符号主义来做这件事,你需要先写一套完整的语法规则,再把汉语词典、成语词典、甚至方言口语句式全部编成可执行的逻辑代码。工作量无限大,而且永远有例外。
我们正在用的输入法,用的是联结主义的方式。它读过几十亿条中文语料,摸清了汉语的统计规律——"我"后面出现概率最高的词是"是";"不"后面最常见的搭配是"知道"和"能"。它根本不知道自己在打中文,它只是知道这些概率。
所以你看:同一个问题,三个学派给出的解法完全不同,效果也天差地别。