AI六十年歧途:封闭规则的幻梦
第 三 章
AI 圈走了 70 年的弯路
— 文字即智能 · 系列 03 —
一
1956 年夏天,美国新罕布什尔州,达特茅斯学院。
一栋老式的红砖教学楼里,一间不大的会议室。窗户开着,外面是新英格兰的夏天,树叶很厚,知了在叫。
十个男人围着一张长桌坐下来。
他们当中年纪最大的 41 岁,最小的 28 岁。有数学家,有逻辑学家,有信息论的开山祖师,有刚拿到博士学位的年轻学者。其中几个名字,后来都成了一个新领域的开山人物——John McCarthy、Marvin Minsky、Claude Shannon、Herbert Simon、Allen Newell。
他们要开一个会,会期六周。
这个会议的发起人,是 28 岁的 McCarthy。他在写邀请信的时候,临时给这次会议起了一个名字。这个名字之前没有人用过,他自己造的。
Artificial Intelligence 人工智能
这是人类历史上第一次,有人把这两个英文单词拼在一起。
那一年图灵死了刚两年。距离他发表《计算机器与智能》也只过去 6 年。但奇怪的是,在这个会议的全程,图灵这个人和他那篇论文,几乎没有被认真讨论过。
这不是因为他们不知道。他们都知道。Minsky 后来还专门写过纪念图灵的文章。但在 1956 年那个夏天,在那张长桌上,他们要做的不是延续图灵那条路——他们要重新画一张路线图。
会议结束的时候,他们留下了一份宣言。宣言里写道,大意是:智能的每一个方面,原则上都可以被精确地描述,以至于可以让一台机器来模拟它。
这句话听起来很谦逊。但它背后藏着一个非常大胆的判断——
智能 = 一套可以被写下来的规则。
他们相信,只要把人类的思维过程拆开,拆成一条一条规则,再让机器去执行这些规则,机器就会变得有智能。
这是一种非常西方、非常笛卡尔、非常哲学家的思路。
但它有一个致命的盲点。
二
那个盲点是——人的智能,从来不是一套可以被写下来的规则。
但他们不知道。或者说,他们知道,但他们觉得只是因为"还没拆够细"。再努力一点,再分得更细一点,总能把人的智能完全拆开。
怀着这个信念,1956 年那个夏天之后,AI 这个新领域开始了它的征程。
他们要造的第一件东西,叫"专家系统"。
思路是这样的——找一个领域的专家,让他把自己脑子里的知识全部说出来。说一条记一条。最后整理成几千条、几万条"如果……那么……"的规则,塞进电脑里。这样电脑就拥有了这个专家的知识。
比如,要造一个医学诊断的专家系统。就找一个传染病专家,让他每天来实验室,跟工程师对谈。工程师在旁边一条一条记。"如果病人发烧超过 39 度,那么……" "如果同时伴有头痛和肌肉酸痛,那么……" "如果潜伏期超过 7 天,那么……"
专家在前面说,工程师在后面把规则录进电脑。一干就是几年。
1970 年代,这种系统真的造出来过一个,叫 MYCIN,用来诊断细菌感染。MYCIN 在严格的封闭测试里,诊断准确率比一些医学院学生还高。
这件事当时震动了整个 AI 圈。所有人都觉得:看,这条路是通的。再造一千个 MYCIN,涵盖一千个领域,人工智能就到手了。
但 MYCIN 没法用。
原因很简单——它只懂传染病。你跟它说"我感冒了",它能给你诊断。但你跟它说"我感冒了,顺便问一下今天天气怎么样",它就傻了。
它没有任何关于"天气"的规则。它没有任何关于"顺便问一下"的规则。它甚至没有"感冒和发烧是不是一回事"这种基本常识。
它只会一件事。出了这一件事,它什么都不会。
整个 1970 年代和 1980 年代,AI 圈做出了几十个这样的系统。每一个都很厉害——在它自己那个小盒子里。每一个都没法用——出了那个盒子。
但这条路上的人,有一个不死心。
三
这个人叫 Doug Lenat。
1984 年,Lenat 39 岁。他在斯坦福做过教授,做过研究员,他对专家系统的局限看得清清楚楚。
他想:专家系统为什么不通用?因为它们没有常识。一个传染病专家系统不会告诉你"水从天上落下来叫做雨",一个法律专家系统不会告诉你"人会死"。这些事情是常识,常识没人写进系统里。
那好办——把常识也写进去。
那年他在德州奥斯汀启动了一个项目,叫 Cyc。Cyc 来自英语 encyclopedia 这个词,百科全书的意思。Lenat 的设想是这样的——
他要花十年时间,雇一群哲学家、逻辑学家、知识工程师,坐在房间里,把人类的全部常识,一条一条手工录入电脑。
"水是湿的。"
"人有两只脚。"
"鸟会飞,但是企鹅不会飞。"
"如果你松手,东西会掉到地上。"
"如果一个人死了,他就不能再吃饭了。"
"如果今天是星期一,那么明天是星期二。"
就这样,一条一条。Lenat 估计,人类的全部常识,大概有几百万条这样的命题。十年应该够录完。
录完之后,机器就有了完整的常识。机器有了完整的常识,它就能像人一样思考。
这是一个非常彻底的方案。它把笛卡尔以来西方哲学"智能 = 理性规则"这个传统,推到了极致——既然智能是规则,那就把所有规则都写下来,一条都不漏。
项目启动的时候,Lenat 信心满满。
结果他错估了一件事。
四
他错估了常识的数量。
他以为常识有几百万条。结果他真的开始录的时候,发现每录一条,会牵出另外十条更基础的常识。
"水是湿的。"
录完这条,马上有问题——什么叫"湿"?机器不知道。那好,再录:"湿是指物体表面附着液体的状态。"
录完这条,又有问题——什么叫"物体"?什么叫"液体"?什么叫"附着"?机器都不知道。那继续往下录:"物体是占据空间的实体……" "液体是没有固定形状但有固定体积的物质……" "附着是指两个物体表面紧密接触……"
越往下挖,越没底。
每一条常识的下面,都藏着 100 条更基础的常识。你以为录完一条,其实只是开了个头。
Lenat 团队里的研究员,从早到晚就在干这一件事——拆解、录入、再拆解、再录入。十年过去了。原计划录完的常识,只录了 5%。
但 Lenat 没放弃。他延长了项目。再十年。又十年。
2023 年,Lenat 去世。Cyc 这个项目,前前后后做了 39 年。
39 年里,Lenat 和他的团队总共录入了大约 2500 万条规则。这是一个惊人的数字。
但 Cyc 仍然不能跟你正常聊天。
不是它录得不够多,是这条路本身,从一开始就走不通。
人的常识不是一堆规则的集合。人的常识是一团没法清晰拆开的东西——它跟感觉混在一起,跟记忆混在一起,跟语境混在一起,跟身体经验混在一起。你拆得越细,它越像水,从你手指缝里漏掉。
Lenat 花了 39 年 证明了一件事—— 笛卡尔的路 走不到智能
这件事的代价,是一个人一生的时间。
但 Cyc 不是当年最有名的 AI。最有名的 AI 在 1997 年那个春天,要登上头条了。
五
1997 年 5 月 11 日,纽约,曼哈顿。
公园大道上一栋办公楼里,IBM 的实验室。一个昏暗的房间,聚光灯打在中央一张棋桌上。一边坐着一个 34 岁的男人,黑头发,神情紧张。另一边没有人——只有一台冰箱大小的机器,沉默地连着几根电缆。
那个男人叫 Garry Kasparov。他是国际象棋的世界冠军,已经在世界第一这个位置上坐了 12 年,被普遍认为是国际象棋史上最强的人。
他对面那台机器,叫深蓝(Deep Blue)。是 IBM 花了 10 年时间、几千万美元造出来的国际象棋专用机。
这是他们第二次对决。前一年的第一次比赛,Kasparov 赢了。这一次,IBM 把深蓝升级了,运算能力翻了一倍。
那个下午是六番棋的最后一局。前五局打成 2 比 2 平,这一局决定胜负。
开局之后,Kasparov 选了一个保守的下法。他想稳住,逼出和棋,把整个对决拖进决胜盘。
但深蓝走出了一步出人意料的子。
之后的几步,Kasparov 的脸色越来越难看。他在棋盘前坐立不安,一会儿揉太阳穴,一会儿往后靠在椅子上,一会儿又凑近棋盘盯着看。
第 19 步。
Kasparov 突然站了起来。他双手抱头,在桌边来回踱了几步,然后回到座位,推倒了自己的国王——认输。
整场比赛只下了 19 步。一共持续了一个多小时。
Kasparov 站起来,头也不回地走出了房间。
第二天,全世界所有的头版头条都是同一个意思——
机器打败了人 AI 时代来临
《时代周刊》把深蓝放上了封面。《纽约时报》用了大半个头版。CNN 滚动播了整整一周。所有人都觉得,这就是人工智能的时刻。
但接下来发生的事,出人意料。
六
赢完之后,IBM 把深蓝拆了。
没错,拆了。这台花了 10 年、烧了几千万美元造出来的机器,在击败 Kasparov 之后,被 IBM 拆成零件,送进了博物馆。
因为它没用。
深蓝只会下国际象棋。它不会跟你聊天,不会写文章,不会做数学题,不会回答"今天天气怎么样"。你把它从那张棋盘前挪开,它就是一堆昂贵的硅片。
它的"智能",全部装在那 64 个方格里。出了那 64 个方格,它什么都不是。
深蓝怎么赢的?简单——它每秒能算 2 亿步棋。它把每一种可能的走法,往前推演 12 步,然后挑里面对自己最有利的那一步。它不"理解"棋,它只是把所有可能性算一遍,然后选最好的一个。
这种方式叫"暴力穷举"。它在棋盘这种封闭世界里有效,因为棋盘上的可能性虽然多,但是有限。可以穷举。可以算清。
但你跟人聊天,可能性是无限的。你说一句"我今天有点累",对方可以回上百万种话,每一种都合理,每一种都不同。深蓝那套穷举方法,在这种地方完全失效。
所以 IBM 在击败 Kasparov 之后,意识到——他们做出了一个完美的棋手,但他们没有做出一个有智能的机器。
深蓝赢完之后的那个夏天,整个 AI 圈也意识到了同一件事。
媒体狂欢退潮之后,大家冷静下来,看着这台已经被拆掉的机器,心里慢慢浮起一句话——
它会下棋,但它不"懂"。
"懂"这个字,是图灵当年留下的那个问题。图灵问的是:机器能不能让人觉得它"懂"?深蓝的答案是——下棋的时候,它让 Kasparov 觉得它懂。但下棋之外,它什么都不懂。
这个胜利,只是一个盒子里的胜利。
七
14 年之后,IBM 又出来了一次。
2011 年 2 月 14 日,情人节那天晚上,美国电视台 ABC,黄金时段,一档叫《Jeopardy!》的智力问答节目。这档节目在美国家喻户晓,跑了 47 年,是全美收视率最高的几个节目之一。
那天晚上是一个特别版——三个选手,两个是人类,一个是机器。
两个人类选手不是普通人。一个叫 Ken Jennings,他在这个节目上连胜了 74 场,是节目史上的纪录保持者。另一个叫 Brad Rutter,是节目史上奖金赢得最多的人。
机器叫 Watson。也是 IBM 造的,代号继承了 IBM 创始人 Thomas Watson 的名字。它是一台占满整个房间的服务器集群,但在演播室里,它的外形被设计成一个看起来很友好的发光屏幕,放在两个人类选手中间。
《Jeopardy!》这个节目的规则比一般问答节目复杂——主持人念出一个"答案",选手要反过来给出"问题"。比如主持人念:"这是世界上最长的河流。"选手要按抢答铃,然后说:"什么是尼罗河?"
题目的内容五花八门——历史、地理、文学、流行文化、双关语、谐音梗、典故。
比赛打了三场,持续了三个晚上。
结果是——Watson 赢了。它的得分,是两个人类选手加起来的三倍多。
最后一题,Ken Jennings 在他的答题板上写下了答案,但同时手写了一行字交给主持人。那行字后来成了那个时代的一个名场面——
I, for one, welcome our new computer overlords (我,在此欢迎我们的 计算机新主人)
这句话被全美国的报纸引了一遍。Watson 上了所有主流媒体的封面。IBM 的股票当周涨了 5%。
所有人又一次以为——AI 时代来临了。
八
但 Watson 跟深蓝是一回事。
它只会答《Jeopardy!》。
它的工作方式是这样的——IBM 在它的硬盘里,提前装入了 2 亿页的资料:维基百科、字典、百科全书、新闻档案、文学经典。主持人念一道题,Watson 在 0.3 秒之内,把这道题跟硬盘里的 2 亿页资料做匹配,挑出最相关的一段,再从那段里抽出一个名词,作为答案。
这是搜索。这是查阅。它不是理解。
你把 Watson 从那个演播室搬出来,问它:"我今天感觉有点孤独,你能跟我聊聊吗?"
它会搜索硬盘里的 2 亿页资料,找跟"孤独"最匹配的段落,然后给你抽出一个名词。比如它可能会说:"孤独是一种心理状态。"
这不是聊天。这是死板的查阅。
Watson 赢完之后,IBM 把它包装成了一款企业级产品,叫 IBM Watson,卖给医院、银行、律师事务所。他们承诺 Watson 能"读懂"医学论文,能"理解"金融报告,能"分析"法律文件。
很多机构买单了。MD Anderson 癌症中心买了 Watson,花了 6200 万美元,想用它辅助癌症诊断。
结果用了四年,Watson 没给出一个有用的诊断建议。2017 年,MD Anderson 把这个项目终止了。报告里写道:Watson 给出的建议,经常是不安全、不靠谱的。
后来同样的事情发生在好几家医院。Watson 这个产品最终在 2022 年被 IBM 卖掉了一部分,2024 年彻底放弃。
那个曾经在电视上让全美国惊呼的 AI,十几年之后,被默默处理掉了。
它会答题,但它不懂题。
它会查资料,但它不读书。
这是一个比深蓝更精致的盒子,但仍然是个盒子。
九
5 年之后,第三场胜利来了。
2016 年 3 月 9 日,韩国首尔,四季酒店六楼。
一个会议室被改造成了对弈现场。中间一张围棋桌,两边各坐一个人——一个是 33 岁的韩国职业九段棋手李世石,世界顶级围棋手之一;另一个是 Google DeepMind 公司的一个工程师,负责替机器落子。
那台机器叫 AlphaGo。
这场比赛之前,几乎所有人都觉得机器赢不了。
围棋跟国际象棋不一样。国际象棋的可能性虽然多,但能算清。围棋不行——围棋每一步的可能性多得吓人,把宇宙里全部原子的数量都算上,都不够装下围棋所有的局面。
1997 年深蓝那种"暴力穷举"的办法,在围棋上行不通。1997 年深蓝赢完之后,有人问:那围棋呢?当时的专家说,围棋至少要再等 50 年。
结果只等了 19 年。
AlphaGo 用的不是穷举,而是一种新方法——它通过自我对弈,自己跟自己下了几千万盘围棋,慢慢"学"出了下棋的感觉。这种方法叫深度强化学习,是当时 AI 圈最热的方向。
第一局,AlphaGo 赢了。
第二局,AlphaGo 又赢了。这一局有一步关键的棋,被称为"第 37 步"。AlphaGo 在棋盘的一个边角位置落了一颗子,这个位置按照人类几千年的围棋经验,根本不该下——太怪了,太"不像人"了。当场所有解说员都愣住了,以为机器算错了。
但后来这步棋的价值慢慢显现——它在十几步之后形成了一道无形的网,把李世石的中盘大龙困死了。
那一步棋之后,有围棋评论员说:这是 AI 第一次走出了"人类不会想到"的棋。
第三局,AlphaGo 又赢了。三比零。系列赛已经赢定。
第四局,李世石赢了一局——后来被称为"人类最后的胜利"。
第五局,AlphaGo 又赢。
最终比分:AlphaGo 四比一。
李世石下完最后一局,在新闻发布会上摘下眼镜,沉默了很久,才说了一句——
是李世石输了 不是人类输了
这句话当时让很多人潸然泪下。
那一周,全世界又一次以为——AI 时代来临了。
十
但 AlphaGo 跟深蓝、Watson 是一回事。
它只会下围棋。
你把它从那张棋盘前挪开,问它:"今天天气怎么样?"
它不会回答。它甚至不理解你在问什么。
AlphaGo 在围棋这个 19×19 的格子里,是神。出了这 361 个格子,它什么都不是。
DeepMind 后来把 AlphaGo 拓展成 AlphaZero,可以下国际象棋、围棋、日本将棋——但仍然只是下棋。再往后,他们做了 AlphaFold,用来预测蛋白质结构——又是另一个盒子。
每一个盒子里都很厉害。每一个盒子都被誉为革命性突破。但盒子和盒子之间,没有打通。
李世石那场比赛之后第七年,2023 年,李世石宣布退役。他说了一句让人心酸的话——大意是:从我面对 AlphaGo 的那一天起,我就知道我赢不了它。再花一辈子,我也赢不了。所以我决定不再下了。
但有意思的是——李世石退役那一年,围棋的世界仍然在转。中国的柯洁、韩国的申真谞、日本的井山裕太,这些棋手照样下棋,照样争冠军,照样有粉丝。围棋这个游戏并没有因为 AlphaGo 而消失。
AlphaGo 改变了围棋,但它没有改变世界。
十一
从 1997 到 2016,19 年,三场惊天动地的胜利。
1997,深蓝。
2011,Watson。
2016,AlphaGo。
三场胜利发生的时候,全世界三次以为 AI 时代来临了。
但每一次,赢完之后,世界并没有改变。每一次,那台赢了的机器,要么被拆掉,要么被冷藏,要么被改造去做另一件孤立的事。
这三场胜利,加上前面那个跑了 39 年的 Cyc 项目,合起来是一段很长很长的弯路。
这条弯路有一个共同的形状——
每一台机器都在 一个封闭的、规则清晰的 盒子里追求完美
下棋的盒子。问答的盒子。常识规则的盒子。蛋白质结构的盒子。
盒子里它们是神。盒子外它们什么都不是。
而智能——真正的智能,人那种"什么都能聊一两句"的智能,从来不在任何盒子里。
人不是只会下棋的人。人也不是只会答题的人。人也不是只会背规则的人。人是什么都能扯几句的人。一个出租车司机能跟你聊政治、聊球赛、聊孩子上学、聊菜价、聊昨天看的电视剧。这种"什么都能扯"的能力,才是智能的核心。
这种能力,深蓝没有。Watson 没有。AlphaGo 没有。Cyc 没有。
整个 AI 圈走了 60 年,没有一台机器具备这种能力。
所有人都在追求"更深、更精、更专"。所有人都觉得"更深、更精、更专"才是智能的方向。
没有人停下来想——也许智能根本不在"更深"那一边,而在"更广、更杂、更日常"那一边?
这种"更广、更杂、更日常"的方向,在那个年代里,有一条路一直被人走着。但这条路被所有人瞧不起。
它没出过任何头条。它没赢过任何比赛。它的研究员被同行嘲笑,被基金会拒绝,被自己的大学院系排挤。
这条路叫——自然语言处理,英文 Natural Language Processing,简称 NLP。
翻译成大白话就是——让机器学说话。
十二
这条路,正是图灵 1950 年指着的那条路。
"让机器学说话",听起来不像"打败国际象棋世界冠军"那么酷。
"让机器学说话",也不会让你拿到《时代》封面。
"让机器学说话",在那 60 年里,在 AI 圈里属于"边角料",是研究主流不会去碰的方向。
但就在深蓝赢了 Kasparov 的那一年、Watson 赢了 Ken Jennings 的那一年、AlphaGo 赢了李世石的那一年,有几个研究员,在地球上几个不起眼的实验室里,默默地干着一件事——
他们在让机器多读一点字。再多读一点字。再多读一点字。
他们不知道自己在通向什么。他们也不知道自己手里的这条路,正是图灵 70 年前留下的那个谜题。
他们只是在做一件被嘲笑的事——
让机器学着说人话。
这条被瞧不起的路,在 2017 年那个夏天的某一个下午,突然出现了一篇论文。这篇论文是 Google 的 8 个工程师写的,他们自己都觉得这只是一篇小工程改进。
这篇论文的标题里,有一个英文短语,后来成了整个 AI 时代的口令——
Attention Is All You Need
翻译过来是:你需要的,只是注意力。
那 8 个工程师不知道,他们刚刚做的这件事,把图灵留下的那个 67 年的谜题,推到了答案的门口。
1997 年,深蓝 2011 年,Watson 2016 年,AlphaGo 都赢了 都没改变世界 与此同时 在一些不起眼的实验室里 几个被嘲笑的研究员 在让机器读字 下一章 我们去看那条 被瞧不起的路