图灵为何未亲自设计AI?
2024年初,中美AI行业发生了两件大事,进一步推动了1993年启动的第三次人工智能浪潮:OpenAI上线GPT商店,AI商业化进程加速;1月16日,中国智谱AI推出了比肩GPT-4的GLM-4大模型,为中国在全球AI领域的竞争增添砝码。
人工智能历经70余载,起伏不定,哪些故事值得铭记,哪些教训又需审视?
跨越七十年的华丽篇章
只为把“智能”装进机器
阿兰·图灵是一位传奇人物,他不仅是当代程序员的“祖师爷”,还是一名世界级长跑运动员,马拉松成绩为2小时46分03秒,仅比1948年奥运会金牌成绩慢11分钟。二战期间,他领导“Hut 8”小组破译德军密码,成为盟军在大西洋战役中击败轴心国海军的关键因素。
图灵也是个马拉松运动员|midjourney
当然,我们今天要说的还是“人工智能”。
图灵被誉为计算机科学与人工智能之父,1950年,图灵首次提出“机器智能(Machine Intelligence)”的概念:“人类利用可用信息和推理来解决问题并做出决策,那么为什么机器不能做同样的事情呢?”
自那时起,无数科学家、科技企业为之奋斗——赋予机器以“智能”的革命悄然展开。70多年过去,“三次浪潮,两次低谷”,人工智能终于冲破层层阻碍,进入大众日常生活。
纵观三次人工智能浪潮,我们会发现一个有趣的现象:理论总是比现实更超前。不是科学家设计不出更好的人工智能,而是受限于当时的计算机技术,无法实现。
人工智能发展大事年表|哈佛大学官网
图灵在1950年的论文《计算机器与智能》中提出了机器思维的概念和著名的图灵测试,是什么阻止了图灵开始工作?有两个原因。首先,在那个年代,计算机缺乏智能的一个关键先决条件:它们无法存储命令,只能执行命令。这意味着,计算机只能被告知要做什么,但不记得自己做了什么。第二,计算成本在上世纪50年代太昂贵了,租赁一台电脑每个月需要20万美元,笔者根据通货膨胀率做了换算,这相当于现在每月租金254万美元,名副其实的“有钱人的游戏”。
名副其实的“有钱人的游戏”|midjourney
科学家之所以称之为科学家,是因为他们的研究总是着眼于未来,即使当下缺乏变成现实的条件。
图灵发表那篇著名的论文后仅两年,计算机科学家阿瑟·萨缪尔(Arthur Lee Samuel)开发出一款跳棋程序,并提出了“机器学习”这个概念。1956年的达特茅斯会议上,约翰·麦卡锡(John McCarthy)正式提出了“人工智能”这个词,1956年也就成为了实际意义上的人工智能元年。
至此,“人工智能”跨越了混沌初开的早期阶段,进入高速发展时期。多年后,当大众回看那个时代,称之为人工智能的“第一次浪潮”。
计算机科学与人工智能之父——阿兰·图灵
我们先来看看“第一次浪潮”给我们今天的生活留下了哪些遗产吧。说出来可能有些惊讶,我们今天使用的大多数软件追根溯源都是“第一次浪潮”的产物,或者说,基于一种叫“手动编码知识(Handcrafted Knowledge)”的人工智能。比如我们的Windows系统,智能手机应用程序,人行道上按下按钮等待红灯变绿的交通灯。这些都是人工智能(此处采用第一次浪潮中对人工智能的定义)。
这真算“人工智能”?
算。
人们对人工智能的理解一直在变化。30年前,如果你问路人,谷歌地图算不算人工智能,得到的答案是肯定的。这个软件能帮你规划最佳路线,还能用清晰的语言告诉你如何行驶,为什么不算?(谷歌地图应用确实是第一波人工智能的典型案例)
第一次人工智能浪潮主要基于清晰且逻辑的规则。系统会检查需要解决的每种情况下最重要的参数,并就每种情况下采取最适当的行动得出结论。每种情况的参数均由人类专家提前确定。因此,这种系统很难应对新的情况。他们也很难进行抽象——从某些情况中获取知识和见解,并将其应用于新问题。
总而言之,第一波人工智能系统能够为明确定义的问题实现简单的逻辑规则,但无法学习,并且很难处理不确定性。
1957年,罗森布拉特发明感知机,这是机器学习人工神经网络理论中神经元的最早模型,这一模型也使得人工神经网络理论得到了巨大的突破。乐观的情绪在科学界蔓延,第一次人工智能浪潮逐渐被推向高潮——挫败要来了。
感知器原理图|加利福尼亚州立大学
1966年,人们发现好像人工智能的路走歪了。逻辑证明器、感知器、强化学习等等只能做很简单、非常专门且很窄的任务,稍微超出范围就无法应对。为了更好地理解,我们建议读者脑补使用Windows系统的体验:一切功能都是提前设计好的,你无法教会这个系统做什么事,它也无法自己学习额外的知识。
另一方面,当时的计算机面临内存有限和处理速度不足的挑战,解决实际的人工智能问题变得十分困难。研究者们迅速认识到,要求程序具备儿童般的世界认知水平是一个过高的期望。在那个时候,没有人能够构建出满足人工智能需求的庞大数据库,也没有人知道如何让程序获取如此丰富的信息。与此同时,许多计算任务的复杂度呈指数级增加,使得完成这些任务变得几乎不可能。
科学家进入了死胡同,人工智能发展也进入了“蛰伏期”。
这一等,就是十多年。
当时间来到了20世纪80年代,两个关键突破重新点燃了“第二次人工智能浪潮”:深度学习和专家系统。
约翰·霍普菲尔德 (John Hopfield) 和大卫·鲁梅尔哈特 (David Rumelhart) 推广了“深度学习”技术,使计算机能够利用经验进行学习。这意味着人工智能可以处理那些“没有提前设定”的问题,它具备了学习能力。另一方面,爱德华·费根鲍姆(Edward Feigenbaum)引入了专家系统,它模仿了人类专家的决策过程。
总的来说,第二次人工智能浪潮改变了人工智能的发展方向。科学家放弃了符号学派思路,改用统计学的思路来研究人工智能。深度学习和专家系统的引入让机器能够根据领域内的专业知识,推理出专业问题的答案。
因此,第二次人工智能浪潮也叫“统计学习(Statistical Learning)”时代。
关于这一次浪潮,笔者想要强调两点,第一,为何它如此重要?第二,它无法克服的弊端是什么?
第二次浪潮时间很短,但通过引入“统计学习系统”,工程师和程序员不会费心去教授系统要遵循的精确规则(第一次浪潮的理念)。相反,他们为某些类型的问题开发统计模型,然后在许多不同的样本上“训练”这些模型,使它们更加精确和高效。
此外,第二波系统还引入了人工神经网络的概念。在人工神经网络中,数据经过计算层,每个计算层以不同的方式处理数据并将其传输到下一个级别。通过训练每一层以及整个网络,它们可以产生最准确的结果。
神经网络示意图|Pixabay
这些都为第三次人工智能浪潮奠定了基础,而且留下了庞大的遗产,我们今天依然在使用。比如人脸识别、语音转录、图片识别,以及自主汽车和无人机的部分功能,都来自于这次浪潮的成果。
但是,这套系统有一个巨大的弊端。根据美国国防高级研究计划局(DARPA)指出,我们尚不清楚人工神经网络背后的实际运行规则,也就是说,这套系统运行良好,但是我们不知道为什么运行得这么好。这就好比人可以把球抛到空中,并且能大概判断球会落在哪里,如果你问他,你是如何做出判断的,是根据牛顿力学定律计算的吗?他无法回答,但他就是知道。
这暴露了一种因果关系挑战,因为“看不到因果”。第二套系统依赖数据输入,数据输出做决策,缺乏因果会导致严重后果:这个系统容易学坏。
微软曾经设计了一个机器人叫“Tai”,他可以顺畅地和人聊天,但如果有越来越多的人告诉他“希特勒是个好人”,它就会逐渐接受这个结论。
这些难题,留给了第三次人工智能浪潮来解决。
这次浪潮也是目前我们所正在经历的,也称之为“情景适应(Contextual Adaptation)”。如果非要确定一个时间节点,应该是1993年之后。摩尔定律让计算机算力急速提升,大数据的发展让海量数据存储和分析成为可能。