人工智能发展历程、关键人物与未来趋势
本文转载自《前进论坛》(2025.04期,总第609期),原标题为“人工智能创新的挑战与机遇”,旨在梳理人工智能技术演进历程,剖析下一代技术发展的契机。文章在原文基础上进行了修订,特别新增了“3.1 人工智能的基本原理”一节,针对当前技术发展的迷雾与噪音提出了见解。欢迎批评指正。
目录
1. 人工智能的里程碑与关键人物
1.1 早期计算机先驱对人工智能的构想
1.2 当代人工智能技术的里程碑
1.3 大模型的发展路线之争
2. 人工智能的关键技术依赖
2.1 算力依赖
2.2 数据依赖
2.3 算法依赖
3. 下一代人工智能计算范式
3.1 人工智能的基本原理
3.2 自适应、自协调、自博弈、自进化的自主智能系统
3.3 超越图灵测试:以关键复杂问题为第一驱动力
参考文献
自从计算机问世,人工智能便成为人们热议的话题:赋予机器类人的思考能力以辅助人类,想必能极大改善生活与工作。早在1920年,捷克作家卡雷尔·恰佩克在戏剧《罗萨姆的万能机器人》中首创了“Robot”一词,描绘了替代人类劳动的智能机器。1941年,阿西莫夫在《骗子》中提出了著名的机器人三定律:
i) 机器人不得伤害人类,也不得坐视人类受到伤害。
ii) 机器人必须服从人类给它的命令,除非这些命令与第一定律相冲突。
iii) 机器人必须保护自己的存在,只要这种保护不违反第一或第二定律。
阿西莫夫让“机器人”概念广为人知,同时也引发了人类与这种类人机器物种伦理关系的思考。
1946年,首台电子计算机EDVAC被发明,计算时代正式开启。
人工智能一直是计算机科学领域的核心议题。在计算机诞生之初,先驱们便致力于研究机器模拟人脑。数学家冯·诺伊曼参与了EDVAC项目,其架构成为现代计算机基础。二战期间,军方利用EDVAC测算弹道,冯·诺伊曼亦参与曼哈顿计划计算原子弹参数,却不幸因核辐射于53岁早逝。晚年,他思考计算机与人脑相似性,著有未完成的《计算机与人脑》。
与此同时,大西洋彼岸的阿兰·图灵于1950年发表《计算机器与智能》,提出机器具备学习能力及“图灵测试”。1954年图灵英年早逝,探索戛然而止。
1956年,麦卡锡等科学家在达特茅斯学院举办会议,提出“人工智能”(AI)概念,确立了符号主义与连接主义等路线,成为学科奠基。此后,AI经历了两次高潮与寒冬。60-70年代,机器证明与感知器引发热潮,后因算力与效果不足而停滞。80-90年代,依赖知识库与逻辑推理的“专家系统”兴起,在特定领域见效,但因维护难、泛化差而泡沫破裂,再次陷入低谷。
人们对新技术的期望常失之偏颇,短期乐观,长期悲观。
在人工智能的第二次寒冬到来后,很长一段时间里,让机器具备像人一样的思考能力仅被视为科幻。在冷落中,辛顿坚持研究,成为“深度学习之父”,并建议年轻人不受环境影响,坚持己见。他推动神经网络大放异彩,也相继获得2018年图灵奖及2024年诺贝尔物理学奖。
辛顿的奠基性工作带来了人工智能的第三次浪潮,命名为“深度学习”。他发明反向传播算法调节网络参数,使其有效。为训练模型,他利用GPU的并行计算能力。
我们目前正身处于人工智能第三次浪潮之中,受学术界、产业界及地缘政治影响,AI备受瞩目。在这历史洪流中,需从纷杂噪音中去芜存菁,保持战略清醒,把握关键问题。
要理解当代人工智能技术,可以从三大里程碑事件、关键人物及三股思潮开始。十年间,三大事件:
i) 2012年AlexNet夺取ImageNet项目竞赛最佳成绩;
ii) 2016年AlphaGo击败人类围棋冠军;
iii) 2022年ChatGPT发布。
围绕这三大里程碑事件登场的各路人物,基本都和2018年获得图灵奖的深度学习三巨头“杰弗里·辛顿、Joshua·Bengio,杨立坤(Yann·LeCan)”有着千丝万缕的联系。
2012年,辛顿成立了一家名叫DNN Research的公司,核心成员包括辛顿两名学生Alex Krizhevsky和Ilya Sutskever,他们基于杨立坤(曾是辛顿的访问学者)的CNN(卷积神经网络)构建了一个名叫AlexNet的深度学习模型,并参加了斯坦福的李飞飞教授建立的ImageNet项目举办的竞赛。ImageNet项目是计算机视觉领域的大规模标注数据集,旨在推动该领域的技术进步。AlexNet在那一年的竞赛中以突破性的成绩取得了胜利,大幅降低了图片识别的错误率,证明了深度学习的潜力。在竞赛中崭露头角后,Google以4400万美元的价格火速收购了辛顿团队的DNN Research公司,Alex Krizhevsky、Ilya Sutskever,包括辛顿本人都因此加入了Google。后来ImageNet项目的发起人李飞飞教授也加入到了Google之中。
当时,Google建立了人工智能部门Google Brain,网罗了几乎市面上最好的人工智能人才。2014年,经过辛顿和Google的传奇工程师Jeff Dean的评估后,Google以六亿美元的价格直接收购了欧洲的人工智能初创公司DeepMind。
DeepMind的创始人戴密斯·哈萨比斯从小是个国际象棋天才,13岁时就取得了全球14岁以下国际象棋选手中排名第二的成绩。酷爱国际象棋的他一定读过奥地利作家茨威格的小说《象棋的故事》,其中茨威格描述了一个人被囚禁在监牢中,整日只能通过在脑海中模拟国际象棋里的黑方和白方互相下棋来消磨度日。他日复一日地在脑海中模拟了成千上万局棋局,每局棋都要一会儿推算出黑方要下的若干步棋,再一会儿切换成白方视角,推算出该如何应对的若干步棋,形成了高度活跃的“左右互博”的纯思维活动。出狱后的一次偶然机会,无名小卒的他在一条船上竟然打败了当时国际象棋的世界冠军。
小说照进现实也不外如是,2016年,《象棋的故事》中描绘的剧情在现实里发生了。DeepMind研发的人工智能AlphaGo击败了当时围棋的世界冠军李世石九段。而AlphaGo所采用的训练方法,恰恰类似于茨威格小说中的描述的自我对弈,DeepMind采用了让两个AlphaGo互相对弈出数千万盘棋局,然后通过强化学习算法判断每步棋的胜率,以此不断优化走棋的策略。这就脱离了人类棋谱的固有知识经验,因为一个人类棋手穷尽一生也就能够下两万局棋左右。而AlphaGo利用大规模算力和深度强化学习的模型,以一种不依赖人类专家经验的通用学习方式,在短短几个月内就模拟出了远超人类历史上所有棋局总和的棋局量,从而探索了人类从未尝试过的棋路,最终超越了人类的顶尖棋手。
可以说DeepMind的AlphaGo是当时人工智能技术上的集大成者,它的模型被称为“深度强化学习”,以深度学习为基础,同时又因为要评估每盘棋面的胜率因此引入了强化学习的手段,来不断优化策略,最终它采用的自我对弈生成大量棋局的做法又蕴含了生成式智能的思想。深度学习、强化学习、生成式智能这三股当代人工智能技术中最重要的思潮在此交汇。
强化学习可以追溯到图灵在1950年的文章,主要方法是通过试错和奖励机制,让AI在环境中学习到最佳的决策策略。这个领域当代最重要的人物是理查德·萨顿,被尊称为强化学习之父。他在2017年加入到了DeepMind以便更直接的指导DeepMind在强化学习上的工作。萨顿由于在强化学习方面的贡献获得了2024年的图灵奖。
生成式智能的开创性工作则来自于Ian Goodfellow,他是Joshua Bengio的学生,他提出了GAN网络,是一种对抗式生成网络,通过一个生成器和一个判别器互相博弈来工作。Goodfellow后来也先后加入到了Google Brain和DeepMind,继续他的研究工作。
得益于人才和资源的优势,DeepMind进一步发展了AlphaGo的核心思想,陆续在蛋白质三维折叠、纯数学猜想验证等基础科学领域不断的超越人类专家经验,取得成功。哈萨比斯也因为AlphaFold在蛋白质三维折叠领域的开创性贡献,推动了生物医药的研究,而获得了2024年的诺贝尔化学奖。2023年4月,为了应对OpenAI的竞争,在Jeff Dean的推动下,Google Brain和DeepMind正式合并为Google DeepMind,由哈萨比斯担任CEO。
稍微梳理一下这些人物之间的关系,有助于我们理解今天的人工智能版图。
当代人工智能技术的第三次里程碑事件,是2022年OpenAI发布ChatGPT,并引发了席卷全球的热潮。ChatGPT推出时基于OpenAI研发的GPT-3.5架构,这是一种自然语言大模型(LLM),能够提供自然语言对话功能,支持问答、写作、代码生成等复杂的开放式任务。根据公开数据显示,早在2020年时的GPT-3就拥有了1750亿个参数,是当时最大规模的人工智能模型。
GPT的全称是“Generative Pre-Trained Transformer”,直译过来是“生成式的、预训练的Transformer架构”,恰如其分的表达了这项技术的关键之处。首先它采用了生成式智能的思想,能够基于自然语言输入来有效预测下一个“token”[7]可能是什么,从而可完成问答等基础任务;其次它采用了预训练的计算范式,基于海量的语料数据,通过数千张高端GPU卡,花费数个月的时间完成训练,训练的成果是一个拥有上千亿参数的人工神经网络,这些参数相当于人脑的神经元,存储着所有训练数据中被提炼过的内涵知识;最后,它基于Transformer架构,这是一个模仿人脑注意力机制的自回归算法架构,它通过分析词与词之间的关系,就能有效的预测下一个词(token)是什么。
Transformer架构