AI发展史话:从图灵之问到智能时代
人工智能的传奇始于一个既简单又深奥的疑问:机器能够思考吗?
这个疑问听起来像是科幻小说的开场白,但它确实是一位数学家在1950年严肃探讨的命题。从那时起,人类踏上了长达七十余年的征程——试图为冰冷的金属和代码注入一丝"智慧"的火花。
二战时期破译了纳粹德国的Enigma密码系统,挽救了无数生命。他不仅构建了现代计算机的理论基础(图灵机),还率先系统性地探讨了机器智能的可能性。
1950年,图灵在哲学刊物Mind上发表了具有里程碑意义的论文:《计算机器与智能》(Computing Machinery and Intelligence)。文章开篇便提出:
图灵测试的核心洞见在于:我们无需界定什么是"思考",只需观察行为是否表现出思考的特征。这与当今ChatGPT的思路惊人地吻合——我们并不确定它是否真正"理解",但它的回应确实愈发接近人类了。
设想你隔着一堵墙与某人交谈。你提问时对方应答如流,你完全猜不到对面其实是台电脑。如果出现这种情况,你能断言那台电脑"不会思考"吗?图灵的回答是:不能。
图灵还预见了许多今日才浮现的问题:
学习能力:机器应能从经验中学习,而非仅执行预设程序
通用性:不应为每个任务制造专用机器,而应打造能学会处理任何事务的通用机器
反对意见:他提前回应了十几种反对"机器能思考"的论点,包括"机器缺乏灵魂""机器无法拥有情感""哥德尔不完备定理表明机器存在局限"等
1956年夏季,美国新罕布什尔州的达特茅斯学院举办了一场为期两个月的研讨会。这次会议后来被公认为人工智能作为独立学科正式诞生的标志。
达特茅斯会议后的十余年(1956-1974),是AI的首个"黄金时期"。研究者们满怀乐观,认为通用智能近在咫尺。
ELIZA是一个极为简单的程序——它仅通过模式匹配将你的问题"反射"回去。比如你说"我很难过",它会回应"为什么你觉得你很难过?"。如此简单的规则,竟让许多人真的以为自己在于一位有智慧的心理医生对话!甚至有人拒绝相信这只是程序。这种现象后来被称为"ELIZA效应"——人类太容易把机器的输出当真了。
这一时期,美国政府(特别是DARPA,美国国防高级研究计划局)大量资助AI研究。研究者们信心十足地预测:
美好的泡沫终会破灭。到了1970年代,AI遭遇了首次重大挫折——并非因为方向错误,而是因为承诺过多,兑现过少。
1957年发明了感知机(Perceptron),这是最早的神经网络模型之一。它能学习简单的分类任务,比如区分左右两侧的图案。《纽约时报》报道称这是"一台会思考的电脑"的雏形。
感知机的原理很简单:接收输入信号,加权求和,若超过阈值则输出1,否则输出0。它能学习调整权重——比如给"正确分类"的输入增加权重,给"错误分类"的输入减少权重。
想象你是一名裁判,要评判一场选美比赛的选手是否"好看"。你有三个标准:五官、身材、气质。每个标准你都有一个权重(你觉得哪个更重要)。你将选手在每个标准上的得分加权求和,若超过你的"及格线"就通过。感知机做的正是这件事——只不过它能自动调整权重。
问题出在哪里?
1969年,明斯基和佩珀特合著了《感知机》(Perceptrons)一书,用严谨的数学证明了感知机的致命缺陷:它连最简单的"异或"(XOR)问题都无法解决。
什么是"异或"?简单来说就是:
输入 (0, 0) → 输出 0
输入 (0, 1) → 输出 1
输入 (1, 0) → 输出 1
输入 (1, 1) → 输出 0
这个问题无法用一条直线将输出为0和输出为1的点分开。而感知机本质上就是在画一条直线来分类——所以它无能为力。
除了学术上的挫折,AI还面临现实的压力:
这就是第一次AI寒冬(约1974-1980)。在这段时期,AI研究经费大幅削减,研究者难以找到工作,"人工智能"这个词在学术圈几乎沦为笑柄。
寒冬并不意味着毫无进展。实际上,这个时期的"退烧"让研究者开始认真思考AI的根本问题:
组合爆炸:许多AI问题(如下棋、定理证明)的状态空间呈指数级增长,当时的计算机根本计算不过来
常识问题:程序能做数学题,但连"水往低处流"这种常识都不了解。没有常识,就不可能有真正的智能
框架问题:在一个不断变化的环境中,如何判断哪些信息是相关的、哪些可以忽略?这个问题至今没有完美解决
莫拉维克悖论:对计算机来说,做数学题和下棋很容易,但认脸和走路却极难——而这恰恰是人类婴儿就能做到的事
寒冬之后,AI找到了一条"务实"的出路:不要试图打造一个无所不能的通用智能,而是将人类专家的知识编码成规则,让计算机在特定领域充当"专家"。这就是专家系统(Expert System)。
想象你将一位老中医的毕生经验写成一本"诊疗手册": 如果发烧 + 咳嗽 + 流鼻涕,那么可能是感冒,开XXX 药方。 如果发烧 + 皮疹 + 关节痛,那么可能是登革热,转传染病科。 专家系统就是将这类"如果…那么…"规则写成程序,让它像专家一样给出诊断建议。
一个典型的专家系统由两部分构成:
专家系统在商业上取得了巨大成功。到1985年,全球企业在AI上的投入超过10亿美元。大量公司成立了AI部门,"知识工程师"成为热门职业。
专家系统的辉煌未能持久。到了1980年代末,问题逐渐暴露:
知识瓶颈:获取专家知识极其困难和昂贵。你得找到真正的专家,然后花几个月时间将他们的经验逐条转化为规则
维护噩梦:规则越多,它们之间的冲突和矛盾就越难管理。添加一条新规则可能破坏十条旧规则
脆弱性:遇到规则未覆盖的情况就完全失效。系统没有"常识",不能灵活应变
缺乏学习能力:规则都是人写的,系统不能从数据中自动学习
1987-1993年,AI行业再次崩塌。企业纷纷关闭AI部门,这个时期被称为第二次AI寒冬。
专家系统就像一本厚厚的"菜谱"——如果你严格按照菜谱操作,确实能做出美味的菜肴。但问题是: 1. 菜谱写起来很慢(知识获取难) 2. 菜谱越厚越难管理(规则冲突) 3. 遇到菜谱上没有的食材就束手无策(缺乏泛化能力) 4. 永远学不会新菜(没有学习能力) 真正的厨师不需要背菜谱——他们理解烹饪的原理,能随机应变。AI也需要从"背规则"进化到"学原理"。
第二次寒冬让AI研究者意识到一个根本问题:靠人写规则行不通,必须让机器自己从数据中学习。这标志着AI的一次重大范式转换——从"知识驱动"转向"数据驱动"。
这个转变的核心思想可以用一句话概括:不要试图告诉机器"答案是什么",而是给机器足够的数据,让它自己发现"规律是什么"。
桌子上混着红豆和绿豆,你拿一根筷子将它们分开。但筷子有很多放法——SVM找的是离红豆和绿豆都最远的那个位置。这样新来的豆子放错位置的概率最小。这就是"间隔最大化"的思想。
他和同事切尔沃嫩基斯(Chervonenkis)在1960年代就提出了统计学习理论(VC维理论),但直到1990年代才被广泛认可。SVM的成功让"统计学习"成为AI的主流范式。
统计学习的复兴不仅仅是因为算法进步,更重要的是数据。互联网的爆发带来了前所未有的海量数据:
搜索引擎:Google每天处理数十亿次搜索,积累了海量的用户行为数据
电子商务:Amazon、淘宝记录了数亿用户的购买行为
社交媒体:Facebook、微博产生了海量的文本、图片和社交关系数据
用户标注:验证码(reCAPTCHA)巧妙地利用用户输入来标注数据——你在证明自己不是机器人的同时,也在帮Google识别数字化书籍中的文字
2012年,AI迎来了一个转折点——深度学习(Deep Learning)横空出世,彻底改变了游戏规则。
神经网络并不是什么新概念。它的历史可以追溯到1943年:
在神经网络被学术界冷落的几十年里,辛顿始终坚信这条路是正确的。他培养了大批深度学习人才(包括Yann LeCun和许多OpenAI/DeepMind的核心成员),被称为"深度学习教父"。2024年他获得诺贝尔物理学奖——因为物理学中的"玻尔兹曼机"正是他提出的神经网络模型。
深度学习之所以在2010年代爆发,不是因为某一个突破,而是三股力量同时汇聚:
她创建了ImageNet数据集——包含1400万张标注图片,涵盖2万多个类别。ImageNet大规模视觉识别挑战赛(ILSVRC)成为深度学习的"奥运会",推动了AlexNet、VGG、ResNet等划时代模型的诞生。
在ImageNet比赛中,传统方法的错误率大约在26%。AlexNet(一个8层的卷积神经网络)直接将错误率降至15.3%——碾压所有传统方法。这个结果震惊了整个计算机视觉界,标志着深度学习时代的正式开始。
GAN(2014):伊恩·古德费洛提出了生成对抗网络——让两个神经网络互相"对抗"来生成逼真的图像。他当时还是个博士生,在酒吧里想到了这个主意。
ResNet(2015):微软亚洲研究院的何恺明等人提出了残差连接,让网络可以训练到152层深。这是一个关键突破——之前网络太深反而效果变差。
这是AI历史上最戏剧性的时刻之一(详见下一节)。
Google的论文《Attention is All You Need》提出了Transformer架构——它是今天所有大语言模型(GPT、Claude、LLaMA)的基础。这篇论文改变了整个AI的走向(详见第6章)。
8岁开始下国际象棋,13岁成为大师。后来转向AI研究,2010年创立了DeepMind。2014年Google以5亿美元收购DeepMind。他的目标一直是"解决智能,然后用它解决一切"。
2016年3月,DeepMind的AlphaGo以4:1击败了韩国棋手李世石——围棋世界冠军。这场比赛被全球直播,数亿人观看。
为什么这很重要?
围棋被认为是人类智慧的"最后堡垒"。国际象棋的每一步大约有35种走法,围棋有250种——围棋的可能棋局数量比宇宙中的原子还多。传统"暴力搜索"方法在围棋上完全不适用,机器必须拥有某种"直觉"。
AlphaGo的影响远超围棋。它证明了AI可以在人类认为"最需要直觉和创造力"的领域超越人类。后来DeepMind又将类似方法应用于蛋白质结构预测(AlphaFold,2020年),解决了困扰生物学界50年的问题。
如果说2012年的AlexNet是深度学习的"引爆点",那么2022年的ChatGPT就是AI走进普通人生活的"iPhone时刻"。
2017年,Google的一篇论文《Attention is All You Need》提出了Transformer架构。这篇论文的标题翻译过来就是"注意力就是你需要的一切"——事实证明,它说对了。
在Transformer之前,处理文本主要靠RNN(循环神经网络)——像人读书一样,逐字逐句地读。问题有两个:
太慢:必须按顺序读,无法并行处理
记不住:读到第100个字时,已经忘了第1个字说了什么
Transformer的核心创新是自注意力机制(Self-Attention):让每个字都能同时"看到"其他所有字,并根据相关性分配不同的"注意力"。
想象你在读一句话:"那只猫坐在垫子上,它看起来很舒服。" 当你读到"它"这个字时,你的大脑会自动"回头看"前面的字,判断"它"指的是谁——猫,而不是垫子。自注意力做的就是这件事:让每个字都能"回头看"其他所有字,找到最相关的那些。
他是AlexNet的共同作者(和Hinton一起),后来成为OpenAI的联合创始人和首席科学家。他坚信"规模就是一切"——只要模型足够大、数据足够多,AI就会涌现出惊人的能力。2024年他离开OpenAI,创立了安全超级智能公司。
2022年11月30日,OpenAI发布了ChatGPT。接下来发生的事情超出了所有人的预期:
ChatGPT为什么能成功?
不只是因为GPT-3强大,更关键的是RLHF(基于人类反馈的强化学习)——让人类标注员给模型的回答打分,模型学会给出更符合人类期望的回答。这就像训练一个学生:不光要他做对题,还要他回答得有礼貌、有条理、不说废话。
ChatGPT的成功引爆了全球AI竞赛。2023-2026年间,AI模型如雨后春笋般涌现:
2024-2026年,AI的发展方向从"对话"转向"行动"——AI Agent(智能体)成为最热门的概念。
ChatGPT像一个顾问——你问它问题,它给你建议,但具体执行还是你自己来。 AI Agent像一个员工——你给它一个任务("帮我订一张明天去上海的高铁票"),它自己规划步骤、调用工具、完成任务、给你报告结果。 这个转变的关键是:AI不只是"生成文本",而是能使用工具(搜索、写代码、调用API)、规划步骤(把复杂任务拆解成小步骤)、记忆(记住之前的对话和任务状态)。
中国的人工智能研究起步并不晚——在某些方面甚至和世界同步。但在不同阶段,中国AI走出了自己独特的道路。
2010年代,中国互联网的爆发为AI提供了独特的"数据红利":
移动支付:支付宝、微信支付产生了海量的交易数据,催生了强大的风控AI
短视频:抖音/TikTok的推荐算法被认为是全球最先进的
电商:淘宝、京东的个性化推荐系统每天处理数十亿次请求
人脸识别:旷视、商汤、依图等公司在人脸识别领域达到世界领先水平
2023年ChatGPT爆发后,中国迅速跟进。据统计,2023-2024年间,中国发布了超过200个大语言模型。
回顾AI的80年历史,我们可以看到一条清晰的思想演变路线:
AI的快速发展带来了巨大的兴奋,也带来了深刻的焦虑。让我们诚实地面对这些问题。
这是普通人最关心的问题。答案是:有些会,有些不会,但几乎所有工作都会改变。
每次技术革命都会引发"失业恐慌",但最终创造的新工作比消灭的多: · 汽车消灭了马车夫,但创造了司机、修理工、加油站员工 · 电脑消灭了打字员,但创造了程序员、设计师、数据分析师 · AI可能消灭一些工作,但也会创造我们现在无法想象的新职业 真正的风险不是"没有工作",而是转型期的阵痛——被取代的人需要时间学习新技能,而这个过程可能很痛苦。
随着AI能力的增强,一个根本性的问题浮出水面:如何确保AI做的事是我们真正想要的?
AI的"目标"是由人类设定的。但如果设定不当,AI可能会以我们不希望的方式达成目标。
AI安全(AI Safety)已经从学术边缘话题变成了全球科技界最关注的议题之一。
幻觉:大模型会一本正经地编造事实,而且编得非常逼真
偏见:模型会放大训练数据中的偏见(性别、种族、地域等)
滥用:AI可能被用于制造假新闻、深度伪造、网络攻击
失控:当AI足够强大时,人类是否还能控制它?
AGI(Artificial General Intelligence)——像人一样能做任何智力工作的AI——是AI研究的终极目标。
关于AGI的时间表,业界分歧很大:
乐观派(如Sam Altman、Elon Musk):3-10年内
温和派(如Yann LeCun):几十年甚至更久
怀疑派(如部分哲学家和认知科学家):可能永远无法实现,因为当前的AI架构从根本上不同于人类智能
面对AI的快速发展,普通人应该持什么态度?
AI就像电的发明。1880年代,人们对电充满恐惧——"电流过人体会触电!"但今天没有人会因为害怕触电而拒绝用电。我们学会了安全地使用电,让它成为生活的一部分。 AI也一样。它有风险,但它也会成为人类文明的一部分。关键不是"要不要用",而是"怎么用好"。
从图灵的一个问题,到如今的ChatGPT,人工智能走过了七十年。这段历史告诉我们:真正的突破往往来自那些"不切实际"的梦想。