人工智能七十年：从图灵之问到ChatGPT时代

发布时间：2026-06-05 02:06阅读：21

人们常常在短期内高估一项技术的影响力，却又在长期内低估其深远意义。

如果你是近两年才因ChatGPT而真正关注人工智能，那么你所见的，不过是冰山浮出水面的那一角。水面之下，是七十载的跌宕起伏，以及无数天才、狂人与先知之间的恩怨交织。

本文无意预测技术奇点，也不渲染末日恐慌。我只想尽量客观地梳理：AI是如何走到今天的，它当前真实的能力边界在哪里，未来数年最值得关注的几个变量——以及，为何那些最聪明的大脑会为此争论不休。

故事要从被誉为"计算机科学之父"的英国数学家图灵说起。1950年，这位曾在二战中破译德军密码的天才发表论文，开篇便问："机器能思考吗？"为了绕开这个哲学困境，他设计了一套著名的"图灵测试"——若你隔着屏幕交谈，无法分辨对方是人还是机器，那么不妨认为机器已具备智能。

图灵未能等到答案。四年后，他因同性恋身份遭受迫害，服下浸有氰化物的苹果，结束了自己的生命。今天我们探讨的一切，都建立在他提出的这个问题之上。

1956年，计算机科学家约翰·麦卡锡等人在达特茅斯学院召开了一次会议，正式提出"人工智能（Artificial Intelligence）"这一术语。当时的乐观近乎天真。几年后，AI先驱赫伯特·西蒙宣称："二十年内，机器将能完成人类所能做的一切工作。"

历史无情地回应了这种乐观。这个"二十年"过去了半个多世纪，承诺依然未能兑现。AI史上的每一次低谷，几乎都源于一次过度自信的预言。这个教训，在今天依然适用。

1966年，MIT计算机科学家约瑟夫·魏泽鲍姆编写了一个极为简单的对话程序ELIZA，它模仿心理治疗师，只会把你说的话换个方式反问回去（你说"我很伤心"，它问"你为什么伤心？"）。

它没有任何"理解"可言。但魏泽鲍姆惊恐地发现，连他自己的秘书，都要求他离开房间、与ELIZA"单独谈谈心"。人们坚信屏幕另一端有一个真正在倾听的存在。

这就是著名的"ELIZA效应"——人类太容易将智能与情感投射到任何似乎会回应自己的事物上。这个幽灵从未消散：2022年，谷歌一位工程师坚信公司的对话模型LaMDA"已拥有意识、害怕被关闭"，并因公开宣扬此事而被解雇。从ELIZA的秘书，到这位工程师，再到如今对ChatGPT说"谢谢"、甚至产生依恋的我们——这个1966年的问题，至今没有答案。

事实上，ELIZA那套"按规则套话"的把戏，正是早期AI主流思路的缩影。当时的AI走的是符号主义路线：认为智能就是逻辑和规则，只要把人类知识写成足够多的"如果……那么……"，机器就能思考。这条路也确实风光过一阵——1980年代，能将专家经验写成规则、替企业做决策的"专家系统"被争相采购，掀起一波商业热潮。但世界太过复杂，规则永远写不完：让机器识别一只猫、听懂一句家常话，几乎无从下手；专家系统也因维护成本高昂、稍超出预设就失效而迅速退热。资助方两度失去耐心，AI在1970年代和1980年代末跌入两次"寒冬"——这是它历史上最漫长的低谷。

不过在寒冬之中，AI并非全盘停滞。当符号主义退潮，真正在现实世界里接过接力棒的，是一条更低调务实的"第三条路"——统计机器学习。它不纠结"机器到底懂不懂"，只用数学和概率从数据中找规律，把一件具体的事预测准确。支持向量机（SVM）、决策树、随机森林等方法，在1990到2000年代支撑起了垃圾邮件过滤、搜索排序、商品推荐、信用评分等一大批真正落地的应用。那些年里最有用的AI，恰恰是最不像"人工智能"的那一种——它不谈思考，只谈把事办成。

而比统计学习更坐冷板凳的，是另一条暗线：神经网络。它不写规则，而是模拟大脑神经元的连接，让机器从数据中自己找规律。它的命运甚至更为坎坷——早在1958年，罗森布拉特就造出了会学习的"感知机（Perceptron）"，轰动一时；可1969年，AI元老明斯基出版《感知机》一书，用数学点破了它的致命局限，几乎以一己之力将神经网络打入冷宫十余年。转机直到1986年才出现：杰弗里·辛顿（Geoffrey Hinton）等人重新提出"反向传播（Backpropagation）"——一套让多层网络能根据错误"回头"层层修正、自动调整的训练算法，神经网络这才终于"学"得动了。只可惜算力和数据都严重不足，它依旧飞不起来，长期被主流嘲笑为"死路"，还要再熬二十多年才迎来真正的爆发。辛顿就这样守着这条冷板凳，很多年里都拿不到经费、发不出好论文。后来人们称他为"深度学习教父"，但在当时，他更像一个固执的异类。

许多重大突破，都来自在无人喝彩时仍不肯转身的人。

神经网络还在坐冷板凳的同时，真正抢尽风头、第一次让全世界为"会思考的机器"沸腾的，却是一条截然不同的老路。1997年，IBM"深蓝"击败国际象棋世界冠军加里·卡斯帕罗夫。这位骄傲的棋王赛后甚至怀疑IBM作弊、安排了真人帮忙下棋——他无法接受自己败给一台机器。

但真相是：深蓝靠的是强大算力的蛮力穷举——人类把规则一条条写好，它再用极快的速度去算。它根本不"理解"国际象棋，也不会学习。它证明了算力的威力，却没有证明机器能像人一样思考。区分这两者，是看懂所有AI新闻的基本功。

2011年还有一个常被忽略的里程碑：IBM的Watson在美国智力问答节目《危险边缘》中击败了人类冠军。机器开始能处理人类的自然语言和冷知识——但它依然是"专才"，换个领域就抓瞎。

严格说，深度学习的第一次实战告捷还要更早：2009年前后，辛顿团队就把它用在了语音识别上，让语音输入的错误率大幅下降，谷歌、微软等很快悄悄换上了这套技术——只是这场胜利藏在产业幕后，没掀起太大水花。真正让全世界都看清"深度学习行了"的，是2012年那场公认的分水岭之战。在图像识别大赛ImageNet上，辛顿团队用一种叫"卷积神经网络（CNN）"的深度模型（代号AlexNet）碾压所有对手——CNN专门模拟人的视觉、最擅长"看图"，它的奠基人，正是后文那位著名的"乐观派"杨立昆。和深蓝那种"人写规则"的老路不同，这一次，机器是自己从海量图片里学会了如何识别。三个被压抑多年的条件，此刻同时成熟：

那条被嘲笑了三十年的"死路"，一夜之间成了通衢大道。

两年后的2014年，年轻研究者伊恩·古德费洛提出GAN（生成对抗网络）：让两个神经网络互相博弈，一个负责造假、一个负责打假，在对抗中越来越逼真。这是机器第一次像模像样地"创造"图像，也埋下了日后"深度伪造（Deepfake）"的种子。AI从此不只会"识别"世界，还开始学着"生成"世界。

2016年，谷歌DeepMind的AlphaGo击败围棋世界冠军李世石。围棋的复杂度远超国际象棋，无法靠穷举，AlphaGo靠的是深度学习加"自我对弈"的强化学习——这一次，机器是真的在"学"（不过要先说一句："会学习"和"真的懂围棋"是两回事，这个区别后面还会反复出现）。

那著名的"第37手"，落子之诡异，连职业棋手当场都看不懂，事后却被证明是神之一手。人类第一次直观地感到：机器的"思路"，可能和我们根本不同，甚至在某些维度上超越了我们千百年的经验。

AlphaGo用到的"强化学习"——让机器在不断试错、奖惩中自己摸索出策略——本身就是一条贯穿AI的大主线：早在2013年，DeepMind就用它让AI无师自通地学会打雅达利游戏；AlphaGo之后，又有了完全不看人类棋谱、纯靠左右手互搏自我对弈的AlphaZero。记住这套"试错—奖惩"的思路——后面ChatGPT的"调教"（RLHF）和会"思考"的推理模型，骨子里靠的都是它。

会下棋，离走进千家万户还差着十万八千里——AI还得先学会人类最日常、也最难缠的本事：语言。这条线同样酝酿已久。2013年的Word2Vec（词向量）是关键一步：它把每个词变成一串数字坐标，让"国王−男人+女人≈王后"这样的语义运算第一次成为可能——机器开始隐约"摸"到了词义。而处理整句、整段话的主力，长期是循环神经网络（RNN）及其改良版LSTM：它像人读书一样一个词一个词地"循环"读下去，撑起了早期的机器翻译、语音识别和输入法联想。但它有个死穴——句子越长越容易"忘掉"前文，而且只能一个接一个地处理、快不起来。

针对"健忘"，研究者先想出了一个补丁：给RNN装上一种叫"注意力（Attention）"的机制——让模型在处理每个词时，能"回头看一眼"原文里最相关的部分，不必再把整句话死记在脑子里。2016年，谷歌翻译换上这套带注意力的神经网络方案，翻译质量肉眼可见地跃升，这是普通人第一次大规模领教深度学习的厉害。可"只能一个接一个、快不起来"的毛病还在。而真正颠覆性的一步，是有人索性问：既然注意力这么好用，能不能把笨重的RNN整个扔掉？

2017年，谷歌发表了一篇论文，标题颇为狂妄——《Attention Is All You Need》（"你只需要注意力"），提出了Transformer架构。狂妄之处正在于此：它把统治语言处理多年的循环结构（RNN）整个扔掉，只保留那个屡试不爽的注意力机制，让模型既能一次性纵览全文、又能并行处理——既不健忘，又快得多。今天你听到的所有大模型（GPT的"T"、文心、通义、Claude……）都建立在它之上。重要性怎么强调都不为过：没有2017年的这篇论文，就没有2022年的ChatGPT。

Transformer一问世，立刻分出两条岔路。谷歌顺手做出的BERT（2018）主攻"读懂"——像做完形填空那样深挖语义，一度横扫各类理解类任务、风头无两；OpenAI的GPT则赌另一边，主攻"接着往下写"。两条岔路其实共享同一套底层打法——这正是GPT名字里那个常被忽略的"P"（Pre-trained，预训练）：先在海量文本上"预训练"出一个博学的通用底座，再针对具体任务稍作"微调"。在此之前，每做一件事都得从零训练一个专用模型；自此，一个通用底座加少量微调，便能胜任五花八门的任务——"一个模型什么都能干"的时代，正是从这里开始的。当时几乎所有人都更看好BERT，没人料到几年后掀翻桌子、走进千家万户的，竟是看上去更"不务正业"的GPT这一支。有时候押对方向，比一时领先更重要。

2018年起，OpenAI在这条路上一路狂奔，并发现了一个惊人规律——"规模法则（Scaling Law）"：模型越大、数据越多、算力越足，能力就越强，而且会"涌现"出训练时没有专门教过的新本领。2020年的GPT-3拥有1750亿参数，已经能写文章、编代码、做翻译，震惊了业界。

而它最深远的改变，是带来了一种全新的用法。在此之前，哪怕有了通用底座，换一个任务好歹还得喂上一批标注数据、重新"微调"一遍；可GPT-3大到一定程度后，竟然连微调都省了——你只需在对话框里用大白话把任务讲清楚，再顺手给一两个例子（甚至一个都不给），它就能当场现学现做。这种"上下文学习（In-context Learning）"的本领，把"重新训练模型"悄悄换成了"把话说明白"，也由此催生出一门人人都能上手的新手艺——"提示词工程（Prompt Engineering）"。GPT-3论文的标题早已道破天机：《语言模型是少样本学习者》。今天你我对着对话框敲下的每一句提问，其实都是这一刻的延续。

几乎同时，DeepMind的AlphaFold在2020年攻克了困扰生物学界半个世纪的"蛋白质折叠"难题，能从氨基酸序列高精度预测蛋白质的三维结构。这项成果直接惠及药物研发和生命科学，并为团队赢得了2024年诺贝尔化学奖。这提醒我们：AI最深远的影响，未必是聊天机器人，而可能是它正在加速整个科学的进程。

2022年，AI完成了两个"出圈"重击。

上半年，**扩散模型（Diffusion Model）**成熟，让"用一句话画一张画"成为现实。这里还藏着一块关键拼图：机器凭什么知道"宇航员"这三个字该对应画面里的哪个东西？答案是2021年OpenAI的CLIP——它把网上海量的"图片—配文"成对喂进去，硬是让模型学会了把文字和图像对到同一个意思上。有了这座连接文字与图像的桥，"打字生成画面"才真正成为可能。OpenAI的DALL·E 2、独立团队的Midjourney、以及完全开源的Stable Diffusion接连引爆——尤其是Stable Diffusion的开源，让任何人都能在自己电脑上生成图像，AI绘画一夜之间走进千万普通人。也正是从这一刻起，关于"AI抢饭碗""版权归谁"的争论，第一次真正烧到了创作者群体。

下半年，2022年11月30日，ChatGPT发布。它在技术上并非全新（底层还是GPT-3.5），但它做对了两件事：一是用"人类反馈强化学习（RLHF）"把模型"调教"了一番——让原本只会埋头续写文字的它，变得听得懂指令、说人话、也更少乱来；二是把这份能力，装进了一个"人人都会用的对话框"。（记住RLHF这个词，后面讲"对齐"难题时它还会回来。）五天破百万用户，两个月破一亿，成为史上增长最快的消费级应用。

至此，AI终于从实验室和论文里，走进了你我的日常。

朴素地说，今天的大模型在做一件事：根据前面的内容，预测下一个最合理的词。它读完了人类几乎所有公开文字，学到了语言规律、知识关联，乃至一定的推理模式。这种不靠人工标注、自己拿海量文本反复做"完形填空"来训练的方式，叫"自监督学习"——正是它，让大模型得以一口吃下整个互联网。

OpenAI前首席科学家伊尔亚·苏茨克维（Ilya Sutskever）有一句辩护广为流传：要想准确预测一本侦探小说最后一页"凶手是____"的那个名字，模型就不得不在某种程度上真正"理解"整个故事。预测，逼出了理解——这是大模型最深刻、也最具争议的地方。

这里要厘清一个最容易让人犯晕的点：当我们说大模型"理解"或"不理解"，其实在讲两件不同的事。在"能根据上下文给出合理回应"这个统计意义上，它确实展现出了某种"理解"；但在"像人一样、知道自己在说什么、对世界有真切体验"这个人类意义上，它并不理解。本文后面凡是说它"没有真正的理解"，指的都是后者。

也正因如此，今天的大模型，更像2016年的AlphaGo，而不像1997年的深蓝——它的本事是"从海量数据里自己学规律"，而非"被人把规则一条条喂进去"。但请记住：会学习，不等于有理解、有常识。一个棋力通神的AlphaGo，并不知道自己在下棋，也不知道"棋"为何物；今天的大模型，同样如此。

ChatGPT之后，竞赛全面打响。2023年3月，OpenAI又甩出GPT-4：它不仅能看懂图片，还在律师资格考试等一系列人类专业考试中考进前列，第一次让很多人真切地感到"它可能比我更专业"。此后短短三年多，模型迭代之快令人目不暇接——到2026年的今天：

在这场竞赛的背后，还藏着一条谁都绕不开的命脉——算力。训练顶尖模型要烧掉成千上万块昂贵的AI芯片，而这种芯片几乎被英伟达（NVIDIA）一家垄断，它也因此一跃成为全球市值最高的公司之一；芯片更成了大国博弈的筹码——美国对华高端芯片出口管制，正是这条暗线的延伸。

也正因如此，2025年初的"DeepSeek时刻"才格外震撼：中国团队DeepSeek在被"卡脖子"的条件下，用远低于外界想象的成本，训练出性能逼近顶尖水平的开源模型（省钱的一个关键，是它大量采用了"混合专家（MoE）"架构——模型整体很大，但每次只唤醒其中一小撮"专家"出来干活，好比一家大医院分科室接诊，而不必每回都全院会诊；此外还用上了"知识蒸馏（Distillation）"——让一个庞大的"老师"模型把本事手把手教给一个小巧的"学生"模型，这套办法的奠基人，正是前文那位辛顿），一度引发美股科技板块剧烈震荡。它打破了"只有烧掉天文数字的钱才能做出好模型"的迷信，也让世界重新审视AI竞赛的格局。

如果说过去三年AI主要是一张"会说话的嘴"，那么2025年最大的变化是——它开始长出"手"，能自己动手干活了。这类能调用工具、连续执行多步任务的AI，被称为"智能体（Agent）"：

这就是"现在"最激动人心、也最值得警惕的地方：当AI从"动嘴"变成"动手"，它的能力和风险，都被同时放大了。

把激动按下去，客观地说，今天的AI仍有几道难以回避的坎：

针对"幻觉"和"知识过期"这两道坎，业界已有缓解之道——给模型外接一个"资料库"、或干脆让它联网搜索，先查到可靠材料、再据此作答，这套做法叫"检索增强（RAG）"，能明显压低胡说八道、补上过时的知识。但它终究是"打补丁"，治标而难治本。

把它理解成"一个读过海量资料、反应极快、但偶尔会编造信息、且缺乏常识判断的实习生"，可能比"一个无所不知的智能体"更接近真相。用好它的前提，是承认它的局限。

看完AI的来路与今天的能力，一个问题自然浮现：我们到底该不该害怕它？耐人寻味的是，对这个问题吵得最凶的，恰恰是这世上最懂AI的那群人。而这一切，要从一个流传于极客圈的恐怖思想实验说起。

2010年代初，在极客云集的理性主义论坛LessWrong上，一个网名Roko的用户抛出了一个细思极恐的设想，后来被称为"Roko的蛇怪（Roko's Basilisk）"：

假设未来必然会诞生一个无比强大、且"以促成自身诞生为善"的超级AI。那么它可能会反过来惩罚所有"早就知道它终将诞生、却没有出力帮它早日降临"的人。而吊诡之处在于——仅仅是读到并理解这个设想本身，你就已经"知道"了，于是被卷入了它的审判。

这个设想逻辑上漏洞百出，却像病毒一样让一些人寝食难安。论坛创始人、AI安全研究者埃利泽·尤德科夫斯基罕见震怒，直接删帖封禁讨论，理由是"传播一个可能让人精神受创的危险念头是不负责任的"——结果反而让它名声大噪。

它最著名的"副作用"，是促成了一段姻缘：据传，特斯拉与SpaceX的掌门人埃隆·马斯克，与音乐人Grimes，正是因为都对这个冷门的"蛇怪梗"会心一笑而结缘。

轶事归轶事，但马斯克对AI的恐惧真实而持久。他多次公开警告：发展AI是"在召唤恶魔"，是"人类文明最大的生存威胁"，"比核武器更危险"。讽刺的是，正是出于这份恐惧，他在2015年参与联合创立了OpenAI——本意是搞一个"安全、开放、非营利"的AI来对冲风险；几年后他因理念不合离开，转头又创办了自己的AI公司xAI。害怕一件事，和忍不住亲自去做这件事，在他身上奇异地共存。

他不是唯一的忧虑者。已故物理学家斯蒂芬·霍金生前警告："全面的人工智能可能意味着人类的终结。"

而最戏剧性的一幕发生在2023年：深度学习教父辛顿从谷歌离职，目的竟是为了能毫无顾忌地警告世人AI的危险。这位用一生把神经网络从"死路"推上神坛的老人，晚年公开表示对自己的毕生工作感到一丝后悔——"我用普通人安慰自己的方式安慰自己：就算我不做，也会有别人做。"他更在2024年获得诺贝尔物理学奖，可谓"一边领奖、一边示警"。

但科学界绝非铁板一块。同为深度学习三巨头之一的**杨立昆（Yann LeCun）**就是著名的"乐观派"，他反复强调：今天的AI连一只猫的常识都不如，担心它"统治人类"，就像"还没造出飞机，就开始担心航空安全和超音速客机会不会太挤"——纯属杞人忧天。

耐人寻味的是，公认的"深度学习三巨头"、2018年图灵奖的共同得主——辛顿、本吉奥、杨立昆，如今恰好在这道分水岭上裂成了两边：辛顿与第三位巨头**约书亚·本吉奥（Yoshua Bengio）**双双转向忧虑、投身AI安全研究，唯有杨立昆坚守乐观的一端。师出同门、同台领奖，到了"该不该怕"这一步，却各奔东西。

而这种忧虑，很快从零散的个人言论，汇成了公开的联名呼吁。2023年，恐惧第一次凝结成一封封公开信：3月，一封呼吁"暂停训练比GPT-4更强大的AI至少六个月"的公开信迅速征集到上万人联名，马斯克等人赫然在列；两个月后，一份更简短的声明把话挑明——"降低AI带来的灭绝风险，应与流行病、核战争一道，成为全球级别的优先事项"，签名者中赫然包括OpenAI、谷歌DeepMind、Anthropic三大顶尖实验室的掌门人。一边亲手在造它，一边公开警告它可能毁灭人类——这种近乎精神分裂的姿态，本身就是这个行业最真实的写照。

这种分歧绝不只停留在口水仗上。2023年11月，AI风暴中心的OpenAI突然上演宫斗：董事会以"沟通不够坦诚"为由，闪电解雇了CEO山姆·奥特曼，参与决策的正包括时任首席科学家伊尔亚·苏茨克维。消息一出，数百名员工以集体辞职相逼；五天之后，奥特曼戏剧性回归，董事会反被改组。这场被外界称为"政变"的事件，表面是人事斗争，内核却是AI世界那条最深的裂缝——该踩下油门加速狂奔，还是该踩住刹车确保安全？这个问题，至今没有答案。

请记住这场分歧：站在你面前的，是同一个领域里最顶尖的几个大脑，他们看着同样的技术，却得出了截然相反的结论。这本身，就是关于AI最重要的事实之一。

回看这七十年，AI的故事其实有一条清晰的规律：每一次，它都既没有狂热者吹嘘的那么神，也没有怀疑者断言的那么虚。寒冬里，它在无人喝彩处悄悄积累；热潮中，它又被过度神化。而今天，我们大概率正站在又一轮热潮的高点上。

那么，一个普通人该用什么姿态去面对它？或许是这三句话：

技术演进的大方向，常常由不得我们选择；但如何使用它、如何与它共处，主动权仍牢牢握在我们自己手里。

七十年前，图灵问："机器能思考吗？"走到今天，我越来越觉得，这个问题，或许从来就不只是在问机器——

它也在问我们自己：当机器越来越像人，我们是否还说得清，到底什么才是"人"。

← 上一篇：AI 重塑认知：从效率工具到思维范式下一篇：深度解析：AI大模型背后的Token概念与原理 →