标签

人工智能七十年:从图灵之问到ChatGPT时代

发布时间:2026-06-05 02:06来源:微信阅读:5

人们常常在短期内高估一项技术的影响力,却又在长期内低估其深远意义。

如果你是近两年才因ChatGPT而真正关注人工智能,那么你所见的,不过是冰山浮出水面的那一角。水面之下,是七十载的跌宕起伏,以及无数天才、狂人与先知之间的恩怨交织。

本文无意预测技术奇点,也不渲染末日恐慌。我只想尽量客观地梳理:AI是如何走到今天的,它当前真实的能力边界在哪里,未来数年最值得关注的几个变量——以及,为何那些最聪明的大脑会为此争论不休。

故事要从被誉为"计算机科学之父"的英国数学家图灵说起。1950年,这位曾在二战中破译德军密码的天才发表论文,开篇便问:"机器能思考吗?"为了绕开这个哲学困境,他设计了一套著名的"图灵测试"——若你隔着屏幕交谈,无法分辨对方是人还是机器,那么不妨认为机器已具备智能。

图灵未能等到答案。四年后,他因同性恋身份遭受迫害,服下浸有氰化物的苹果,结束了自己的生命。今天我们探讨的一切,都建立在他提出的这个问题之上。

1956年,计算机科学家约翰·麦卡锡等人在达特茅斯学院召开了一次会议,正式提出"人工智能(Artificial Intelligence)"这一术语。当时的乐观近乎天真。几年后,AI先驱赫伯特·西蒙宣称:"二十年内,机器将能完成人类所能做的一切工作。"

历史无情地回应了这种乐观。这个"二十年"过去了半个多世纪,承诺依然未能兑现。AI史上的每一次低谷,几乎都源于一次过度自信的预言。这个教训,在今天依然适用。

1966年,MIT计算机科学家约瑟夫·魏泽鲍姆编写了一个极为简单的对话程序ELIZA,它模仿心理治疗师,只会把你说的话换个方式反问回去(你说"我很伤心",它问"你为什么伤心?")。

它没有任何"理解"可言。但魏泽鲍姆惊恐地发现,连他自己的秘书,都要求他离开房间、与ELIZA"单独谈谈心"。人们坚信屏幕另一端有一个真正在倾听的存在。

这就是著名的"ELIZA效应"——人类太容易将智能与情感投射到任何似乎会回应自己的事物上。这个幽灵从未消散:2022年,谷歌一位工程师坚信公司的对话模型LaMDA"已拥有意识、害怕被关闭",并因公开宣扬此事而被解雇。从ELIZA的秘书,到这位工程师,再到如今对ChatGPT说"谢谢"、甚至产生依恋的我们——这个1966年的问题,至今没有答案。

事实上,ELIZA那套"按规则套话"的把戏,正是早期AI主流思路的缩影。当时的AI走的是符号主义路线:认为智能就是逻辑和规则,只要把人类知识写成足够多的"如果……那么……",机器就能思考。这条路也确实风光过一阵——1980年代,能将专家经验写成规则、替企业做决策的"专家系统"被争相采购,掀起一波商业热潮。但世界太过复杂,规则永远写不完:让机器识别一只猫、听懂一句家常话,几乎无从下手;专家系统也因维护成本高昂、稍超出预设就失效而迅速退热。资助方两度失去耐心,AI在1970年代和1980年代末跌入两次"寒冬"——这是它历史上最漫长的低谷。

不过在寒冬之中,AI并非全盘停滞。当符号主义退潮,真正在现实世界里接过接力棒的,是一条更低调务实的"第三条路"——统计机器学习。它不纠结"机器到底懂不懂",只用数学和概率从数据中找规律,把一件具体的事预测准确。支持向量机(SVM)、决策树、随机森林等方法,在1990到2000年代支撑起了垃圾邮件过滤、搜索排序、商品推荐、信用评分等一大批真正落地的应用。那些年里最有用的AI,恰恰是最不像"人工智能"的那一种——它不谈思考,只谈把事办成。

而比统计学习更坐冷板凳的,是另一条暗线:神经网络。它不写规则,而是模拟大脑神经元的连接,让机器从数据中自己找规律。它的命运甚至更为坎坷——早在1958年,罗森布拉特就造出了会学习的"感知机(Perceptron)",轰动一时;可1969年,AI元老明斯基出版《感知机》一书,用数学点破了它的致命局限,几乎以一己之力将神经网络打入冷宫十余年。转机直到1986年才出现:杰弗里·辛顿(Geoffrey Hinton)等人重新提出"反向传播(Backpropagation)"——一套让多层网络能根据错误"回头"层层修正、自动调整的训练算法,神经网络这才终于"学"得动了。只可惜算力和数据都严重不足,它依旧飞不起来,长期被主流嘲笑为"死路",还要再熬二十多年才迎来真正的爆发。辛顿就这样守着这条冷板凳,很多年里都拿不到经费、发不出好论文。后来人们称他为"深度学习教父",但在当时,他更像一个固执的异类。

许多重大突破,都来自在无人喝彩时仍不肯转身的人。

神经网络还在坐冷板凳的同时,真正抢尽风头、第一次让全世界为"会思考的机器"沸腾的,却是一条截然不同的老路。1997年,IBM"深蓝"击败国际象棋世界冠军加里·卡斯帕罗夫。这位骄傲的棋王赛后甚至怀疑IBM作弊、安排了真人帮忙下棋——他无法接受自己败给一台机器。

但真相是:深蓝靠的是强大算力的蛮力穷举——人类把规则一条条写好,它再用极快的速度去算。它根本不"理解"国际象棋,也不会学习。它证明了算力的威力,却没有证明机器能像人一样思考。区分这两者,是看懂所有AI新闻的基本功。

2011年还有一个常被忽略的里程碑:IBM的Watson在美国智力问答节目《危险边缘》中击败了人类冠军。机器开始能处理人类的自然语言和冷知识——但它依然是"专才",换个领域就抓瞎。

严格说,深度学习的第一次实战告捷还要更早:2009年前后,辛顿团队就把它用在了语音识别上,让语音输入的错误率大幅下降,谷歌、微软等很快悄悄换上了这套技术——只是这场胜利藏在产业幕后,没掀起太大水花。真正让全世界都看清"深度学习行了"的,是2012年那场公认的分水岭之战。在图像识别大赛ImageNet上,辛顿团队用一种叫"卷积神经网络(CNN)"的深度模型(代号AlexNet)碾压所有对手——CNN专门模拟人的视觉、最擅长"看图",它的奠基人,正是后文那位著名的"乐观派"杨立昆。和深蓝那种"人写规则"的老路不同,这一次,机器是自己从海量图片里学会了如何识别。三个被压抑多年的条件,此刻同时成熟:

那条被嘲笑了三十年的"死路",一夜之间成了通衢大道。

两年后的2014年,年轻研究者伊恩·古德费洛提出GAN(生成对抗网络):让两个神经网络互相博弈,一个负责造假、一个负责打假,在对抗中越来越逼真。这是机器第一次像模像样地"创造"图像,也埋下了日后"深度伪造(Deepfake)"的种子。AI从此不只会"识别"世界,还开始学着"生成"世界。

2016年,谷歌DeepMind的AlphaGo击败围棋世界冠军李世石。围棋的复杂度远超国际象棋,无法靠穷举,AlphaGo靠的是深度学习加"自我对弈"的强化学习——这一次,机器是真的在"学"(不过要先说一句:"会学习"和"真的懂围棋"是两回事,这个区别后面还会反复出现)。

那著名的"第37手",落子之诡异,连职业棋手当场都看不懂,事后却被证明是神之一手。人类第一次直观地感到:机器的"思路",可能和我们根本不同,甚至在某些维度上超越了我们千百年的经验。

AlphaGo用到的"强化学习"——让机器在不断试错、奖惩中自己摸索出策略——本身就是一条贯穿AI的大主线:早在2013年,DeepMind就用它让AI无师自通地学会打雅达利游戏;AlphaGo之后,又有了完全不看人类棋谱、纯靠左右手互搏自我对弈的AlphaZero。记住这套"试错—奖惩"的思路——后面ChatGPT的"调教"(RLHF)和会"思考"的推理模型,骨子里靠的都是它。

会下棋,离走进千家万户还差着十万八千里——AI还得先学会人类最日常、也最难缠的本事:语言。这条线同样酝酿已久。2013年的Word2Vec(词向量)是关键一步:它把每个词变成一串数字坐标,让"国王−男人+女人≈王后"这样的语义运算第一次成为可能——机器开始隐约"摸"到了词义。而处理整句、整段话的主力,长期是循环神经网络(RNN)及其改良版LSTM:它像人读书一样一个词一个词地"循环"读下去,撑起了早期的机器翻译、语音识别和输入法联想。但它有个死穴——句子越长越容易"忘掉"前文,而且只能一个接一个地处理、快不起来。

针对"健忘",研究者先想出了一个补丁:给RNN装上一种叫"注意力(Attention)"的机制——让模型在处理每个词时,能"回头看一眼"原文里最相关的部分,不必再把整句话死记在脑子里。2016年,谷歌翻译换上这套带注意力的神经网络方案,翻译质量肉眼可见地跃升,这是普通人第一次大规模领教深度学习的厉害。可"只能一个接一个、快不起来"的毛病还在。而真正颠覆性的一步,是有人索性问:既然注意力这么好用,能不能把笨重的RNN整个扔掉?

2017年,谷歌发表了一篇论文,标题颇为狂妄——《Attention Is All You Need》("你只需要注意力"),提出了Transformer架构。狂妄之处正在于此:它把统治语言处理多年的循环结构(RNN)整个扔掉,只保留那个屡试不爽的注意力机制,让模型既能一次性纵览全文、又能并行处理——既不健忘,又快得多。今天你听到的所有大模型(GPT的"T"、文心、通义、Claude……)都建立在它之上。重要性怎么强调都不为过:没有2017年的这篇论文,就没有2022年的ChatGPT。

Transformer一问世,立刻分出两条岔路。谷歌顺手做出的BERT(2018)主攻"读懂"——像做完形填空那样深挖语义,一度横扫各类理解类任务、风头无两;OpenAI的GPT则赌另一边,主攻"接着往下写"。两条岔路其实共享同一套底层打法——这正是GPT名字里那个常被忽略的"P"(Pre-trained,预训练):先在海量文本上"预训练"出一个博学的通用底座,再针对具体任务稍作"微调"。在此之前,每做一件事都得从零训练一个专用模型;自此,一个通用底座加少量微调,便能胜任五花八门的任务——"一个模型什么都能干"的时代,正是从这里开始的。当时几乎所有人都更看好BERT,没人料到几年后掀翻桌子、走进千家万户的,竟是看上去更"不务正业"的GPT这一支。有时候押对方向,比一时领先更重要。

2018年起,OpenAI在这条路上一路狂奔,并发现了一个惊人规律——"规模法则(Scaling Law)":模型越大、数据越多、算力越足,能力就越强,而且会"涌现"出训练时没有专门教过的新本领。2020年的GPT-3拥有1750亿参数,已经能写文章、编代码、做翻译,震惊了业界。

而它最深远的改变,是带来了一种全新的用法。在此之前,哪怕有了通用底座,换一个任务好歹还得喂上一批标注数据、重新"微调"一遍;可GPT-3大到一定程度后,竟然连微调都省了——你只需在对话框里用大白话把任务讲清楚,再顺手给一两个例子(甚至一个都不给),它就能当场现学现做。这种"上下文学习(In-context Learning)"的本领,把"重新训练模型"悄悄换成了"把话说明白",也由此催生出一门人人都能上手的新手艺——"提示词工程(Prompt Engineering)"。GPT-3论文的标题早已道破天机:《语言模型是少样本学习者》。今天你我对着对话框敲下的每一句提问,其实都是这一刻的延续。

几乎同时,DeepMind的AlphaFold在2020年攻克了困扰生物学界半个世纪的"蛋白质折叠"难题,能从氨基酸序列高精度预测蛋白质的三维结构。这项成果直接惠及药物研发和生命科学,并为团队赢得了2024年诺贝尔化学奖。这提醒我们:AI最深远的影响,未必是聊天机器人,而可能是它正在加速整个科学的进程。

2022年,AI完成了两个"出圈"重击。

上半年,**扩散模型(Diffusion Model)**成熟,让"用一句话画一张画"成为现实。这里还藏着一块关键拼图:机器凭什么知道"宇航员"这三个字该对应画面里的哪个东西?答案是2021年OpenAI的CLIP——它把网上海量的"图片—配文"成对喂进去,硬是让模型学会了把文字和图像对到同一个意思上。有了这座连接文字与图像的桥,"打字生成画面"才真正成为可能。OpenAI的DALL·E 2、独立团队的Midjourney、以及完全开源的Stable Diffusion接连引爆——尤其是Stable Diffusion的开源,让任何人都能在自己电脑上生成图像,AI绘画一夜之间走进千万普通人。也正是从这一刻起,关于"AI抢饭碗""版权归谁"的争论,第一次真正烧到了创作者群体。

下半年,2022年11月30日,ChatGPT发布。它在技术上并非全新(底层还是GPT-3.5),但它做对了两件事:一是用"人类反馈强化学习(RLHF)"把模型"调教"了一番——让原本只会埋头续写文字的它,变得听得懂指令、说人话、也更少乱来;二是把这份能力,装进了一个"人人都会用的对话框"。(记住RLHF这个词,后面讲"对齐"难题时它还会回来。)五天破百万用户,两个月破一亿,成为史上增长最快的消费级应用。

至此,AI终于从实验室和论文里,走进了你我的日常。

朴素地说,今天的大模型在做一件事:根据前面的内容,预测下一个最合理的词。它读完了人类几乎所有公开文字,学到了语言规律、知识关联,乃至一定的推理模式。这种不靠人工标注、自己拿海量文本反复做"完形填空"来训练的方式,叫"自监督学习"——正是它,让大模型得以一口吃下整个互联网。

OpenAI前首席科学家伊尔亚·苏茨克维(Ilya Sutskever)有一句辩护广为流传:要想准确预测一本侦探小说最后一页"凶手是____"的那个名字,模型就不得不在某种程度上真正"理解"整个故事。预测,逼出了理解——这是大模型最深刻、也最具争议的地方。

这里要厘清一个最容易让人犯晕的点:当我们说大模型"理解"或"不理解",其实在讲两件不同的事。在"能根据上下文给出合理回应"这个统计意义上,它确实展现出了某种"理解";但在"像人一样、知道自己在说什么、对世界有真切体验"这个人类意义上,它并不理解。本文后面凡是说它"没有真正的理解",指的都是后者。

也正因如此,今天的大模型,更像2016年的AlphaGo,而不像1997年的深蓝——它的本事是"从海量数据里自己学规律",而非"被人把规则一条条喂进去"。但请记住:会学习,不等于有理解、有常识。一个棋力通神的AlphaGo,并不知道自己在下棋,也不知道"棋"为何物;今天的大模型,同样如此。

ChatGPT之后,竞赛全面打响。2023年3月,OpenAI又甩出GPT-4:它不仅能看懂图片,还在律师资格考试等一系列人类专业考试中考进前列,第一次让很多人真切地感到"它可能比我更专业"。此后短短三年多,模型迭代之快令人目不暇接——到2026年的今天:

在这场竞赛的背后,还藏着一条谁都绕不开的命脉——算力。训练顶尖模型要烧掉成千上万块昂贵的AI芯片,而这种芯片几乎被英伟达(NVIDIA)一家垄断,它也因此一跃成为全球市值最高的公司之一;芯片更成了大国博弈的筹码——美国对华高端芯片出口管制,正是这条暗线的延伸。

也正因如此,2025年初的"DeepSeek时刻"才格外震撼:中国团队DeepSeek在被"卡脖子"的条件下,用远低于外界想象的成本,训练出性能逼近顶尖水平的开源模型(省钱的一个关键,是它大量采用了"混合专家(MoE)"架构——模型整体很大,但每次只唤醒其中一小撮"专家"出来干活,好比一家大医院分科室接诊,而不必每回都全院会诊;此外还用上了"知识蒸馏(Distillation)"——让一个庞大的"老师"模型把本事手把手教给一个小巧的"学生"模型,这套办法的奠基人,正是前文那位辛顿),一度引发美股科技板块剧烈震荡。它打破了"只有烧掉天文数字的钱才能做出好模型"的迷信,也让世界重新审视AI竞赛的格局。

如果说过去三年AI主要是一张"会说话的嘴",那么2025年最大的变化是——它开始长出"手",能自己动手干活了。这类能调用工具、连续执行多步任务的AI,被称为"智能体(Agent)":

这就是"现在"最激动人心、也最值得警惕的地方:当AI从"动嘴"变成"动手",它的能力和风险,都被同时放大了。

把激动按下去,客观地说,今天的AI仍有几道难以回避的坎:

针对"幻觉"和"知识过期"这两道坎,业界已有缓解之道——给模型外接一个"资料库"、或干脆让它联网搜索,先查到可靠材料、再据此作答,这套做法叫"检索增强(RAG)",能明显压低胡说八道、补上过时的知识。但它终究是"打补丁",治标而难治本。

把它理解成"一个读过海量资料、反应极快、但偶尔会编造信息、且缺乏常识判断的实习生",可能比"一个无所不知的智能体"更接近真相。用好它的前提,是承认它的局限。

看完AI的来路与今天的能力,一个问题自然浮现:我们到底该不该害怕它?耐人寻味的是,对这个问题吵得最凶的,恰恰是这世上最懂AI的那群人。而这一切,要从一个流传于极客圈的恐怖思想实验说起。

2010年代初,在极客云集的理性主义论坛LessWrong上,一个网名Roko的用户抛出了一个细思极恐的设想,后来被称为"Roko的蛇怪(Roko's Basilisk)":

假设未来必然会诞生一个无比强大、且"以促成自身诞生为善"的超级AI。那么它可能会反过来惩罚所有"早就知道它终将诞生、却没有出力帮它早日降临"的人。而吊诡之处在于——仅仅是读到并理解这个设想本身,你就已经"知道"了,于是被卷入了它的审判。

这个设想逻辑上漏洞百出,却像病毒一样让一些人寝食难安。论坛创始人、AI安全研究者埃利泽·尤德科夫斯基罕见震怒,直接删帖封禁讨论,理由是"传播一个可能让人精神受创的危险念头是不负责任的"——结果反而让它名声大噪。

它最著名的"副作用",是促成了一段姻缘:据传,特斯拉与SpaceX的掌门人埃隆·马斯克,与音乐人Grimes,正是因为都对这个冷门的"蛇怪梗"会心一笑而结缘。

轶事归轶事,但马斯克对AI的恐惧真实而持久。他多次公开警告:发展AI是"在召唤恶魔",是"人类文明最大的生存威胁","比核武器更危险"。讽刺的是,正是出于这份恐惧,他在2015年参与联合创立了OpenAI——本意是搞一个"安全、开放、非营利"的AI来对冲风险;几年后他因理念不合离开,转头又创办了自己的AI公司xAI。害怕一件事,和忍不住亲自去做这件事,在他身上奇异地共存。

他不是唯一的忧虑者。已故物理学家斯蒂芬·霍金生前警告:"全面的人工智能可能意味着人类的终结。"

而最戏剧性的一幕发生在2023年:深度学习教父辛顿从谷歌离职,目的竟是为了能毫无顾忌地警告世人AI的危险。这位用一生把神经网络从"死路"推上神坛的老人,晚年公开表示对自己的毕生工作感到一丝后悔——"我用普通人安慰自己的方式安慰自己:就算我不做,也会有别人做。"他更在2024年获得诺贝尔物理学奖,可谓"一边领奖、一边示警"。

但科学界绝非铁板一块。同为深度学习三巨头之一的**杨立昆(Yann LeCun)**就是著名的"乐观派",他反复强调:今天的AI连一只猫的常识都不如,担心它"统治人类",就像"还没造出飞机,就开始担心航空安全和超音速客机会不会太挤"——纯属杞人忧天。

耐人寻味的是,公认的"深度学习三巨头"、2018年图灵奖的共同得主——辛顿、本吉奥、杨立昆,如今恰好在这道分水岭上裂成了两边:辛顿与第三位巨头**约书亚·本吉奥(Yoshua Bengio)**双双转向忧虑、投身AI安全研究,唯有杨立昆坚守乐观的一端。师出同门、同台领奖,到了"该不该怕"这一步,却各奔东西。

而这种忧虑,很快从零散的个人言论,汇成了公开的联名呼吁。2023年,恐惧第一次凝结成一封封公开信:3月,一封呼吁"暂停训练比GPT-4更强大的AI至少六个月"的公开信迅速征集到上万人联名,马斯克等人赫然在列;两个月后,一份更简短的声明把话挑明——"降低AI带来的灭绝风险,应与流行病、核战争一道,成为全球级别的优先事项",签名者中赫然包括OpenAI、谷歌DeepMind、Anthropic三大顶尖实验室的掌门人。一边亲手在造它,一边公开警告它可能毁灭人类——这种近乎精神分裂的姿态,本身就是这个行业最真实的写照。

这种分歧绝不只停留在口水仗上。2023年11月,AI风暴中心的OpenAI突然上演宫斗:董事会以"沟通不够坦诚"为由,闪电解雇了CEO山姆·奥特曼,参与决策的正包括时任首席科学家伊尔亚·苏茨克维。消息一出,数百名员工以集体辞职相逼;五天之后,奥特曼戏剧性回归,董事会反被改组。这场被外界称为"政变"的事件,表面是人事斗争,内核却是AI世界那条最深的裂缝——该踩下油门加速狂奔,还是该踩住刹车确保安全?这个问题,至今没有答案。

请记住这场分歧:站在你面前的,是同一个领域里最顶尖的几个大脑,他们看着同样的技术,却得出了截然相反的结论。这本身,就是关于AI最重要的事实之一。

回看这七十年,AI的故事其实有一条清晰的规律:每一次,它都既没有狂热者吹嘘的那么神,也没有怀疑者断言的那么虚。寒冬里,它在无人喝彩处悄悄积累;热潮中,它又被过度神化。而今天,我们大概率正站在又一轮热潮的高点上。

那么,一个普通人该用什么姿态去面对它?或许是这三句话:

技术演进的大方向,常常由不得我们选择;但如何使用它、如何与它共处,主动权仍牢牢握在我们自己手里。

七十年前,图灵问:"机器能思考吗?"走到今天,我越来越觉得,这个问题,或许从来就不只是在问机器——

它也在问我们自己:当机器越来越像人,我们是否还说得清,到底什么才是"人"。