人工智能演进历程:从图灵之问到智能涌现
在当下这个时代,仅仅能够使用人工智能或许已显不足,因其发展速度迅猛,诸多领域已然超越人类。诚然,“打不过就加入”是一种应对策略,但另一方面,我们仍需深入探究其内在机理。我计划对人工智能的发展脉络、内部运作机制以及相关产业进行系统梳理,今日便从它的演进历史谈起。
图灵是我颇为欣赏的那类人,他们能够进行深入而持久的思考,直至触及问题的本质。
1950年,图灵在他发表的论文《计算机器与智能》中提出了一个划时代的问题:
“机器能够思考吗?”
并为此设计了著名的“图灵测试”——倘若一台机器能够通过文字对话迷惑人类裁判,使其无法分辨对话者是人还是机器,那便证明了它具备智能的展现。
随后的1956年夏天,在美国达特茅斯学院举行的一场研讨会上,科学家们围坐在草坪上畅谈,梦想着创造出“会思考的机器”,并正式确立了“人工智能”这一学科名称。
关于AI发展历程的图片,我未能找到特别满意的。下面这张图视觉效果尚可,但尝试让AI添加中文翻译却屡屡出错,因此我改用文字大致罗列关键节点:
1950年:图灵测试 - 机器能思考吗?
1956年:达特茅斯会议 - 人工智能“正式诞生”
1974-1980年:第一次寒冬
1980年代:专家系统 - AI首次接近商业应用
1987-1993年:第二次寒冬
1997年:IBM“深蓝”击败卡斯帕罗夫(国际象棋世界冠军)
2012年:深度学习(卷积神经网络在图像识别领域取得突破)
2017年:谷歌研究团队提出Transformer架构
2020年:GPT-3发布 - 大模型+预训练+海量参数
2022-23年:ChatGPT引爆对话式AI,大模型进入大众应用阶段
2024-25年:多模态与智能体AI加速成熟(AI能同时处理文本、图像、音频等多种模态,并具备自主执行任务的能力,即AI Agent)
最初,图灵提出的“机器能否思考”这一问题,实际上为后续的人工智能研究设定了根本目标:让机器像人一样聪慧。
1956年的达特茅斯会议则正式确立了“人工智能”这一名称,使其作为一门独立学科诞生。当时推动研究的主力军主要是大学和科研机构,核心力量集中在麻省理工学院、斯坦福大学、爱丁堡大学等学府。
1951至1960年代,早期的神经网络思想在麻省理工学院等机构萌发,神经网络机器也随之问世。
1964至1967年,麻省理工学院开发的ELIZA成为世界上最早的聊天程序之一。
1960年代,政府与大学共同推动发展,这一阶段仍以学术研究为主,上述大学依然是人工智能研究的中心。
由此可见,在起步阶段,人工智能主要由大学和研究机构“主导”,鲜有商业公司涉足。但IBM很早就嗅到了商机,开始资助早期研究。达特茅斯会议中,亦有IBM成员参与。
此后,人工智能经历了两次发展低谷:
第一次大约在1974至1980年代初,主要症结在于计算机算力羸弱、数据匮乏,过度乐观的预期无法兑现,导致资金投入减少,进展陷入停滞。
第二次大约在1987至1993年左右,“专家系统”让AI首次进入企业视野。它旨在“将专家知识编码为规则,使其在特定领域内能做出实用判断”。然而,其维护成本高昂,适用范围狭窄,行业的热情再次消退。人们也开始意识到,仅靠规则的堆砌无法创造出真正通用的智能。
真正的转机出现在1997年。
IBM推出了超级计算机“深蓝”,在国际象棋比赛中击败了世界冠军加里·卡斯帕罗夫,这是人工智能首次在公众面前“扬眉吐气”。IBM也以实际行动证明:公司不仅能制造硬件,还能将AI推向舞台中央。
进入2010年代,更多商业公司如同“幕后英雄”,开始默默提供基础设施、核心引擎和开发工具。硬件与软件公司联手“点燃”了发展的引擎。它们顺应人工智能发展的大趋势,自身也获得了巨大成长。
彼时,互联网时代来临,数据如洪流般涌现。
科学家们发现了一个公式:数据 + 算力 + 优秀算法 = AI变得更聪明。
此刻,硬件公司站到了台前。
英伟达原本主营游戏显卡,却意外发现其GPU特别适合AI所需的“并行计算”。2006年,英伟达推出CUDA软件平台,让全球的程序员都能便捷地使用GPU训练AI模型。2012年,AlexNet神经网络凭借英伟达GPU在图像识别大赛中取得压倒性胜利,深度学习时代正式拉开序幕!
软件公司亦不甘落后。
谷歌开源了TensorFlow框架,如同为AI开发提供了一套“乐高积木”。Meta随后推出了更为灵活且同样开源的PyTorch。
2014年,谷歌收购DeepMind;2016年,其开发的AlphaGo在围棋比赛中以4:1击败世界冠军李世石,举世震惊!谷歌还自主研发了TPU芯片,比GPU更专为AI计算而设计。
2017年,谷歌研究团队提出了Transformer架构。
Transformer是现代大模型最关键的基石之一。其最大的革新在于,用“注意力机制”替代了许多传统序列模型的处理方式。简而言之,它不再机械地按顺序读取句子,而是能够更灵活地捕捉上下文中最关键的信息。
Transformer之所以至关重要,是因为它让模型更擅长处理长文本,也更适合训练大规模语言模型。后来我们所见的GPT、BERT、Claude等模型,其底层架构都离不开Transformer这条技术路线。
Transformer这个词颇有意思,既有“变换器”的含义,也让人联想到“变形金刚”。有传闻称其开发者是变形金刚的粉丝。我个人对这部动漫也有几个不同阶段的理解:小时候初看变形金刚,觉得这个构想神奇无比,汽车能变成机器人,实在太酷了;长大后却觉得这个设定不太合理,外星人怎么可能和地球上的汽车一样;再后来才恍然大悟,这样的智能形态或许比人类更适合在太空中生存。不知以此命名的开发者们是否也有与我相似的想法和感受。
言归正传。
随后,大模型时代开启:
2020年代,以OpenAI为引领,科技巨头们集体冲刺,并见证了“涌现”现象。
2022年11月,OpenAI推出ChatGPT——一个能够写诗、编程、参加考试,还能与人聊天的AI。其背后的GPT系列模型,参数量达到天文数字,依赖的正是“越大越聪明”的缩放定律。
OpenAI本身是研究实验室,但真正助其腾飞的,是微软的巨额投资和Azure云平台。谷歌紧随其后推出多模态模型Gemini。Meta开源了LLaMA模型。亚马逊投资了Anthropic公司,并推出Claude模型。
这个时期特别值得一提的是,人工智能展现出了惊人的“涌现”现象:
当模型规模(参数、数据、算力)扩大到一定程度时,会突然“涌现”出之前完全没有被明确训练过的智能能力,例如复杂推理、创造性写作,甚至幽默感。这些能力并非一步步教授而成,而是在交互中自然浮现!
这与我欣赏的凯文·凯利(KK)早在三十年前在其著作《失控》中预言的“智能涌现”高度契合。(KK也属于我欣赏的那类深入持久思考直至极致的人,但他还擅长以最贴近世界本真的方式去学习、思考和探索。在众多人中,KK与我的内在最为相似,至今我手机屏保仍是他年轻时在湖边小木屋的照片,喜欢户外自然的朋友可以看看他的相关视频)
凯文·凯利认为:
复杂的智能并非由中央设计师一手规划而成,而是从大量简单元素(如神经元或数据点)的交互中自然“涌现”出来的——正如蚁群的集体智慧无需蚁后指挥一样。
大语言模型正是这种“涌现”现象的生动例证:它从单纯的“预测下一个词”这一任务中,意外地涌现出了通用智能的火花!
此时,硬件供应链成为了AI发展的“生命线”。英伟达的H100、Blackwell系列GPU成为了AI训练的“心脏”。
今天写得有些长了,暂且到此为止,做个小结:
从图灵提出“机器能否思考”这一根本问题出发,历经达特茅斯会议正式定名,在两次寒冬中反复受挫后,凭借深度学习、Transformer架构、大模型与多模态/智能体技术的不断突破,并在算力、云平台及产业链相关公司的共同推动下,人工智能大致就是这样从“会回答”走向了“会生成、会理解、会做事”。
人工智能的发展是科学家、工程师、硬件公司、软件公司、云服务巨头合力的成果,当然,也是科技与时代发展到一定阶段的必然产物。
下一篇我们将从人工智能发展过程中各个环节的内在运作机制入手,再次进行梳理,以明晰它究竟是如何一步步进化而来的。