人工智能演进历程：从图灵之问到智能涌现

发布时间：2026-04-17 21:01阅读：20

在当下这个时代，仅仅能够使用人工智能或许已显不足，因其发展速度迅猛，诸多领域已然超越人类。诚然，“打不过就加入”是一种应对策略，但另一方面，我们仍需深入探究其内在机理。我计划对人工智能的发展脉络、内部运作机制以及相关产业进行系统梳理，今日便从它的演进历史谈起。

图灵是我颇为欣赏的那类人，他们能够进行深入而持久的思考，直至触及问题的本质。

1950年，图灵在他发表的论文《计算机器与智能》中提出了一个划时代的问题：

“机器能够思考吗？”

并为此设计了著名的“图灵测试”——倘若一台机器能够通过文字对话迷惑人类裁判，使其无法分辨对话者是人还是机器，那便证明了它具备智能的展现。

随后的1956年夏天，在美国达特茅斯学院举行的一场研讨会上，科学家们围坐在草坪上畅谈，梦想着创造出“会思考的机器”，并正式确立了“人工智能”这一学科名称。

关于AI发展历程的图片，我未能找到特别满意的。下面这张图视觉效果尚可，但尝试让AI添加中文翻译却屡屡出错，因此我改用文字大致罗列关键节点：

1950年：图灵测试 - 机器能思考吗？

1956年：达特茅斯会议 - 人工智能“正式诞生”

1974-1980年：第一次寒冬

1980年代：专家系统 - AI首次接近商业应用

1987-1993年：第二次寒冬

1997年：IBM“深蓝”击败卡斯帕罗夫（国际象棋世界冠军）

2012年：深度学习（卷积神经网络在图像识别领域取得突破）

2017年：谷歌研究团队提出Transformer架构

2020年：GPT-3发布 - 大模型+预训练+海量参数

2022-23年：ChatGPT引爆对话式AI，大模型进入大众应用阶段

2024-25年：多模态与智能体AI加速成熟（AI能同时处理文本、图像、音频等多种模态，并具备自主执行任务的能力，即AI Agent）

最初，图灵提出的“机器能否思考”这一问题，实际上为后续的人工智能研究设定了根本目标：让机器像人一样聪慧。

1956年的达特茅斯会议则正式确立了“人工智能”这一名称，使其作为一门独立学科诞生。当时推动研究的主力军主要是大学和科研机构，核心力量集中在麻省理工学院、斯坦福大学、爱丁堡大学等学府。

1951至1960年代，早期的神经网络思想在麻省理工学院等机构萌发，神经网络机器也随之问世。

1964至1967年，麻省理工学院开发的ELIZA成为世界上最早的聊天程序之一。

1960年代，政府与大学共同推动发展，这一阶段仍以学术研究为主，上述大学依然是人工智能研究的中心。

由此可见，在起步阶段，人工智能主要由大学和研究机构“主导”，鲜有商业公司涉足。但IBM很早就嗅到了商机，开始资助早期研究。达特茅斯会议中，亦有IBM成员参与。

此后，人工智能经历了两次发展低谷：

第一次大约在1974至1980年代初，主要症结在于计算机算力羸弱、数据匮乏，过度乐观的预期无法兑现，导致资金投入减少，进展陷入停滞。

第二次大约在1987至1993年左右，“专家系统”让AI首次进入企业视野。它旨在“将专家知识编码为规则，使其在特定领域内能做出实用判断”。然而，其维护成本高昂，适用范围狭窄，行业的热情再次消退。人们也开始意识到，仅靠规则的堆砌无法创造出真正通用的智能。

真正的转机出现在1997年。

IBM推出了超级计算机“深蓝”，在国际象棋比赛中击败了世界冠军加里·卡斯帕罗夫，这是人工智能首次在公众面前“扬眉吐气”。IBM也以实际行动证明：公司不仅能制造硬件，还能将AI推向舞台中央。

进入2010年代，更多商业公司如同“幕后英雄”，开始默默提供基础设施、核心引擎和开发工具。硬件与软件公司联手“点燃”了发展的引擎。它们顺应人工智能发展的大趋势，自身也获得了巨大成长。

彼时，互联网时代来临，数据如洪流般涌现。

科学家们发现了一个公式：数据 + 算力 + 优秀算法 = AI变得更聪明。

此刻，硬件公司站到了台前。

英伟达原本主营游戏显卡，却意外发现其GPU特别适合AI所需的“并行计算”。2006年，英伟达推出CUDA软件平台，让全球的程序员都能便捷地使用GPU训练AI模型。2012年，AlexNet神经网络凭借英伟达GPU在图像识别大赛中取得压倒性胜利，深度学习时代正式拉开序幕！

软件公司亦不甘落后。

谷歌开源了TensorFlow框架，如同为AI开发提供了一套“乐高积木”。Meta随后推出了更为灵活且同样开源的PyTorch。

2014年，谷歌收购DeepMind；2016年，其开发的AlphaGo在围棋比赛中以4:1击败世界冠军李世石，举世震惊！谷歌还自主研发了TPU芯片，比GPU更专为AI计算而设计。

2017年，谷歌研究团队提出了Transformer架构。

Transformer是现代大模型最关键的基石之一。其最大的革新在于，用“注意力机制”替代了许多传统序列模型的处理方式。简而言之，它不再机械地按顺序读取句子，而是能够更灵活地捕捉上下文中最关键的信息。

Transformer之所以至关重要，是因为它让模型更擅长处理长文本，也更适合训练大规模语言模型。后来我们所见的GPT、BERT、Claude等模型，其底层架构都离不开Transformer这条技术路线。

Transformer这个词颇有意思，既有“变换器”的含义，也让人联想到“变形金刚”。有传闻称其开发者是变形金刚的粉丝。我个人对这部动漫也有几个不同阶段的理解：小时候初看变形金刚，觉得这个构想神奇无比，汽车能变成机器人，实在太酷了；长大后却觉得这个设定不太合理，外星人怎么可能和地球上的汽车一样；再后来才恍然大悟，这样的智能形态或许比人类更适合在太空中生存。不知以此命名的开发者们是否也有与我相似的想法和感受。

言归正传。

随后，大模型时代开启：

2020年代，以OpenAI为引领，科技巨头们集体冲刺，并见证了“涌现”现象。

2022年11月，OpenAI推出ChatGPT——一个能够写诗、编程、参加考试，还能与人聊天的AI。其背后的GPT系列模型，参数量达到天文数字，依赖的正是“越大越聪明”的缩放定律。

OpenAI本身是研究实验室，但真正助其腾飞的，是微软的巨额投资和Azure云平台。谷歌紧随其后推出多模态模型Gemini。Meta开源了LLaMA模型。亚马逊投资了Anthropic公司，并推出Claude模型。

这个时期特别值得一提的是，人工智能展现出了惊人的“涌现”现象：

当模型规模（参数、数据、算力）扩大到一定程度时，会突然“涌现”出之前完全没有被明确训练过的智能能力，例如复杂推理、创造性写作，甚至幽默感。这些能力并非一步步教授而成，而是在交互中自然浮现！

这与我欣赏的凯文·凯利（KK）早在三十年前在其著作《失控》中预言的“智能涌现”高度契合。（KK也属于我欣赏的那类深入持久思考直至极致的人，但他还擅长以最贴近世界本真的方式去学习、思考和探索。在众多人中，KK与我的内在最为相似，至今我手机屏保仍是他年轻时在湖边小木屋的照片，喜欢户外自然的朋友可以看看他的相关视频）

凯文·凯利认为：

复杂的智能并非由中央设计师一手规划而成，而是从大量简单元素（如神经元或数据点）的交互中自然“涌现”出来的——正如蚁群的集体智慧无需蚁后指挥一样。

大语言模型正是这种“涌现”现象的生动例证：它从单纯的“预测下一个词”这一任务中，意外地涌现出了通用智能的火花！

此时，硬件供应链成为了AI发展的“生命线”。英伟达的H100、Blackwell系列GPU成为了AI训练的“心脏”。

今天写得有些长了，暂且到此为止，做个小结：

从图灵提出“机器能否思考”这一根本问题出发，历经达特茅斯会议正式定名，在两次寒冬中反复受挫后，凭借深度学习、Transformer架构、大模型与多模态/智能体技术的不断突破，并在算力、云平台及产业链相关公司的共同推动下，人工智能大致就是这样从“会回答”走向了“会生成、会理解、会做事”。

人工智能的发展是科学家、工程师、硬件公司、软件公司、云服务巨头合力的成果，当然，也是科技与时代发展到一定阶段的必然产物。

下一篇我们将从人工智能发展过程中各个环节的内在运作机制入手，再次进行梳理，以明晰它究竟是如何一步步进化而来的。

← 上一篇：AI技术革新小学道德与法治教学：生活化实践的新路径下一篇：人工智能学院举办学生骨干专题培训 →