标签

方绍伟解读AI:技术范式的演进轨迹

发布时间:2026-05-07 20:21来源:微信阅读:5

从20世纪中期的思想萌芽,到今天技术全面加速,人工智能(AI)已经走过了七十余年的发展历程。回望其最初源头,得从20世纪初的数学与计算理论说起:希尔伯特提出可判定性等关键问题(能否用固定步骤判断数学命题真假),为后续研究提供了方向;哥德尔的不完备定理进一步界定了数学系统的边界,也在理论层面给“强AI”设下上限;图灵提出通用计算模型,为现代计算机与经典符号式AI奠定了基础;冯・诺依曼完善计算机体系结构,让抽象设想更快走向落地,助推早期AI的成形。

AI技术范式的演进主线可概括为:三大主义→专家系统→传统机器学习→深度学习→强化学习→生成式AI→世界模型→具身智能→通用人工智能→超人工智能。它从抽象逻辑走向真实应用,从单点技术迈向多技术融合;每一次推进都体现了人类对“机器智能”本质的持续追问,也反映出技术演化的必然规律。

一、奠基路径:1950-1970年,三大主义的多线并行

1950年至1970年间,AI技术范式进入以三大主义为核心的奠基阶段。在希尔伯特、哥德尔、图灵、冯诺依曼等人的前期理论支持下,人工智能的发展轮廓逐渐清晰,三条关键探索路线同时铺展开来。

符号主义作为最早登场的范式,其主旨在于“用规则来模拟智能”。它借助图灵所奠定的通用计算模型,通过人类事先设计逻辑规则与符号体系,使机器沿着预设路径完成推理与思考。该方向的先行者包括艾伦·麦席森·图灵(Alan Mathison Turing)、约翰·麦卡锡(John McCarthy)等。1950年,图灵在《计算机器与智能》(Computing Machinery and Intelligence)中提出著名的图灵测试:通过让人和机器对话、让人难以区分对面身份,来作为判断机器是否具备智能的核心尺度。1956年,麦卡锡、明斯基等学者发起达特茅斯会议,并将这一研究正式命名为“人工智能”,标志着该领域作为独立学科登上历史舞台。此时期,逻辑机器研发与定理证明不断取得突破,符号逻辑系统让机器能够进行较为直接的逻辑推演与证明验证:既延续了图灵通用计算的思想,也回应了希尔伯特的数学探索议题,为后续符号主义走向工程化准备了土壤。

与符号主义同向推进的,是连接主义。它强调“用结构来模拟智能”,试图借助神经元之间的连接方式来复刻人脑的工作机制,通过调节连接权重实现知识存储与处理。1943年,沃伦·斯特吉斯·麦卡洛克(Warren Sturgis McCulloch)与沃尔特·皮茨(Walter Pitts)发表论文,利用严谨数学语言刻画神经元的基本运作,为连接主义打下理论根基;1957年,康奈尔大学教授弗兰克·罗森布拉特(Frank Rosenblatt)提出感知机(Perceptron),作为一种前向人工神经网络,凭借迭代试错方法解决二元线性分类问题,开创了监督学习的先河,也成为连接主义的重要标志。可到1969年,马文·明斯基(Marvin Minsky)与西摩·帕特(Seymour Papert)在《感知机》(Perceptron)中指出感知机在处理异或(XOR)等线性不可分任务时存在明显局限,这一判断在当时带来强烈冲击,使连接主义研究进入长期低潮(同时也与经费与学术竞争等因素交织)。

在同一时期,还有行为主义(也常被称为控制论AI)这条别样的“智能路线”。它以“感知→行动”的闭环反馈为核心,主张智能并非主要来自符号逻辑或神经网络,而是在与外部环境的交互、试错迭代中逐步形成,本质上更接近“用行为来模拟智能”。代表人物罗德尼·布鲁克斯(Rodney Brooks)亲手打造了“艾伦”“赫伯特”等基于行为的机器人,提出“行为主义智能”的关键理念。早期控制论研究、遗传算法的初步尝试,以及简单的自主机器人研发,都属于对这一思路的生动实践。尽管当时行为主义并未成为主流,却在机器人方向悄然积累力量,像埋在地下的种子,为之后强化学习与具身智能的蓬勃发展提前埋下伏笔。

不过,受算力不足、规则依赖过强等现实条件制约,AI的雄心与现实落差很快显现:经费相继被压缩,AI产业随之迎来第一次寒冬。但三大主义之间并非割裂,而是相互支撑、互为补充,共同构成了人工智能的底层理论根基,也为后续范式迭代指明了路径。如今的人形机器人往往综合了三种范式的思路:底层侧重动作反射,中层负责环境感知,顶层承担逻辑规划。三足鼎立的三种路径,在人形机器人应用研发中最终实现更紧密的拼合——符号主义负责构建逻辑骨架并追求理性推演;连接主义提供神经网络的学习能力与数据驱动基础;行为主义则通过面向现实世界的工程实践,为机器人在复杂环境中获得可生存的“躯壳”。

二、落地实践:1970-1990年,专家系统的兴起与回落

1970年至1990年间,AI技术范式进入专家系统时代。它被认为是符号主义从理论走向应用的重要阶段。专家系统的核心做法,是把某个行业领域的专家知识提炼、整理为结构化规则库,并配套专门的推理机制,让计算机能够模仿专家的思维过程,用于解决特定领域的复杂问题;因此也可视作“符号主义的实用化延伸”。

这一阶段的关键人物之一是爱德华·费根鲍姆(Edward Feigenbaum),常被称作“专家系统之父”。1976年,他主导研发的MYCIN医疗诊断专家系统,能够依据患者症状判断细菌感染类型并给出治疗建议,准确率甚至超过人类专家(后因诊疗责任等原因未能进一步推广);同时,工业故障诊断、金融风险评估等场景中的专家系统也不断出现并取得关注。虽然这一时期没有特别公认的“标志性著作”,但专家系统的规模化部署成为最亮眼的特点。到了1980年代,专家系统在全球范围内掀起热潮,美国就有上千套系统投入使用;同一时期,邮政信件分拣系统也体现了符号规则与图像识别相结合的自动化应用范式。

然而,热度背后也逐渐暴露出短板:首先是知识工程成本过高,需要大量专家投入来提炼规则;其次随着业务领域复杂度提高,规则数量呈现“爆炸式增长”,维护与更新难度快速上升;更关键的是,专家系统通常缺乏自主学习能力,只能在既定规则范围内工作,难以应对未知情境。多重瓶颈叠加后,专家系统最终走向衰退,AI产业也随之进入第二次寒冬。

三、转向关键:1990-2010年,传统统计机器学习崛起

1990年至2010年间,AI技术范式完成一次重要转轨。传统统计机器学习开始登上舞台,并成为衔接连接主义早期尝试与深度学习的重要桥梁。这一范式以“用数据与统计来模拟智能”为核心,逐步减少对人工规则与浅层神经网络的依赖。其关键逻辑是:通过提取数据特征、引入概率统计建模,让机器能够从海量数据中归纳规律。

这一时期的研究力量同样十分耀眼。1997年,汤姆·米切尔(Tom M. Mitchell)出版《机器学习》(Machine Learning),以规范方式给出机器学习的形式化定义,为学科发展提供了锚点;1995年,弗拉基米尔·万普尼克(Vladimir Vapnik)与科尔特斯(Cortes)提出支持向量机(Support Vector Machine,SVM),成为当时影响力极大的算法之一;2001年,利奥·布雷曼(Leo Breiman)提出随机森林算法,成功缓解了传统决策树容易发生的过拟合问题。

从技术构成看,这一时期覆盖支持向量机、决策树、随机森林、贝叶斯分类器、隐马尔可夫模型等多种方法。其共同特点在于人工特征工程:研究者需要结合领域经验,从原始数据中筛选出有效特征,再输入模型训练。正因如此,突破不断涌现:1998年,杨立昆(Yann LeCun)提出用于手写数字识别的LeNet-5卷积神经网络,初步展示了神经网络的应用潜力;2006年,杰弗里·辛顿(Geoffrey Hinton)在《科学》(Science)发表《用神经网络降低数据维数》一文,提出深度信念网络(DBNs),为深度学习的兴起提前铺路。传统统计机器学习确实打破了专家系统的局限,使AI更能处理复杂数据;但其对人工特征提取的高度依赖以及效率瓶颈,也成为长期制约因素。

四、感知回归:2010-2018年,深度学习的强势复位

2010年至2018年,AI技术范式迎来深度学习的爆发窗口。连接主义在这一阶段重新获得生命力,并显著走向成熟。这一范式强调“用深层结构与大规模数据模拟智能”,依托海量数据的支撑与图形处理器(Graphics Processing Unit,GPU)的算力推动,构建多层神经网络,使机器能够进行相对自主的特征提取,从而让感知能力出现质的提升。

该方向的重要推动者包括杰弗里·辛顿(被誉为“深度学习之父”)、杨立昆与尤舒亚·本吉奥(Yoshua Bengio)。三人凭借在深度学习领域的开创性贡献,于2018年共同获得图灵奖。早在1997年,瑟普·霍克赖特(Sepp Hochreiter)及其导师于尔根·施密德胡伯(Jürgen Schmidhuber)就提出长短期记忆网络(Long Short-Term Memory,LSTM),用以缓解传统循环神经网络的梯度消失困境。2012年,辛顿团队在ImageNet图像识别竞赛中依靠深度卷积神经网络(Convolutional Neural Network,CNN)夺冠,准确率显著超过传统方案,标志着深度学习正式进入更广泛的应用落地阶段。

此阶段的核心技术包括卷积神经网络(CNN)、循环神经网络(Recurrent Neural Network,RNN)、长短期记忆网络(LSTM)等。与此同时,神经网络的层数从早期的少量层加速跃迁到几十层甚至上百层;GPU的并行计算能力也破解了深层网络训练的算力瓶颈,而大数据的累积为模型训练提供了足够“养料”。重要事件同样接连出现:AlphaGo的前身研究为强化学习突破奠定了铺垫;语音识别与自然语言处理(Natural Language Processing,NLP)逐步走向商业化,苹果Siri、谷歌翻译等产品开始进入日常生活。

到这一阶段,AI已经具备“看得懂、听得清、识得出”的感知能力,但限制仍然存在——它更多停留在感知任务上,难以完成真正的生成式创作,也难以稳定理解事物之间的因果关系。

五、决策跨越:2015-2020年,强化学习形成独立分支

2015年至2020年间,强化学习(Reinforcement Learning,RL)从深度学习的体系中进一步脱颖而出,发展为更独立的技术方向。它实现了从“识别”迈向“决策与行动”的关键跨越,并成为AI技术范式中的重要分支。其核心思想是:智能体通过与环境持续互动进行试错,通过奖励机制驱动策略持续改进,本质可理解为“用交互与奖励模拟智能”。

该范式的重要代表人物包括理查德·萨顿(Richard Sutton)与安德鲁·巴托(Andrew Barto)。1998年,两人合著《强化学习导论》(Reinforcement Learning: An Introduction),把行为主义的工程实践上升为更完整的理论体系,为后续强化学习的系统化发展奠定基础;1988年,萨顿提出并完善时序差分学习算法(Temporal Difference Learning,TD(λ));1989年,克里斯·沃特金斯(Chris Watkins)提出Q学习算法,讨论了其收敛性问题,为算法走向实际提供了更可靠的支撑。

这一时期的关键技术包括Q学习、时序差分学习、策略梯度类方法等。其核心机制在于突出智能体与环境之间的动态交互,通过“试错—反馈—优化”的闭环,逐步获得更优的决策策略。2016年,谷歌深度思维(DeepMind)研发的阿尔法围棋(AlphaGo)击败世界冠军李世石,其系统架构结合了卷积神经网络(Convolutional Neural Network,CNN)(用于学习棋局特征)与强化学习(通过自我对弈优化策略),成为强化学习落地的象征性事件。同年,开放人工智能(OpenAI)推出开放人工智能训练平台(OpenAI Gym),为强化学习研究与评测提供了更标准的环境支持,促进其在机器人决策、自动驾驶规划等领域的应用。2025年,安德鲁·巴托与理查德·萨顿因在强化学习方面的开创性贡献获得图灵奖,也说明这一路线在学界获得了更高层级的认可。

六、创造浪潮:2020-2024年,生成式AI加速崛起

2020年至2024年间,生成式人工智能(Generative AI)迅速扩张,成为AI技术范式的新突破,使AI从“识别者”向“创造者”转型。其核心思路是采用转换器(Transformer)架构,从语言、图像、音频等多模态数据进行生成,并具备一定程度的逻辑推理能力;本质可概括为“借助大模型与多模态技术模拟创造性智能”。

这一阶段的重要推动者包括开放人工智能(OpenAI)的山姆·奥特曼(Sam Altman),以及谷歌(Google)“转换器八子”(Noam Shazeer、Jakob Uszkoreit等八位研究者)。2017年,谷歌的八位研究人员发表论文《你所需要的是注意力》(Attention Is All You Need),系统提出Transformer架构,针对循环神经网络(Recurrent Neural Network,RNN)处理长文本的核心瓶颈实现了关键突破,为生成式AI的诞生提供了坚实技术支架。

此阶段的核心技术就是Transformer架构。具体而言,通过自注意力机制,模型能够捕捉文本、图像等数据中的长距离依赖关系,再结合大规模预训练与微调方法,实现多模态生成能力的提升。重大进展也持续出现:2020年,OpenAI发布生成式预训练Transformer(Generative Pre-trained Transformer,GPT)系列模型,从GPT-3起参数规模突破千亿级,语言生成能力显著增强;2022年,稳定扩散(Stable Diffusion)问世,带来高质量图像生成。百度文心一言、阿里通义千问等国产大模型也相继登场,推动生成式AI在本土场景中的落地与普及。

在这一阶段,AI已经具备“会说、会写、会画、会进行基础逻辑推理”的能力(例如龙虾OpenClaw的AI Agent)。它开始广泛渗透内容创作、客服对话、代码生成等领域,进而深刻影响人们的生产与生活方式。

七、认知跃迁:2024年至今,世界模型的全新探索

2024年至今,AI技术范式进入世界模型(World Model)阶段,实现了从“懂语言”向“理解世界如何运行”的跨越式提升。其关键思想在于:让AI学习物理世界的规律、掌握事物之间的因果关系与时空变化逻辑,从而能够模拟真实环境、预测未来场景;本质可理解为“用世界规律来模拟智能”。

这一范式的核心力量包括开放人工智能(OpenAI)、谷歌(Google)等,关键技术是世界模型算法。方法上,AI通过融合图像、视频、传感器等多模态数据,建立对物理世界的抽象认知:能够模拟物体运动轨迹、推测环境变化趋势,甚至在一定程度上“想象”尚未发生的情景。进展同样值得关注:OpenAI推出世界模型,Google发布精灵(Genie)物理仿真模型,各类基于世界模型的物理仿真系统陆续落地,并在自动驾驶、机器人操作、气象预测等方向发挥作用。世界模型的出现,使AI不再过度依赖“喂数据”,而能依托对世界的理解做出决策与预测,从而成为迈向通用人工智能(Artificial General Intelligence,AGI)的重要一步。

从技术路线差异看,抽象表征路线以AMI Labs、Meta等为代表,侧重在潜在空间中预测抽象结构:因果推理更强、算力消耗相对低、可解释性也更好,但视觉输出的直观表现可能不足,内容创作能力也会受限。像素生成路线由OpenAI、NVIDIA领衔,主打更高逼真度的像素与3D画面生成、物理模拟效果更突出,适合内容生产;不足之处在于算力需求更高、因果逻辑相对弱,且长时序建模难度更大。空间智能路线以World Labs、腾讯等为代表,强调对3D空间与物体关联的原生理解,工程落地更贴合游戏与机器人领域,但短板在实时交互表现与计算复杂度方面。

八、知行合一:具身智能与世界模型同步演进

与世界模型并行发展的,是具身智能(Embodied AI)。它并非与主线无关的分支,而是与世界模型相互补充、协同推进。具身智能的核心在于让AI拥有“虚拟或物理身体”,从而进入真实世界完成感知、移动、操作与交互;把世界模型的“认知”进一步落实为可执行的“行动”。

如果说世界模型更像AI的“认知之脑”,那么具身智能就是AI的“行动之身”。具身智能的想法最早可追溯到1950年图灵在《计算机器与智能》(Computing Machinery and Intelligence)中的构想,只是长期因技术条件不足而被暂时搁置。1986年,罗德尼·布鲁克斯(Rodney Brooks)从控制论视角提出智能的具身化与情境化强调,为具身智能的推进点亮方向。

代表性进展也持续出现:2024年,OpenAI与人形机器人初创公司菲戈(Figure)合作推出Figure 01机器人;同年在成都世园会展出的物流机器人、消毒机器人等应用,让具身智能进入公众视野;2025年,具身智能入选“2024年度十大科技名词”,同时在政府工作报告中明确提出培育具身智能等未来产业,显示其正加快走向产业化阶段。其核心技术涉及机器人硬件、传感器融合、运动控制等,重点在于将世界模型的认知能力与机器人的物理操作深度耦合,使AI能够在真实场景中独立完成更复杂的任务——从家庭服务到工业操作,价值呈现出多元扩展的趋势。

九、未来设想:AGI与ASI的终局追寻

面向未来,AI技术范式将持续朝通用人工智能(Artificial General Intelligence,AGI)与超人工智能(Artificial Superintelligence,ASI)方向推进,去抵达更远的智能边界。

通用人工智能的关键在于让AI具备跨领域的自主学习能力、通用推理能力以及自我规划能力,其智能水平可与人类相当,能够胜任人类全部脑力劳动。1997年,马克·古布鲁德(Mark Gubrud)首次在学术讨论中使用“通用人工智能(AGI)”这一术语;2007年,本·戈策尔(Ben Goertzel)出版《通用人工智能》(Artificial General Intelligence),使该概念进一步走向主流。2026年,谷歌深度思维(DeepMind)负责人德米斯·哈萨比斯(Demis Hassabis)提出“爱因斯坦测试”,为通用人工智能的判断提供了新的标尺——限制知识在1911年以前,观察AI能否独立推导出1915年的广义相对论;若能达成,就意味着接近通用人工智能门槛。

超人工智能则被视为AI发展的终极形态,其核心在于让机器的智能水平在认知、创造、科研等各方面全面超过人类,成为压倒性的“最强大脑”。2014年,牛津大学哲学家尼克·博斯特罗姆(Nick Bostrom)在《超级智能》(Superintelligence)一书中系统界定超人工智能(ASI),并将其分为速度型、质量型、集体型三类,为人类理解“AI的终局可能性”提供了思考框架。超人工智能是否会真的到来,仍是一个引人入胜且充满争议的问题。

十、结语

从三大主义的理论奠基,到世界模型与具身智能的协同共生;从浅层学习的探索尝试,到深度技术的迅猛崛起;AI技术范式的每一次演进,既是人类对智能本质理解不断加深的结果,也是技术突破与真实需求相互推动的体现。底层根基的三大主义、用于落地过渡的专家系统与传统机器学习、现代逐步成型的深度学习与强化学习、当前爆发的生成式AI与世界模型,以及面向未来的通用人工智能与超人工智能,这条清晰脉络不仅记录了AI七十余年的成长轨迹,也预示着人工智能将进一步深度融入社会,持续重塑生产与生活方式,开启一个充满无限可能的智能新时代。

当下更关键的并非是AI是否会让人惊喜,而在于:你是否愿意认真对待这场技术革命,并敢于把握其中蕴含的无限可能,否则就可能在风险与机遇交织的转折点错过未来。