标签

02: 一文厘清 AI、机器学习与深度学习的层级关系

发布时间:2026-05-26 06:16来源:微信阅读:5

本文是「机器学习从 0 到 1」系列的第二篇文章。继上回探讨了机器学习的定义后,本期将重点解析一个常被大众混淆的议题:AI、机器学习以及深度学习,这三者究竟有何关联?

当你浏览资讯时:

"某企业利用 AI 技术完成了癌症的初期筛查。"

接着看到:

"深度学习模型在图像辨识领域已超越人类表现。"

再看到一条:

"机器学习协助银行侦测欺诈性交易。"

三条资讯,出现了三个不同的术语。

然而,它们所指的其实是相近的技术范畴。

那么,这三个词汇究竟是否等同?

若非同物,彼此间又存在何种联系?

许多人对这三者的认知往往是:

认为它们是可以互相替换的同义词。

然而事实真相是,它们的关系呈现为:

三个同心圆,逐层包含。

深度学习隶属于机器学习,而机器学习则隶属于人工智能。

它们并非同一概念,但存在明确的从属逻辑。

本文将逐一拆解这三个圆圈的内涵。

人工智能(Artificial Intelligence,简称 AI)是范围最大的外圈。

其定义相当广泛:

泛指一切能让机器展现出某种"智能"行为的技术与方法总和。

请注意定义中的两个核心词:"机器"与"智能行为"。

究竟何为"智能行为"?

会下棋算吗?能对话算吗?能辨识面孔算吗?

此问题尚存争议。但通常我们所指的"智能行为"涵盖:

人工智能这一概念,早在 1956 年便已提出。

彼时既无大数据,也无 GPU,计算机算力极为匮乏。

因此早期的 AI,依赖的并非数据,而是规则与逻辑。

早期曾流行一种称为专家系统的 AI。

其做法是:邀请一批领域专家(如医师),将其知识整理为规则,编入程序中。

例如一套医疗诊断专家系统,内部可能内含数千条规则:

此类方式在特定领域曾十分奏效。

但它存在一个致命缺陷:

规则由人编写,人能写出多少规则,系统便只能处理多少情境。

一旦遭遇规则未覆盖的状况,系统便束手无策。

现实世界过于复杂,人类无法编写出足以涵盖所有情况的规则。

AI 的首次热潮,便因此逐渐消退。

随后,随着数据量激增与算力提升,一种新思维开始兴起:

与其让人类编写规则,不如让机器自行从数据中学习规则。

这便是机器学习。

机器学习(Machine Learning,简称 ML)是 AI 大圈中的一个子集。

其核心思想前文已述及:

非由人写规则,而是让机器从数据里归纳规律,并利用规律进行预测。

机器学习让 AI 真正变得"实用"。

垃圾邮件过滤、推荐系统、信用评分、图像分类……

这些如今习以为常的应用,背后多由机器学习驱动。

机器学习并非单一算法,而是一大类方法的集合体。

常见的包括:

这些算法具备一个共性:

它们大多依赖人工设计的特征。

何谓"人工设计的特征"?

举例来说:若想用机器学习识别猫的图片。

你需先告知程序:去观察图片的颜色分布、边缘轮廓、纹理模式……

这些"观察重点"的信息由人来设计,再交给模型去学习。

这在许多场景中效果显著。

但面对某些复杂难题,如语音识别、自然语言理解、高分辨率图像处理……

人工设计特征变得愈发困难,甚至无法实现。

此时,深度学习应运而生。

深度学习(Deep Learning,简称 DL)是机器学习圈内的一个子集。

其核心工具为神经网络——一种受人类大脑结构启发的计算模型。

深度学习的最大突破在于:无需人工设计特征,它能直接从原始数据中学习特征。

仍以识别猫为例。

传统机器学习:你指定程序关注哪些特征 → 程序学习这些特征与"猫"的关联。

深度学习:你将原始图片直接输入神经网络 → 它自行决定关注何种特征 → 自主学习与"猫"的关系。

此差异看似细微,影响却极其深远。

由于深度学习将"特征提取"这一步也实现了自动化,因此其能处理的问题复杂度大幅提升。

这是因为神经网络是由一层层结构堆叠而成。

层数越多,网络越"深",所能学习的模式便越复杂。

"深度学习"中的"深度"二字,指的正是这种层数的深度。

深度学习的基本理念,其实早在数十年前便已萌芽。

但它需要两个条件才能真正释放威力:

条件一:海量数据

神经网络需要庞大数数据才能训练得当。互联网兴起后,此条件方得满足。

条件二:强劲算力

神经网络的训练计算量极大。GPU 的发展使其成为可能。

2012 年,名为 AlexNet 的深度学习模型,在图像识别竞赛中以压倒性优势击败了所有传统机器学习方法。

自那一年起,深度学习进入了爆发式增长期。

仅看定义或许仍显抽象。

我举个类比助您记忆三者关系。

试想交通工具这一大类:

交通工具是最大概念——所有能运送人或货物的器具皆属此类。

汽车是交通工具的一种——是目前最普及、最常用的类型。

特斯拉电动车是汽车的一种——是近年最热门、性能最强的代表。

对应到我们的三个概念:

这个类比还能助您理解另一要点:

特斯拉属于汽车,但并非所有汽车都是特斯拉。

同理:

深度学习属于机器学习,但并非所有机器学习都是深度学习。

若您用随机森林预测用户流失,这是机器学习,但非深度学习。

若您用 BERT 进行文本情感分析,这既是深度学习,也是机器学习,更是 AI。

说了这么多,您或许有个最实际的问题:

我该先学 AI、机器学习,还是深度学习?

我的建议是:先掌握经典机器学习,再拓展至深度学习。

原因有三:

深度学习训练需大量数据与算力,调试难度也更高。

经典机器学习算法(如线性回归、决策树、随机森林):

并非所有问题都需深度学习。

预测用户流失、预估商品销量、识别欺诈交易……

这些典型业务问题,经典机器学习通常能给出优异结果。

甚至在许多场景下,经典机器学习优于深度学习——因为数据量未必巨大,且模型更易解释。

深度学习中的许多概念,在经典机器学习中已有雏形:

先学经典机器学习,理解这些概念后,再学深度学习会顺畅许多。

反之,若直接攻读深度学习,会有大量概念不知来源,学起来十分吃力。

本系列将陪您走完前两步。

夯实此基础,日后无论朝哪个方向发展,都会轻松许多。

我们用这张图来铭记今日内容:

三句话牢记三者关系:

深度学习 是 机器学习 的一种 机器学习 是 人工智能 的一种 但它们并非同一事物

另附一张对比表,助您快速掌握三者核心差异:

理清了这三个概念的关系,您可能又冒出个问题:

那我要学机器学习,需具备什么基础?数学要学到何种程度?Python 要掌握到哪?我目前的基础够起步吗?

下一篇,我将为您彻底厘清此问题。

不同背景者需补充的内容各异。我会分情况提供一套可直接执行的学习路径。

若本文对您有益,欢迎转发给同样被这三个词困扰的朋友。

您初次听闻"深度学习"这个词是何时?当时感受如何?欢迎在评论区交流。