02: 一文厘清 AI、机器学习与深度学习的层级关系
本文是「机器学习从 0 到 1」系列的第二篇文章。继上回探讨了机器学习的定义后,本期将重点解析一个常被大众混淆的议题:AI、机器学习以及深度学习,这三者究竟有何关联?
当你浏览资讯时:
"某企业利用 AI 技术完成了癌症的初期筛查。"
接着看到:
"深度学习模型在图像辨识领域已超越人类表现。"
再看到一条:
"机器学习协助银行侦测欺诈性交易。"
三条资讯,出现了三个不同的术语。
然而,它们所指的其实是相近的技术范畴。
那么,这三个词汇究竟是否等同?
若非同物,彼此间又存在何种联系?
许多人对这三者的认知往往是:
认为它们是可以互相替换的同义词。
然而事实真相是,它们的关系呈现为:
三个同心圆,逐层包含。
深度学习隶属于机器学习,而机器学习则隶属于人工智能。
它们并非同一概念,但存在明确的从属逻辑。
本文将逐一拆解这三个圆圈的内涵。
人工智能(Artificial Intelligence,简称 AI)是范围最大的外圈。
其定义相当广泛:
泛指一切能让机器展现出某种"智能"行为的技术与方法总和。
请注意定义中的两个核心词:"机器"与"智能行为"。
究竟何为"智能行为"?
会下棋算吗?能对话算吗?能辨识面孔算吗?
此问题尚存争议。但通常我们所指的"智能行为"涵盖:
人工智能这一概念,早在 1956 年便已提出。
彼时既无大数据,也无 GPU,计算机算力极为匮乏。
因此早期的 AI,依赖的并非数据,而是规则与逻辑。
早期曾流行一种称为专家系统的 AI。
其做法是:邀请一批领域专家(如医师),将其知识整理为规则,编入程序中。
例如一套医疗诊断专家系统,内部可能内含数千条规则:
此类方式在特定领域曾十分奏效。
但它存在一个致命缺陷:
规则由人编写,人能写出多少规则,系统便只能处理多少情境。
一旦遭遇规则未覆盖的状况,系统便束手无策。
现实世界过于复杂,人类无法编写出足以涵盖所有情况的规则。
AI 的首次热潮,便因此逐渐消退。
随后,随着数据量激增与算力提升,一种新思维开始兴起:
与其让人类编写规则,不如让机器自行从数据中学习规则。
这便是机器学习。
机器学习(Machine Learning,简称 ML)是 AI 大圈中的一个子集。
其核心思想前文已述及:
非由人写规则,而是让机器从数据里归纳规律,并利用规律进行预测。
机器学习让 AI 真正变得"实用"。
垃圾邮件过滤、推荐系统、信用评分、图像分类……
这些如今习以为常的应用,背后多由机器学习驱动。
机器学习并非单一算法,而是一大类方法的集合体。
常见的包括:
这些算法具备一个共性:
它们大多依赖人工设计的特征。
何谓"人工设计的特征"?
举例来说:若想用机器学习识别猫的图片。
你需先告知程序:去观察图片的颜色分布、边缘轮廓、纹理模式……
这些"观察重点"的信息由人来设计,再交给模型去学习。
这在许多场景中效果显著。
但面对某些复杂难题,如语音识别、自然语言理解、高分辨率图像处理……
人工设计特征变得愈发困难,甚至无法实现。
此时,深度学习应运而生。
深度学习(Deep Learning,简称 DL)是机器学习圈内的一个子集。
其核心工具为神经网络——一种受人类大脑结构启发的计算模型。
深度学习的最大突破在于:无需人工设计特征,它能直接从原始数据中学习特征。
仍以识别猫为例。
传统机器学习:你指定程序关注哪些特征 → 程序学习这些特征与"猫"的关联。
深度学习:你将原始图片直接输入神经网络 → 它自行决定关注何种特征 → 自主学习与"猫"的关系。
此差异看似细微,影响却极其深远。
由于深度学习将"特征提取"这一步也实现了自动化,因此其能处理的问题复杂度大幅提升。
这是因为神经网络是由一层层结构堆叠而成。
层数越多,网络越"深",所能学习的模式便越复杂。
"深度学习"中的"深度"二字,指的正是这种层数的深度。
深度学习的基本理念,其实早在数十年前便已萌芽。
但它需要两个条件才能真正释放威力:
条件一:海量数据
神经网络需要庞大数数据才能训练得当。互联网兴起后,此条件方得满足。
条件二:强劲算力
神经网络的训练计算量极大。GPU 的发展使其成为可能。
2012 年,名为 AlexNet 的深度学习模型,在图像识别竞赛中以压倒性优势击败了所有传统机器学习方法。
自那一年起,深度学习进入了爆发式增长期。
仅看定义或许仍显抽象。
我举个类比助您记忆三者关系。
试想交通工具这一大类:
交通工具是最大概念——所有能运送人或货物的器具皆属此类。
汽车是交通工具的一种——是目前最普及、最常用的类型。
特斯拉电动车是汽车的一种——是近年最热门、性能最强的代表。
对应到我们的三个概念:
这个类比还能助您理解另一要点:
特斯拉属于汽车,但并非所有汽车都是特斯拉。
同理:
深度学习属于机器学习,但并非所有机器学习都是深度学习。
若您用随机森林预测用户流失,这是机器学习,但非深度学习。
若您用 BERT 进行文本情感分析,这既是深度学习,也是机器学习,更是 AI。
说了这么多,您或许有个最实际的问题:
我该先学 AI、机器学习,还是深度学习?
我的建议是:先掌握经典机器学习,再拓展至深度学习。
原因有三:
深度学习训练需大量数据与算力,调试难度也更高。
经典机器学习算法(如线性回归、决策树、随机森林):
并非所有问题都需深度学习。
预测用户流失、预估商品销量、识别欺诈交易……
这些典型业务问题,经典机器学习通常能给出优异结果。
甚至在许多场景下,经典机器学习优于深度学习——因为数据量未必巨大,且模型更易解释。
深度学习中的许多概念,在经典机器学习中已有雏形:
先学经典机器学习,理解这些概念后,再学深度学习会顺畅许多。
反之,若直接攻读深度学习,会有大量概念不知来源,学起来十分吃力。
本系列将陪您走完前两步。
夯实此基础,日后无论朝哪个方向发展,都会轻松许多。
我们用这张图来铭记今日内容:
三句话牢记三者关系:
深度学习 是 机器学习 的一种 机器学习 是 人工智能 的一种 但它们并非同一事物
另附一张对比表,助您快速掌握三者核心差异:
理清了这三个概念的关系,您可能又冒出个问题:
那我要学机器学习,需具备什么基础?数学要学到何种程度?Python 要掌握到哪?我目前的基础够起步吗?
下一篇,我将为您彻底厘清此问题。
不同背景者需补充的内容各异。我会分情况提供一套可直接执行的学习路径。
若本文对您有益,欢迎转发给同样被这三个词困扰的朋友。
您初次听闻"深度学习"这个词是何时?当时感受如何?欢迎在评论区交流。