AI、机器学习与数据驱动：概念厘清与边界划分

发布时间：2026-07-02 10:34阅读：2

我有的时候会有一种困惑：在我们控制领域里面用到的“基于数据”的建模、故障诊断与预测控制，属于人工智能的范畴吗？

“机器学习”、“神经网络”、“大模型”这些热词在控制领域里面怎么理解，彼此是什么关系？

一、机器学习的范畴

在控制、信号、过程工业等领域里，凡是“基于数据”的建模、辨识与预测方法，绝大多数在数学本质上就是机器学习，因而也属于广义的人工智能。之所以让人觉得陌生，并不是因为它们是新东西，而是因为控制、统计、计算机（人工智能）这三个学科在历史上长期各自发展，在不同的会议和期刊里把高度重叠的方法起了不同的名字。换句话说，问题往往不在于“数据驱动到底算不算人工智能”，而在于“同一类方法被三个圈子起了三套名字”。理解了这一点，后面的所有热词就都能各归各位。

二、套娃式的从属关系：四个热词如何层层包含

先把最常被混用的四个词的关系定下来。可以把它们想象成一组俄罗斯套娃，从大到小层层嵌套。最外层是人工智能（AI），它是一个很大的筐，泛指一切让机器表现出“智能”的方法。历史上它有两条主要路线：

一条是符号主义，也叫知识驱动，靠人把知识和规则明确地写进系统，典型代表是专家系统与逻辑推理，它本身并不“学习”；

另一条就是机器学习，让机器自己从数据里把规律学出来。

机器学习内部，有一类专门的模型叫神经网络，它本质上是由大量“神经元”级联而成的函数。把神经网络的层数堆得很深，再配上大数据与大算力，就成了深度学习；今天最受瞩目的大模型（如 GPT、Claude 这一类）正是深度学习里的一个分支。于是这四个词构成一条严格的包含链：深度学习 ⊂ 神经网络 ⊂ 机器学习 ⊂ 人工智能（见图 1）。每一个热词，都是它前一个词的子集——这正是“机器学习属于人工智能”这句话成立的原因，但它也只是其中一层而已。

图 1人工智能、机器学习、神经网络、深度学习的层层包含关系；符号主义是人工智能中不依赖“学习”的另一条路线，统计学则与机器学习大面积重叠。

这里还要补一个常被忽略的角色：统计学。

机器学习与统计学是大面积重叠、谁也不完全包含谁的关系——线性回归、逻辑回归既属于统计，也属于机器学习。统计学家 Leo Breiman 有一篇著名的文章《统计建模：两种文化》，讲的正是这两个圈子在做同一件事却各说各话。所以在图 1 里，统计学被画成一个与机器学习大半交叠、又探出人工智能之外的椭圆。

三、关键的一步：控制里的“数据驱动”≈机器学习，只是换了行话

这是化解困惑的核心。控制、统计、人工智能三个学科平行发展，发明了大量高度重叠的方法，名字却互不相同。几组直接的对应关系最能说明问题。你所熟悉的系统辨识——从输入输出数据辨识出传递函数或状态空间模型——本质上就是“从数据里学一个模型”，这正是机器学习里监督学习与回归在做的事；辨识一个 ARX 模型，数学上就是对时间序列做线性回归；子空间辨识所依赖的奇异值分解（SVD）与投影，和主成分分析（PCA）是同一套数学。

在数据驱动的故障诊断里常用的 PCA、PLS 以及统计过程监控（SPC / MSPC），本身就是标准的机器学习方法（无监督或有监督的降维与分类），只是过程工业与控制界很早就在用，没把它叫作“人工智能”而已。再看数据驱动预测控制这条线：从经典的动态矩阵控制（DMC，基于阶跃响应数据），到子空间预测控制，再到近年的数据驱动预测控制（DeePC），直至用强化学习来做控制——越往后越“人工智能”，而强化学习更是公认的机器学习与人工智能的核心分支。图 3 把这些对应关系并排列出。

图 3控制（统计）圈与机器学习圈对同一类方法的不同称呼。左右两栏指向的，往往就是同一件事。

把这条线想透，结论便很清楚：真正的问题不是“数据驱动算不算人工智能”，而是“我早就在用机器学习，只不过控制圈给它起了‘系统辨识、数据驱动’这套别名”。

四、基于模型 vs 基于数据

控制专业最熟悉的一条分界线——基于模型与基于数据——其实是整个工程科学里最根本的一条轴线，而人工智能圈也有完全对应的分法，只是叫法不同。

基于模型，又称机理建模或白箱，是从物理定律出发写出微分方程、状态空间模型；故障诊断用观测器、奇偶方程、残差生成，预测控制（MPC）则用机理模型预测未来再做滚动优化。

基于数据，又称经验建模、黑箱或灰箱，不需要显式的机理，直接从数据里学出输入与输出之间的关系——这一整列，数学上就是机器学习（见图 2）。

图 2“基于模型”与“基于数据”是贯穿工程科学与人工智能的同一条根本轴线；右侧一整列在数学上就是机器学习。

这意味着，人工智能圈里许多让人发怵的热词，对于学控制的朋友而言并不是全新的概念，而是换了马甲的老朋友。

五、神经网络与深度学习：万能逼近器及其规模化

神经网络可以理解为一类“万能函数逼近器”：给足够多的神经元和足够多的数据，它几乎能逼近任意非线性映射。它在控制领域早有应用——用神经网络辨识被控对象的非线性动态（即神经网络辨识或 NARX 模型）、神经网络控制与神经自适应控制，以及在故障诊断中把神经网络当作分类器。深度学习则只是“很深的神经网络，是“很深的神经网络，加上现代训练技巧，再加上大数据与大算力”。

需要特别说明的是：真正点燃这一轮人工智能热潮的，主要是深度学习的规模化，尤其是生成式模型与大语言模型那一小块，而不是“基于数据做预测”这件事本身。后者几十年前就已存在，它与今天的大模型同根同源，却并不是同一个东西。把这一点想清楚，就不会因为“大模型很火”而误以为自己多年来做的数据驱动方法“不算人工智能”。

六、“基于数据的预测算不算人工智能”：两层答案

这个问题之所以让人犯晕，是因为“人工智能”一词在日常里有两种用法，必须分开来看。

第一层是技术定义：只要是从数据里学出规律、再用于预测或决策，它就是机器学习，而机器学习是人工智能的子集——按这个标准，答案基本是“算”。

第二层是日常与营销语境：人们嘴上说的“人工智能”，常常特指深度学习、神经网络、大模型那一小撮最时髦的技术。一个用线性回归预测销量的模型，技术上是最简单的监督学习，但很少有人在口语里管它叫“人工智能”；同理，用 PCA 做故障诊断技术上属于机器学习，日常也未必会被称作“人工智能”。

所以，当别人问“这算不算人工智能”，先分清他问的究竟是技术归属（这种意义下基本都算），还是“有没有用到神经网络、大模型那套时髦技术”（这就要看你具体用了什么方法了）。把这两层分开，很多无谓的争论自然就消解了。

七、最容易踩的术语陷阱：同一个词，不同意思

跨界的人除了会把“异名同物”当成两种东西（这正是图 3 要破除的误解），还常常在另一类陷阱上栽跟头：同一个词，在不同领域指的却是完全不同的东西。表 1 列出几个最典型的“假朋友”。理解它们，能帮你在阅读人工智能文献时少走很多弯路。

表 1跨界时最容易混淆的“一词多义”

容易混淆的词

在控制 / 信号语境里指

在机器学习语境里指

基于模型（model-based）

拥有被控对象的机理模型（微分方程、状态空间）

强化学习里 model-based / model-free 的“model”，指环境的动力学模型——同一个词，两个所指

预测（predict）

MPC 中的“预测”指预测系统未来一段时间的状态轨迹

机器学习中的“predict”指预测输出标签或数值

模型（model）

通常指被控对象本身的数学模型

在“大模型”语境里，指参数极多的神经网络本身

反过来，也有不少“异名同物”的情形：

控制里说的“辨识”，机器学习里叫“训练”或“学习”，多数时候指的就是同一件事；

控制里的“在线辨识、自适应”，与机器学习里的“在线学习”在思想上也高度一致。把“同词不同义”与“异名同物”这两类情况分清，跨学科阅读就会顺畅很多。

结语

把整张关系网收束成一句话：

人工智能 ⊃ 机器学习 ⊃ 神经网络 ⊃ 深度学习；

“基于数据”的故障诊断与预测控制，绝大多数在数学上就属于机器学习，因此也属于广义的人工智能，只是控制圈用了“系统辨识、数据驱动”这套行话。

如果你跟我一样也是学控制的，我们的专业很自然的就帮我们理解了机器学习最核心的“机理与数据”。接下来真正需要补的是深度学习与大模型那一小块的具体技术——例如反向传播、各类网络结构（卷积网络、循环网络、Transformer），以及把强化学习系统地用于控制的那套方法。

← 上一篇：AI 裁员潮后的反思：企业发现机器无法完全替代人类下一篇：萤瓴 AI 深度解析：直播新手的破局利器 →