AI、机器学习与数据驱动:概念厘清与边界划分
我有的时候会有一种困惑:在我们控制领域里面用到的“基于数据”的建模、故障诊断与预测控制,属于人工智能的范畴吗?
“机器学习”、“神经网络”、“大模型”这些热词在控制领域里面怎么理解,彼此是什么关系?
一、机器学习的范畴
在控制、信号、过程工业等领域里,凡是“基于数据”的建模、辨识与预测方法,绝大多数在数学本质上就是机器学习,因而也属于广义的人工智能。之所以让人觉得陌生,并不是因为它们是新东西,而是因为控制、统计、计算机(人工智能)这三个学科在历史上长期各自发展,在不同的会议和期刊里把高度重叠的方法起了不同的名字。换句话说,问题往往不在于“数据驱动到底算不算人工智能”,而在于“同一类方法被三个圈子起了三套名字”。理解了这一点,后面的所有热词就都能各归各位。
二、套娃式的从属关系:四个热词如何层层包含
先把最常被混用的四个词的关系定下来。可以把它们想象成一组俄罗斯套娃,从大到小层层嵌套。最外层是人工智能(AI),它是一个很大的筐,泛指一切让机器表现出“智能”的方法。历史上它有两条主要路线:
一条是符号主义,也叫知识驱动,靠人把知识和规则明确地写进系统,典型代表是专家系统与逻辑推理,它本身并不“学习”;
另一条就是机器学习,让机器自己从数据里把规律学出来。
机器学习内部,有一类专门的模型叫神经网络,它本质上是由大量“神经元”级联而成的函数。把神经网络的层数堆得很深,再配上大数据与大算力,就成了深度学习;今天最受瞩目的大模型(如 GPT、Claude 这一类)正是深度学习里的一个分支。于是这四个词构成一条严格的包含链:深度学习 ⊂ 神经网络 ⊂ 机器学习 ⊂ 人工智能(见图 1)。每一个热词,都是它前一个词的子集——这正是“机器学习属于人工智能”这句话成立的原因,但它也只是其中一层而已。
图 1人工智能、机器学习、神经网络、深度学习的层层包含关系;符号主义是人工智能中不依赖“学习”的另一条路线,统计学则与机器学习大面积重叠。
这里还要补一个常被忽略的角色:统计学。
机器学习与统计学是大面积重叠、谁也不完全包含谁的关系——线性回归、逻辑回归既属于统计,也属于机器学习。统计学家 Leo Breiman 有一篇著名的文章《统计建模:两种文化》,讲的正是这两个圈子在做同一件事却各说各话。所以在图 1 里,统计学被画成一个与机器学习大半交叠、又探出人工智能之外的椭圆。
三、关键的一步:控制里的“数据驱动”≈机器学习,只是换了行话
这是化解困惑的核心。控制、统计、人工智能三个学科平行发展,发明了大量高度重叠的方法,名字却互不相同。几组直接的对应关系最能说明问题。你所熟悉的系统辨识——从输入输出数据辨识出传递函数或状态空间模型——本质上就是“从数据里学一个模型”,这正是机器学习里监督学习与回归在做的事;辨识一个 ARX 模型,数学上就是对时间序列做线性回归;子空间辨识所依赖的奇异值分解(SVD)与投影,和主成分分析(PCA)是同一套数学。
在数据驱动的故障诊断里常用的 PCA、PLS 以及统计过程监控(SPC / MSPC),本身就是标准的机器学习方法(无监督或有监督的降维与分类),只是过程工业与控制界很早就在用,没把它叫作“人工智能”而已。再看数据驱动预测控制这条线:从经典的动态矩阵控制(DMC,基于阶跃响应数据),到子空间预测控制,再到近年的数据驱动预测控制(DeePC),直至用强化学习来做控制——越往后越“人工智能”,而强化学习更是公认的机器学习与人工智能的核心分支。图 3 把这些对应关系并排列出。
图 3控制(统计)圈与机器学习圈对同一类方法的不同称呼。左右两栏指向的,往往就是同一件事。
把这条线想透,结论便很清楚:真正的问题不是“数据驱动算不算人工智能”,而是“我早就在用机器学习,只不过控制圈给它起了‘系统辨识、数据驱动’这套别名”。
四、基于模型 vs 基于数据
控制专业最熟悉的一条分界线——基于模型与基于数据——其实是整个工程科学里最根本的一条轴线,而人工智能圈也有完全对应的分法,只是叫法不同。
基于模型,又称机理建模或白箱,是从物理定律出发写出微分方程、状态空间模型;故障诊断用观测器、奇偶方程、残差生成,预测控制(MPC)则用机理模型预测未来再做滚动优化。
基于数据,又称经验建模、黑箱或灰箱,不需要显式的机理,直接从数据里学出输入与输出之间的关系——这一整列,数学上就是机器学习(见图 2)。
图 2“基于模型”与“基于数据”是贯穿工程科学与人工智能的同一条根本轴线;右侧一整列在数学上就是机器学习。
这意味着,人工智能圈里许多让人发怵的热词,对于学控制的朋友而言并不是全新的概念,而是换了马甲的老朋友。
五、神经网络与深度学习:万能逼近器及其规模化
神经网络可以理解为一类“万能函数逼近器”:给足够多的神经元和足够多的数据,它几乎能逼近任意非线性映射。它在控制领域早有应用——用神经网络辨识被控对象的非线性动态(即神经网络辨识或 NARX 模型)、神经网络控制与神经自适应控制,以及在故障诊断中把神经网络当作分类器。深度学习则只是“很深的神经网络,是“很深的神经网络,加上现代训练技巧,再加上大数据与大算力”。
需要特别说明的是:真正点燃这一轮人工智能热潮的,主要是深度学习的规模化,尤其是生成式模型与大语言模型那一小块,而不是“基于数据做预测”这件事本身。后者几十年前就已存在,它与今天的大模型同根同源,却并不是同一个东西。把这一点想清楚,就不会因为“大模型很火”而误以为自己多年来做的数据驱动方法“不算人工智能”。
六、“基于数据的预测算不算人工智能”:两层答案
这个问题之所以让人犯晕,是因为“人工智能”一词在日常里有两种用法,必须分开来看。
第一层是技术定义:只要是从数据里学出规律、再用于预测或决策,它就是机器学习,而机器学习是人工智能的子集——按这个标准,答案基本是“算”。
第二层是日常与营销语境:人们嘴上说的“人工智能”,常常特指深度学习、神经网络、大模型那一小撮最时髦的技术。一个用线性回归预测销量的模型,技术上是最简单的监督学习,但很少有人在口语里管它叫“人工智能”;同理,用 PCA 做故障诊断技术上属于机器学习,日常也未必会被称作“人工智能”。
所以,当别人问“这算不算人工智能”,先分清他问的究竟是技术归属(这种意义下基本都算),还是“有没有用到神经网络、大模型那套时髦技术”(这就要看你具体用了什么方法了)。把这两层分开,很多无谓的争论自然就消解了。
七、最容易踩的术语陷阱:同一个词,不同意思
跨界的人除了会把“异名同物”当成两种东西(这正是图 3 要破除的误解),还常常在另一类陷阱上栽跟头:同一个词,在不同领域指的却是完全不同的东西。表 1 列出几个最典型的“假朋友”。理解它们,能帮你在阅读人工智能文献时少走很多弯路。
表 1跨界时最容易混淆的“一词多义”
容易混淆的词
在控制 / 信号语境里指
在机器学习语境里指
基于模型(model-based)
拥有被控对象的机理模型(微分方程、状态空间)
强化学习里 model-based / model-free 的“model”,指环境的动力学模型——同一个词,两个所指
预测(predict)
MPC 中的“预测”指预测系统未来一段时间的状态轨迹
机器学习中的“predict”指预测输出标签或数值
模型(model)
通常指被控对象本身的数学模型
在“大模型”语境里,指参数极多的神经网络本身
反过来,也有不少“异名同物”的情形:
控制里说的“辨识”,机器学习里叫“训练”或“学习”,多数时候指的就是同一件事;
控制里的“在线辨识、自适应”,与机器学习里的“在线学习”在思想上也高度一致。把“同词不同义”与“异名同物”这两类情况分清,跨学科阅读就会顺畅很多。
结语
把整张关系网收束成一句话:
人工智能 ⊃ 机器学习 ⊃ 神经网络 ⊃ 深度学习;
“基于数据”的故障诊断与预测控制,绝大多数在数学上就属于机器学习,因此也属于广义的人工智能,只是控制圈用了“系统辨识、数据驱动”这套行话。
如果你跟我一样也是学控制的,我们的专业很自然的就帮我们理解了机器学习最核心的“机理与数据”。接下来真正需要补的是深度学习与大模型那一小块的具体技术——例如反向传播、各类网络结构(卷积网络、循环网络、Transformer),以及把强化学习系统地用于控制的那套方法。