名实不符的 AI 始祖：源自猫脑的算法为何称为卷积网络？

发布时间：2026-06-09 00:07阅读：29

Convolutional Neural Network 这一称谓并非在创立之初便已确立，卷积一词更是横跨数学、神经科学及信号处理三大学科的跨领域命名。

下文将梳理 CNN 的完整渊源，解析仿照猫视觉的 Neocognitron 为何未能成为 CNN 的通用名称？

1959 年，哈佛大学的 Hubel 与 Wiesel 在麻醉猫身上进行视觉皮层电生理实验，意外发现了两类视觉神经元：

简单细胞 S 仅关注极小视野区域，锁定边缘、横线及直角。复杂细胞 C 则能整合多个简单细胞的信号，即便物体位置变动也能完成识别。这构成了后来神经网络的核心概念：局部感受野与平移不变性，二人亦因此荣获 1981 年诺贝尔奖。

彼时这套生物机制尚无任何人工智能相关的命名，二十年后日本学者福岛邦彦关注此生理结构，于 1979 年构建了初代原型机，命名为 Neocognitron 新认知机。其中 S 层是卷积的前身，C 层则是池化的雏形。但因缺乏反向传播机制，仅能进行无监督自学，无法利用标注数据训练，只能视为 CNN 的雏形。

1987 至 1988 年间出现的两个过渡模型，是将卷积概念植入神经网络的关键节点：

1987 年 TDNN（时延神经网络），Hinton 团队首次将一维数学卷积引入神经网络，用于处理时序音频，证实了权值共享可压缩参数量。其名称 Time Delay 直译为时延。

1988 年 SIANN（平移不变神经网络），华裔学者张伟构建了二维图像卷积网络，应用于医学病灶识别，命名围绕 Shift-Invariant 平移不变，依然回避了 Convolution 一词。

至此卷积已成为网络核心运算，但业界习惯依据其功能时延或平移不变特性命名，无人将卷积作为大类名称。

随后 LeCun 整合了前人成果，结合了福岛 Neocognitron 的层级架构、TDNN 的卷积运算以及反向传播 BP 算法，用于识别美国邮政的手写邮编。

他摒弃了沿用认知机或时延网络等功能性命名思路，直接以网络最核心的数学操作 Convolution 定名：Convolutional Neural Network，缩写为 CNN。

许多初学者一见到卷积便感到头疼，本质上是因名称中的数学词汇而却步。抛开数学定义，CNN 之所以被称为卷积，是因为它利用一套固定的小模板——卷积核，在图像上逐格滑动以抓取同类特征，这与人类眼睛逐层寻找轮廓和细节的机制完全同源。猫的视觉细胞天生就具备活体卷积特性。

英文 CNN 定名于 1989 年，但中文“卷积”二字并非直接翻译而来。该词源自我国五六十年代信号处理学科的译名，Convolution 早年在通信领域被译为褶积，90 年代人工智能引入时，国内计算机与数学学界统一确立卷积为中文名称并沿用至今。

← 上一篇：AI创作热潮背后的思考：意义究竟在哪里？下一篇：鞋王3亿豪掷AI数据，千百度双主业格局成型 →