标签

名实不符的 AI 始祖:源自猫脑的算法为何称为卷积网络?

发布时间:2026-06-09 00:07来源:微信阅读:2

Convolutional Neural Network 这一称谓并非在创立之初便已确立,卷积一词更是横跨数学、神经科学及信号处理三大学科的跨领域命名。

下文将梳理 CNN 的完整渊源,解析仿照猫视觉的 Neocognitron 为何未能成为 CNN 的通用名称?

1959 年,哈佛大学的 Hubel 与 Wiesel 在麻醉猫身上进行视觉皮层电生理实验,意外发现了两类视觉神经元:

简单细胞 S 仅关注极小视野区域,锁定边缘、横线及直角。复杂细胞 C 则能整合多个简单细胞的信号,即便物体位置变动也能完成识别。这构成了后来神经网络的核心概念:局部感受野与平移不变性,二人亦因此荣获 1981 年诺贝尔奖。

彼时这套生物机制尚无任何人工智能相关的命名,二十年后日本学者福岛邦彦关注此生理结构,于 1979 年构建了初代原型机,命名为 Neocognitron 新认知机。其中 S 层是卷积的前身,C 层则是池化的雏形。但因缺乏反向传播机制,仅能进行无监督自学,无法利用标注数据训练,只能视为 CNN 的雏形。

1987 至 1988 年间出现的两个过渡模型,是将卷积概念植入神经网络的关键节点:

1987 年 TDNN(时延神经网络),Hinton 团队首次将一维数学卷积引入神经网络,用于处理时序音频,证实了权值共享可压缩参数量。其名称 Time Delay 直译为时延。

1988 年 SIANN(平移不变神经网络),华裔学者张伟构建了二维图像卷积网络,应用于医学病灶识别,命名围绕 Shift-Invariant 平移不变,依然回避了 Convolution 一词。

至此卷积已成为网络核心运算,但业界习惯依据其功能时延或平移不变特性命名,无人将卷积作为大类名称。

随后 LeCun 整合了前人成果,结合了福岛 Neocognitron 的层级架构、TDNN 的卷积运算以及反向传播 BP 算法,用于识别美国邮政的手写邮编。

他摒弃了沿用认知机或时延网络等功能性命名思路,直接以网络最核心的数学操作 Convolution 定名:Convolutional Neural Network,缩写为 CNN。

许多初学者一见到卷积便感到头疼,本质上是因名称中的数学词汇而却步。抛开数学定义,CNN 之所以被称为卷积,是因为它利用一套固定的小模板——卷积核,在图像上逐格滑动以抓取同类特征,这与人类眼睛逐层寻找轮廓和细节的机制完全同源。猫的视觉细胞天生就具备活体卷积特性。

英文 CNN 定名于 1989 年,但中文“卷积”二字并非直接翻译而来。该词源自我国五六十年代信号处理学科的译名,Convolution 早年在通信领域被译为褶积,90 年代人工智能引入时,国内计算机与数学学界统一确立卷积为中文名称并沿用至今。