从机械记忆到概念生成:AI智能的新突破
当你看到一个红苹果时,大脑会立刻识别出“苹果”这个词,同时联想到“甜、脆、水果”等特征。即使没有实物在场,你也能清楚地告诉他人“请帮我买个苹果”,而对方绝不会误解成别的东西。这正是人类智能的高明之处:我们能将视觉信息压缩为简洁的符号(即概念),并随时调用这些概念进行交流和推理。而如今的AI虽然能通过大量图片学会识别苹果,但若问“苹果和香蕉有什么共同点”,它可能会说“都是水果”,但这个答案只是从文字统计中得来,实际上它并没有在脑中形成“水果”这个抽象概念。因此,科学家认为:概念的形成和理解,才是智能的关键,而AI尚未掌握。 一个名为CATS Net的“概念相机”模型 最近,中国科学院自动化研究所等团队在《自然·计算科学》上发表了一项研究,他们设计了一种叫作CATS Net的神经网络,专门用于解决概念理解问题。 该模型的设计出人意料地简洁,但思想却很巧妙:将“概念”从模型参数中“提取”出来,形成一个独立的模块。 CATS Net包含两个部分: 概念抽象(CA)模块:就像一个“压缩器”,将高维视觉信息(比如一张猫的图片)压缩成一个几十维的“概念向量”——这是AI对“猫”的内部编码。 任务求解(TS)模块:像一个“执行者”,负责处理具体任务(比如判断图片里是不是猫)。 关i键机制是门控:概念向量不是简单的标签,而是像一把把“钥匙”,能打开不同的“计算通道”。当你输入“猫”的概念时,网络会切换到猫的判断模式;输入“车”,则切换到车的模式。同一个图像,概念不同,判断结果就不同。 这就像你手机里装了多个滤镜:概念就是选择滤镜的那个“旋钮”。 概念是“长”出来的,不是预设的 更厉害的是,这些概念不是人工定义的,而是模型自己从数据中“长”出来的。训练时,模型同时学习网络参数和概念向量,结果概念空间自发形成了有语义结构的小宇宙——动物、家具、交通工具自动聚成不同的群落。而且,这个概念空间与人类心理学的语义模型高度一致。 换句话说,模型自己悟出了“猫和狗都是动物,桌子和椅子都是家具”。这比死记硬背高级多了。 最惊艳:概念可以“隔空传送” 研究团队还做了一个脑洞实验:训练两个网络,一个(老师)学习全部类别,另一个(学生)故意漏掉“苹果”这个类别。两个网络独立训练后,各自形成了不同的概念空间。然后,用一个“翻译模块”把老师的概念空间映射到学生的空间。结果,学生仅凭接收到的一个“苹果”概念向量,就能识别出从未见过的苹果图片。 这就像你从来没吃过芒果,但朋友告诉你“芒果是黄色的、甜的、热带水果”,你第一次见到就能认出它。知识不再依赖复制参数,而是通过低维概念传递。这正是人类语言的本质:用极少的符号,传递复杂的经验。 古人云:“心有灵犀一点通。”CATS Net做到了AI之间的“灵犀一点”。 这项研究能解决什么日常问题? 第一,为什么现在的AI经常“一本正理地胡说八道”? 因为它没有真正的概念。它只是记住了词与词的统计关系,并不理解“苹果”和“香蕉”共享“水果”这个抽象属性。CATS Net的方向是让AI先建立概念,再说话。 第二,AI能像人一样“举一反三”吗? 理论上可以。一旦形成了概念空间,给AI一个从未见过的新物体,它能根据概念向量判断它属于哪个类别(比如“这是一种新水果”)。这比传统AI的“刻板分类”更接近人类的学习方式。 对未来AI有什么影响? 它可能催生真正的“可沟通的AI”——不同AI之间可以通过概念向量交换知识,而不需要共享原始数据。就像两个人用语言交流,而不是互相复制大脑。 免责声明:本文基于前沿研究,CATS Net目前仍是实验室模型。AI的“理解”与人类有本质差异,请勿过度拟人化。 如果你教一个AI认识“苹果”,你会用什么概念来描述它?评论区聊聊你的“概念教学法”。 资料