标签

AI的深层困境,始于七十年前的一个理解偏差

发布时间:2026-06-25 04:32阅读:1

现如今,许多人对生成式AI已经不再感到神秘莫测了。

胡乱编造内容的问题早已是老话题了,这里就不再多说,咱们来探讨一下意义的问题。

人与人之间的交流包含着多层次、多维度的意义。这不难理解,当有人问你“吃了没”,其中隐藏的意图,一整篇文章都不一定能阐述清楚。

特别是在与人类创作的内容进行互动时,创作者的本意、语境以及双方共享的背景知识……大量无需言说的信息在传递着。

顾城那句“黑夜给了我一双黑色的眼睛,我却用它来寻找光明”,结合诗名《一代人》,很难不让人联想到那个特殊年代的某些往事。

再看看AI的产出,其中有什么深层的内涵吗?

这种机器仅仅模仿表面而导致的空洞无物,我认为这正是当前AI困境的关键所在。

我们正在沉迷于一种以模仿为基础的技术。

其实真的不用把AI的产出(做了什么)想得太神奇。只要稍微了解一下AI的工作原理(怎么做的),你立刻会感到一种“不过如此”的失落。

这跟看魔术表演很像。凭空把一个人变没了,确实震撼,但如果你全程看到那人只是通过暗道藏起来了,是什么感觉?

我追溯AI几十年来的演变,发现这门学科从根源上就存在缺陷。这件事要从七十多年前,那位被誉为计算机之父的人物说起。

1950年,艾伦·图灵发表了一篇名为《计算机器与智能》的论文。

论文开篇第一段,图灵提出了一个问题:机器能够思考吗?然后说,这个问题太过模糊,无法用科学或哲学方法进行准确定义,咱们换个方式问吧。

他设想了一个非常具体的场景:让一台模拟人的机器与另一位真正的人,同时隔着屏幕与询问者进行辨别游戏,如果询问者无法区分谁是真人,机器就获胜。

去年有部西班牙科幻剧集《亿万地堡》中,有段情节完美还原了这个场景⬇️

图灵将其称为“模仿游戏”(The imitation game)。如今广为人知的“图灵测试”(Turing Test),是后来人工智能学界改的名称。

为什么改名我没有弄清楚,这不重要。我要说的是“误读”,这事可就大了,涉及到方向问题。

图灵在论文中明确区分了,模仿游戏并非“机器能否思考”的答案,而是一个替代方案。

他的核心思路是:咱们先别纠结“思考”是什么了,问题都没法界定清楚,在这兜圈子没意义,先来看看能不能模仿吧。

后来的主流AI圈显然没有理解。他们把图灵测试从替代方案,硬生生拔高成判断智能的标准。

简单来说,就是谁模仿得像谁就聪明。至于到底有没有思考——谁在乎?

有没有觉得哪里不对劲儿?

这个误读,决定了AI接下来的发展方向。

1956年夏天,美国达特茅斯学院,一群数学家、工程师聚在一起开了个研讨会。会议持续了近两个月,随后,人工智能(Artificial Intelligence,缩写为AI)这个词正式诞生。

会议的主要发起者叫约翰·麦卡锡,当时还是个年轻的数学助理教授。他从洛克菲勒基金会的生物与医学研究部获得了研究资金。

注意这个出资方,生物与医学方向,这是否可以说明,资助的初衷是推动对智能和认知基础的理解呢?

研究智能这件事,至少应该跟认知科学、神经科学、哲学有关吧。麦卡锡申请经费的时候,评审委员会大概也是这么想的。

但这个会议却是完全由数学家和工程师们主导,还有IBM等公司的实质性参与,其他学科的学者没几个。

研讨会的参与者之一,机器学习之父雷·所罗门诺夫在2006年时回顾说,人工智能项目被主动地引向了工程方向。

研讨会的核心人物之一马文·明斯基,在筹备阶段的信中这样写道:“到开会的时候,我们这些人应该已经对哲学和语言问题达成共识了,这样就不用把时间浪费在这些琐事上了。”

哲学是琐事。语言是琐事。认知是琐事。

达特茅斯会议把AI跟数学和工程紧紧绑在了一起。这个方向的核心思想,叫符号主义,意指基于逻辑和数学符号操作来模拟思考过程。

两年后,这些研究者们又去开了个叫“思维过程机械化”的会议(Mechanisation of Thought Processes),会后发表的也全是数学论文。

从那以后,搞数学和搞工程的人彻底不用心虚了。AI成了他们的领地。至于智能到底是怎么回事,不重要了。

只要机器能表现得像人就行了。

了解西方哲学史的都不难理解,其实这个逻辑很早以前就埋下种子了。

17世纪,笛卡尔在《第一哲学沉思集》中提出了“心物二元论”,主张心灵和身体(物质)是两种属性对立的实体。心灵是思维实体,身体是广延实体。

简单来说:心灵负责思考,身体不思考。

之后,托马斯·霍布斯在《利维坦》中写道:

“人们进行推理的过程,就是在心里把各个部分累加在一起得到一个总和,或是把一个数目与另一个数目相减得到差值的过程……推理就是对人们一致认可的常用语词的计算,并标识或阐明我们思想的过程。”(第五章 论推理与科学)

简而言之他的意思是:理性,说到底就是计算。

把这两位合在一起,能得出个什么结论呢?

心灵等于思考,理性等于计算,所以思考等于计算。既然思考只是计算,那么机器当然也能思考,只要算得够快就行了呗。

后来莱布尼茨接过这杆旗。他受汉字启发(关于文字的起源:一个统治了世界两千年的错误定义),曾想过构建一种在结构上类似的通用字符(直接表意)。

既然推理可以通过计算来完成,那如果能设计出一种通用字符,当人们发生争执时,心平气和地拿起笔来“算一算便知”(Calculemus)。

三百年后,图灵问出的“机器能否思考”,其实就是这一计算主义思想的自然延续。

问题是,笛卡尔、霍布斯、莱布尼茨讲的计算主义,只是个认识论假设,而AI界直接将其当成了施工图纸。

既然模仿可以看作是智能,那么下一个问题就很实际了:怎么让机器模仿得更逼真?

第一条路,也就是符号主义。

1966年,约瑟夫·维森鲍姆写了个聊天程序ELIZA,模拟心理治疗师。规则一句话就能讲清楚:你说我很难过,程序就把“难过”摘出来,问你为什么难过。

就这么个玩意儿,当时把很多用户都忽悠瘸了。不少人坚持认为自己在跟真人聊天,甚至还想跟ELIZA独处。

维森鲍姆据此写下了《计算机力量与人类理性》,专门批判这种将计算机拟人化的倾向,而这一现象也被正式命名为“ELIZA效应”。

其实这个现象,早在达特茅斯会议时就有人预言了。当时罗斯·阿什比说:“当机制的一部分被隐藏起来,机器的行为就会显得很了不起。”

是不是很像魔术?

这条路后来一路通向了1997年,IBM深蓝击败国际象棋世界冠军。

第二条路,叫控制论。

设想一个恒温器,温度高了开空调,温度低了关空调。嗯……这能算智能吗?

麦卡锡觉得算。

1979年,他写了篇论文《赋予机器心理属性》,专门论证了恒温器等简单系统可以被视为拥有信念:“恒温器有信念,它相信房间太热了,相信空调该开了。”

这位跟明斯基一样对哲学持轻蔑态度的计算机科学家,在论文中还专门补了一句:我知道有人会骂我学术上不严谨,但我坚持这么说。

四年后,他又写了一篇,把这个逻辑延伸到自动取款机上:自动取款机相信你账户里有钱,相信不该给你那么多钱。

恒温器有信念。取款机能思考。摄像头加传感器在城市里铺满,就成了“智慧城市”。你戴个能测心跳的手环,就可以叫“智能穿戴”了。

倒真挺符合西方用命名自我欺骗的传统。

第三条路,也是当下最火的,叫机器学习。或者咱直接点出要害:数据驱动的模仿。

怎么让机器认出照片里的人脸呢?找个几千人,用几千个小时,把几百万张图一张张标好:这张有脸,那张没脸。然后让机器统计规律。

规律这东西听起来复杂,但本质上就是一句话:相似的东西,有相似的用途。

如今的ChatGPT、Deepseek,核心技术就在这条路上。模拟人类说话。

把整个互联网上的文本吃进去,然后根据上下文预测下一个词。2021年FAccT会议上,有AI伦理学家称这种机制为“随机鹦鹉”。

这只鹦鹉不知道自己在说什么,只是基于它吃过的东西,然后进行随机排列组合。

不知道你有没有产生过这类疑问:为什么AI从来不说脏话?因为那些科技公司雇人对有毒内容进行了人工筛除。

2023年《时代》杂志曾报道过,OpenAI通过外包公司,雇了几千个肯尼亚低薪工人,手动把训练数据中的脏话、暴力等有毒内容筛掉了。

现在AI看起来的体面,全靠廉价劳动力洗的。

这就不难理解为什么AI会一本正经胡说八道了。在这个只有“下一个词大概率是什么”的模仿逻辑里,幻觉是必然的副作用。

模仿有没有用?有用。但同时存在很大问题。

假设我们训练了个看X光片的AI,诊断准确率超过放射科医生,然后医院开始裁人。

几年后,突然冒出种新病毒,引发的肺炎跟以往所有情况都不同,AI不认识,怎么办?放射科医生已经被裁光了,现在你需要人重新标记新片子重新训练模型,但没有人了。

之前在(互联网正在抹掉它最重要的发明)中我就写过,AI正在杀死自己的数据