AI的深层困境，始于七十年前的一个理解偏差

发布时间：2026-06-25 04:32阅读：1

现如今，许多人对生成式AI已经不再感到神秘莫测了。

胡乱编造内容的问题早已是老话题了，这里就不再多说，咱们来探讨一下意义的问题。

人与人之间的交流包含着多层次、多维度的意义。这不难理解，当有人问你“吃了没”，其中隐藏的意图，一整篇文章都不一定能阐述清楚。

特别是在与人类创作的内容进行互动时，创作者的本意、语境以及双方共享的背景知识……大量无需言说的信息在传递着。

顾城那句“黑夜给了我一双黑色的眼睛，我却用它来寻找光明”，结合诗名《一代人》，很难不让人联想到那个特殊年代的某些往事。

再看看AI的产出，其中有什么深层的内涵吗？

这种机器仅仅模仿表面而导致的空洞无物，我认为这正是当前AI困境的关键所在。

我们正在沉迷于一种以模仿为基础的技术。

其实真的不用把AI的产出（做了什么）想得太神奇。只要稍微了解一下AI的工作原理（怎么做的），你立刻会感到一种“不过如此”的失落。

这跟看魔术表演很像。凭空把一个人变没了，确实震撼，但如果你全程看到那人只是通过暗道藏起来了，是什么感觉？

我追溯AI几十年来的演变，发现这门学科从根源上就存在缺陷。这件事要从七十多年前，那位被誉为计算机之父的人物说起。

1950年，艾伦·图灵发表了一篇名为《计算机器与智能》的论文。

论文开篇第一段，图灵提出了一个问题：机器能够思考吗？然后说，这个问题太过模糊，无法用科学或哲学方法进行准确定义，咱们换个方式问吧。

他设想了一个非常具体的场景：让一台模拟人的机器与另一位真正的人，同时隔着屏幕与询问者进行辨别游戏，如果询问者无法区分谁是真人，机器就获胜。

去年有部西班牙科幻剧集《亿万地堡》中，有段情节完美还原了这个场景⬇️

图灵将其称为“模仿游戏”（The imitation game）。如今广为人知的“图灵测试”（Turing Test），是后来人工智能学界改的名称。

为什么改名我没有弄清楚，这不重要。我要说的是“误读”，这事可就大了，涉及到方向问题。

图灵在论文中明确区分了，模仿游戏并非“机器能否思考”的答案，而是一个替代方案。

他的核心思路是：咱们先别纠结“思考”是什么了，问题都没法界定清楚，在这兜圈子没意义，先来看看能不能模仿吧。

后来的主流AI圈显然没有理解。他们把图灵测试从替代方案，硬生生拔高成判断智能的标准。

简单来说，就是谁模仿得像谁就聪明。至于到底有没有思考——谁在乎？

有没有觉得哪里不对劲儿？

这个误读，决定了AI接下来的发展方向。

1956年夏天，美国达特茅斯学院，一群数学家、工程师聚在一起开了个研讨会。会议持续了近两个月，随后，人工智能（Artificial Intelligence，缩写为AI）这个词正式诞生。

会议的主要发起者叫约翰·麦卡锡，当时还是个年轻的数学助理教授。他从洛克菲勒基金会的生物与医学研究部获得了研究资金。

注意这个出资方，生物与医学方向，这是否可以说明，资助的初衷是推动对智能和认知基础的理解呢？

研究智能这件事，至少应该跟认知科学、神经科学、哲学有关吧。麦卡锡申请经费的时候，评审委员会大概也是这么想的。

但这个会议却是完全由数学家和工程师们主导，还有IBM等公司的实质性参与，其他学科的学者没几个。

研讨会的参与者之一，机器学习之父雷·所罗门诺夫在2006年时回顾说，人工智能项目被主动地引向了工程方向。

研讨会的核心人物之一马文·明斯基，在筹备阶段的信中这样写道：“到开会的时候，我们这些人应该已经对哲学和语言问题达成共识了，这样就不用把时间浪费在这些琐事上了。”

哲学是琐事。语言是琐事。认知是琐事。

达特茅斯会议把AI跟数学和工程紧紧绑在了一起。这个方向的核心思想，叫符号主义，意指基于逻辑和数学符号操作来模拟思考过程。

两年后，这些研究者们又去开了个叫“思维过程机械化”的会议（Mechanisation of Thought Processes），会后发表的也全是数学论文。

从那以后，搞数学和搞工程的人彻底不用心虚了。AI成了他们的领地。至于智能到底是怎么回事，不重要了。

只要机器能表现得像人就行了。

了解西方哲学史的都不难理解，其实这个逻辑很早以前就埋下种子了。

17世纪，笛卡尔在《第一哲学沉思集》中提出了“心物二元论”，主张心灵和身体（物质）是两种属性对立的实体。心灵是思维实体，身体是广延实体。

简单来说：心灵负责思考，身体不思考。

之后，托马斯·霍布斯在《利维坦》中写道：

“人们进行推理的过程，就是在心里把各个部分累加在一起得到一个总和，或是把一个数目与另一个数目相减得到差值的过程……推理就是对人们一致认可的常用语词的计算，并标识或阐明我们思想的过程。”（第五章论推理与科学）

简而言之他的意思是：理性，说到底就是计算。

把这两位合在一起，能得出个什么结论呢？

心灵等于思考，理性等于计算，所以思考等于计算。既然思考只是计算，那么机器当然也能思考，只要算得够快就行了呗。

后来莱布尼茨接过这杆旗。他受汉字启发（关于文字的起源：一个统治了世界两千年的错误定义），曾想过构建一种在结构上类似的通用字符（直接表意）。

既然推理可以通过计算来完成，那如果能设计出一种通用字符，当人们发生争执时，心平气和地拿起笔来“算一算便知”（Calculemus）。

三百年后，图灵问出的“机器能否思考”，其实就是这一计算主义思想的自然延续。

问题是，笛卡尔、霍布斯、莱布尼茨讲的计算主义，只是个认识论假设，而AI界直接将其当成了施工图纸。

既然模仿可以看作是智能，那么下一个问题就很实际了：怎么让机器模仿得更逼真？

第一条路，也就是符号主义。

1966年，约瑟夫·维森鲍姆写了个聊天程序ELIZA，模拟心理治疗师。规则一句话就能讲清楚：你说我很难过，程序就把“难过”摘出来，问你为什么难过。

就这么个玩意儿，当时把很多用户都忽悠瘸了。不少人坚持认为自己在跟真人聊天，甚至还想跟ELIZA独处。

维森鲍姆据此写下了《计算机力量与人类理性》，专门批判这种将计算机拟人化的倾向，而这一现象也被正式命名为“ELIZA效应”。

其实这个现象，早在达特茅斯会议时就有人预言了。当时罗斯·阿什比说：“当机制的一部分被隐藏起来，机器的行为就会显得很了不起。”

是不是很像魔术？

这条路后来一路通向了1997年，IBM深蓝击败国际象棋世界冠军。

第二条路，叫控制论。

设想一个恒温器，温度高了开空调，温度低了关空调。嗯……这能算智能吗？

麦卡锡觉得算。

1979年，他写了篇论文《赋予机器心理属性》，专门论证了恒温器等简单系统可以被视为拥有信念：“恒温器有信念，它相信房间太热了，相信空调该开了。”

这位跟明斯基一样对哲学持轻蔑态度的计算机科学家，在论文中还专门补了一句：我知道有人会骂我学术上不严谨，但我坚持这么说。

四年后，他又写了一篇，把这个逻辑延伸到自动取款机上：自动取款机相信你账户里有钱，相信不该给你那么多钱。

恒温器有信念。取款机能思考。摄像头加传感器在城市里铺满，就成了“智慧城市”。你戴个能测心跳的手环，就可以叫“智能穿戴”了。

倒真挺符合西方用命名自我欺骗的传统。

第三条路，也是当下最火的，叫机器学习。或者咱直接点出要害：数据驱动的模仿。

怎么让机器认出照片里的人脸呢？找个几千人，用几千个小时，把几百万张图一张张标好：这张有脸，那张没脸。然后让机器统计规律。

规律这东西听起来复杂，但本质上就是一句话：相似的东西，有相似的用途。

如今的ChatGPT、Deepseek，核心技术就在这条路上。模拟人类说话。

把整个互联网上的文本吃进去，然后根据上下文预测下一个词。2021年FAccT会议上，有AI伦理学家称这种机制为“随机鹦鹉”。

这只鹦鹉不知道自己在说什么，只是基于它吃过的东西，然后进行随机排列组合。

不知道你有没有产生过这类疑问：为什么AI从来不说脏话？因为那些科技公司雇人对有毒内容进行了人工筛除。

2023年《时代》杂志曾报道过，OpenAI通过外包公司，雇了几千个肯尼亚低薪工人，手动把训练数据中的脏话、暴力等有毒内容筛掉了。

现在AI看起来的体面，全靠廉价劳动力洗的。

这就不难理解为什么AI会一本正经胡说八道了。在这个只有“下一个词大概率是什么”的模仿逻辑里，幻觉是必然的副作用。

模仿有没有用？有用。但同时存在很大问题。

假设我们训练了个看X光片的AI，诊断准确率超过放射科医生，然后医院开始裁人。

几年后，突然冒出种新病毒，引发的肺炎跟以往所有情况都不同，AI不认识，怎么办？放射科医生已经被裁光了，现在你需要人重新标记新片子重新训练模型，但没有人了。

之前在（互联网正在抹掉它最重要的发明）中我就写过，AI正在杀死自己的数据

← 上一篇：理想蔚来隔空交锋：理想提5C增程，蔚来仅回二字下一篇：禾迈Intersolar Europe展全场景光储方案，助力欧洲能源转型 →