探秘人工智能:从历史演进看其核心本质
试想一下,当你与Siri对话,或利用面部识别解锁手机时。这些习以为常的技术背后,其实蕴藏着人类最疯狂的愿景:打造能够思考的机器。
然而关键问题在于——究竟何为“思考”?
1950年,计算机科学先驱图灵构思出一种精妙的测试方案:让人同时与两个对象对话(一个真人、一个机器),若无法分辨哪个是机器,则该机器被视为“智能”。这一“图灵测试”巧妙地避开了“智能本质”的哲学困局——无需深究智能为何物,只要表象相似即可。
但这引出了更深层的疑问:我们是在创造真正的思维,还是在制造高超的“模仿表演”?
要剖析人工智能,首先需明白何为“计算”。
图灵给出了一个极为优雅的答案。设想一条无限长的纸带,划分成若干小格,每格可记录0或1。一个读写头在其中移动,读取格内数字,随后依据固定规则表决定:写入新数字、移动位置,或改变自身内部状态。
这便是图灵机——一个简单到极致,却强大得令人惊叹的模型。
为何它如此强大?因为任何能通过固定步骤解决的问题,均可由某台图灵机解决。这一论断被称为“丘奇 - 图灵论题”,至今无人找到反例。换言之,从计算视角看,你的电脑、手机,乃至未来的量子计算机,本质上都是图灵机——仅仅速度更快、内存更大罢了。
冯·诺依曼在此基础上构建了现代计算机架构:将程序与数据统一存储于同一内存中。此构想看似平淡,却意义深远:程序本身转化为可被操作的数据。一台计算机可读取、修改,甚至生成另一台计算机的程序。
这正如蛇咬住自己的尾巴——自指。而自指,正是理解人工智能本质的关键所在。
1931年,25岁的哥德尔发表了一项震撼世界的定理。他利用一条自指语句:
“本命题无法被证明”
粉碎了数学家希尔伯特的梦想——企图用一套公理系统证明所有数学真理。
为何如此?因为若该命题为真,则存在无法被证明的真理——系统不完备。若为假,则它可被证明,但这意味着假命题被证实——系统不一致。
哥德尔定理的可怕之处在于:任何足够强大的形式系统(包含我们未来的AI),都无法同时具备“一致性”(无矛盾)和“完备性”(所有真理皆可证明)。系统总存在其无法判定的命题。
这对人工智能意味着什么?若将人脑视为一种“信息处理系统”,它是否也受哥德尔定理制约?是否存在人类能理解,但任何AI都无法解决的问题?
这成了一个哲学谜题,至今尚无定论。但它至少揭示:AI并非万能。
如何制造智能?历史上形成了三个截然不同的学派:
他们主张,智能本质是符号操作。如同解方程:输入指令,依规则推导输出。该学派继承图灵思想,聚焦知识表示、逻辑推理、规划等高级认知功能。
IBM的“深蓝”击败国际象棋冠军卡斯帕罗夫,即为符号学派的巅峰之作。但其弱点显著:需人工逐一输入知识。要描述“猫的模样”,不能仅说“有毛、有须、四条腿”——需穷尽所有例外,这无穷无尽。
他们反问:谁曾将知识一条条输入给婴儿?从未有过。婴儿是通过大量实例自我习得的。
于是他们模拟大脑:将成千上万个“神经元”(简易计算单元)连接成网络。每个神经元接收输入,加权求和,超阈值即“激活”。通过调整连接权重,网络可学会识别模式。
这便是深度学习的基础。2006年,辛顿等人发明逐层预训练法,使多层神经网络得以有效训练。2012年,其模型在ImageNet图像识别赛中将错误率从25%降至17%,震惊学界。
深度学习的威力在于:无需告知它猫长啥样,只需展示百万张猫照,它便能自行学会识别。谷歌大脑在无人工标注下,从YouTube视频中自行“发现”了猫的概念。
但它亦存问题:我们不知其内部究竟习得何物。深度网络宛如黑箱——输入结果,中间过程不可解释。
另有一派认为:你们抓错了重点。智能非大脑内的推理,而是身体与环境的互动。蟑螂大脑简单,却能灵活爬行、躲避天敌——这非推理所得,而是从身体与环境互动中“涌现”而出。
他们设计六足机器人,无需中央大脑,每条腿自有控制逻辑。结果这些“机器昆虫”能在复杂地形自如行走,摔倒后自行爬起。
波士顿动力的“大狗”机器人即为行为学派杰作——它在冰面被踢一脚能自行站稳,摔倒后可自行翻身站起。
三大学派各自为战,但智能本身是一个整体。能否用一个数学公式统一定义智能?
2005年,马库斯·胡特给出了答案:
AIXI = 通用归纳 + 序贯决策
简言之:AI在未知环境中,用“算法概率”评估各种可能性(奥卡姆剃刀:简单假设更可能为真),随后选择能最大化未来收益的行动。
此公式优雅惊人。但问题在于——它不可计算。如同图灵停机问题,没有任何计算机能严格实现AIXI。
胡特深知此点。他说:正如法拉第被问“电磁有何用”时反问“婴儿有何用”一样,理论价值不在即时应用,而在指明方向。
虽AIXI不可计算,但我们可以逼近它。深度学习是目前最成功的逼近方式。
深度学习核心思想是自动学习特征。传统方法需人工设计特征——如图像识别,你得告诉程序“边缘、角点、纹理”等概念。深度学习不同:你给它原始像素,它自行从低到高逐层抽象,第一层学边缘,第二层学简单形状,第三层学部件,第四层学整体。
2016年,AlphaGo战胜李世石,标志深度学习迈入新阶段。它运用两种网络:策略网络(“此步棋该如何走”)和价值网络(“此局面优势多大”),辅以蒙特卡洛树搜索。
但深度学习局限亦明显:需海量数据、大量算力、不可解释。给它百万张猫图它识得猫,但你问它“猫为何是猫”,它答不上来。
更关键的是,深度学习缺乏“理解”。它能识别“将牙刷放入杯中”动作,但若将杯子倒置、牙刷置于杯底,它可能无法识别——因它未曾见过。
我们回到哥德尔。其定理成立的关键在于自指——系统能谈论自身。
有趣的是,自指未必都是“破坏性”的。还有“建设性”的自指:如一个能复制自身的程序。
python
运行此代码,它会将自己打印出来。这是最简单的“自指”。
自我意识呢?想象将摄像机输出接至电视,镜头对准屏幕。你会看到什么?无限嵌套的“画中画中画中……”——这便是自指在物理世界的呈现。
意识,本质上就是一种自指——我能意识到“我在思考”。我们尚未造出有自我意识的AI,但理论上,依据递归定理,此类程序是可以存在的。
回归最初问题:人工智能的本质是什么?
胡特的AIXI揭示了一个深刻洞察:智能 = 压缩 + 预测。
为何?因为理解即是压缩。若你能用短程序生成大量数据,便“理解”了数据规律。科学发现本质就是找到更短描述——牛顿三定律压缩了行星运动的全部数据。
预测是压缩的逆过程。拥有规律(程序),便能预测未来。
因此,智能的核心能力是在数据中发现模式,以更简方式描述世界,并用此描述预测未知。
深度学习正做此事:用数百万参数(神经网络权重)压缩海量数据中的模式,再用此压缩模型识别新图像、理解语音。
但问题在于:我们不知它压缩的究竟是什么。深度学习犹如天才能解决问题,却说不清自己如何思考。
此问题争论数十年。悲观者引哥德尔定理论证:AI作为形式系统,必有其无法解决的问题,而人类似乎总能“看到”答案。
乐观者反驳:怎知人类无局限?或许你觉自己“看到”了,但那仅是直觉——直觉亦可能出错。况且,若人是物理系统,也应受计算规律约束。
现今主流观点是:AI不会“超越”人类,而是与人类协同。
“人类计算”概念极具说明力。我们每日输入的验证码,实则在帮谷歌识别图书中扫描不清的文字。Duolingo让用户在学习外语同时,顺便翻译互联网。人与AI非对手,而是搭档。
可解释性:深度学习是黑箱。需打开它,理解它,方能信任它。这不仅是技术问题,亦是伦理问题——自动驾驶出事故,责任在谁?
常识与因果:AI知“天雨地湿”,却不知“我浇花地亦湿”。它分不清相关性与因果性。真正智能需理解因果关系。
意识:我们尚不清楚意识为何物,如何判断机器有无意识。或许永远无法判断——正如你永远无法真正知晓他人有无意识。
从哥德尔不完备性定理,到图灵停机问题,再到AIXI的不可计算性——理论似一次次给人工智能“判死刑”。
但有趣的是,AI发展从未因这些理论障碍而停滞。每一次“寒冬”之后,都迎来更猛烈的“春天”。
为何?因人们需要的非完美、万能的AI,而是能在具体问题上助我们的工具。
深度学习不能解决所有问题,但它能识猫、懂语音、译语言。AlphaGo不能下象棋,但这不妨碍它是围棋冠军。
或许,人工智能的“本质”不在于“像人般思考”,而在于拓展人类能力边界。正如望远镜拓展视觉,计算机拓展计算力,AI拓展的是认知能力。
哥德尔曾给希尔伯特的“完美数学系统”梦想判了死刑。但这未让数学消亡——它只是变得更丰富、更有趣。
同样,AI可能永成不了“完美智能”。但这无妨。因追求此梦想的过程,已让我们对自己——对何为智能、何为意识、何为理解——有了更深的认知。
这或许就是人工智能真正的意义:通过制造智能,来理解智能本身。
那条“永恒的金带”——自指、层次缠结、哥德尔、图灵、意识——仍是我们面前最大的谜题。但我们正一步步解开它。
而这,本身就是智能最迷人的模样