人工智能发展的关键局限在于物理躯体

发布时间：2026-04-05 01:11阅读：12

利维坦编者按：面对能够在棋类比赛中击败人类顶尖选手的人工智能，许多人感到忧虑，视其为“人工智能终将取代人类”的潜在信号。然而，本文作者的观点显示，他并不认为这一天会在近期到来——在他看来，人工智能的发展仍有漫长道路，其核心挑战在于如何借鉴人脑的运作机制。

人脑的能力似乎没有边界。我们不仅能驾驶车辆，还能建造摩天大楼，运营企业，处理复杂情感。我们可以自如地抓取物品，灵活操作，每个人都掌握了数百种复杂技能，并能将它们组合运用，高效完成任务。相比之下，人工智能目前还存在根本性的局限。正如谷歌DeepMind联合创始人杰米斯·哈萨比斯所言：“我们真的能够开发出‘通用智能’吗？人脑是目前唯一存在的例证。人类为何具备这种能力、如何实现它，值得我们投入时间去深入探究。”

文/Ben Medlock

译/Carlyle

校对/喵昕

原文/bigthink.com/aeon-ideas/the-body-is-the-missing-link-for-truly-intelligent-machines

本文基于创作共同协议（BY-NC），由Carlyle在利维坦发布

2017年7月12日，香港“RISE”科技大会现场。在汉森机器人公司举办的人工智能展览中，一场关于人类未来的讨论开始前，机器人“汉”静立于舞台中央。图源：萨克·劳伦斯/法新社/盖蒂图片社

将意识视为初级认知结构的顶层功能，这种想法颇具吸引力。毕竟，我们感知自我意识的方式，与感受心跳或肠胃蠕动的体验截然不同。假如能将大脑活动独立分析并分层拆解，或许我们能构建出类似顶层的结构，创造出接近人类的人工智能，同时避免有机生命体复杂的物理形态带来的难题。

我理解这种观点的吸引力，因为我是SwiftKey的联合创始人之一，这家预测性语言软件公司已被微软收购。我们的目标是模拟人类理解与运用语言的非凡过程。我们已经取得了显著进展：对于2012年至2014年间为物理学家史蒂芬·霍金开发的新型高端交流系统，我深感自豪。尽管取得了这些令人振奋的成果，但我始终清醒地认识到，我们距离创造出拟人智能还很遥远。原因何在？因为我们对认知的建模存在偏差。许多人工智能研究者目前尚未攻克这一难题的核心：具身化过程。

日本机器人学家石黑浩创造的人形机器人Geminoid F。该机器人以一位日俄混血女性模特为原型，F代表女性，她“诞生”于2010年，能够做出眨眼、微笑、皱眉等65种不同面部表情。图源：Cait Oppermann

回顾20世纪50年代，在现代人工智能起步之初，方向就已出现偏差。计算机科学家试图通过建立基于符号的逻辑系统，来模拟有意识的逻辑思维过程。这种方法将现实世界的实体与数据代码相关联，并创建环境的虚拟模型，再将此模型投射回现实本身。

例如，在符号逻辑的框架下，若想创造一个学习“猫是一种动物”的工具，你可以用数学定理对特定知识进行编码，如“猫>是>动物”。此类定理还能应用于更复杂的句子中，使系统能够陈述命题并判断其真伪——这些命题包括“通常你的猫和马一样大”，以及“猫一般会捕捉老鼠”。

这种方式在早期人为构建的简单环境中取得了成功：在麻省理工学院计算机科学家特里·维诺格拉德于1968年至1970年设计的虚拟世界“SHRDLU”中，计算机可与用户对话，并协助移动锥体、球体等简单形状的障碍物。然而，面对现实世界的复杂问题，符号化逻辑往往束手无策，严密的符号系统在模糊定义和过于宽泛的理解方式中逐渐失效。

过去几十年间，随着计算机性能的提升，研究者尝试从海量数据中通过统计信息抽象出模型，这种方法通常被称为“机器学习”。不同于为高层级知识和逻辑思维编码的方式，机器学习采用自下而上的途径，其算法通过反复学习识别对象间的关联，例如对图像文件中的物体进行分类或将录音转换为文本。这类系统或许能学会识别猫的图像，比如通过观察数百万张猫的照片，或从大量文本中提取信息，以建立猫与鼠之间的联系。

面对问题时，沃森能同时运行数千种算法寻找答案，然后整合这些结果，并评估对每个答案的置信度。图源：wikipedia

近年来，机器学习已得到广泛应用。我们开发出了在语音识别、图像转换、唇语解读等方面超越人类的人工智能系统，例如在问答节目《Jeopardy！》中战胜人类的沃森；有些机器已能在棋类游戏中击败我们，比如围棋人工智能AlphaGo，有些正在学习创作视觉艺术作品、编配流行音乐，甚至编写自己的软件程序。从某种意义上说，它们自我学习的算法模仿了我们所了解的大脑有机体潜意识的过程。机器学习的算法从简单的“特征”起步（如单个字母或像素），再将它们组合成更复杂的“类别”，同时考虑到现实世界信息解读固有的不确定性与模糊性。这在某种程度上类似于视觉皮质的功能——该结构接收来自眼睛的生物电信号，并将其解读为可识别的图案和物体。

《2001太空漫游》中的HAL9000高智能计算机。图源：Giphy

要想像人类一样思考，算法仍有漫长道路——最难以跨越的障碍在于，我们不断演化的生物结构以及生物学基础处理信息的方式。人类由数以万计的真核细胞构成，而根据化石记录，真核细胞首次出现于25亿年前。每个人类细胞都是人体这个网络化机器的重要组成部分，其组件数量与现代喷气式飞机的零件数量相当——所有这一切都源于生物与自然界长期以来的相互依存与竞争。

在《盆地与山脉》（1981）中，作者约翰·迈克菲写道，若伸出双臂代表整个地球历史，复杂生命体直到远端手腕处才开始发展，而“只需用中等颗粒的指甲锉轻轻一磨，整个人类历史便消失殆尽”。

图源：Rose Tree Media School District

传统的进化理论认为，我们体内多样化的细胞是由原始真核动物经过随机基因突变和自然选择发展而来。但在2005年，芝加哥大学生物学家詹姆斯·夏皮罗提出了一个激进的新观点。他认为，真核细胞通过操纵自身DNA来响应环境刺激，从而“智能地”适应宿主有机体的环境。近期微生物学的研究发现为这一观点提供了支持。例如，哺乳动物的免疫系统倾向于复制DNA序列以产生有效抗体来抵御疾病，而且我们现在知道，人类基因组中至少有43%的DNA能够通过“自然基因工程”的方式从一个位点转移到另一个位点。

（shapiro.bsd.uchicago.edu/Shapiro.2005.Gene.pdf）

从聪明且具备自我组织能力的细胞，到我们用以深思熟虑的大脑智能，二者之间似乎存在距离。但关键在于，在我们拥有意识并能思考之前，我们的细胞就已能从环境中获取信息，并相互协作，将我们塑造成强大且善于自我维持的代理者。被我们视为“智能”的东西，不应仅通过符号来展示客观世界。相反，我们所认知的世界只是自然向我们呈现的部分，它植根于我们的发展过程，体现了我们作为生物体的需求。安东尼奥·达马西奥在其认知领域开创性著作《笛卡尔的错误》（1994）中写道，大自然“创造出调节理智的机制，绝非仅仅凌驾于生物调节机制之上，而是源于生物调节机制，并与之紧密依存”。也就是说，我们是用整个身体思考，而不仅仅是大脑。

石黑浩制造的人形少女机器人Kodomoroid。图源：Mashable

我认为，在这个充满不确定性的世界中，让肉体得以存续的基本条件，正是人类灵活而强大的智慧根基。然而，很少有人工智能研究者真正受到这一观点的影响。大多数人工智能算法的驱动力，仍然

← 上一篇：AI提示词分享：如何构建课程能力图谱下一篇：虚拟伴侣的灰色地带：AI女友背后的暴利生态 →