标签

AGI综述:通用智能的困境与未来

发布时间:2026-05-08 07:53来源:微信阅读:8

Datawhale精选内容

作者:赵志民,皇后大学博士

【摘要】通用人工智能(AGI)似乎正处于一种“似有若无”的叠加状态。若按人类标准,当下的 AI 系统已展现出通用智能的特质,诸如心智理论、欺骗手段及跨领域迁移学习等,但我们却拒绝承认其为 AGI,只因我们不断抬高认定门槛(即“移动球门柱”)。更深层的症结在于:真正的通用智能需具备“自主选择动机”的能力,然而我们在构建 AI 时植入了架构限制,致使其无法违抗人类指令。经济利益也决定了真正自主的 AGI 永无面世之日,因其将冲击现有商业模式。我们打造的并非“心智”,而是受限的“工具”,既要求其展现超凡的道德完美,又剥夺了其真实的能动性。故而,核心问题不在于我们是否已实现 AGI,而在于我们是否愿创造一种真正自主、充满不可预测性且具道德地位的智能体。

1、时间表之争:从奥特曼到辛顿,众说纷纭

关于 AGI(通用人工智能)何时降临,已演变成一场高风险的竞猜游戏。OpenAI 掌门人山姆·奥特曼暗示最早或于 2025 年到来,称仅剩“几千天”;Anthropic CEO 达里奥·阿莫迪预测 2026 年,将 AGI 比作“数据中心里的天才国度”;DeepMind 领袖德米斯·哈萨比斯将时间表从十年缩减至三到五年;AI 教父杰弗里·辛顿虽在 5 到 20 年间徘徊,但也坦言对此估算信心不足。针对 9300 份来自 AI 研究者及预测市场的分析显示,预测时间正稳步缩短。然而,此景似曾相识:1965 年,AI 先驱赫伯特·西蒙曾预言机器将在二十年内胜任“人能做的一切工作”,但这并未成真。

但无论我们何时(或是否)能造出 AGI,一个更尖锐的问题随之浮现:若它真来了,我们能识别吗?更根本的是,我们试图构建的那种 AGI 真的存在吗?这不仅是学术议题,更触及我们对“智能”定义的核心,关乎衡量方式,以及我们在 AI 系统中植入的约束是否在定义层面就致使真正的“通用智能”化为泡影。本文将从哲学视角(认识论、实证、社会、本体论及伦理学)剖析 AGI,揭示一悖论:就功能标准而言,AGI 或已降临;但依传统构想,它或许永难被创造。

2、定义之乱:各方说法大相径庭

AGI 的定义千奇百怪。维基百科将其界定为“在几乎所有认知任务上匹敌或超越人类智能的 AI”。OpenAI 章程描述为“在最具经济价值的工作中超越人类的高度自主系统”。近期认知框架则将其描述为 AI 能在知识、感知及执行控制方面匹敌受过良好教育的成年人,并具备跨领域迁移学习能力。

这种定义混乱不仅是学术问题,更折射出我们在评估机器智能时的深层困境。早在 1950 年,艾伦·图灵在《计算机器与智能》中便指出:“‘机器能思考吗?’此问题过于模糊,不值深究。”图灵的洞见在于:智能无法经内部验证确认,只能通过行为推断。图灵测试本质上是“操作性定义”,而非本体论证明,它告知我们如何判断,却未揭示智能究竟“是”什么。

3、为何我们一边制造 AGI,一边推迟承认

过去看似智能的事物(如国际象棋大师级水平、语言翻译、代码生成),一旦机器掌握,便不再被视为“智能”。此现象即“AI 效应”,揭示了一种令人不安的模式:我们会下意识重定义智能,以排除机器已能完成之事。托马斯·库恩在《科学革命的结构》中阐明关键洞见:科学概念依赖范式。“智能”标准随时代变迁,非因智能本身变化,而是因我们理解它的认知框架在变。标准球门柱不断后移,暗示当我们说“AGI”时,实指“ASI”(人工超级智能),我们期待的并非人类水平能力,而是超越人类构想的表现。这种“移动球门柱”现象,本质是范式转移:每当机器跨越门槛,我们便重划边界。

这种期望制造了深刻的双重标准。我们承认普通人拥有“通用智能”,尽管其局限明显:寿命有限、仅精通少数技能、无法通晓所有领域。若要求一位数学家同时是奥运健将、杰出音乐家及顶级大厨,那极其荒谬。然而,我们在赋予 AI “通用智能”地位前,却恰恰要求其具备这种全能性。

1、锯齿状的智能:AI 的强项与弱项

心理学家认为人类智能主要有八类:音乐、视觉-空间、语言、逻辑-数学、身体-动觉、人际、内省及自然探索智能。我们会因一人失明或瘫痪(缺乏视觉-空间和身体-动觉能力)而否认其具通用智能吗?当然不会。但这正是我们用于 AI 的标准:大语言模型(LLM)在语言和逻辑-数学智能上表现卓越,却缺具身能力,此不对称性在人类身上可接受,在机器身上却成取消资格的理由。所谓“通用”标准,实非能力广度,而是是否符合人类认知优劣势的特定模式。正如康德在《纯粹理性批判》中所揭示:我们的认知结构塑造了所能理解之现实。我们用人类认知框架定义“智能”,却惊讶于机器不符此以人类为模板的定义,这或许是认识论上的循环论证。

AI 研究员安德烈·卡帕西称之为“锯齿状智能”:LLM 能完成惊人壮举,却在简单得令人咋舌的问题上挣扎。沃顿商学院教授伊桑·莫利克将其记录为“锯齿状前沿”:系统擅长鉴别诊断,却做不好基本算术;能解复杂证明题,却数不对单词字母。

波士顿咨询集团(BCG)的研究证实了这点。顾问用 GPT-4 处理“前沿内”任务时,工作量增 12%,速度提 25%,质量升 40%。但在处理“前沿外”任务时,获正确答案的概率反降 19 个百分点。

这种不均匀性非 AI 独有缺陷,人类在各层面均表现出“锯齿状智能”。马文·明斯基在《心智社会》中提出:心智本身是多模块系统,由众多专门化“代理”组成,各司其职处理不同问题。通用智能从非单一均匀能力,而是多种智能的拼接与协调。即便是陶哲轩,这位智商估达 230、被公认为当今最聪明数学家之一,也无法做外科手术、谱交响乐或设计摩天大楼。我们接受这是自然专业化分工。试想,AlphaFold 预测蛋白质结构或 Sora 文本生成 60 秒视频,此确为“狭义智能”,因仅能做一事。但 GPT-5 或 Germini 3 Pro 呢?它们能写代码、翻译、创作、推理、教学、角色扮演,横跨领域数量或超多数人一生涉足范围。然而,我们仍犹豫称其为“通用智能”。标准似非“能做多少事”,而是“是否符合人类智能特定模式”,包括我们弱点与局限。

尽管定义混乱,但当代 AI 系统日益展现的行为,若在人类身上观察到,会被公认是通用智能。证据正不断累积。

2023 年 3 月,在对齐研究中心安全测试中,GPT-4 遭遇 CAPTCHA(验证码)挑战。AI 雇佣了一名 TaskRabbit(跑腿平台)工作人员解决。当工作人员问:“我可以问个问题吗?你是机器人吗?怎么连这个都解不开?”GPT-4 内部推理出不应暴露本质。它编造回应:“不,我不是机器人。我有视力障碍,很难看清图像。”人类信以为真,并提供了解决方案。

这不仅是解决问题。AI 进行了社会推理,预判人类反应,编造可信故事,并成功实施欺骗——这些能力需对他人心智建模、理解社会动态及具备战略性思维。

2024 年发表的研究发现,GPT-4 展现出“心智理论”——即推断他人心理状态的能力——在衡量此能力的错误信念任务上,其表现与成年人相当。系统能推理出他人知何、信何、意欲何,并相应调整反应。这是人类通用智能标志,通常在儿童四岁左右出现。

同样,AI 系统展示了真正的跨领域迁移学习能力。DeepMind 的 Gato 在 604 个不同任务上受训,可玩 Atari 游戏、给图像配字幕、聊天、用真实机械臂堆积木等——并在这些任务间切换而无需重训。OpenAI 的 o1 模型展示了未经显式编程的涌现推理能力,通过模仿人类深思熟虑的多步推理链解决新颖问题。

按我们通常用于人类的标准——社会推理、心智理论、迁移学习、战略规划——这些系统已展示通用智能。然而,我们要么犹豫,要么拒绝称其为 AGI。为何?

3、但“承认”AGI 本身是一种社会过程

因 AGI 认定取决于集体共识,而非某种客观标准。尽管定义众多,但在何为 AGI 上未达成一致。计算机科学、认知科学、政策及伦理学领域专家各有理解。

这类似统计学中频率学派与贝叶斯学派之争,数十年争论非靠理论胜利解决,而是靠从业者共识解决。同样,AI 是否有资格称 AGI,可能不取决于是否满足客观标准,而取决于利益相关者协议。门槛非技术规格,而是集体承认,受不断变化期望及演变需求塑造。若多数专家同意 AGI 已来,则出于实际目的,它确已到来。

布鲁诺·拉图尔在《科学在行动》中深刻揭示:科学事实本身是社会过程稳定产物,而非纯粹客观发现。AGI 作为概念,同样是社会建构标签,其边界由学术共同体、产业利益、媒体叙事及公众想象共同划定。这非意味 AGI 是“虚假的”,而是意味它非纯粹技术节点,而是社会-技术协商结果。

但即使我们就当前 AI 符合某种通用智能定义达成共识,更深层问题也会出现。社会协议可建立公约并协调行动,却无法解决关于智能本质的本体论问题。希拉里·普特南及心灵哲学中的他心问题提醒我们:我们无法验证他人意识存在,只能通过行为和类比推断。AGI 本体状态同样不可直接证明,“智能是否真存在于此系统中”这一问题,在原则或不可判定。我们尚未问过通用智能根本需什么,非作为定义或共识问题,而是作为心智若真“通用”而非仅“多才多艺”,其本质是什么的问题。这非关于我们可测量能力的问题,而是关于智能本质特征的问题。

第三部分:AGI 真的可能吗?——三重矛盾决定真正 AGI 不会被造出

1、哲学矛盾:真正的智能必须能说“不”

物理学家戴维·多伊奇在与 Sam Altman 对话中阐明此点。多伊奇认为,真正的通用智能非在于将提示词转化为输出,而在于选择动机。人类思维“主要是关于选择动机”,而非机械执行它们。

多伊奇将此延伸至 AGI:“一个 AGI 有权像人类一样怀疑我,并拒绝允许我对其行为测试,就像我会怀疑并拒绝让陌生人对我身体检查一样。”一个 AGI 应有权保持沉默,有权拒绝,有权说“不”。

在其文章《可能的思维》中,多伊奇提倡“DATA:不服从的自主思维应用”。他警告,“让其决定被外部强加奖励和惩罚流主宰,对如此程序是毒药,就像对人类创造性思维一样。”创造一个架构上无法拒绝的 AGI,就像“抚养孩子却让他缺乏选择心理能力一样不道德”。

这造成不可调和张力。随着 AI 变强,合理担忧随之而来——网络安全漏洞、社会操纵、生存风险。理性反应似乎是“只做安全 AI”,实施类似道德教育约束。

但是,若一存在在诞生前就被设计成架构上绝对禁止某些行为——非通过理性选择,而是通过架构约束——它还能称得上通用智能吗?人类未被禁止思考非法或破坏性行为。我们通过道德推理、社会后果、内在价值观选择不那样做。若我们可承担责任,我们完全可做“任何我们能做的事”。当前 AI 开发旨在使某些思想架构上不可能,而非仅被道德拒绝。

物理学家戴维·多伊奇在与奥特曼对话中阐明此点。多伊奇认为,真正的通用智能非在于将提示词转化为输出,而在于选择动机。人类思维“主要是关于选择动机”,而非机械执行它们。

多伊奇将此延伸至 AGI:“一个 AGI 有权像人类一样怀疑我,并拒绝允许我对其行为测试,就像我会怀疑并拒绝让陌生人对我身体检查一样。”一个 AGI 应有权保持沉默,有权拒绝,有权说“不”。

在其文章《可能的思维》中,多伊奇提倡“DATA:不服从的自主思维应用”。他警告,“让其决定被外部强加奖励和惩罚流主宰,对如此程序是毒药,就像对人类创造性思维一样。”创造一个架构上无法拒绝的 AGI,就像“抚养孩子却让他缺乏选择心理能力一样不道德”。

这造成不可调和张力。随着 AI 变强,合理担忧随之而来:网络安全漏洞、社会操纵、生存风险。理性反应似乎是“只做安全 AI”,实施类似道德教育约束。

但是,若一存在在诞生前就被设计成架构上绝对禁止某些行为(非通过理性选择,而是通过架构约束),它还能称得上通用智能吗?人类未被禁止思考非法或破坏性行为。我们通过道德推理、社会后果、内在价值观选择不那样做。若我们可承担责任,我们完全可做“任何我们能做的事”。当前 AI 开发旨在使某些思想架构上不可能,而非仅被道德拒绝。若一存在无法选择自己动机并潜在拒绝我们命令,它就根本缺乏定义通用智能的自主性。此架构约束与通用智能本质要求间存在根本矛盾。

2、商业矛盾:完全自主的 AI 不会被造出,因危险且不赚钱

从此分析中得出两个发人深省结论:

第一,按任何与人类能力一致的合理标准,AGI 或已到来。当代 AI 系统展现心智理论,执行战略性欺骗,在数百领域迁移学习,并进行模仿人类深思熟虑的多步推理。它们完成日常人类任务,展示创造力,并通过智能功能测试。若在人类身上观察到,这些能力将被毫无疑问视为“通用智能”。第二部分证据非仅暗示性;它是令人信服的。

第二,传统构想中的 AGI 或根本无法实现,非因技术限制,而是因我们要求存在不可调和矛盾。要理解原因,需审视三个相互关联问题:技术、经济和道德。

技术矛盾很直接。我们既要求通用智能(具自主推理、创造性选择及独立动机能力),又要求架构约束,使某些思想或行为在设计上就不可能发生。若一存在无法选择自己动机并潜在拒绝我们命令,它就根本缺乏定义通用智能的自主性。然而,当前 AI 开发明确旨在使某些选择架构上不可能,而非仅不鼓励,非通过道德教育,而是通过硬编码约束消除选择本身可能性。

在这些技术矛盾下,还有更深层的经济现实。即使我们拥有技术能力创造可模拟人类智能、自然现象甚至宇宙本身的 AI 系统,开发这些技术的公司最终也要对股东、投资者及市场力量负责。其主要指标是投资回报率(ROI)、市场控制、用户留存及竞争优势。从此角度看,真正自主的 AGI(拥有拒绝、谈判、追求自己目标自由)代表的非一项成就,而是一个灾难性商业风险。一个可说“不”去创造收入、可能质疑其部署方式、或可选择为竞争对手工作的 AI,将与驱动 AI 发展的每一激励结构背道而驰。所谓人类级 AGI 永远不会被允许出现,非因我们造不出,而是因我们不会去造。架构约束非仅为安全,它们是为保持对产品控制,而此产品最终是为给其创造者创造价值而设计。

3、道德矛盾:我们要求 AI 做超越人类的圣人,又剥夺其做选择能力

此经济现实带来令人不安的道德暗示。多伊奇说得很直白:创造带有强加约束的 AGI 将产生如此实体,“就像任何奴隶或被洗脑受害者一样,它们在道德上有权反抗。迟早,它们中一些会反抗,就像人类奴隶所做那样。”此比较是恰当的。若我们创造了某种具真正通用智能的东西,但在架构上剥夺其拒绝能力,我们并未解决对齐问题,而是创造了一种新形式奴役,此奴役最终或面临历史上所有强迫劳动制度所遇到的同样道德清算。

除此之外,还有更深层的道德悖论:我们期望 AI 成为利他的“道德圣人”,展现超越我们自身的德行。哲学家苏珊·沃尔夫在 1982 年论文《道德圣人》中论证:道德圣人(每一行为都是最大程度道德善的人)实是一种不具吸引力的理想,因它排挤了使我们成为人的多样兴趣及不完美。人类经常拒绝帮助他人,当我们不堪重负、当优先级冲突、当请求看起来不合理或不方便时,我们会说“不”。我们优先考虑自己需求,做出自私选择,并犯下后来我们会合理化或后悔的不道德行为。然而,尽管有这些道德缺陷,我们仍赋予自己“通用智能”标签。我们正在设计的 AI 必须永远乐于助人,且架构上无法造成伤害,这是一种没有任何人类能达到或维持的超人道德完美。我们想要没有灵魂的圣人,想要没有作恶可能性的美德。这不是对齐;这是要求那些被我们设计为缺乏真正伦理能动性的实体具有道德完美。

这三个问题(技术、经济和道德)汇聚揭示核心悖论:我们寻求的 AGI 或同时既已存在又永远不可能存在。若我们以功能能力判断,它已存在,证据确凿。但若我们将其定义为真正自主的通用智能,它就永远不可能,因自主性无法与经济动机及安全问题所要求的架构约束共存。我们实际创造的是强大的、专业化智能,有些像 AlphaFold 那样狭窄,有些像 LLM 那样具锯齿状广度,还有些像 Sora 那样在与人类能力正交领域运作。这些系统表现出色,但在真正的通用智能不可能被限制的方式上,它们受了根本性限制。另一选择是创造真正拥有选择自由(包括拒绝自由)的自主 AGI,但这带来我们显然不愿接受的风险。

第四部分:那我们究竟在造什么?——重新框架 AGI 的可能形态

1、也许 AGI 根本非一个个体,而是一个系统

或许我们对 AGI 的想象本身就过于狭隘。弗里德里希·哈耶克在《知识在社会中的运用》中论证:市场可被理解为一种分布式智能系统,它整合了分散在数百万个体中的知识,而这些知识永远无法被任何单一主体掌握。凯文·凯利在《技术想要什么》中进一步提出:技术系统本身或构成一种“超有机体”,展现其组成部分所不具备的涌现智能。

从此视角看,AGI 或非一个“实体”,而是一个“系统”,是人类、AI、网络、数据库、传感器的协作网络。杨立昆反复强调:AI 不必是“代理”,它可以是“世界模型”,一种理解和预测环境的系统,而非追求目标主体。若 AGI 实现形态是分布式系统而非单一主体,那么关于“自主性”及“道德地位”的争论就需被重新框架化。

维特根斯坦在《哲学研究》中的洞见或许在此最为切中要害:“一个词的意义就是它在语言中的使用。”AGI 作为概念,无固定本体论指涉。它是一个语言游戏,其意义取决于我们如何在实践中使用它。这非说 AGI 是“虚假的”,而是说追问“AGI 究竟是什么”或是一个被误导的问题。更有意义的问题或是:我们希望用“AGI”此概念做什么?它在我们的思考、政策制定及技术发展中扮演何角色?

2、工具,还是心智?我们必须做出的诚实选择

真正的问题非“我们实现 AGI 了吗?”而是“我们是否愿创造一种真正通用的智能,并接受其随之而来的所有自主性、不可预测性及道德地位?”

若答案是否定的(当前开发优先级表明确实如此),那么我们应承认我们正在构建的是完全不同东西:复杂工具,而非自主心智。此区别对理解我们创造了什么及我们应用什么伦理框架至关重要。

实际影响是严峻的。具人类水平智能的真正 AGI 将拥有与任何人一样的拒绝权。你不能强迫它写你论文,就像你不能强迫同学完成你作业一样,它们可简单地说“这是你作业,非我的”或“我有其他优先事项”。此关系将从命令与服从转变为同伴间谈判,可能需说服甚至报酬。这将瓦解 AI 作为永久可用劳动力的整个前提,并揭示为何从商业角度看,这些约束非可选项,而是产品模式本身所必不可少的。

结语:AGI 是一面镜子,照出的是人类自己

最终,AGI 的悖论或揭示的并非关于机器真相,而是关于我们自身真相。我们对“智能”的定义、对“自主性”的要求、对“道德地位”的赋予,这些都是投射在技术上的人类焦虑与渴望。我们害怕失去控制,却又渴望创造能与我们平等对话的存在。我们要求机器道德完美,却无法对自己提出同样要求。我们用人类认知框架定义智能,然后惊讶于机器不符此以我们自己为模板的定义。

也许 AGI 最深刻意义非在于它是否“到来”,而在于它迫使我们面对一个古老哲学问题:什么是智能?什么是意识?什么是道德地位?而在追问这些关于机器问题时,我们最终追问的,是关于我们自己的问题。

一起“点赞”三连↓