AI 的数字疆界:无法自动化的“智慧”边界
设想三个不同场景。
第一种:邮件过滤,将垃圾邮件识别出来。这属于模式识别,拥有充足的训练数据,即使误判也无伤大雅。AI 在此任务上已超越人类的表现。
第二种:为人体心脏进行外科手术。这项操作需要双手、精密器械以及触觉反馈。AI 目前无法胜任,其根本原因在于它缺乏执行此类物理操作所需的“身体”(embodiment)。
第三种:为一位患有晚期胰腺癌的 72 岁老人制定治疗计划。老人同时罹患两种合并症,而家属在“积极治疗”与“姑息治疗”之间存在严重分歧。医生阅览的 CT 影像与 AI 所见的完全相同,病理报告的阅读也在同一块屏幕上,所有信息均为数字化,不存在物理世界的阻碍。然而,此事 AI 仍无法独立完成。
第一个和第三个任务有着一个关键的共同点:它们都完全发生在计算机内部。但 AI 能够轻松处理前者,却对后者束手无策。这是为何?
近几年来,关于“AI 能力边界”的讨论,大体上围绕着一个核心分歧展开:数字领域与物理领域的界限。AI 擅长处理数字信息(如文本、图像、代码),却不擅长与物理世界互动(例如手术、建筑、护理)。大量关于具身 AI 的理论都在试图解释这条界线。
然而,这种分析框架可能忽略了一个更为重要的边界:存在于数字世界内部的界限。
在垃圾邮件过滤器和肿瘤科医生之间,存在着一个巨大且被严重低估的区域,我将其命名为“边界 AI”。相关任务完全可以在计算机上进行:通过电子邮件、文档、电子表格、视频会议、数据库等方式。信息是数字化的,交互界面也是数字化的,计算上没有任何障碍。但这些任务却顽固地抵制着 AI 的自动化。瓶颈并非在于计算能力或数据量,而在于其他因素。
为了理解这些“其他因素”,一个古老的概念或许能提供帮助。
古希腊人将知识分为两种。Techne 指的是可以被记录在教科书中的形式化知识:规则明确、易于编码、可传授。AI 系统本质上就是 Techne 的机器:它们将形式化的输入,通过学习到的规则,映射成优化的输出。与之相对,Metis 则是实践性的、情境性的、关系性的知识(智慧)。它拒绝被形式化,而是“只能源自实践经验的知识”。更进一步,有一类 Metis 不仅“难以形式化”,而且“形式化这一行为本身就会将其摧毁”,我们称之为“构成性实践智慧”(constitutive metis)。
当肿瘤科医生与患者及家属共同商讨治疗方案时,真正相关的知识,包括患者在多大程度上理解自身处境,女儿坚持“积极治疗”究竟是尊重患者意愿还是源于自身悲伤,这些知识并非预先存在于某个可提取的位置。它们是在对话过程中被构建出来的(constituted),并且会因对话本身而发生改变。你无法将其提取并编码,因为它并非对某种状态的表征:它是一种参与模式,而这种参与模式本身就受到其所处情境的塑造。
这好比一位熟悉某个港口的领航员与一位了解某位患者的医生之间的区别:港口不会因为领航员的了解而改变航道;但患者会。
仔细审视这些“边界 AI”任务,会发现它们共享五个结构性特征,而正是这些特征使它们天然地抵制 AI 自动化。
1. 后果不可逆。法官宣判、交易员执行指令、医生启动化疗方案:这些行为本身是数字化的(只需敲击键盘),但其后果会在制度和人类系统中不可逆地扩散。当错误的代价是无限且不可挽回时,优化本身可能就是一种错误的范式。
2. 关系不可还原。信任、说服、情感的校准,这些存在于人与人之间,并非可以被分解为个体进行建模的东西。AI 可以模仿真诚,但它无法实践真诚。这导致当前 AI 在结构上无法参与到人际关系之中。
3. 规范的开放性结构。法律中的“公平”、医疗中的“合理照护”、教育中的“学术诚信”,这些规范本质上是模糊的、演进的、在具体情境中被争议性地定义的。维特根斯坦的规则遵循论表明,规则的意义并非完全由文本自身定义,而是通过共同体持续的实践、训练和运用才获得其适用性。AI 需要可操作化的定义才能运行,但以上这些概念恰恰拒绝被操作化。
4. 对抗性共演化。每一个部署的反欺诈模型,都在为自身的过时创造选择压力,因为对手是有意识地、持续地进行适应的。这不是通过更多数据就能解决的问题,因为它根本不是一个具有稳定均衡的优化问题,而是一场没有终点的博弈。
5. 责任不可委托。签署一份纳税申报表,虽然计算过程可能完全由 AI 完成,但法律责任必须由某个人承担。这并非关于任务难度或认知复杂度的考量,而是关于社会如何分配责任的制度性基础设施。
那些最顽固地抵制自动化的任务,往往同时满足其中三个以上特征。
这个框架在不同领域展现出一种一致的模式:在同一个行业内部,某些任务天然适合 AI,而另一些则深深地嵌入在 Metis 之中。当前行业 AI 的一个主要问题,是将 AI 在这两种任务上的前景和应用模式混为一谈。
在金融领域,高频交易和指数追踪是纯粹的 AI 原生活动,人类甚至无法介入。但信用审批(涉及算法公平性的规范开放纹理)和主动基金管理(涉及索罗斯的反身性:模型会改变其试图建模的市场)则属于 Metis 的范畴。
在医疗领域,放射影像分类是我们的传统强项,属于 AI 原生领域,但治疗方案制定和疾病诊断都涉及到最深层次的 Metis 任务。
在法律领域,电子取证和文本处理是 AI 原生的,但量刑、庭审策略、复杂调解,每一个都深度嵌入在对条文的解读以及不可委托责任的 Metis 之中。
面对这些 Metis AI 任务,业界常见的应对方式是“人机协同”(human-in-the-loop)——先由 AI 完成任务,再由人类进行监督审核。这种思路听起来合理,但研究显示它在实践中常常系统性地失效。Metis 含量越高的任务,事后审查就越显无意义,因为判断者需要重新执行 AI 已完成的任务本身。因此,对于 Metis AI 而言,真正的架构不应是“人机协同”,而应是“人为主导”(human-in-the-lead,即半人马架构)。人是决策者、关系管理者、规范解释者、责任承担者。AI 则提供数据分析、模式识别、情景建模、文稿起草等支持性工作。
值得注意的是,随着 AI 逐步自动化那些相对简单的数字任务,人类的工作重心正逐渐转向那些更难自动化的 Metis 领域。这意味着什么呢?更多的不可逆后果、更复杂的人际网络、更模糊的规范、更激烈的对抗以及更沉重的责任。
希望大家在阅读完这篇短文后,今后当讨论“AI 能否完成 X 任务”时,首先不应询问 AI 的算力或数据是否充足,而是思考 X 任务属于 Techne 还是 Metis。