人工智能:我们真正需要的是可靠的工具而非可信赖的伙伴
我们所需的人工智能:
可靠的帮手而非可信的伙伴
作者:Nicholas George Carroll,
标题(英文):Artificial Goodwill and Human Vulnerability: The Case for Building Merely Reliable, Rather than Trustworthy
期刊:Philosophy & Technology
发布时间:2025年5月
原文链接:https://link.springer.com/article/10.1007/s13347-025-00881-w
人工智能技术正日益成为我们日常生活的重要组成部分。我们常常依赖这一技术在多个领域为我们提供建议或协助我们做决策。然而,我们能否信任(trust)人工智能技术?如果可以,我们是否应该将它们设计得值得信任(trustworthy)?近来的学术研究正聚焦于这一点,但却鲜有研究从信任哲学(philosophical theories of trust)出发来帮助我们了解开发值得信任的人工智能是否必要且可行。在本文,作者介绍了Annette Baier的信任哲学理论,并从该理论中发展出三种“值得信任”的定义,且这三种定义都有可能指导开发出值得信任的人工智能。但在作者来看,无论依据哪种定义,开发值得信任的人工智能都是不可取的,我们应开发的仅是可靠(reliable)的人工智能。
信任是社会运转的基石,然而信任一旦被辜负,就会对人带来巨大的伤害。在人与人之间的关系中,信任尚可以依靠道德、责任等方式来进行控制。而在人与人工智能的关系里,这一问题就变得模糊。为了澄清我们是否需要可信任的人工智能这一问题,作者引入Annette Baier的理论作为分析框架。该理论认为,信任不仅包含“依赖”(reliance)——即相信某方将按预期行动,更关键的是,这种依赖建立在对方怀有“善意”(goodwill)的基础之上。换言之,我们信任一个人,是因为我们相信他不仅有能力,更有意愿按照我们的期望行事而不背叛我们。基于此,论文提炼出三种可能的“值得信任”的定义:基于善意的定义、基于友好感情的定义与基于对信赖关系响应的定义。
构建这三种定义的“值得信任”的人工智能在技术上都是可能实现的,但这样的人工智能会给人带来更多的风险。在人与人的关系中,信任是有被背叛的可能的,这种背叛基于人真实的意图与想法。而人工智能并不能像人一样拥有真实的感知或表达善意的能力。一旦人将真实信任赋予它们,便可能在心理层面产生错误依赖,忽视其因故障风险、失控风险或被滥用的导致无法完成人类任务的可能性。而这种错误的信任会让人受到被背叛的伤害。而当我们把人工智能仅仅视为是“可靠的”,就仅要求其在特定任务中表现稳定,不涉及情感或道德期待。就像书架能够可靠的承载书一样,即使它因不能承担而坍塌,我们也不会因此感到背叛而仅仅感到失望。相比之下,背叛可能会对我们造成更严重且持久的影响,例如影响我们信任他人的能力。仅可靠的人工智能技术无法完成任务的原因只有出现故障。相比之下,值得信赖的人工智能技术既可能因故障而背叛我们,也可能因未能表现出值得信赖的特质而背叛我们。从风险规避角度来看,最好设计出伤害我们最少的人工智能技术。
END.
Jurisprudence of Technology
以大模型为代表的人工智能技术,在政务服务领域正从“试点探索”迈向“深度应用”。从智能问答、智能写作到智能导办、智能决策,大模型逐步成为提升政务服务效率、优化公共服务水平的核心技术支撑。然而,当前政务大模型普遍采用的“大模型+知识库”应用范式,暴露出数据泄露、算法偏见、虚假信息生成等风险,多次引发公众信任危机。
在政务服务场景下,可信不仅是技术问题,更是关乎民众信任和治理效能的重大命题。构建涵盖“计算、语料、模型、知识、场景、生成”的六大可信体系,是推动智能政务服务从“可用”向“可靠”转变的关键所在。构建六大可信体系,夯实可信根基,方能使人工智能技术真正成为提升治理能力、增强群众获得感的“数字公仆”,助力建设透明、高效、有温度的政务服务体系。(本文作者李兵系人民中科研究院院长,吴方、秦晓鲁系人民中科研究院研究员)