标签

人工智能的控制与问责:开发者与用户间的协调理论

发布时间:2026-04-28 22:42来源:微信阅读:5

Grote, Gudela, Sharon K. Parker, and Kevin Crowston. 2026. “Taming Artificial Intelligence: A Theory of Control-Accountability Alignment among AI Developers and Users.”Academy of Management Review51(2):278–99. doi:10.5465/amr.2023.0117.

随着能够自主适应的人工智能(AI)系统的涌现,关于其潜在影响的讨论愈发激烈。人工智能被界定为“依赖机器学习、计算和统计技术,并借助海量数据集生成响应、分类或动态预测的系统”(Faraj、Pachidi 和 Sayegh,2018:62)。鉴于人们对其看法差异巨大,人工智能激发了前所未有的想象:一方面,有人将其视为能为企业和社会繁荣带来无限机遇的新型蒸汽机;另一方面,亦有人视其为“需要被严格约束并极其谨慎地部署的庞然大物,以防其反噬创造者并最终毁灭我们”(Roose,2023)。各国政府和监管机构已着手制定管理人工智能风险的规范(例如,欧盟,2023;美国国家标准与技术研究院,2023;白宫,2023),高级别专家组也定期召开会议,旨在就减轻人工智能风险的措施达成国际共识(Hern,2024)。然而,技术的快速迭代使得这些努力面临挑战。ChatGPT及类似大型语言模型(LLM)的公开问世,进一步加剧了对人工智能相关风险的担忧,甚至引发了暂停进一步开发的呼吁,以便技术开发者、政策制定者及监管机构能够制定控制此类系统风险的策略(未来生命研究所,2023)。

当前管理学界的研究辩论反映了对人工智能的两种截然不同的观点。部分学者担忧人工智能可能对员工、组织乃至社会带来深远的负面效应,例如加剧监控、助推虚假信息传播、扩大不平等以及限制人类自主性(Balasubramanian、Ye 和 Xu,2022;Jarvenpaa 和 V€alikangas,2020;Kane、Young、Majchrzak 和 Ransbotham,2021;Kellogg、Valentine 和 Christin,2020;Zuboff,2019)。与此同时,另一些研究则持更为乐观的态度,尤其是在企业价值创造方面(Brock & von Wangenheim,2019;Murray、Rhymer & Sirmon,2021;Shresta、Ben-Menahem & von Krogh,2019),以及在改善医疗保健和应对气候变化等社会层面(Chhillar & Aguilera,2022;Floridi、Cowls、King & Taddeo,2021)。

社会技术设计思维(例如,Clegg,2000;Hollnagel & Woods,2005;Leonardi,2012)普遍认为,技术的实际影响受到多种因素的制约,包括技术本身的特性以及用户如何在日常实践中整合和理解技术(例如,Bailey & Barley,2020;Leonardi & Barley,2010;Orlikowski & Scott,2008;Parker & Grote,2022)。“人机交互”的理念强调,为了确保技术系统的安全有效运行,人类必须拥有对其的控制权,这被视为发挥技术积极作用的关键(Billings,1997;Endsley,2023;Hollnagel & Woods,2005)。然而,赋予人类充分的控制权并非易事,许多复杂技术的失效案例,如波音737 Max的悲剧性空难,飞行员在面对故障软件的操作时无法有效干预,便证明了这一点。波音的事件也揭示了技术设计决策如何可能受到商业利益的驱动,而这些利益有时会压倒良好的人机交互(Norman & Euchner,2023)。

在人工智能领域,控制与问责的议题同样凸显。一些观点认为,可解释和可理解的人工智能有助于强化人类的控制,其应用旨在增强而非替代人类的决策(例如,Choudhary、Marchetti、Shresta 和 Puranam,2025;Langer 等人,2021;Raisch 和 Fomina,2025;Rudin,2019)。问责制及其相关的基本伦理考量受到了前所未有的重视,尤其是在人工智能对劳动者以外的更广泛社会群体产生影响之后(Floridi 等人,2018)。人工智能也成为了商业利益驱动技术发展的一个典型案例(Roose,2023)。

然而,一些关键的技术和组织细节促使研究者们重新审视如何协调人工智能技术的控制与问责,这正是本文理论探讨的起点。最显著的区别在于,当代人工智能的开发过程涉及从新的人工智能系统使用前后产生的大量数据集中进行学习,这使得人工智能成为首个其使用方式能够从根本上重塑其自身的技术(例如,Faraj等人,2018;Jacobides、Brusoni和Candelon,2021;Slota等人,2023)。自学习人工智能系统的复杂性和动态性极大地削弱了其透明度和可预测性,产生了所谓的“黑箱问题”,即使是人工智能开发者,其控制力也受到限制(Asatiani、Malo、Nagbol、Penttinen、Rinta-Kahila和Salovaara,2021;Berente、Gu、Recker和Santhanam,2021;Castelvecchi,2016;Diakopoulos,2016;Rudin,2019)。例如,据报道,谷歌通过简单地屏蔽“大猩猩”图像类别,解决了其图像识别算法将黑人误识别为大猩猩的问题。然而,软件开发者选择这种快速修复的原因尚不明确:是由于他们未能找到更完善的解决方案,还是因为资源投入不足,抑或其他原因(Vincent,2018)。同样,大型语言模型(LLM)的开发者在为其系统添加“防护措施”或消除“幻觉”(即不相关、错误或捏造的信息)方面遇到的困难,促使研究者们呼吁开发能够将LLM输出更好地置于上下文中的AI弹性界面(Glassman、Gu和Kummerfeld,2024)。

此外,开发与使用之间的紧密联系模糊了人工智能开发者和用户应承担的控制与责任界限(Wieringa,2020)。管理训练数据中的偏差是开发者与用户如何相互依赖以确保算法和系统结果有效性的一个典型例子(例如,Choudhary 等人,2025;Teodorescu、Morse、Awwad 和 Kane,2021)。然而,通常需要考虑整个人工智能供应链,这包括数据提供商、通过云服务提供大型人工智能模型访问权限的公司,以及协助人工智能用户理解系统输出的知识中介,这造成了责任分配上的“多方参与”困境(Cobbe、Veale 和 Singh,2023;Waardenburg 和 Huysman,2022;Waardenburg、Huysman 和 Sergeeva,2022)。

随着人工智能系统自主适应能力的日益增强,我们似乎正走向一个人类不再拥有完全系统控制权的新阶段。然而,根据现行法律标准,在可预见的未来,人工智能系统的后果仍需由人类承担(Burton、Habli、Lawton、McDermid、Morgan & Porter,2020)。因此,所有参与人工智能开发和使用的相关方的控制权下降,给问责机制的分配带来了新的挑战。此外,相关方之间日益增强的相互依赖性也使得明确界定控制权和问责权变得更加困难。本文作者将论证,在现有社会技术原则的指导下,控制与问责的协调一致能够降低人工智能风险,但如何实现和促进这种协调则需要重新思考。因此,本文的理论旨在探讨一个根本性问题:如何协调人工智能系统的控制与问责,以有效降低其潜在风险?

为解答此问题,作者们将整合关于控制与问责、相关方治理以及相关方协商的研究成果。作者们阐述了控制与问责机制的协调如何有助于减轻人工智能风险,因为控制赋予了相关方实现预期目标并避免不良后果的动力,而问责机制则激励他们采取行动。人工智能风险不仅包括使用人工智能可能带来的负面后果,例如招聘过程中的偏见、医疗诊断失误或对员工/客户的不公平对待,还包括控制与问责机制本身不协调所产生的风险,例如相关工作人员的压力和福祉下降,以及相关组织遭受的财务或声誉损失。作者们探讨了不同程度的人工智能系统自主适应性对人工智能用户和开发者控制与问责机制转变的影响,并明确了哪些条件更有利于就控制与问责机制的协调做出有效决策,从而实现充分的风险缓解。特别是,作者们提出,在人工智能的整个生命周期中,采用更加分散的相关方治理模式和整合式协商,让所有相关方参与其中,是实现人工智能开发和使用过程中控制与问责机制协调的关键前提。

作者们的理论从多个维度丰富了对人工智能影响的管理学研究。首先,在人工智能工作者活动的微观层面,作者们深入分析了人工智能开发者与用户如何协同降低人工智能风险。迄今为止,对控制-问责一致性的关注几乎完全集中在人工智能技术用户的工作条件上(Parker & Grote,2022)。作者们认为,随着人工智能任务相互依赖性的增强,这种视角过于片面,若忽视人工智能开发者的控制-问责问题,将可能带来重大风险。其次,在组织运作的中观层面,作者们借鉴了组织控制和治理领域的文献(Aguilera、Filatotchev、Gospel & Jackson,2008;Sitkin、Long & Cardinal,2020),详细阐述了如何在不同组织的不同参与者之间协调先进人工智能系统的控制与问责,并提出了支持这种协调的组织性措施。因此,作者们为管理人工智能供应链中的“多方参与”问题提供了一些思路(Cobbe et al., 2023)。第三,在相关方关系的宏观层面,作者们提出了在更加分散的治理模式下进行整合式相关方协商的条件。由此,作者们为近期关于如何有效处理人工智能治理中相关方权力差异的讨论做出了贡献(Chhillar & Aguilera, 2022)。

总而言之,作者们的理论与近期关于以更全面的视角处理技术开发与使用问题的观点相契合,这些观点涵盖了权力动态、对技术目的与影响的不同解读,以及新兴使用模式的有限可预测性等议题(Anthony, Bechky & Fayard, 2023; Bailey & Barley, 2020)。需要指出的是,作者们并未直接探讨人工智能的预期用途:他们只是具体阐述了使预期用途更有可能成功实现的条件。因此,作者们的理论并未直接回应当前关于人工智能被用于恶意目的的风险讨论,例如算法管理(Kellogg等人,2020)或过度监控(Zuboff,2019)。然而,在人工智能用户几乎没有或完全没有控制权的情况下,将实现预期结果和避免不良结果的责任分配给人工智能开发者,或许可以间接降低恶意人工智能出现的可能性。