AI军事应用带来的法律、伦理与技术挑战
“21世纪关键技术”关注科技未来发展趋势,研究21世纪前沿科技关键技术的需求,和影响。将不定期推荐和发布世界范围重要关键技术研究进展和未来趋势研究。
当以色列国防军在加沙冲突中运用名为“薰衣草”(Lavender)的人工智能目标锁定系统,据悉据此生成超过3.7万个哈马斯目标候选名单时,一个此前长期停留在学术讨论层面的问题骤然变得紧迫:当杀戮决策通过算法加速与分散,现有国际法框架还能否有效约束战争?这一现实困境,正是由荷兰研究委员会(NWO-MVI)资助、T.M.C.阿塞尔研究所主导的DILEMA项目(将国际法与伦理整合进军事人工智能项目)多年研究工作的出发点,也是其近期重要成果——学术专著《军事人工智能中的法律、伦理和技术困境》(Legal, Ethical, and Technical Dilemmas in Military Artificial Intelligence)——所着力回答的核心命题。
这部由贝雷尼斯·布坦(Bérénice Boutin)、泰勒·凯特·伍德科克(Taylor Kate Woodcock)和萨贾德·索尔坦扎德(Sadjad Soltanzadeh)主编、斯普林格出版社出版的论文集,汇集了来自国际法、军事伦理、计算机科学与政策研究等多个领域的13章专题研究,并在2023年10月举办的DILEMA国际会议成果基础上深度扩展而来。该书将理论探讨与政策建议贯穿始终,试图为一个正被技术加速重塑的领域提供严肃的智识坐标。
DILEMA项目最具挑战性的理论贡献之一,是对现有政策讨论框架的系统性纠偏。长期以来,军事AI的国际辩论几乎被“致命性自主武器系统”(AWS)这一单一议题所主导——争论焦点集中于机器能否在没有人类干预的情况下自主选择并攻击目标。该书认为,这种聚焦虽然必要,却遮蔽了一个更广泛、更普遍也更迫切的问题领域:那些被定性为“辅助”人类决策而非取代人类决策的AI系统。
决策支持系统(DSS)、情报分析工具、目标识别软件——这些系统在设计上要求人类保持控制权,但在实际操作中,尤其是在时间压力极大的高烈度战场环境中,人类操作者往往倾向于直接采纳算法推荐,而不对其背后的逻辑进行审查。这一现象被称为“自动化偏见”(automation bias)。书中多位作者指出,当AI系统变得越来越复杂、响应越来越迅速,人机之间的控制边界并非静止的制度设计,而是在实践中持续变形、消融的动态过程。
在这个意义上,“有意义的人类控制”(meaningful human control,MHC)——这一被广泛援引的国际法概念——面临根本性挑战。布坦与伍德科克合著的章节明确指出,MHC不能仅仅停留在制度安排层面的形式性保障,必须在AI系统设计、测试和部署的全生命周期中落实为可操作的技术与法律标准。否则,人类控制将只是一个书面上存在、实践中空洞的概念。
该书另一条贯穿始终的主线,是对现行国际人道法(IHL)在AI时代适用性的深度审视。传统IHL框架以清晰的指挥链条和可识别的责任主体为前提——命令由人发出,决策由人负责,伤亡由人承担。但AI系统的介入从根本上改变了这一结构:责任在开发者、系统设计者、军事指挥官和前线操作者之间弥散分布,形成所谓“多手问题”(many hands problem)与“责任鸿沟”(responsibility gap)。
本书末章由布坦独立撰写,题为《疏忽与故障之间:如何处理AI失误的责任》,这一问题被置于国家层面的尽职调查义务框架下加以考察。她指出,机器学习系统的不可预测性——包括训练数据偏差、分布外场景下的行为突变,以及所谓“涌现行为”——对现有国际法中的可预见性标准构成严峻挑战。当一架无人机因训练集未覆盖特定视角下的服装图案而将平民识别为目标,这究竟是技术故障、设计疏忽,还是指挥官的责任?书中援引的一个思想实验场景令人警醒:AI无人机在经过严格测试的情况下仍发生“幻觉”致使平民伤亡,而此类事件最终极可能被归类为“战争中不可避免的意外”,从而规避任何形式的法律追责。
法兰克福和平研究所的伊丽莎白·霍夫伯格尔-皮潘(Elisabeth Hoffberger-Pippan)在其专章中则将分析焦点转向大型语言模型(LLMs)。她的研究具有相当的前沿性:当美国军队已在测试“多诺万”(Donovan)和“哥谭”(Gotham)等LLM辅助作战规划系统时,这些工具是否需要接受《日内瓦公约附加议定书》第36条规定的武器审查程序,在国际法学界尚无定论。霍夫伯格尔-皮潘的结论审慎而精确:LLM通常不构成武器或武器系统,但根据其设计方式和实际部署方式,可能被认定为“战争手段或方法”,从而触发第36条义务。各国对“战争方法”这一术语的解释分歧显著——英国将其理解为“战争如何进行”,德国将其延伸至军事行动的规划与概念,这种解释碎片化本身就是问题的一部分。
克劳迪亚·克罗诺夫斯卡(Klaudia Klonowska)与伍德科克在合著章节中进一步揭示了法律讨论中另一层潜藏的认识论陷阱:人与AI能力的类比修辞。她们指出,当法律学者试图通过将AI的速度、精度与人类士兵相比较来确立AI的法律地位时,这种比较实际上简化了AI系统的复杂性,并误导了IHL合规分析的方向。AI并不是“更快的人”,也不是“更准的步枪”;它是一套嵌入社会-技术结构的复杂系统,其行为不能用针对人类行为者的法律概念直接度量。
该书第三部分聚焦技术层面,试图回答一个更具体的问题:能否将IHL原则直接编码进AI系统,使其在部署时自动保持法律合规?托马什·祖雷克(Tomasz Zurek)和汤姆·范·恩格斯(Tom van Engers)在计算模型章节中提出了一套将IHL规则转化为形式语言的框架,涵盖比例原则(proportionality)和区分原则(distinction)的算法表达。然而,作者并未对这一路径抱有天真的乐观:他们明确指出,IHL原则在本质上要求语境性解读和道德判断,这恰恰是当前任何计算系统都无法真正复现的能力。
萨贾德·索尔坦扎德在其独立撰写的章节中将这一批判推至哲学层面。他论证道,无论是基于规则的系统还是数据驱动的机器学习模型,在处理军事行动中具有规范意义的决策时都存在根本性局限:前者无法捕捉道德推理所必需的情境灵活性,后者则在真实战场环境中难以测试,且不可预测性本身就构成法律与伦理风险。他的核心结论直截了当:将具有规范意义的军事决策委托给AI系统,在当前技术水平下既不被法律许可,也在伦理上难以辩护。
荷兰应用科学研究组织(TNO)的伊里斯·科恩(Iris Cohen)等人提出的“情境化AI引入方法”(CAIOM)则是这一部分相对务实的贡献。该方法强调,军事AI系统的性能评估必须嵌入具体的操作情境,避免一刀切的通用标准,并需要纳入多方利益相关者的系统性评估。乔纳森·奎克(Jonathan Kwik)的章节则进一步发展出“迭代评估”框架,主张AI系统的法律合规评估不应停留于初始部署审核,而必须贯穿系统全生命周期——因为机器学习模型在实战部署后可能随时间漂移,产生与测试阶段截然不同的行为。
在全球治理层面,该书直面当前多边谈判的困境。自主武器相关的联合国特定常规武器公约政府专家组(CCW GGE)已历经多年磋商,至今未能达成具有法律约束力的协议。美国、俄罗斯、中国等主要军事强国在核心问题上立场分歧,加之各国对AI军事投资的竞争性焦虑,使国际规范的建立陷入典型的安全困境。
马塞尔·施利布斯(Marcel Schliebs)和凡妮莎·沃斯(Vanessa Vohs)在最后一章探索了多边协议失灵情境下的替代路径,提出国家立法与行业自律的“双轨方法”。他们认为,在志同道合国家之间推动立法收敛,同时借助AI企业在采购和出口中的话语权形成事实性规范压力,或许是在全球条约遥遥无期时的务实选择。索菲亚·罗曼斯基(Sofia Romansky)和蒂姆·斯韦斯(Tim Sweijs)则援引中心为战略研究的海牙战略研究中心的分析视角,强调“责任”(responsibility)概念必须成为国际军事AI治理框架的核心——不仅是事后追责的法律工具,更是驱动负责任研发与部署的前期规范动力。
DILEMA项目的一个重要政策主张贯穿全书:监管必须前置于部署。与其依赖事后的损害救济,各国应在AI系统的研发与测试阶段就嵌入法律与伦理审查机制。这一主张对正在快速推进军事AI投资的各国政府具有明确的政策含义——当自动化偏见和算法不透明性已在真实冲突中造成平民伤亡时,“部署后再规范”的路线几乎必然是滞后且不充分的。
《军事人工智能中的法律、伦理和技术困境》的价值,不仅在于它对一个快速演变领域的及时记录,更在于它以跨学科的严谨性揭示了这场变革的深层结构性矛盾:国际法的规范体系建立于一个人类行为者可被识别、意图可被追溯的世界,而AI驱动的战争正在系统性地消解这一前提。在加沙、乌克兰等真实战场上,算法决策的后果已无可回避。这部著作提醒政策制定者、法律学者和技术开发者:此刻的每一个设计选择和规范空白,都将以人命为代价。