军事AI面临法律伦理与技术三重挑战

发布时间：2026-05-27 13:16阅读：16

“21世纪关键技术”聚焦科技演进方向，探讨21世纪前沿核心技术的实际需求及其深远影响。平台将不定期甄选并发布全球范围内关键技术的研发进展与未来走向预测。

当以色列国防军在加沙地带冲突中启用代号为“薰衣草”（Lavender）的AI目标筛选系统，并据称生成了超过3.7万个哈马斯潜在目标名单时，一个长期局限于学术探讨的议题瞬间变得迫在眉睫：当杀戮决策经由算法加速并分散执行时，现行的国际法体系是否仍能对战争实施有效制约？这一现实难题，正是由荷兰研究委员会（NWO-MVI）资助、T.M.C.阿塞尔研究所牵头的DILEMA项目（将国际法与伦理融入军事人工智能）历经多年研究的核心起点，也是其近期重磅成果——学术专著《军事人工智能中的法律、伦理和技术困境》（Legal, Ethical, and Technical Dilemmas in Military Artificial Intelligence）——致力回应的关键命题。

这部由贝雷尼斯·布坦（Bérénice Boutin）、泰勒·凯特·伍德科克（Taylor Kate Woodcock）及萨贾德·索尔坦扎德（Sadjad Soltanzadeh）联合主编、斯普林格出版社发行的论文集，集结了国际法、军事伦理、计算机科学及政策研究等跨学科领域的13篇深度专题研究，并在2023年10月举办的DILEMA国际会议成果基础上进行了大幅扩充。全书将理论思辨与政策建议紧密结合，旨在为一个正被技术急速重塑的领域确立严谨的智识坐标。

DILEMA项目最具突破性的理论贡献，在于对现有政策讨论框架的系统性修正。长久以来，关于军事AI的国际辩论几乎被“致命性自主武器系统”（AWS）这一单一议题所垄断——争论核心在于机器是否能在无人干预下自主选定并攻击目标。本书指出，此类聚焦虽有必要，却掩盖了一个更广泛、更普遍且更为紧迫的问题域：那些被定义为“辅助”而非“取代”人类决策的AI系统。

决策支持系统（DSS）、情报分析工具、目标识别软件——这些系统在设计初衷上要求人类保留控制权，但在实际运行中，特别是在时间紧迫的高强度战场环境下，人类操作员往往倾向于直接采纳算法建议，而不再深究其背后的逻辑。这种现象被称为“自动化偏见”（automation bias）。书中多位作者强调，随着AI系统日益复杂、响应愈发迅捷，人机之间的控制边界并非静止的制度设定，而是在实践中持续扭曲、消融的动态过程。

在此语境下，“有意义的人类控制”（meaningful human control，MHC）——这一被广泛引用的国际法概念——正面临根本性挑战。布坦与伍德科克合著的章节明确指出，MHC不能仅停留在制度层面的形式化保障，必须在AI系统的设计、测试及部署全生命周期中转化为可执行的技术与法律标准。否则，人类控制将沦为纸面存在、实践中空洞的概念。

本书另一条贯穿始终的主线，是对现行国际人道法（IHL）在AI时代适用性的深度审视。传统IHL框架建立在清晰的指挥链条与可辨识的责任主体之上——命令由人下达，决策由人负责，伤亡由人承担。然而AI系统的介入彻底颠覆了这一结构：责任在开发者、系统设计者、军事指挥官及前线操作员之间弥散分布，形成了所谓的“多手问题”（many hands problem）与“责任鸿沟”（responsibility gap）。

本书末章由布坦独立撰写，题为《疏忽与故障之间：如何处理AI失误的责任》，该问题被置于国家层面的尽职调查义务框架下展开探讨。她指出，机器学习系统的不可预测性——涵盖训练数据偏差、分布外场景下的行为突变，以及所谓的“涌现行为”——对现行国际法中的可预见性标准构成严峻挑战。当一架无人机因训练集未覆盖特定视角下的服装图案而误将平民识别为目标，这究竟是技术故障、设计疏忽，还是指挥官的责任？书中援引的一个思想实验场景令人警醒：AI无人机在经历严格测试后仍发生“幻觉”致平民伤亡，而此类事件最终极可能被归类为“战争中不可避免的意外”，从而规避任何形式的法律追责。

法兰克福和平研究所的伊丽莎白·霍夫伯格尔-皮潘（Elisabeth Hoffberger-Pippan）在其专章中将分析焦点转向大型语言模型（LLMs）。她的研究极具前瞻性：当美军已在测试“多诺万”（Donovan）和“哥谭”（Gotham）等LLM辅助作战规划系统时，这些工具是否需接受《日内瓦公约附加议定书》第36条规定的武器审查程序，在国际法学界尚无定论。霍夫伯格尔-皮潘的结论审慎而精准：LLM通常不构成武器或武器系统，但依据其设计方式与实际部署形态，可能被认定为“战争手段或方法”，从而触发第36条义务。各国对“战争方法”这一术语的解释存在显著分歧——英国将其解读为“战争如何进行”，德国则将其延伸至军事行动的规划与概念，这种解释的碎片化本身就是问题的一部分。

克劳迪亚·克罗诺夫斯卡（Klaudia Klonowska）与伍德科克在合著章节中进一步揭示了法律讨论中另一层潜藏的认识论陷阱：人与AI能力的类比修辞。她们指出，当法律学者试图通过将AI的速度、精度与人类士兵相比较来确立AI的法律地位时，这种比较实际上简化了AI系统的复杂性，并误导了IHL合规分析的方向。AI并非“更快的人”，也非“更准的步枪”；它是一套嵌入社会 - 技术结构的复杂系统，其行为无法用针对人类行为者的法律概念直接衡量。

该书第三部分聚焦技术层面，试图回答一个更为具体的问题：能否将IHL原则直接编码进AI系统，使其在部署时自动保持法律合规？托马什·祖雷克（Tomasz Zurek）和汤姆·范·恩格斯（Tom van Engers）在计算模型章节中提出了一套将IHL规则转化为形式语言的框架，涵盖比例原则（proportionality）和区分原则（distinction）的算法表达。然而，作者并未对这一路径抱有天真的乐观：他们明确指出，IHL原则在本质上要求语境化解读与道德判断，这恰恰是当前任何计算系统都无法真正复现的能力。

萨贾德·索尔坦扎德在其独立撰写的章节中将这一批判推至哲学层面。他论证道，无论是基于规则的系统还是数据驱动的机器学习模型，在处理军事行动中具有规范意义的决策时均存在根本性局限：前者无法捕捉道德推理所必需的情境灵活性，后者则在真实战场环境中难以测试，且不可预测性本身就构成法律与伦理风险。他的核心结论直截了当：将具有规范意义的军事决策委托给AI系统，在当前技术水平下既不被法律许可，也在伦理上难以辩护。

荷兰应用科学研究组织（TNO）的伊里斯·科恩（Iris Cohen）等人提出的“情境化AI引入方法”（CAIOM）则是这一部分相对务实的贡献。该方法强调，军事AI系统的性能评估必须嵌入具体的操作情境，避免一刀切的通用标准，并需纳入多方利益相关者的系统性评估。乔纳森·奎克（Jonathan Kwik）的章节则进一步发展出“迭代评估”框架，主张AI系统的法律合规评估不应止步于初始部署审核，而必须贯穿系统全生命周期——因为机器学习模型在实战部署后可能随时间漂移，产生与测试阶段截然不同的行为。

在全球治理层面，该书直面当前多边谈判的困境。自主武器相关的联合国特定常规武器公约政府专家组（CCW GGE）已历经多年磋商，至今未能达成具有法律约束力的协议。美国、俄罗斯、中国等主要军事强国在核心问题上立场迥异，加之各国对AI军事投资的竞争性焦虑，使国际规范的建立陷入典型的安全困境。

马塞尔·施利布斯（Marcel Schliebs）和凡妮莎·沃斯（Vanessa Vohs）在最后一章探索了多边协议失灵情境下的替代路径，提出国家立法与行业自律的“双轨方法”。他们认为，在志同道合国家之间推动立法收敛，同时借助AI企业在采购和出口中的话语权形成事实性规范压力，或许是在全球条约遥遥无期时的务实选择。索菲亚·罗曼斯基（Sofia Romansky）和蒂姆·斯韦斯（Tim Sweijs）则援引中心为战略研究的海牙战略研究中心的分析视角，强调“责任”（responsibility）概念必须成为国际军事AI治理框架的核心——不仅是事后追责的法律工具，更是驱动负责任研发与部署的前期规范动力。

DILEMA项目的一项重要政策主张贯穿全书：监管必须前置于部署。与其依赖事后的损害救济，各国应在AI系统的研发与测试阶段就嵌入法律与伦理审查机制。这一主张对正在快速推进军事AI投资的各国政府具有明确的政策含义——当自动化偏见和算法不透明性已在真实冲突中造成平民伤亡时，“部署后再规范”的路线几乎必然是滞后且不充分的。

《军事人工智能中的法律、伦理和技术困境》的价值，不仅在于它对一个快速演变领域的及时记录，更在于它以跨学科的严谨性揭示了这场变革的深层结构性矛盾：国际法的规范体系建立于一个人类行为者可被识别、意图可被追溯的世界，而AI驱动的战争正在系统性地消解这一前提。在加沙、乌克兰等真实战场上，算法决策的后果已无可回避。这部著作提醒政策制定者、法律学者和技术开发者：此刻的每一个设计选择和规范空白，都将以人命为代价。

阅读报告全文，请访问21世纪关键技术的“未来知识库”

截止到4月30日“未来知识库”精选的百部前沿科技趋势报告

（加入未来知识库，全部资料免费阅读和下载）