法律AI的困境:功能强大不等于值得信赖
本文由律商联讯(励讯集团旗下法律信息服务公司)全球执行副总裁兼总法律顾问Alexandra Smyth撰写,并在《财富》杂志发表。Alexandra对人工智能的炒作进行了剖析,并指出,法律界问错了问题——关键不在于哪个人工智能功能最强大,而在于哪个人工智能在法庭上值得信赖,这二者之间的区别至关重要。
上个月,阿拉巴马州一个家庭输掉了一场信托纠纷,因为他们的律师援引了根本不存在的案例。阿拉巴马州最高法院驳回了他们的上诉,称其行为"极其恶劣",并禁止该律师在没有共同律师签字的情况下再次向该法院提交文件。
同月,俄勒冈州一名联邦法官对两名律师处以11万美元罚款——这是美国法律史上最大的AI"幻觉"罚单,原因是他俩提交了23个捏造的引证和8段虚构的引文。该案随后被驳回。
在曼哈顿,一名法官最近裁定,一名被告使用通用AI聊天机器人协助准备辩护,已构成对律师-客户特权的放弃。如果你将自己的辩护策略输入聊天机器人,政府可以传唤调取、阅读并将其用作对你不利的证据。
根据律师兼数据科学家Damien Charlotin编制的数据库,全球已有超过1300起案件中,法院或仲裁庭对法律文件中的AI生成"幻觉"发表了评论。每一起案件背后,都有一个支付了律师费、信任法律体系的当事人;而在更多情况下,背后坐着的,是一个对"自信满满地生成文本、却毫无自我核查能力"的技术盲目信任的律师。
并非所有AI都生而平等。在基于开放网络训练的通用大语言模型(如ChatGPT和Claude)与接入律师数十年来一直使用的专业数据库的行业专用法律AI工具之间,存在本质区别。遗憾的是,华尔街似乎难以区分二者。
最近Anthropic为Claude发布法律插件时,引发了科技股约2850亿美元的抛售。然而,全球各地法庭中发生的混乱局面讲述了一个不同的故事——解决法律领域的AI问题,远比调整一个标准大语言模型困难得多。
她现在最常被问到的问题是:“哪种AI能力最强?”Alexandra认为这个问题问错了。真正该问的是:“哪种AI在法庭上值得信赖?”这是两个截然不同的问题。在法律领域,“能力强”和“可信赖”根本不是一回事。
律师的义务同时指向当事人和法庭。美国律师协会已指出其《职业行为示范规则》中有五条直接受AI使用影响,涉及专业能力、保密义务、对法庭的诚实义务和监督责任。
当律师提交一个"幻觉"引证时,他们辜负了当事人的信任。这也是对法庭的失职。事实上,它腐蚀了整个法律体系赖以运转的记录基础。
这一结构性问题远比律师使用哪个模型更深层。通用AI的设计目标是生成看起来像正确答案的文本,在大多数领域,这确实能完成大部分工作。但在法律领域,这是错误的方向。模型无法核实它所引用的案例是否真实存在,无法核实案例是否如诉状所声称的那样表述,也无法核实该案例是否仍具有约束力先例的效力。这一差距是架构性的,不是通过下一轮训练就能解决的能力问题。后果是实实在在的:律师受到处罚,诉求被驳回,被告被交到检方手中。
对任何法律AI工具应该问的问题,不是它在基准测试中表现如何,而是它建立在什么基础之上,以及律师是否能够在公开法庭上追溯、核实并为输出结果负责。
AI改变法律实践有两种方式。第一种是"压缩"——同样的工作,更快的速度。第二种是"扩展"——以前从未有过的工作。AI在法律领域的扩展潜力巨大,但它只能建立在不捏造法律条文的基础之上。基于数十年来特定法官判决数据构建的诉讼策略,不是现有工作的加速版,而是前所未有的一种工作。嵌入交易文件中、能在法律变更时即时更新的合规监控也是如此。类似的例子还有很多,而且每周都在增加。
市场终将为法律行业一直以来的认知定价:在法律领域,一个错误答案的代价,是某人的自由、资产,或其家庭的未来。