法律AI的困境：功能强大不等于值得信赖

发布时间：2026-06-10 11:57阅读：24

本文由律商联讯（励讯集团旗下法律信息服务公司）全球执行副总裁兼总法律顾问Alexandra Smyth撰写，并在《财富》杂志发表。Alexandra对人工智能的炒作进行了剖析，并指出，法律界问错了问题——关键不在于哪个人工智能功能最强大，而在于哪个人工智能在法庭上值得信赖，这二者之间的区别至关重要。

上个月，阿拉巴马州一个家庭输掉了一场信托纠纷，因为他们的律师援引了根本不存在的案例。阿拉巴马州最高法院驳回了他们的上诉，称其行为"极其恶劣"，并禁止该律师在没有共同律师签字的情况下再次向该法院提交文件。

同月，俄勒冈州一名联邦法官对两名律师处以11万美元罚款——这是美国法律史上最大的AI"幻觉"罚单，原因是他俩提交了23个捏造的引证和8段虚构的引文。该案随后被驳回。

在曼哈顿，一名法官最近裁定，一名被告使用通用AI聊天机器人协助准备辩护，已构成对律师-客户特权的放弃。如果你将自己的辩护策略输入聊天机器人，政府可以传唤调取、阅读并将其用作对你不利的证据。

根据律师兼数据科学家Damien Charlotin编制的数据库，全球已有超过1300起案件中，法院或仲裁庭对法律文件中的AI生成"幻觉"发表了评论。每一起案件背后，都有一个支付了律师费、信任法律体系的当事人；而在更多情况下，背后坐着的，是一个对"自信满满地生成文本、却毫无自我核查能力"的技术盲目信任的律师。

并非所有AI都生而平等。在基于开放网络训练的通用大语言模型（如ChatGPT和Claude）与接入律师数十年来一直使用的专业数据库的行业专用法律AI工具之间，存在本质区别。遗憾的是，华尔街似乎难以区分二者。

最近Anthropic为Claude发布法律插件时，引发了科技股约2850亿美元的抛售。然而，全球各地法庭中发生的混乱局面讲述了一个不同的故事——解决法律领域的AI问题，远比调整一个标准大语言模型困难得多。

她现在最常被问到的问题是：“哪种AI能力最强？”Alexandra认为这个问题问错了。真正该问的是：“哪种AI在法庭上值得信赖？”这是两个截然不同的问题。在法律领域，“能力强”和“可信赖”根本不是一回事。

律师的义务同时指向当事人和法庭。美国律师协会已指出其《职业行为示范规则》中有五条直接受AI使用影响，涉及专业能力、保密义务、对法庭的诚实义务和监督责任。

当律师提交一个"幻觉"引证时，他们辜负了当事人的信任。这也是对法庭的失职。事实上，它腐蚀了整个法律体系赖以运转的记录基础。

这一结构性问题远比律师使用哪个模型更深层。通用AI的设计目标是生成看起来像正确答案的文本，在大多数领域，这确实能完成大部分工作。但在法律领域，这是错误的方向。模型无法核实它所引用的案例是否真实存在，无法核实案例是否如诉状所声称的那样表述，也无法核实该案例是否仍具有约束力先例的效力。这一差距是架构性的，不是通过下一轮训练就能解决的能力问题。后果是实实在在的：律师受到处罚，诉求被驳回，被告被交到检方手中。

对任何法律AI工具应该问的问题，不是它在基准测试中表现如何，而是它建立在什么基础之上，以及律师是否能够在公开法庭上追溯、核实并为输出结果负责。

AI改变法律实践有两种方式。第一种是"压缩"——同样的工作，更快的速度。第二种是"扩展"——以前从未有过的工作。AI在法律领域的扩展潜力巨大，但它只能建立在不捏造法律条文的基础之上。基于数十年来特定法官判决数据构建的诉讼策略，不是现有工作的加速版，而是前所未有的一种工作。嵌入交易文件中、能在法律变更时即时更新的合规监控也是如此。类似的例子还有很多，而且每周都在增加。

市场终将为法律行业一直以来的认知定价：在法律领域，一个错误答案的代价，是某人的自由、资产，或其家庭的未来。

← 上一篇：AI 重塑制造：智能设计与虚拟验证的三阶进化之路下一篇：微科盟AI科研助手——全流程智能科研解决方案 →