标签

蒋舸演讲:AI训练场景下版权合理使用的经济学判断逻辑

发布时间:2026-05-13 08:58来源:微信阅读:5

本次分享聚焦人工智能与版权领域交叉的核心议题——AI训练环节中合理使用的认定问题,从传统版权制度中合理使用的法经济学分析框架出发,探索AI训练相关责任的科学界定路径。

一、版权合理使用的本质逻辑:基于法经济学的市场失灵框架

分析AI训练的合理使用问题,需首先回溯版权合理使用制度的法经济学根基。虽然法律条文列举了多种合理使用情形,但其底层逻辑始终建立在市场失灵理论基础之上。

具体而言,当使用方向权利人寻求授权的交易成本,超过交易所能产生的收益(至少超过使用者自身可获取的收益)时,使用者将因交易摩擦过大而放弃这类有助于提升社会整体福利的使用行为。此时,若法律未将其纳入可免责的合理使用范畴,将面临两难局面:要么使用者放弃使用,阻碍社会福利增长;要么使用者违规使用,削弱法律公信力。

该理论能够有效阐释私人使用、图书馆借阅等传统合理使用场景,尽管存在“交易成本如何量化”“经济效益能否覆盖全部社会需求”等细节层面的分歧,但总体而言,其仍是分析各类合理使用情形的基本框架。该理论的核心要义可归纳为:市场失灵时认定为合理使用;市场正常运行则不认定为合理使用。

二、AI训练合理使用判定的主要误区:误读“许可市场”的真实内涵

将市场失灵理论应用于AI训练场景时,现行主流观点存在显著偏差。

当前一种流行观点认为,AI训练市场不存在失灵现象,其依据是训练数据授权市场已然存在且处于发展期,授权市场的出现即表明市场未失灵,进而得出“AI训练不构成合理使用”的结论。然而这一观点过于粗糙,忽视了关键前提——授权市场上的交易行为,与AI训练阶段的版权授权并非同一回事,需要严格区分AI训练所涉及的具体市场类型,以及该市场是否真正呈现失灵状态。

美国版权局2025年发布的《人工智能与版权报告三》即为这类粗略观点的典型例证。该报告指出,当前已存在活跃的自愿授权市场,且已取得初步进展,应继续推进授权市场建设,仅在授权市场无法覆盖的领域,才考虑延伸性集体管理等替代方案。但结合实际判例分析可知,该观点混淆了“训练数据授权”与“AI训练的版权授权”之间的核心界限。

三、案例验证:区分训练数据授权与AI训练版权授权

多个典型判例可有力证明上述观点,当前AI训练相关的付费行为及责任承担,多数与训练本身的版权问题无直接联系。

在英国法院审理的Getty诉OpenAI案中,OpenAI承担的是商标侵权及反假冒责任,而非因使用作品进行训练而产生的版权责任,争议焦点在于其输出内容未经授权使用了Getty的商标,与训练本身的版权问题毫无关联;美国版权局所提及的“成熟训练数据市场”中,AI企业支付的费用,主要用于数据采集、整理、分类、标注、清洗等劳动对价,或是数据背后的商业秘密价值,而非针对作品本身用于训练的版权授权费用,即便数据涉及版权作品,付费核心亦非版权授权。

再看慕尼黑法院审理的Gemini诉OpenAI案,OpenAI支付的费用,系因训练后输出内容与原作品构成实质性相似(如歌词),属于训练后的版权责任,而非训练过程本身的版权对价;巴斯弗斯诉Anthropic案的15亿美元和解,核心争议在于训练前使用盗版