AI侵犯著作权刑事风险研究——从生成式技术视角切入(上部)
摘要:近年来,伴随人工智能技术的爆发式增长,AIGC(人工智能生成内容)已深度融入大众日常生活。无论生活场景还是学习场景,人们皆可依托人工智能技术获取所需解决方案。然而,AIGC衍生的法律责任亦随之攀升。本文拟从刑事责任维度,剖析AI从训练端到输出端可能牵涉的系列刑责问题。
引言:由"文生图首案"引发的刑法追问
我国首例AI生成内容著作权侵权纠纷(2023)京0491民初11279号案所触发的刑事责任思考
案情介绍:原告李某与被告刘某因侵害作品署名权、信息网络传播权产生纠纷。原告借助开源软件Stable Diffusion创作涉案图片,并于小红书平台发布。被告在百家号账号发表文章时,将该图片作为配图使用,既未获原告授权,又截除原告在小红书平台的署名水印。原告主张被告行为侵害其合法权益,诉请赔礼道歉并赔偿经济损失。
设问:若用户利用AI创作《三体》续篇并营利,AI开发者、运营方、使用者何者须负刑责?
一、冲击与嬗变:AI重构侵犯著作权犯罪的行为架构
(一)行为模式的转型:从"复制+发行"到"输入+输出"
传统侵犯著作权方式仅限于人工复制粘贴,将《中华人民共和国著作权法》(2020修正)(下称"著作权法")规制的各类作品予以复制、发行、表演、放映等。
然当今AI已普及至日常生活,催生出侵犯著作权罪的新型样态。此处需简要阐释AIGC的运行机理。以常见模型GPT-3为例,其囊括精简后的Common Crawl数据集、WebText数据集、图书语料库及经精心筛选的英文维基百科高质量数据集。开发者投喂海量数据与参数后,模型学习并提取特征,依据提示词要求生成用户所需内容,继而优化反馈,使输出内容更契合预期质量与风格。
前述"数据"置于知识产权语境即"作品"。循此分析,不难发现AI在上述运作流程中潜藏的著作权侵权风险:AI开发者的训练数据来源何处?获取途径为何?所获取作品是否经著作权人许可或授权用于生成?若AI模型训练采用"海量数据"抓取著作权作品(如爬虫获取小说、图片),是否构成《刑法》第217条【侵犯著作权罪】之"复制发行"?AI模型基于被侵权著作权产品生成风格近似或易混淆的作品,使用者及开发者是否须承担责任?
上述系列问题不仅构成法律疑难,更对商业秩序、社会伦理造成结构性冲击。
(二)主观要件模糊化:
生成式人工智能模型可依使用者要求实施创作。于开篇之际,笔者已提出设问。此处增设一假设条件:用户须承担刑事责任。将此假设代入设问,用户怀揣侵权目的,意图营利,凭借"提示词工程"成功生成《三体》续篇,则从刑事责任角度审视,开发者是否构成共同犯罪?
探究开发者是否须负刑责,尚需回归《刑法》总则,即开发者是否具有犯罪故意。
使用AI过程中,细察可知AI于文末标注"文本由AI生成、内容仅供参考"等免责条款。然现行《刑法》并未规定免责条款系规避刑事法律风险之要素。是故,开发者究竟是否具有侵权/犯罪故意?究竟属技术中立抑或放任心态?就目前公开技术而言,尚未可知。
二、核心争议:AI生命周期中的三大刑事认定难题
(一)模型训练阶段:"临时复制"与"数据挖掘"的入罪边界
争议焦点:爬取受保护作品训练模型,是否属于《刑法》第217条之"复制"?
上海市公安局知识产权犯罪侦查总队大队长杜孔明确指出:"AI训练过程中的复制行为确属《刑法》第217条侵犯著作权罪规制之复制行为,因AI训练中的复制系通过网络爬虫汇聚海量素材至语料库,其实质是以数字化方式复制原作者作品,且不具备临时复制所要求的暂时性、无独立经济价值及客观性要件,属稳定复制;但其结论为AI训练过程中的复制行为不构成《刑法》意义上的侵犯著作权行为。"
沈北检察亦明确表示:"数据训练阶段非法爬取受著作权保护的作品,可能触发《刑法》第217条规定的侵犯著作权罪;而开发者通过参数调整引导模型生成与训练数据高度相似的作品,可能构成对'改编权'的侵犯。"
依现行法律理论与司法实践,爬取受保护作品用于训练模型是否构成《刑法》第217条之"复制",需结合具体情形分析:
1.从"复制"行为本质观之
《刑法》第217条之"复制"通常指以印刷、复印、数字化等方式将作品制作一份或多份之行为。于模型训练场景中,若通过爬虫将受保护作品完整或实质性复制至本地存储或训练数据集,且复制行为具有稳定性、独立性(非临时性),则可能契合"复制"行为特征。
2.是否构成"复制"的关键判定要素
复制的完整性与实质性:若爬取作品被完整复制或复制作品核心表达部分(如文字、图像、代码等),而非仅提取少量非实质性信息,则更可能被认定为"复制"。
复制的目的与用途:若复制行为旨在直接利用作品内容(如生成与受保护作品相似之输出),而非单纯为技术分析或研究,则更可能被认定为侵权复制。
是否规避技术措施:若爬虫通过破解验证码、绕过访问限制等方式获取受保护作品,或违反爬虫协议(robots协议),则直接增强目的与行为之违法性。故此情形下,极有可能被认定为"复制"行为。
3.合理使用的抗辩可能
若爬取行为符合合理使用原则(如为科研、教育、非商业目的,且对作品的利用未影响原作品正常市场价值),则可能不构成侵权。但合理使用于刑事领域之适用需严格审查,通常须证明行为具有公共利益价值且未对著作权人造成实质性损害。
综上,单纯爬取受保护作品训练模型的行为,若满足复制的完整性、实质性及非合理使用条件,可能构成《刑法》第217条之"复制"行为。然具体是否构成犯罪,尚需结合主观故意、营利目的、复制数量及情节严重程度等因素综合判定。
(二)内容生成阶段:"实质性相似"的刑事证明困境
困境:AI输出的是"思想"抑或"表达"?
通过提示词,AI使用者可获致答案。如前文所述,使用者借助"提示词工程",例如:用户指令AI,"请模仿刘慈欣《三体》之写作风格,撰写一部类似科幻小说,要求不涉及该书人名、地点及其他可能构成侵权之要素。"此种情形下,使用者利用AI生成与《三体》高度相似之内容并发行,此时作为《三体》著作权人,该如何维权?或退一步言,其可否维权?
从刑事知识产权证据角度观之,首先须证明两部作品达到实质性相似,方可能达致入罪标准。而此关键步骤在于对两部作品进行司法鉴定。"以公开换取保护"乃知识产权领域之重要原则,著作权作为知识产权之一种,亦须遵循此原则。换言之:著作权人公开发行《三体》,即意味着公众可了解、提炼该书之思想背景、核心情节及创意表达等。
从刑事责任另一角度探讨能否维权,尚有一基本前提,即AI生成内容属于作品。关于是否属法律意义上之"作品",目前司法实践与理论观点争议甚大。对比(2019)京73民终2030号案、"真假奥特曼"案与本文引出之(2023)京0491民初11279号案裁判思路,可见传统司法观点存在裁判不一之矛盾。然就目前主流理论观点而言,AI生成内容并不当然属于著作权法规定之"作品"。
从当前司法鉴定技术而言,虽可通过文字重叠率、图谱特征比对等手段进行司法鉴定,但仍难以直接证明两者高度相似。因精明使用者会借助AI或自行修改实施脱敏处理,极大可能规避与原作品实质性相似。如此看来,能否认为"AI沦为犯罪工具"?笔者认为,答案是肯定的。
(三)主体归责:"技术中立"抗辩的刑事审查标准
此处笔者续设一情境:AI用户利用电影《冰雪奇缘》艾莎公主形象,生成相似人物并用于商业活动。AI平台收到迪士尼侵权通知后删除该用户生成记录。
前文已述,免责条款抗辩于刑事责任领域并不当然有效,然"技术中立"抗辩之有效性需综合审查。其难点在于,不同AI模型间算法虽有差异,然算法本身作为人类开发之科学技术,往往蕴含AI开发者对模型生成内容的主观偏好及显性或潜在的价值判断,故除免责条款外,"技术中立"亦不能直接阻断犯罪构成要件。
关于Safe Harbor原则于刑事领域适用的有限性。Safe Harbor(避风港)原则确系源于民事领域之《数字千年版权法》(DMCA)及我国《信息网络传播权保护条例》,其核心为"通知-删除"规则,用于免除网络服务提供者之民事赔偿责任。注意,此处免除的是民事责任。