标签

全国首例AI模型侵权案:审理边界与保护路径的法律分析

发布时间:2026-04-22 11:33来源:微信阅读:5

编者按

近期,北京知识产权法院对"抖音公司诉亿睿科公司侵害著作权及不正当竞争案"作出终审判决。这一全国首例针对人工智能模型结构与参数的生效判决,不仅明确了AI模型结构与参数的可保护性,探索了基于竞争利益的保护路径,还深入阐明了人工智能模型领域商业道德、市场竞争秩序等核心认定要素。该判决为未来AI模型保护及同类案件审理提供了重要参考,对规范AI行业发展、维护市场竞争秩序具有深远的探索价值与规则导向作用。为便于感兴趣的读者更加深入全面了解本案,呈现本案办理过程中的专业思考,AI时代知产圈特邀请本案二审代理律师撰写了本案的办案手记,以飨读者。

近期,北京知识产权法院作出了抖音公司诉亿睿科公司模型结构及参数不正当竞争纠纷案的二审判决。笔者所在的汇仲知识产权团队代理了该案的二审程序,现就本案办理过程中的学习和思考进行分享。

一、关于模型结构与参数的保护

本案二审判决认为人工智能模型(结构与参数)应当构成受到反不正当竞争法保护的竞争利益,为人工智能模型的保护提供了一种有价值的思路。关于该问题,有以下两点案件背景和思考。

本案二审判决认为人工智能模型(结构与参数)应当构成受到反不正当竞争法保护的竞争利益,为人工智能模型的保护提供了一种有价值的思路。关于该问题,有以下两点案件背景和思考。

(一)保护对象的进一步明确与分析思路的调整

本案一审程序中,原告以模型生成物为权利基础主张被告侵害其著作权,同时主张被告使用原告模型结构及参数的行为构成不正当竞争。一审法院未支持涉案模型生成物受到著作权法保护的相关主张,认定被告诉争行为构成不正当竞争。一审判决作出后,被告单方面上诉。因此,不正当竞争行为的认定成为了二审程序的争议焦点。

由于原告在本案中主张的竞争利益系基于模型结构与参数,而一审判决的分析主要围绕模型产品,对于模型结构、参数并未过多展开,我们认识到该问题可能被二审法院重点关注,在模型结构、参数的阐明及保护路径选择方面需更具有针对性。因此,我方二审的工作重点由一审程序中特效形成过程的独创性贡献、控制程度等转变到对模型技术内涵和保护路径的阐述。

二审程序中结合我方的进一步明确,法院很快明确了审理范围及审理对象,将审理对象限定为涉案模型的结构与参数本身,而非模型特效应用产品。笔者认为,二审判决对于审理对象的明确具有重要价值,对于产品、软件与模型适当加以区分,使本案更加聚焦于人工智能模型的核心技术内容,贴合模型开发的产业实际,为未来类型模型抄袭案件的审理提供了一种更加精细化和贴合产业实践的分析视角。同时,该限缩也直接影响对于保护路径的分析讨论。在保护模型开发者竞争利益的同时,也为人工智能产品的研发、应用、软件等其他未涉案环节、层面所涉客体的保护预留了继续探索和讨论的空间。

(二)模型结构和参数保护路径的分析与选择

本案中,涉案模型结构主要包括整体网络结构和网络结构中的卷积层、BN层、激活函数、升采样模块、子网络的连接关系①。涉案模型的参数主要包括卷积层的输入通道数、输出通道数、卷积核大小以及偏置,输入通道数*输出通道数*卷积核大小对应卷积核的权重参数,前述参数决定了卷积核如何从输入数据中提取特征,例如特征的类型、数量等等。

根据《最高人民法院关于适用〈中华人民共和国反不正当竞争法〉若干问题的解释》第一条规定,经营者扰乱市场竞争秩序,损害其他经营者或者消费者合法权益,且属于违反反不正当竞争法第二章及专利法、商标法、著作权法等规定之外情形的,人民法院可以适用反不正当竞争法第二条予以认定。因此,模型结构和参数作为新类型的保护客体,如适用《反不正当竞争法》第二条对其予以保护,首先需要考虑涉案模型结构和参数是否属于专门法或《反不正当竞争法》专门条款的调整对象,本案一、二审法院对此问题均给予了充分关注。笔者对该问题也从以下两方面进行了思考,供进一步分析探讨。

1.关于著作权法保护路径的可行性分析

我们认为,将涉案模型结构和参数认定为计算机软件或“其他作品”,进而获得著作权法的保护存在一定阻碍。

其一,模型结构和参数与计算机软件的保护对象存在实质性差异。

《计算机软件保护条例》第二条规定:“本条例所称计算机软件(以下简称软件),是指计算机程序及其有关文档。”第三条前两款规定:“(一)计算机程序,是指为了得到某种结果而可以由计算机等具有信息处理能力的装置执行的代码化指令序列,或者可以被自动转换成代码化指令序列的符号化指令序列或者符号化语句序列。同一计算机程序的源程序和目标程序为同一作品。(二)文档,是指用来描述程序的内容、组成、设计、功能规格、开发情况、测试结果及使用方法的文字资料和图表等,如程序设计说明书、流程图、用户手册等。”根据上述规定可知,计算机软件的保护对象包括计算机程序和文档两部分,且此处的“文档”系与计算机程序有关的文档。

一方面,涉案模型结构和参数应不属于《计算机软件保护条例》所指的计算机软件程序。本案原告主张的模型是已训练完成的模型成果,不涉及训练模型所使用的计算机软件代码。人工智能模型本质上是一种数学模型,反映了输入与输出之间的关系,模型由计算机软件代码训练、建构形成,形成后的模型结构参数自身并不直接包含计算机软件代码。涉案模型结构和参数被保存在模型文件中,不是以代码形式保存,模型文件中不包含代码化指令序列。由此来看,涉案模型结构和参数自身并不包含计算机软件程序。此外,模型结构是用于体现模型本身特征的内容,不具有具体的执行逻辑,需要依赖深度学习框架予以加载,与传统的计算机软件程序存在区别。

另一方面,涉案模型结构和参数亦区别于《计算机软件保护条例》所指的“文档”。模型文件属于模型的核心内容,自身拥有相对独立的特征和内容,并不属于对计算机程序内容、组成等的“描述”,且在重要性、功能用途、语言可读性方面与《计算机软件保护条例》第三条第(二)项“文档”定义中所列举的“程序设计说明书、流程图、用户手册”等文档存在明显区别。

此外,根据本案中相关技术专家的介绍,在模型相同、加载模型的计算机软件程序不同的情况下,提供相同的输入也有可能形成相同的生成物,生成物相同不能说明涉案软件的代码相同。由此也可以看出,模型和加载它的计算机软件代码之间具有区别,二者具有相对独立性。

其二,模型结构与参数的核心价值和侵权行为指向往往并非在于表达层面。

根据“思想与表达二分法”,著作权保护不延及其中的思想观念、抽象的数学概念、技术方案、程序本身。《TRIPS协议》第九条第二款规定:“版权的保护仅延伸至表达方式,而不延伸至思想、程序、操作方法或数学概念本身。”该规则亦在我国著作权司法实践中被广泛适用。

就本案所涉保护对象而言,模型的本质为数学模型,其核心价值是思维而非表达。笔者认为,模型的核心价值并不属于著作权法意在保护的对象。模型参数的存在形式为数字,不受到著作权法保护。尽管模型结构可以通过可视化工具呈现为图形化形式(涉案权利模型系通过Netron可视化工具打开呈现),也可以通过二进制、文本、符号等不同格式固定、表达出来,但格式和表达的区别并不决定模型的核心特征,也不是模型形成的前提,且表达形式的可选择类型、表达与思想之间是否尚存在足够的空间存在疑问。

因此,尽管模型本身与计算机软件存在一定共性,但著作权法保护可能无法抵达模型结构的核心,也难以有力地阻止变相侵权的行为。

综合前述分析,将涉案模型结构和参数认定为计算机软件或“其他作品”存在一定的解释上的障碍或不适宜之处,本案难以通过著作权法保护涉案模型的结构和参数。

2.商业秘密保护路径的困境

涉案模型文件系跟随软件发放至用户终端,并进行了特定加密设置。本案一审程序中,原告方委托了司法鉴定。司法鉴定机构安装权利软件、侵权软件后,通过技术手段获取、导出、解密原、被告的涉案模型文件,并通过模型可视化工具Netron对于模型结构、参数进行了可视化呈现。

《最高人民法院关于审理侵犯商业秘密民事案件适用法律若干问题的规定》第十四条第一、二款规定:“通过自行开发研制或者反向工程获得被诉侵权信息的,人民法院应当认定不属于反不正当竞争法第九条规定的侵犯商业秘密行为。前款所称的反向工程,是指通过技术手段对从公开渠道取得的产品进行拆卸、测绘、分析等而获得该产品的有关技术信息。”

涉案模型本身属于分发至用户终端的小模型,而非仅部署于服务器中,模型文件可以通过对公开渠道获取的软件包进行特定技术分析手段予以获取,这在一定程度上影响了模型结构和参数的秘密性。在这种情况下,通过商业秘密保护规制被诉行为亦存在一定障碍。

考虑到前述保护路径面临的障碍,二审法院根据在案情形适用《反不正当竞争法》第二条确定了一种通过反不正当竞争法规制模型结构与参数抄袭行为的路径,同时通过对商业道德、市场竞争秩序等多要件的分析明确了竞争行为动态规制的边界,对于原告作为模型开发者的竞争权益予以确认,为未来类似案件中模型结构和参数的保护将提供有意义的借鉴。

二、涉案行为不正当性的认定

本案中,二审判决对于涉案行为不正当性的认定和分析,对于类似案件同样具有一定参考价值。

(一)对涉案行为构成“抄袭”的认定

本案中,原告通过两方面的举证初步证明被告使用了抖音公司的模型结构、参数,一方面是模型前端生成效果的比对;另一方面是双方涉案模型的结构和参数的直接比对。

从模型生成效果的比对来看,两个模型的漫画特效成像效果和处理缺陷高度相似。如脸型、头发、眉形、鼻子的形状、色彩、光影的处理高度相似,且两个特效存在共同的处理缺陷,如在侧脸幅度、低抬头幅度较大时,存在侧面眼睛形状、脸轮廓线、鼻子崩坏或消失,接近纯侧时无法修饰轮廓线,头顶和脖子无法呈现漫画效果、下巴边缘线消失等问题。

从模型结构和参数的对比来看,原告通过提交《专家意见书》,对于模型原理、原告主张模型与现有公开GAN模型的差异、双方模型的统一性分析进行了系统说明。本案中,模型比对是从两个模型的网络结构图的基础上,从基础网络结构、网络整体结构的角度进行模型比对,然后从微观角度对于卷积层、BN层、激活函数、升采样模块、子网络连接关系进行比对,最终得出模型结构一致(整体网络结构、非相邻子网络之间的连接关系、相互连接的非相邻子网络结构、卷积层层数、升采样次数和位置一致)、卷积层数据(输入通道数、输出通道数、卷积核大小②;偏置)具有91.7%的相似度、分辨率一致、激活函数一致的结论。专家意见对于双方模型存在的差异进行了说明,认为所涉的4处不同之处对于网络结构、网络性能及最终漫画效果的影响微小,从整体感官角度可忽略不计,从技术实现角度,两模型具备高度同一性。

在此基础上,被告对于模型结构、参数等细节方面存在如此高的相似度并未作出合理解释,亦未提出有效的模型研发合同和模型训练证据,且自主研发证据无法看出与涉案模型的关联性。综合前述情况,法院认定被告直接使用了原告的模型结构和参数。

本案对于模型结构、参数内容的分析,以及对于模型使用行为的举证思路、认定规则,均具有探索意义和规则导向作用。事实上,在很多情形下,难以通过类似手段获取被诉模型的参数,如何证明模型侵权行为值得进一步探讨。例如,在斯坦福大学Llama3-V模型与清华大学面壁AI模型MiniCPM-Llama3-V2.5的抄袭争议中,网友们通过模型运行瑕疵、识别清华简的特殊能力、高斯扰动验证等多种情节认为模型存在相似之处。③

(二)涉案行为不正当性的分析

在《反不正当竞争法》第二条的分析框架下,二审法院从商业道德、其他经营者利益、市场竞争秩序及消费者利益四个方面分析并认定被诉行为的不正当性,尤其对于人工智能的领域商业道德、市场竞争秩序的论述具有较大的启发和借鉴意义。

1.关于人工智能模型领域的商业道德

二审法院在判决中明确指出:“从事人工智能模型研发经营的企业不得未经许可直接使用他人通过数据训练改进而来的模型结构和参数。”

现阶段,国内外各类大模型、行业模型层出不穷,人工智能领域的研发经营主体众多,国内外也逐渐出现了模型套壳、抄袭争议。例如,关于斯坦福大模型项目Llama3-V涉嫌套壳清华大学MiniCPM模型的讨论、deep seek的知识蒸馏争议等等④。

二审代理初期,笔者并未摆脱权利法的思维,认为直接使用他人模型结构和参数的行为理所当然地具有不正当性,但并未从规则层面探究人工智能模型领域的商业道德和市场竞争秩序。在经过大量检索后,发现人工智能领域的现有政策文件、行业规范中涉及模型研发过程、模型结构和参数的具体内容较为缺失。笔者认为,二审法院通过个案裁判方式明晰“从事人工智能模型研发经营的企业不得未经许可直接使用他人通过数据训练改进而来的模型结构和参数”这一人工智能模型领域重要的商业道德,对于规范当前模型的研发和经营活动具有很强的规则导向作用和极高的社会价值。

2.关于人工智能模型领域的市场竞争秩序

二审法院认为,市场竞争秩序是否被扰乱取决于影响竞争如何产生、竞争如何进行的各要素之间的结构和运行机制是否被干扰。而影响竞争的市场运行机制包括准入机制、供求机制、价格机制、信息机制、信用机制和创新机制。市场运行机制框架下的市场竞争秩序分析同样具有较强的借鉴意义。

三、关于本案的进一步思考

模型的结构、参数是人工智能产品的核心,在各行业模型训练、研发活动积极开展的现状下,希望本案能够引起企业和社会对于人工智能模型相关技术保护的关注。值得注意的是,部分人工智能大模型的结构和参数完全开源,允许他人在遵守相关开源协议的情况下进行使用,该行为并未违反本案所明确的商业道德。而对于那些闭源人工智能大模型的结构和参数并未公开,亦难以通过反向工程等获取,此类模型结构和参数可能满足商业秘密的构成要件从而优先受到商业秘密保护。

此外,当前对于他人模型的修改、利用和直接使用行为的种类众多,比如直接调用他人模型API接口、知识蒸馏、模型微调、模型窃取、模仿预训练架构等等,对于该类行为类型、行为是否合法、合法性边界还存在探索空间,值得结合相关纠纷案例继续研究。

① 摘自涉案《专家意见书》:Con层(即卷积层):卷积运算的目的是对输入的图片进行特征提取,卷积后输出对应的特征图,输入数据共享卷积核的参数,有效减少了网络参数量。卷积层需要设置输入数据的通道数、输出数据的通道数、卷积核的大小、卷积运算时的步长、是否使用偏置以及对图片的填充这些超参数。BN层:BN层将输入数据(即前一层网络输出的特征图)的分布标准化,使输出数据呈现出分布均值为0,方差为1的标准正态分布;因标准化后,数据分布在0附近,其表达能力有限,为了恢复其表达能力,引入了gamma和beta这两个可学习参数,使输出数据的分布符合均值为beta,方差为gamma的正态分布,以增加训练的稳定性。非线性激活层(NA):ReLU 将网络神经元的输出映射到0到正无穷大之间,让网络有学习非线性函数的能力。Upsample(即升采样模块):将特征图的尺寸提升至原来两倍,升采样方式为线性插值。激活函数(Tanh):Tanh 将网络神经元的输出映射到-1到1之间,增加模型收敛速度。

② 输入通道数*输出通道数*卷积核大小得出的卷积层权重。

③ 李冬梅,《斯坦福 AI 团队“套壳”清华系开源大模型被实锤!被揭穿后全网删库跑路》,InfoQ,2024.6.3,https://www.infoq.cn/article/3CsQrogtkfPJ4gaEgmM8。

④ 吕倩,《斯坦福AI项目作者对抄袭中国大模型致歉!承诺撤下相关模型》,第一财经,2024.6.4,https://mp.weixin.qq.com/s/pAS8tjHYNsKupCE2UiFsRQ。