标签

生成式AI内容在著作权法中的定性与保护路径探析

发布时间:2026-06-03 13:34来源:微信阅读:7

文章全文

摘要:在著作权法框架内,人工智能生成内容的法律属性存在较大争议,海量数据的简单堆砌能否划入作品范畴,学术界众说纷纭。本文以人类作品的演进历程与知识产权制度的激励目标为突破口,提出“数据作品”概念以期为人工智能生成物寻求恰当的法律定位。数据作品是指原始数据通过“深度学习-数据输入-数据输出”的转化过程,演变为具有独创性的数据化表达成果。数据作品的权利归属应突破以人类作者为中心的传统思维,构建“人类作者+AI作者”双核心模式。数据作品的可版权性体现在其独特的独创性:独立完成、生成式思维与保护、传播价值。鉴于人工智能生成内容存在的质量参差与易复制特点,还需防范“公地悲剧”风险,并创设新型财产权将人工智能自主生成的内容界定为数据作品,统一纳入著作权法的保护范围。

关键词:著作权法; 生成式AI; 数据作品; “人类作者+AI作者”双核心模式; 独创性

一、问题的提出

生成式人工智能的出现犹如一记重拳冲击着当今以人类为中心的社会运行体系,既令人振奋又引人深思。如何正确应对这一智能变革并将其纳入符合社会发展逻辑的轨道,已成为各领域研究与讨论的核心议题。尤其在知识产权领域,著作权的保护与传播方式与生成式人工智能的学习、计算、生成等环节紧密相连,因此制定及时有效的应对策略势在必行。人工智能突破专用人工智能的限制,达到通用人工智能的标准已是指日可待。当前,以DeepSeek、ChatGPT为代表的生成式人工智能正是人工智能技术奇点临近的信号,其“涌现能力”的展现,在某种程度上超越了现有的应用型人工智能模型,具备了“通用人工智能”特征或“类人属性”。特别是深度合成技术的成熟与应用,使生成式人工智能拥有了类似人脑的“学习—吸收—输出”运作机制:在深度学习阶段,接收数据输入,借助算法模型拓展学习的深度与广度;在合成阶段凭借输出成果以假乱真,充斥市场。进而,在Web3.0时代,AIGC内容迅速涌入作品市场,严重动摇了传统著作权法的制度基础。因此,面对海量“低质作品”的涌入,著作权法是将其纳入作品保护体系还是弃之不顾?一方面,若选择忽视,必将导致法律制度落后于技术发展,引发各种社会问题;另一方面,若选择纳入,生成式人工智能的生成物应如何定性?其能否被视为作品?基于此,本文尝试在著作权法框架下对上述问题进行分析与解答。

二、人工智能生成内容的定性——数据作品

(一)从人类作品到数据作品:人类中心主义的建立到超越

自人类从原始社会进入文明时代以来,无论是早期的石器、青铜器、铁器,还是后来的蒸汽、电气乃至当前的高度信息化机器,都凝聚着人类智慧,彰显着人类发展史的辉煌。为保护人类区别于其他物种的关键要素,即人类智慧成果,我们进行了诸多探索。但古代受限于传播效率低下和权利意识淡薄,对作者权利的保护并不重视。然而进入近现代,随着世界上首部作品保护法——《安娜女王法》在出版商的利益诉求下诞生,其规定写者即为作者,从而作者与作品的概念开始出现。之后,一系列版权制度由此展开,人类作品作为早已存在但颇具新意的名词出现在世人面前。梳理著作权发展史,大致可将其分为以《安娜女王法》为起源的版权制度和以《法国作者权法》为开端的作者权制度。值得注意的是,两者不约而同地将创作作品的“作者”置于突出而醒目的位置,强调了“人”或“人类”因创作“作品”而享有“权利”的事实。例如,《英国版权法》规定作者是创作作品的人,《美国版权法》强调保护对象为作者创作的作品,《伯尔尼公约》在作者权利方面规定了精神权利,我国《著作权法》更是明确规定著作权的主体为人类。由此可见,当今世界延续著作权历史发展的脉络,仍默认著作权主体仅为人类。值得一提的是,虽然《英国版权法》1998年修正案中首次引入“计算机生成作品”,但仅作为一种新作品形式,并不影响人类中心主义的核心地位。

发展到今天,信息化社会变革与大数据时代已成为现实,作品的产生从传统的人类“冥思苦想”到如今人工智能的“一键生成”,创作主体从原先的唯一人类作者变为现在的“人机协作”。其中具有代表性的是OpenAI公司于2022年11月推出的全新聊天机器人模型ChatGPT,迅速创造了用户数量激增的奇迹,随后文生视频大模型Sora问世更是被誉为人工智能时代的里程碑。此外,还有如雨后春笋般涌现的中国移动九天、百度文心一言、阿里巴巴通义千问、华为云盘古、腾讯混元助手、OPPO安第斯、VIVO蓝心等一系列生成式人工智能服务模型,它们标志着人工智能新时代的来临,人工智能生成物席卷全球的趋势已成。面对“未来将至”,著作权法势必要顺势而变。具体而言,一方面是司法实践中的实际现状:国内的菲林律师事务所诉百度公司著作权侵权案、腾讯公司人工智能写作软件Dreamwriter生成的新闻报道被侵权案;国外的Telstra公司诉电话号码出版公司案、《通向天堂之近路》绘画登记案、《黎明的扎里亚》登记案等,体现了国内外对人工智能生成内容是否应为著作权法保护的迥异态度和模糊认知。另一方面是理论界的应然争论:学界虽然对人工智能生成内容的价值存在已达成共识,但在如何定性以及采用何种保护机制上仍存在较大分歧。定性方面:有观点认为人工智能生成物,即智能作品实质上是人工智能对设计版权的演绎作品;也有观点认为人工智能生成内容是否为作品应适用独创性判断标准,以此为据,将代表所有者意志创作作为理由判定著作权归属于人工智能所有者享有;还有观点认为“以人为本”的精神贯穿著作权法始终,作品与人类作者难舍难分。保护机制方面:有限人格说将人与人工智能拟制为代理关系;创作主体与权利主体分离说将人机协作成果视为类似于视听作品、职务作品、委托作品的特殊作品。由此,实际层面与理论层面都亟需符合实践需求与体系完善的“作品—作者”诠释的新进程。有鉴于此,一种兼具“人机协作”属性与数据表达属性的作品新类型——数据作品,可以弥补现今对人工智能生成物定位的缺失。

(二)数据作品:“人类作者+AI作者”双核心模式

世界知识产权组织在《经修订的关于知识产权政策和人工智能问题的议题文件》中,依据是否有人的参与,将人工智能生成内容区分为:人工智能生成的(人工智能自主创造的)与人工智能辅助完成的两大类。有学者在此基础上进一步分为人工智能自主生成、准人工智能自主生成、人工智能辅助生成。当今学界主流观点认为,人工智能辅助生成内容基于人类主导可以受到著作权的保护,但人工智能自主生成物或准人工智能自主生成物由于是生成式人工智能通过算法、数据模型进行的“作品创作”而被著作权法排除在保护体系之外。但面对海量人工智能自主生成物的现实存在,如果单纯以不符合著作权法激励人类创作的立法目的 and 生成式人工智能的开发者可以从其他方面获取利益而不需要著作权法的保护为由,显然缺乏说服力。因此,在正视人工智能生成内容对著作权法领域带来的冲击的背景下,本文认为,将其定性为数据作品以区别于人类作品来进行类型化保护较为妥当。

1.著作权主体之辨:AI作者

生成式人工智能是指类人工智能系统,通过“学习—吸收—输出”机制进行内容创作,从而被视为具有类似人类创造力的人工智能。其由机器学习模型提供支持,是一种基于海量数据进行预训练的超大型模型,通常被称为根基模型,主要技术包括深度学习、生成对抗网络(Generative Adversarial Networks,简称GAN)等。深度学习技术通过持续训练神经网络,分析输入数据的特征和规律,然后根据这些规律生成新的数据;GAN则具有两个神经网络,一个为生成器网络负责生成数据,另一个为判别器网络负责判断数据的真实性,两者相互配合以不断改进生成质量。根据生成式人工智能的工作原理可以看出,其涉及的算法迭代和模型创新都是基于对数据的处理而发展起来的,所以将其生成内容命名为数据作品,在概念科学上并无不当。另外,可以明显发现生成式人工智能在生成过程中所展现出的学习能力——如同人类孩童般疯狂地从外部世界吸收知识并逐渐形成自己的判断,并基于这种判断指引接下来的行为。鉴于这种类人属性,虽然生成式人工智能处于弱人工智能阶段(即类似于民法上人类之无行为能力人时期),但在重视其生成技术具有巨大发展潜力的前提下,给予自主生成物现阶段一个合适的定位是必要的。而数据作品的提出恰好能够在生成式人工智能自主生成物的传播、保护等方面突破人类中心主义的束缚,得以纳入人机协作的领域。所谓人机协作,是指在赋予AI主体地位并单独享有著作权存在理论困境与现实障碍的前提下,将人工智能生成物视为人类与AI的合作作品,由此可以适用既有的著作权法规则。值得注意的是,此处AI作者并不是独立的权利主体,而是在人机协作的特定情境下针对数据作品的特有主体拟制,是对该种新作品类型权利归属的理论补充。

2.创作方式:从生成式思维到数据化表达

以法教义学视角审视,对创作行为的认识和界定主要建立在《中华人民共和国著作权法》中“作品”概念基础之上,而著作权规范体系中一切“作品”的规则构建都源于“独创性”要件所建立起来的“作品—作者”这样一种权利主客体关系。“独创性”一般可以阐释为——作品源于作者独立、个性的创作,并赋予其特有人格属性,是作者精神世界的客观映射。从人类创作时代的视角来看,此种独创性的内涵无疑最为契合著作权法的立法初衷,但在大数据与智能化时代,也即AI创作时代,此种理解就略显宽泛。

首先,就形式而言,无论是起源于英国的版权制度,还是起源于法国的作者权制度,都是保护作品的制度,即作品是对于思想观念、客观事实、自然规律等的表达,保护作品就是保护表达,而不是保护被表达的对象。这种流行的“思想/表达二分法”在《美国版权法》第102条、《TRIPS协议》第9条第2款中分别有具体规定,使得当今学界在判断独创性的前提究竟是思想还是表达上观点达成一致。换言之,作品是属于将智力成果这种抽象概念进行权利化后的别称,是将虚拟的思维转化为实在的“表达”后才得以纳入著作权法的保护体系中,因此,独创性的判断必须局限于“表达”上,即作品作为“表达”本身是否满足“独”“创”“性”的要求。

其次,就实质而言,独创性是决定特定表达是否构成作品的关键,是客观的判断依据,不宜与诸如思想、精神、人格等主观因素相混同。换言之,人工智能的内容生成过程是生成式思维(不同于人类思维)的运行过程,其生成物在一定程度上已与人类作品难以区分。基于“生成式思维-数据化表达”二分法的最新表述,数据作品的提出恰是大数据时代二分法应然变革下的实然回应,是AI独创性表达的逻辑体现。

三、数据作品的可版权性分析

大数据时代以生成式人工智能为标志步入了一个全新的人机交互层级——共创作品领域,即发端于Web3.0时代的用户中心创作模式。简言之,不同于Web1.0时期的单一浏览模式、Web2.0时期引入的初步交互性用户体验模式,Web3.0时期可以被称为一种被用户拥有的互联网。在此时期,无论是频繁的作品二次创作,还是基于区块链的非同质化通证交易形式,将极大丰富作品的传播形态、拓宽利益空间,继而催生出大量的协作作品(人类借助于ChatGPT进行的制作)和数据作品(主要由AI单独生成)。为避免上述类型作品进入市场引起的“公地悲剧”,也为明晰数据作品与人类作品形式不同但实质相同的传播、保护新路径,有必要借助“独创性”理论以阐释人工智能生成内容的可版权性,现分述如下。

(一)数据作品的“独”:独立完成

“独”通常指独立、自主,映射在著作权领域则表现为作品有无抄袭以及引用、复制是否合理。以此为据,AI的创作行为无论是在数据作品的获取与输入环节(“机器摄入”)、数据的处理与分析环节(“机器学习”),还是在数据的生成与传播环节(“机器输出”),皆满足“独”的要求。

究其实质,人工智能的关键技术体现在“深度学习”模型上,借由算法在海量数据中抓取有价值的部分。随着数据的精心“投喂”与处理能力的显著“成长”,人工智能逐渐失控,使得人类控制下的程序算法和脱离人类的独立思考之间的界限变得模糊,导致人类预先的算法设定或输入文本的自主选择难以成为生成内容独创性的