标签

AI训练数据:著作权问题的焦点解析

发布时间:2026-05-03 11:59来源:微信阅读:4

一、导论

人工智能系统的运转高度依赖于训练过程,而训练过程又需要借助海量的案例材料。从公开的互联网上搜集的人工智能训练素材,绝大多数都受到著作权的保护。这种大规模、未经授权地使用受著作权保护内容的行为,触及了复制权的法律范畴,因为人工智能系统需要通过文件复制来进行内容分析;此外,如果训练完成的人工智能系统是基于训练数据构建的,这种行为还会涉及到对衍生作品的控制权。

在2023年5月,美国版权局就人工智能与视觉艺术的交集召开了专门的听证会,其核心议题集中在受版权保护的作品在训练数据中的使用情况。美国联邦贸易委员会已向OpenAI公司发出调查取证的请求,要求提供该公司训练数据的来源。