标签

AI法律研究第152篇:开放权重非开源——部署前需警惕的法律边界

发布时间:2026-07-03 09:52阅读:2

Anthropic首席执行官Dario Amodei近期公开表态:“AI模型公开权重并非开源,仅允许本地运行和微调,用户无法了解训练过程,也无法像Linux那样实现集体共建——因此我们关注的是性能而非是否开源。”这一说法部分正确,部分错误。

正确之处在于:严格依据OSI现行定义,多数所谓的“开源大模型”实际上仅提供开放权重,并未同时公开训练代码、预训练数据集及完整复现流程,不符合OSI《开源人工智能定义》的全要素标准。在此意义上,它们并非传统软件法意义上的“开源软件”。

错误之处在于:暗示“开放权重无关紧要,与闭源无异”。恰恰相反——开放权重附带许可证,如Llama 3社区许可、DeepSeek许可、Apache 2.0附加条款等,这些许可证直接决定产品是否需要被迫开源、能否商用、是否会在IPO时受阻。忽视这一点,是许多企业陷入法律陷阱的起点。

维度

传统开源软件(如Linux,符合OSI标准)

AI开放权重模型(如Llama 3 / DeepSeek-V3 / Qwen2.5)

闭源商用模型API(如Claude / GPT-4o / Gemini)

客体开放范围

完整源代码,可编译复现

通常仅模型权重加推理代码;训练代码和数据多不公开

无权重重源码,仅API调用

能否本地私有部署

✅(需遵守许可证)

❌(数据经厂商服务器)

OSI开源定义符合度

完全符合

部分符合(OSI有争议;DeepSeek与Qwen部分宽松许可证可视为开源友好,Llama 3附加商业限制条款被部分学者认为非OSI开源)

不符合

许可证约束力

Copyleft或宽松许可证,具合同法与版权法效力(罗盒案及最高法确认)

受所附许可证约束——可能是宽松或附带商业限制的自定义许可

受API服务协议约束,无Copyleft传染

Copyleft传染性风险

GPL与AGPL有强传染性,衍生作品须开源

多数开放权重模型用Apache 2.0或MIT或自定义非Copyleft许可,通常无强制开源义务;但需核对个别模型

IPO或合规披露要求

须纳入开源组件台账,说明许可证及合规状态

同样须纳入台账!即便仅开放权重,若嵌入产品需披露许可证类型、是否修改权重、是否满足附加条件

仅披露API依赖,不涉及源码或权重

法律核心提醒

违反GPL导致授权终止,构成侵权

违反许可证附加条件可能引发违约或侵权主张

违反服务条款导致停服,无版权传染

律师提示:最高法院在(2021)最高法知民终51号中明确——开源许可证是附解除条件的著作权许可合同,违反条件授权自动终止,继续使用构成侵权。此规则同样适用于附带许可证的开放权重模型,即便它不是“OSI严格开源”。

企业法务收到AI模型后,首要任务不是测试效果,而是要求技术部门提供许可证全文:

典型:Qwen2.5系列、DeepSeek-V3、Stable Diffusion基模

法律后果:保留版权声明即可商用、可修改、可闭源封装。无Copyleft传染。

注意点:确认无附加使用限制条款;部分厂商在Apache 2.0文本后悄悄添加内容,需全文搜索“restrict”、“prohibit”或“not permitted”。

典型:Meta Llama 3系列——正文用Apache 2.0但附加月活跃用户超7亿须申请商业授权及禁止用于特定监管对象或用途。

法律后果:超阈值未获授权构成违约;用于制裁清单实体可能触犯出口管制。

审查动作:产品侧统计月活跃用户;合规侧确认客户是否在受制裁名单中。

法律后果:若贵司将受GPL约束的模型权重视为派生作品并进行分发,理论上须开源。目前学理争议较大,但风险不可忽视。

建议:遇到GPL或AGPL系开放权重模型,优先考虑能否换用Apache 2.0等价替代品,避免引发衍生作品开源争议。

典型:OpenRAIL(B) ——在Apache 2.0基础上增加禁止深度伪造、生物武器设计及特定有害用途的条款。

法律后果:违约多主张为合同违约,但仍可导致授权终止及停止使用要求。国内暂无直接判例,但合同效力依《民法典》第464条应被认可。

注意:此类许可被OSI质疑违背不歧视原则,故不被视为OSI开源——但对企业而言,限制条款比Copyleft更需要逐条核对。

结合罗盒案、最高法知民终51号及《创业板数字经济领域首发审核指南》,建议:

记录每个引入模型的名称、版本及