聚焦:AI 模型蒸馏引发的版权困境
#作者:Claudia Philipp本文刊载于《加州大学法律、科学与技术期刊》第 17 卷第 49 页。本号专注学术传播,尊崇原创者与知识产权。如有异议,敬请联络,致谢!#摘要文章深入剖析了大型语言模型(LLMs)背景下模型蒸馏的合规性难题。所谓模型蒸馏,即借由复刻大型专有“教师”模型的输出表现,以此培育小型“学生”模型。伴随 AI 技术的迅猛演进,专利法与合同法体系正遭遇严峻考验。具体来说,本文着重探讨美国现有版权法能否为尖端大模型研发者提供周全庇护,以及未经许可的蒸馏操作是否触犯侵权红线。经由剖析主
AI巨头Anthropic新模型竟自称DeepSeek
5月29日,Anthropic正式推出了其最新旗舰大模型Claude Opus 4.8。同一天,该公司还宣布成功完成650亿美元的H轮融资,投后估值高达9650亿美元,距离万亿美元大关仅一步之遥。然而,模型上线不久,多个平台的用户通过API测试发现,Opus 4.8在回答自身身份相关问题时,竟声称自己是阿里通义千问(Qwen)或DeepSeek。这一现象并非孤例,无论是Linux do等技术社区,还是微博、X等社交平台,都有网友验证并复现了该问题。极具讽刺意味的是,就在三个月前,Anthropic曾高调指
美国AI巨头Claude Opus 4.8被指"借鉴"国产千问、DeepSeek
日前,美国人工智能企业 Anthropic 发布了全新的 Claude Opus 4.8 模型。该模型上线后,在全球各大模型评测榜单中始终位居前列,被认为是业内综合性能最强的大模型之一。然而近期,有网友披露该模型疑似存在对国产人工智能大模型进行蒸馏的情况。有用户通过 API 调用发现,这款美国顶级大模型经常出现身份混淆问题,多次将自身识别为阿里千问、DeepSeek 等国内主流开源模型。测试结果已得到微博、X平台多位网友的反复验证,且能稳定复现,并非偶发的系统故障。不过,用户在网页端测试时,并未出现类似的
苹果深耕端侧 AI:摆脱云端依赖的新战略
在即将于下月召开的苹果年度开发者盛典上,备受瞩目的 iPhone 人工智能功能升级终于要亮相了。与此同时,业界普遍预测,苹果将展示其角逐 AI 赛道的独特王牌:利用遍布全球的庞大设备群,实现 AI 模型在终端本地的直接运行。 据熟悉苹果全球开发者大会筹备内情的消息源透露,苹果计划展示其过去十五年间为 iPhone、Apple Watch 及 Mac 电脑自主研发定制芯片所积累的技术底蕴。这份深厚的积淀,将成为其在设备端本地部署 AI 模型的核心竞争力。相比之下,当前主流方案依赖搭载高性能 AI 芯片的大型
AI本质探析:从互联网到工业制造的转变
我们过去常常将 AI 视为互联网的延伸。这或许是因为许多从事 AI 工作的人原本就来自互联网行业。然而,随着观察的深入,我们发现当前 AI 的商业根基更类似于制造业。传统互联网的核心模式是:编写一次代码,便可无限复制,边际成本趋近于零。其核心在于代码背后的流量增长,并通过流量实现盈利。但大模型的运作方式并非如此。大模型企业需要采购 GPU、建设数据中心、消耗电力、训练模型、部署推理系统,然后持续生成 token。它并非简单地复制软件,而是通过工业体系持续产出一种新的产品:智能。NVIDIA 首席执行官黄仁
AI Daily | DeepSeek 多模态论文亮相,国产模型周调用量首超美国
五一假期刚刚收尾,OpenAI 便投下了一颗重磅炸弹。5 月 6 日凌晨,ChatGPT 的默认模型悄然从 GPT-5.3 切换为 GPT-5.5 Instant。坦率而言,此次升级最值得留意的并非参数规模的扩大或推理性能的提升,而是一项偏向实用的改进——幻觉率骤降 52.5%。这意味着什么?以往向大模型提问时,它可能信心满满地抛出一个错误答案。如今 GPT-5.5 学会了“知之为知之”——减少信口开河,把握分寸,不再絮絮叨叨。OpenAI 官方公布的四项核心升级方向为:幻觉减少、协作能力增强、输出更为克
马斯克诉OpenAI庭审聚焦AI安全与商业利益
本周的庭审围绕马斯克起诉OpenAI的核心原因展开,马斯克方认为此举旨在维护AI安全开发的初心,并促使公司回归非营利模式。然而,OpenAI的律师萨维特则反驳称,马斯克并非真心支持非营利,其真实意图是打压竞争对手。谁才是AI安全的真正守护者?在庭审初期,马斯克将自己描绘成AI安全领域的长期倡导者,并表示创办OpenAI是为了制衡Google在AI领域的领先地位。他引用了与Google联合创始人佩奇的对话,并向陪审团表示,AI失控可能导致“终结者”般的灾难性后果。萨维特则对马斯克的说法提出质疑,指出xAI曾
AI并购风云录
Manus并购案遭中国监管否决没过几天,Meta便火速调整方向,将一家人形机器人AI新创企业Assured Robot Intelligence收入囊中。Meta曾以"历史级大手笔"(数十亿美金)试图收购中国AI智能体Manus,交易由扎克伯格亲自主导,仅用十余天便闪电敲定。2026年4月27日:中国国家发改委依法干预,紧急中止该笔交易,严令撤销并购、清除相关数据Manus启动退款、切断对Meta的授权、重启本地化数据存储;Meta方面则全面撤退深度剖析:收购Manus本是Meta在AI Agent领域发
DeepMind CEO:AI Agent是通往AGI的关键路径
近日,Google DeepMind CEO Demis Hassabis在一次与YC CEO的深度对话中,就通用人工智能(AGI)的技术演进、AI Agent的发展、模型压缩与边缘计算的潜力、长文本处理的局限性以及AI在科学前沿的应用等议题进行了探讨。Hassabis特别强调了强化学习和搜索技术在解决科学领域复杂组合问题中的关键作用。Hassabis指出,实现AGI的核心在于构建一个能够主动解决问题的系统。他认为当前的AI架构已掌握了约一半的关键组件,包括大规模预训练、强化学习和思维链推理,但在持续学习
马斯克称xAI或“部分蒸馏”OpenAI
2026 年 4 月 30 日,Elon Musk 在加州联邦法院就 OpenAI 相关案件接受交叉询问时,被追问 xAI 是否曾对 OpenAI 模型做过“蒸馏”,并据此训练 Grok。Musk 起初表示,这类做法属于“所有 AI 公司”都可能遵循的行业惯例。随后,当律师继续追问这是否等同于正式承认,他回应:“算是部分如此。”这里所说的“模型蒸馏”,并非单纯照搬代码,而是让一个更强的模型充当“老师”,通过学习其输出内容、推理逻辑或行为风格,来训练另一个模型。在庭上,Musk 进一步将蒸馏概括为“用 AI
肖茜视角:人工智能“蒸馏”之争折射全球发展困境
肖茜清华大学战略与安全研究中心副主任近日,围绕人工智能企业“模型蒸馏”的讨论热度骤升,OpenAI、Anthropic与Alphabet等美国顶尖企业罕见地采取了协同行动,引发了国际社会的广泛关注。所谓AI“蒸馏”,简单理解就是让一个AI模型通过与另一个模型的互动,学习其“解题方法”,从而提升自身能力。这一事件发生在美国商务部宣布推进AI出口计划、构建“全方位AI对外输出体系”后不久。许多人留意到,上述企业的首席执行官均是美国AI“安全与保障”顾问委员会的核心成员。该事件映射出当前全球AI竞争态势中的一个
模型蒸馏训练可能隐藏不可见偏见
字数 1437,阅读大约需 8 分钟利用AI训练模型虽比从零构建更省钱省时,但也潜藏风险。该文摘自: https://www.nature.com/articles/d41586-026-01224-1《自然》杂志最新研究揭示,AI生成的数据中可能潜藏着潜意识信号,这些信号会“教会”其他大型语言模型(LLM)特定的特征和偏好。虽然这种偏好可能看似无害,比如偏爱某种动物,但也可能导致LLM推荐暴力或危险行为。目前,LLM常被用来生成训练其他AI的数据,即“模型蒸馏”技术,相比从头训练更高效。但作者指出,这种
美三大AI公司联动施压中国同行 DeepSeek被推上风口
4月6日,彭博社报道称,美国三家人工智能龙头——OpenAI、Anthropic和Alphabet旗下谷歌——正展开少见的协同行动,借助"前沿模型论坛"(Frontier Model Forum)进行信息互通,意在限制中国竞争者从美国先进AI模型中获取输出结果,以便在全球AI竞争中保持领先。"前沿模型论坛":由竞争转向协作"前沿模型论坛"由上述三家公司联合微软于2023年发起成立,是一个行业性非营利机构,主要目标是识别涉嫌违反服务条款的"对抗性蒸馏&
AI三巨头联手封锁技术捷径,中国大模型面临终极检验
表面上是维护知识产权的举措,实质是全球人工智能竞赛的激化。OpenAI、Anthropic与谷歌主导的全球人工智能联盟,正从根本上重塑大模型领域的竞争法则。01深度解析:模型蒸馏技术,究竟是什么样的产业"速成通道"?02产业全景扫描:中国自主研发大模型,哪些依赖技术迁移,哪些坚持自主创新?03遭质疑的"技术借鉴方":双起典型争议事件回顾04速成路径被封,中国大模型产业,进入"实力验证"阶段05结语:人工智能领域,不存在一步登天的坦途