苹果可借Gemini蒸馏轻量AI模型
作者:杰西卡・E・莱辛、阿米尔・埃夫拉蒂、艾琳・吴
苹果(252.62, 0.98, 0.39%)与谷歌(289.59, 0.39, 0.13%)达成的人工智能合作,不仅是为了协助苹果完善 Siri 助手及其他已公布的 AI 能力,双方协作的实际范围也比外界先前了解的更广。
我们此前曾提到,苹果可以对谷歌 Gemini 不同版本的 AI 模型进行适配和微调,使其按苹果设定的方式回应用户请求。而真实协议给予苹果在使用谷歌技术方面更高的自主空间。
据一名熟悉合作内容的人士透露,苹果能够在自建数据中心中完整调用 Gemini 模型。凭借这一权限,苹果可以训练更轻量的模型来处理特定任务,或者将模型压缩到足以直接部署在苹果设备上,以提高处理效率。
这种产出轻量模型的方法被称为模型蒸馏,其本质是把作为“教师”的大语言模型所掌握的能力,传递给作为“学生”的另一套模型。
具体来说,苹果可以让 Gemini 主模型完成一系列任务,产出高质量结果或答案,其中也包括模型逐步展开推理的“思维链”过程。随后,苹果可将这些结果和答案作为训练样本,输入更小、成本更低的模型中,进而获得蒸馏后的轻量模型。
由于苹果拥有对 Gemini 的完整访问能力,其“学生模型”还可以学习 Gemini 生成答案时的内部计算方式,这相比仅仅模仿最终答案,往往能够取得更好的效果。
通过蒸馏形成的轻量模型,整体表现有望接近顶级“教师模型”,但对计算资源的需求会明显下降。
不过该人士也指出,这项技术真正落地并不容易:Gemini 主要围绕聊天机器人、企业场景和编程任务进行优化,与苹果对 Siri 的功能定位并非完全一致。
该人士表示,这次合作并不代表苹果放弃研发自有 AI 模型,苹果基础模型团队仍在持续推进自主研发,至于苹果在这一方向投入了多少资金,目前外界尚不得而知。
外界或许会猜测,苹果基础模型团队未来可能会基于蒸馏版 Gemini 打造新模型。但参与相关项目的人士对此并不认同,因为该团队似乎没有计划开发一款直接与 Gemini 正面竞争的产品。
目前苹果基础模型团队究竟聚焦哪些研发路线尚未明朗,但可以确定的是,团队目标之一同样是打造能够直接运行在苹果设备端的自研轻量模型。
现阶段,Siri 将借助 Gemini 生成回答,具备问答、讲故事、情绪陪伴,以及帮助用户完成行程预订等多种能力。
部分新能力预计会在苹果 6 月举行的年度开发者大会上亮相,包括 Siri 记住历史对话内容,以及主动提醒用户提早出门、绕开机场接机道路拥堵等更具预判性的功能。
尽管苹果与谷歌的这项合作可被视为近 20 年科技行业中一次典型的双赢案例,但新的协议并不意味着两家公司在人工智能赛道上的竞争会就此停止。
正如 OpenAI 与苹果都在研发面向消费者的个人 AI 设备,例如智能眼镜和可穿戴胸针等,谷歌同样势必会推出新产品,试图削弱 iPhone 在移动消费设备领域的主导优势。
责任编辑:郭明煜
新浪财经声明:此消息系转载自合作媒体,新浪财经刊载本文旨在传递更多资讯,文章内容仅供参考,不构成投资建议。
郑重声明:1.根据《证券法》规定,严禁编造、传播虚假信息或误导性信息,扰乱证券市场;2.用户在本社区发布的所有资料、言论等仅代表个人观点,与本网站立场无关,也不构成任何投资建议。用户应依据独立判断,自主决定证券投资并承担相应风险。
