知识蒸馏精要:三类核心知识解析与最优选择策略
第三章 知识形态归类与蒸馏目标甄选方略
继第二章构建"师-生"框架之后,一个关键命题随之而来:学生模型应当汲取何种知识?
知识蒸馏远非简单的"照搬照抄"。教师模型内部蕴藏着多层信息,涵盖最终决策、中间推演过程以及抽象逻辑关联。甄选不同的"知识形态"作为蒸馏标的,将直接影响学生模型的性能天花板与训练复杂度。
本章将系统剖析三类核心知识形态,并给出实用的遴选策略,助您在工程实践中作出最佳判断。
依据知识在神经网络中的呈现方式,可将其划分为三个层级:输出特征(响应)、中间特征(表征)与关系特征(结构)。
此属最经典、最基础的蒸馏范式,由Geoffrey Hinton于2015年首创。
若将输出视为"答案",中间层则好比"解题思路"。
此乃最抽象、最高阶的蒸馏形态,聚焦于"要素间的内在关联"。
在工程实践中,无法逐一尝试所有方案。现提供一套基于实战经验的"选择决策树"。
常见误区与规避指南:
如下代码演示了如何在单个训练步骤中,灵活融合三类蒸馏损失。
解析:
经由本章学习,您应能依据当前项目需求,明确规划采用何种"知识"来训练学生模型。下一章将探讨更具体的"架构演进",剖析工业界如何将这些理论付诸实践。
咚咚王
《Python 编程:从入门到实践》 《利用 Python 进行数据分析》 《算法导论中文第三版》 《概率论与数理统计(第四版) (盛骤) 》 《程序员的数学》 《线性代数应该这样学第 3 版》 《微积分和数学分析引论》 《(西瓜书)周志华-机器学习》 《TensorFlow 机器学习实战指南》 《Sklearn 与 TensorFlow 机器学习实用指南》 《模式识别(第四版)》 《深度学习 deep learning》伊恩·古德费洛著 花书 《Python 深度学习第二版(中文版)【纯文本】 (登封大数据 (Francois Choliet)) (Z-Library)》 《深入浅出神经网络与深度学习 +(迈克尔·尼尔森(Michael+Nielsen)》 《自然语言处理综论 第 2 版》 《Natural-Language-Processing-with-PyTorch》 《计算机视觉-算法与应用(中文版)》 《Learning OpenCV 4》 《AIGC:智能创作时代》杜雨 +&+ 张孜铭 《AIGC 原理与实践:零基础学大语言模型、扩散模型和多模态模型》 《从零构建大语言模型(中文版)》 《实战 AI 大模型》 《AI 3.0》