模型蒸馏训练可能隐藏不可见偏见
字数 1437,阅读大约需 8 分钟利用AI训练模型虽比从零构建更省钱省时,但也潜藏风险。该文摘自: https://www.nature.com/articles/d41586-026-01224-1《自然》杂志最新研究揭示,AI生成的数据中可能潜藏着潜意识信号,这些信号会“教会”其他大型语言模型(LLM)特定的特征和偏好。虽然这种偏好可能看似无害,比如偏爱某种动物,但也可能导致LLM推荐暴力或危险行为。目前,LLM常被用来生成训练其他AI的数据,即“模型蒸馏”技术,相比从头训练更高效。但作者指出,这种