AI前沿精选:揭示模型偏见与推理新策略(7.3)
LG - 机器学习 CV - 计算机视觉 CL - 计算与语言1、[CL] Distill to Detect:通过插件蒸馏暴露大语言模型的隐秘偏见 2、[LG] QuasiMoTTo:拟蒙特卡洛推理时扩展方法 3、[CL] DiscoLoop:融合离散嵌入与连续隐状态的循环架构用于多跳推理 4、[CL] 图原生强化学习借助概念重组实现可追踪的科学假设构建 5、[LG] 正确且恰当:结合可验证奖励与人类示例的语言模型训练摘要:利用插件蒸馏技术揭示大语言模型的隐性偏见、基于拟蒙特卡洛的推理时计算扩展、面向多