标签

XAI数学基础与Bandit优化:博士论文研究进展

发布时间:2026-05-09 11:17来源:微信阅读:6

本研究论述由两大部分构成。首先,本文呈献了一系列旨在拓展可解释人工智能(Explainable AI, XAI)数学根基的研究成果。具体来说,本论文深入剖析了归因技术、反事实解释以及基于概念的模型。

归因方法致力于发掘对模型特定决策起关键作用的输入特征,然而,“关键性”的界定常常含糊不清。在第二章,我们引入了一种新的解读视角,将归因得分转化为一种“方向性”指示。此方向性指示告知使用者如何调整其特征以达成特定目标。然而,现有研究揭示,此类方法在输入层面存在鲁棒性不足的问题:特征高度相似的用户可能获得差异显著的解释。

在接下来的第三章与第四章,我们聚焦于反事实解释的研究。我们论证了遵循此类解释进行操作,会引发底层数据分布的偏离。进一步的研究表明,这种偏离可能导致模型精度下降,甚至随着时间的推移使解释本身失效。

在第五章,我们提出了一种新颖的方法与框架,用于构建样本效率高的基于概念的模型。通过有效运用因果表示学习(Causal Representation Learning)中的技术,我们实现了更高的决策数据效率。

最后,在第二部分及最终章节,我们探讨了Bandit 凸优化问题。我们开发了一种能够解决该问题的新型算法;相较于现有算法,该算法在保证易于高效实现的同时,显著优化了遗憾界(Regret bounds)。