AI理财顾问被问责:模型决策依据何在?
一个真实尴尬的场景
某城商行推出了 AI 理财顾问,运行半年后业绩表现良好。
然而一次突如其/的检查中,监管部门随机抽查了 6 个月前的对话记录:
客户咨询:我有 50 万闲置资金,希望稳健投资。
AI 回复:建议 70% 投资 R3 中风险产品,30% 投资 R4 中高风险……
监管方提出三个质询点,银行行长无一能回答:
1. 当时选择这个配置比例的原因?模型推导逻辑是什么?
2. 谁来承担这条建议的责任?提示词由谁编写?规则由谁设定?
3. 当时使用的模型版本是什么?合规规则库是哪个版本?
——"我们需要查看系统日志。"
——"日志只记录了用户提问和 AI 回答,没有推理过程。"
这个时刻,银行实际上已处在合规风险的边缘。问题不在于 AI 回答错误,而在于无法说明推荐理由。
这正是学术界持续讨论的核心问题:生产环境 LLM 缺乏可追溯性,这本身就是一种风险。
为何"推理过程"和"日志记录"无法解决问题
许多团队的初始反应是:我们也有日志记录,也启用了 Chain-of-Thought(推理链)来解释 AI 思路。
但这并不足够。学术文献中有个重要观点——
可解释性 ≠ 可审计性。
可解释性仅需说明"结果是什么",可审计性要求"如何得出此结果、过程