人工智能在金融业的演进逻辑与应用层次
聂铭江,江苏省金科数字与科技金融研究院高级研究员
【编者按】本文系作者于2026年4月15日在国家金融与发展实验室科研工作例会上的发言。全文分两大部分。首先以银行业为例,探讨人工智能在金融信息处理中的应用;其次在此基础上,分析人工智能应用于金融业的三个层次及其深远影响。
01 人工智能与银行信息处理
针对人工智能在银行信息处理中的运用,现实中有三点观察。其一,生成式AI已从大语言模型拓展至能处理图片、音频、视频的多模态模型,主要用于文档生成(如会议纪要、客服话术、贷款尽调报告、合同解析等)、代码编写、文档核验、知识库问答等。但因存在“幻觉”,大模型难以直接参与面向客户的决策和核心业务判断。其二,解释型AI结合替代数据,能高效精准评估借款人还款意愿和能力,已在信贷评估中广泛应用。其三,在资本监管要求下,内部评级法(核心是评估违约概率PD)仍主要依赖线性回归、逻辑回归等传统“小模型”。
国际清算银行(BIS)2024年12月一份研究报告1对全球银行业AI应用情况进行了调研,结果见表1:
表1:全球银行业使用人工智能的情况
表1显示,除反洗钱(AML)/反恐融资(CFT)中“分析可疑活动”、“实时监测未经授权的信用卡使用”以及“评估是否放贷”等主要属于解释型AI外,其他应用场景多属生成式AI。
由此引出三个需讨论的问题。第一,在银行信息处理中,“小模型”、解释型AI和生成式AI将各自扮演何种角色?第二,这对银行的模型风险管理有何影响?第三,这对银行信贷评估和审批流程有何冲击?
需要说明的是,尽管将解释型AI和生成式AI并列讨论,但二者并非对立关系。首先,二者底层均为人工神经网络,但架构不同。目前生成式AI主要使用基于注意力机制的Transformer架构,解释型AI的神经网络架构更为多样化。其次,尽管分析的数据类型有别,但二者均用神经网络估测概率分布。解释型AI主要用于分类问题(如区分是否违约或不同信用评级),预测属于某类别的概率。生成式AI的内核是在概率意义上预测下一个Token(词元),在给出结果前先给出其在词表中的概率分布。换言之,生成式AI内嵌了关于下一个Token的分类问题(即解释型AI)。
银行与借款人之间存在信息不对称,银行信息处理的核心目标是评估还款意愿和能力。尽管处理的信息形态各异,但主要分为两类:硬信息,以数字形式存在,定量、结构化,不含主观判断;软信息,以文本形式存在,定性、非结构化,主观判断是组成部分。对应这两类信息,银行主要有两类放贷技术:交易型放贷,使用企业财务报表和信用评分等硬信息;关系型放贷,使用银行长期接触积累的软信息。从本文分析角度,近似成立以下关系:
硬信息≈ 结构化数据→交易型放贷
软信息≈ 非结构化数据→关系型放贷
对于结构化数据,有成熟分析方法,一般分四步:假设数据生成过程(基于因果关系或统计相关性),通过样本估计未知参数,利用模型样本外预测,评估预测效果。在银行业,结构化数据分析场景包括:身份识别、信用评估、异常交易检测。
长期以来,以文本、图片、音频、视频为代表的非结构化数据被认为只能由人脑生成,大模型发展已证明其内在规律丰富。首先,非结构化数据通过嵌入或“词元化”转化为词向量,被神经网络处理。其次,以ChatGPT为代表的大模型使用Transformer架构,通过统计学习识别隐含模式。接着,大模型在概率意义上预测非结构化数据合理延续(即“下一个Token”),体现为针对提示词的回复。
无论是结构化还是非结构化数据,银行处理方法本质都是建模。模型适用场景取决于可解释性和预测误差。模型可解释性分对内(How)和对外(Why)。参数越多,可解释性越低,大模型具有“黑盒”特征。
针对结构化数据的预测误差易测:连续变量用均方误差(MSE),离散变量用两类错误和ROC曲线下面积(AUC)。对处理非结构化数据的大模型,“幻觉”即预测误差。生成Token偏离真实情况是题中应有之义,非单纯Bug,需接受风险,通过RAG和知识图谱缓解。评估非结构化数据效果比结构化数据更难,需靠SFT和RLHF等技术对齐。
从模型风险管理看,可解释性或误差不代表不可用,需结合场景和风险容忍度。不同银行容忍度不同,模型风险管理也可适用“三道防线”框架。
解释型AI和生成式AI均可纳入主流风险管理框架。微观审慎角度看,AI风险包括信用、网络、声誉、战略、法律、数据隐私风险。宏观审慎角度看,风险体现为“羊群”行为和市场集中。总之,不同模型应互补,大模型因“幻觉”不能直接面向客户,但可作为员工“副驾驶”,辅助处理,并为“小模型”提供输入。
生成式AI目前主要用在银行内部辅助。尽管解释型AI在信贷评估应用良好,监管仍偏好可解释性强的“小模型”(如VaR、渐进单因子模型、线性回归)。因此,AI在银行业渗透顺序如图1所示。
图1 人工智能在银行业的渗透顺序
从图1可见:第一,模型可解释性与预测效力呈反比,生成式AI效力最强但可解释性最低;第二,AI在银行业渗透顺序是从内部辅助逐渐深入以资本监管为代表的核心场景。
图2展示了AI对银行放贷技术的影响。随着ICT发展,硬信息数字化占比提升,成为模型分析对象。大模型提高了分析非结构化数据的能力,部分关系型放贷将变为交易型放贷,信贷审批权可适当上收。现实中已有此趋势。
图2 人工智能对银行放贷技术的影响
02 人工智能应用于金融业的三个层次及其影响
以金融信息处理为基础,AI在金融业有广阔前景。一方面,金融业特性适配AI;另一方面,AI从“工具→助手→智能体”演进,深化应用。两者合力下,AI应用从浅到深体现为三个层次,产生深远影响。
金融业与AI适配性体现在两方面:一是行业特征匹配,金融信息密集(研报、合同等),流程清晰(输入输出明确),规则明确,便于AI嵌入;二是成本效率、客户竞争、合规压力、人才培养四方面压力推动。我国银行业在净息差下降背景下部署AI动力很强。
最强AI基础模型由头部公司开发,但金融业对数据安全要求高,不能直接用公共API。金融业逐渐收敛到三种数据安全方案:一是“防火墙网关”模式,自建平台接入外部模型;二是混合云架构,按敏感度分层处理;三是完全本地化部署,使用开源模型。
AI从“工具→助手→智能体”演进核心不是技术代更(仍是Transformer),而是人机关系变化,体现在四边界拓展:能力、权限、流程、责任。
1.工具或“副驾驶”
此阶段核心是“人发起、人主导、人审核”;AI提供建议、补充信息、加速产出,但不主动行动、不连系统、不执行操作;人机交互独立。代表性应用是聊天机器人,大模型发挥“生成下一个Token”基础功能。
2.助手
此阶段核心是“人分配任务、AI持续协作、人保留关键判断权”;AI“知道”用户身份、任务、偏好,能持续跟进、记住前情,嵌入工作流,但不自主行动、不直接操作电脑系统。
此阶段得益于“检索增强生成”(RAG)技术。大模型输出结合搜索引擎、知识图谱,缓解幻觉,提高准确性。
AI“记住”前情的基础是交互记录含在提示词中,但这不改变大模型权重(无真正“学习”)。若视大模型为函数,过往记录改变输入,参数不变。即“记忆”在提示词中,大模型本身无记忆。
3.智能体
此阶段核心是AI能规划步骤、调用工具、连接系统、根据反馈调整执行;不等于无人化,更现实是半自动执行,在明确规划、权限、审批节点下自主运行,关键决策仍需人工。
媒体对智能体夸大其词。智能体未改变大模型“生成下一个Token”基础,只是改变调用方式和与系统互动,即“上下文工程”。大模型输出含系统调用指令,若授权,指令被执行并产生真实影响,影响再纳入提示词新一轮输入,使大模型在人类指令下分步执行复杂任务。
此阶段得益于“模型上下文协议”MCP、“智能体间协议”A2A等标准化协议,使多智能体协作成为可能。
智能体落地需前提:工具接口、权限分层、审批节点、日志追踪、评估机制、人工兜底。
1.作为工具增强个人
首先,法务、合规、客服、开发、文档处理等中后台岗位任务高频、标准化,落地快。其次,对投研等知识密集型前台,AI替代部分重复劳动,改变信息获取和整理速度,但不改变决策责任归属。此层次,所有风险和责任仍由人类承担。
2.作为助手“理解”角色、上下文和客户
首先是面向员工的助手。助手围绕岗位持续工作,跟进客户关系,记住交易条款,会面前整理材料。其次是面向客户的助手。从答疑延伸到协助查账单、转账确认等轻量流程。此层次,核心判断权仍在人类,但AI给出个性化建议时,责任边界开始模糊。
3.智能体开始参与完整业务流程
AI在明确边界内接手多步骤任务,释放人力处理意外和关键判断。目前看,智能体适用两类场景:一是规则驱动型流程,如反洗钱、制裁合规、KYC审查、合规报送,规则清晰、步骤标准、数据