标签

AI驱动金融变革的深层逻辑

发布时间:2026-05-08 15:40来源:微信阅读:5

本文系作者2026年4月15日在国家金融与发展实验室科研例会上的专题分享。全文分为两大板块。第一板块聚焦银行业,探讨AI在金融信息处理中的实践应用。人工智能作为强大的信息处理引擎,而金融资源配置、风险管控、机构内部运营及客户服务等均以信息处理为根基。AI在金融领域的落地始于信息处理,其拓展应用亦以此为基础。第二板块在此基础上,剖析AI赋能金融的三个递进层次及其深远影响。

AI驱动金融变革的深层逻辑

01

AI与银行信息处理

针对AI在银行信息处理中的实践,当前可观察到三个现象。其一,生成式AI已从单一语言模型扩展至支持图文音视的多模态系统,现阶段主要应用于文档生成(如会议纪要、客服话术、贷前调查报告、离任审计报告及合同解析等)、代码编写、文本核验、知识库构建与智能问答等场景。然而受限于幻觉问题,大语言模型尚难以直接介入面向客户的决策与核心业务判断。其二,解释型AI结合替代数据,可高效精准评估借款主体偿债意愿与能力,已在银行授信评审中广泛落地。其三,在资本监管框架下,内部评级体系(核心是测算违约概率PD)仍主要依托线性回归、逻辑回归等传统轻量级模型。

国际清算银行(BIS)2024年12月发布的研究报告1调研了全球银行业AI应用现状,结果如表1所示:

表1:全球银行业AI应用现状

表1所列场景中,除反洗钱(AML)/反恐融资(CFT)中的“可疑活动分析”、“信用卡盗刷实时监测”及“信贷审批评估”等主要采用解释型AI外,其余多为生成式AI应用范畴。

这引发三个待探讨的议题。第一,在银行信息处理体系中,轻量级模型、解释型AI与生成式AI各自承担何种职能?第二,这对银行的模型风险管控带来哪些挑战?第三,这对银行授信评审及审批流程产生何种影响?

需特别说明,尽管将解释型AI与生成式AI并行讨论,但二者并非对立关系。首先,两者底层均基于人工神经网络,仅在网络架构上存在差异。当前生成式AI主要采用注意力机制的Transformer架构,而解释型AI的神经网络架构更为多元。其次,尽管主要处理的数据类型不同(见下文),但二者均利用神经网络估算数据概率分布。解释型AI多用于分类任务(如判断借款人是否违约或评定信用等级),预测归属某类别的概率。生成式AI本质是在概率层面预测下一个词元(Token,亦可为像素组、音频或视频片段),在输出结果前会先给出词元在词表中的概率分布。换言之,生成式AI内嵌了关于下一个Token的分类判断(即解释型AI功能)。

银行与借款人间存在信息壁垒,银行信息处理的核心目标是评判借款主体的偿债意愿与偿债能力。尽管银行处理的信息形态各异,但可归纳为两类。第一,硬信息,通常以数字形态呈现,定量且结构化,不含主观判断或个人见解。第二,软信息,多以文本形式存在,定性且非结构化,主观判断与观察是其不可分割的组成部分,需结合具体语境理解。与此对应,银行形成两类授信技术。第一,交易型授信,依托企业财报、信用评分等硬信息。第二,关系型授信,倚重银行与企业长期多维接触中积累的软信息,此类信息无法从公开渠道或财务报表获取。从本文视角,以下两组关系基本成立:

硬信息≈ 结构化数据→交易型授信

软信息≈ 非结构化数据→关系型授信

针对结构化数据,已形成成熟的分析范式,通常分为四步。第一,设定结构化数据背后存在待估算的数据生成机制。该机制既可源于理论研究的因果链条(对应结构化模型),也可基于变量间的统计相关性(对应简约化模型)。机制中包含待估未知参数及误差项,以涵盖观测误差与遗漏变量等因素。第二,利用样本数据估算参数。经济学实证研究多基于参数估计开展假设检验,但实践应用中预测价值更为关键。第三,运用估计得到的模型开展样本外预测。第四,评估预测效能。若预测效果未达预期,可调整模型设定或参数配置(即模型选择或调优)。

银行业中,结构化数据分析的典型场景包括:第一,身份认证,基于人脸、指纹、虹膜及声纹等生物特征识别用户身份;第二,信用评价,评估借款主体信用状况(是否违约及违约概率);第三,异常交易侦测,识别可疑交易与欺诈行为。

长期以来,文本、图像、音频及视频等非结构化数据被认为仅可由人脑创造,无法通过算法生成。大模型的发展证实,非结构化数据的内在规律远超预期。首先,非结构化数据通过嵌入(Embedding)或“词元化”转化为词向量(本质是低维空间中的点),从而可被神经网络处理。代表性方法包括Word2Vec、GloVe、FastText等。其次,以ChatGPT为代表的大模型采用注意力机制的Transformer架构,通过统计学习有效识别非结构化数据中潜藏的模式与结构。继而,大模型在概率层面预测非结构化数据的合理延续(即“下一个Token”),表现为对提示词的响应输出。

无论对结构化还是非结构化数据,银行的处理方法本质均为数据建模。银行在何种场景选用何种模型,均可纳入模型风险管理框架,这取决于模型的两大核心属性——可解释性与预测偏差。

模型可解释性涵盖两个层面。第一,对内可解释性,旨在阐明模型内部运作机理,回应“如何运作”的问题。第二,对外可解释性,旨在说明模型为何得出特定结果,回应“为何如此”的问题。一般而言,数据生成机制越复杂,未知参数越多(“模型越大”),可解释性越弱。因此,基于神经网络的解释型AI与生成式AI在可解释性上天然弱于线性回归、逻辑回归等轻量级模型,具备“黑箱”特性。

针对结构化数据的模型预测偏差易于度量。若被预测变量为连续变量(如经济增速、企业利润等),预测偏差可采用均方误差(MSE)衡量。若被预测变量为离散变量(如是否违约、信用等级等),预测偏差可采用两类错误(“拒真”、“纳伪”)及ROC曲线下面积(AUC)等指标度量。

对处理非结构化数据的大模型而言,“幻觉”实质上对应预测偏差。大模型既然在概率层面预测下一个Token,生成结果偏离真实情况实属必然。这并非通过改进神经网络架构、或增加训练语料与算力就能修复的“缺陷”,而是大模型的固有属性。使用大模型即意味着需接纳幻觉风险。实践中通常通过融合“检索增强生成”(RAG)技术与知识图谱等手段缓释大模型引发的幻觉风险。这本质上是在对幻觉风险容忍度低的场景中采用其他信息处理方式,而非修正大模型的幻觉问题。另需指出,对包括本文在内的非结构化数据的理解具有主观性,评估文本生成效果比评估结构化数据预测效果更具挑战。有监督微调(SFT)与基于人类反馈的强化学习(RLHF)等大模型对齐技术正是针对此问题。

从模型风险管理视角,存在可解释性问题或预测偏差并不意味着模型不可用,而是需结合应用场景与风险容忍度实施管控。不同银行及不同应用场景对模型风险的容忍度可能存在差异。例如,通常情况下,内部信用评估模型的AUC达到0.65即可被接受。模型风险管理亦可如同信用风险、市场风险与流动性风险等适用“三道防线”管控框架。

解释型AI与生成式AI均可纳入风险管理的主流分析框架。从微观审慎监管角度,AI引致的风险主要体现于以下方面。第一,信用风险:低估违约概率或违约损失。第二,网络安全风险:与外部服务商的连接增多;多系统间IT关联增强;AI在模型训练中遭遇“数据投毒”。近期广受关注的事件是,Anthropic的Claude Mythos被用于发现代码漏洞。第三,声誉风险:运营失效影响公众信任;对客户不公平对待引发负面舆情。第四,战略风险:与其他机构合作使银行丧失对核心职能的掌控力。第五,法律风险:AI模型训练语料可能侵权;面向客户的AI工具可能提供不准确或不恰当的反馈。第六,数据隐私风险:AI模型在训练与使用中可能泄露个人或敏感信息。

从宏观审慎监管角度,AI引致的风险主要体现为:第一,“羊群效应”,源于不同银行使用相同基础模型与训练语料;第二,第三方AI供应商导致市场集中与相互关联。迄今为止,全球鲜有大型银行通过预训练研发出性能优异的基础模型,主要采用头部AI公司与互联网公司研发的基础模型,基础模型及供应商的集中化趋势已不容忽视。

总体而言,不同模型应依据应用场景发挥各自优势,实现协同增效。轻量级模型、解释型AI与生成式AI之间并非相互替代,而是互补关系。大模型因“幻觉”不能直接面向银行客户,但可作为银行员工的“智能副驾”(Copilot),辅助信息处理与报告生成。大模型的输出还可作为轻量级模型的输入。大模型将显著提升银行处理非结构化数据的效率与效果。

生成式AI现阶段主要用于银行内部辅助场景。尽管解释型AI在银行授信评审中应用成效良好,监管机构仍倾向可解释性强的轻量级模型。例如,在巴塞尔资本协议中,风险资本计量的核心工具是风险价值(VaR);贷款组合信用风险计量的基础是渐进单因子风险模型;内部评级法在测算违约概率(PD)的主流工具是线性回归与逻辑回归。因此,AI在银行业呈现出图1所示的渗透路径。

图1 AI在银行业的渗透路径

从图1可见:第一,模型的可解释性与预测效力呈反向关系,其中生成式AI预测效力最强,但可解释性最弱;第二,AI在银行业的渗透路径是从内部辅助场景逐步延伸至以资本监管为核心的关键领域。

图2展示了AI对银行授信技术的影响。随着信息与通讯技术(ICT)演进,越来越多信息以数字化方式被采集与记录(硬信息占比持续提升),成为可供模型分析的对象。大模型显著增强了银行分析非结构化数据的能力。因此,部分关系型授信将转化为交易型授信,银行信贷审批权限可适当集中。现实中该趋势已显现。

图2 AI对银行授信技术的影响

02

AI赋能金融业的三个层次及其影响

以金融信息处理为基石,AI在金融业拥有广阔的应用前景。一方面,金融业自身特性与AI高度契合;另一方面,AI从“工具→助手→智能体”的进化将深化其在金融领域的应用。在这双重驱动下,AI赋能金融业由浅入深将表现为三个递进层次,并对金融业产生深刻影响。

金融业与AI的契合性主要体现在两方面。第一,行业属性匹配。首先,金融业信息密度高,大量工作涉及处理研究报告、公告、合同、监管文件等非结构化文本,与大语言模型的核心能力高度匹配。大模型将使非结构化数据更高效地融入金融体系,提升金融活动效率。其次,金融业流程密度高,业务环节步骤明确,输入输出清晰,便于AI从辅助单一步骤到参与完整流程,且流程中大量手工操作可被自动化工具替代。最后,金融业规则密度高,为AI划定了清晰的操作边界。“流程密集+规则密集”使AI深度嵌入金融业务流程,从处理信息延伸至处理资金。第二,来自成本效率、客户竞争、合规压力、人才培养四方面的驱动力推动金融机构布局AI。尤其在我国,银行业在净息差收窄背景下具备强烈动力部署AI。

最强AI基础模型通常由头部AI公司与互联网公司研发,但金融业对数据安全性要求严苛,无法直接调用公共API。经近年探索,金融业逐步形成三种数据安全解决路径。第一,“防火墙网关”模式:金融机构自建综合AI平台对接外部模型,员工请求经内部网关路由,数据在防火墙内完成加密、脱敏与权限校验后发送至外部模型。第二,混合云架构:按数据敏感度分层处置,最敏感数据留存于私有云或本地环境,中度敏感任务通过企业级公有云配合加密与隔离机制处理,非敏感负载可考虑更开放的云环境。第三,完全本地化部署:采用开源模型在企业自有基础设施上运行,全部数据处理在内部完成,不依赖外部API。

AI从“工具→助手→智能体”演进的本质并非技术代际更替(当前主流大模型均为Transformer架构,尚未出现有竞争力的替代架构),而是人机关系的演变,体现在四条边界拓展。第一,能力边界:AI在各阶段能做什么、不能做什么?第二,权限边界:AI被授权访问与操作哪些系统与数据?第三,流程边界:AI嵌入业务流程的深度与广度。第四,责任边界:AI参与的决策与行动中,责任如何界定?

1.工具或“智能副驾”

该阶段的核心特征是“人发起、人主导、人审核”;AI提供建议、补充信息并加速产出,但不主动行动、不连接其他系统、不执行操作;每次人机交互均为独立事件。典型应用为聊天机器人,大模型主要发挥“在概率层面生成下一个Token”的基础功能。

2.助手

该阶段的核心特征是“人分配任务、AI持续协作、人保留关键决策权”;AI“知晓”用户身份、工作场景及历史对话,能持续跟进、“记忆”前文并“理解”偏好,开始嵌入特定岗位的工作流,但不自主行动、不直接操作用户的电脑系统。

该阶段得益于“检索增强生成”(RAG)技术。大模型的输出可与搜索引擎结果、知识图谱及专家知识融合,缓解大模型幻觉问题,提升输出结果的准确性与时效性。

AI“记忆”前文、与用户持续互动的基础,是将过往交互记录纳入提示词。但该交互不改变大模型权重设置,模型未发生真正意义上的“学习”。若将大模型视为一个函数,其权重即函数参数,那么纳入过往交互记录是通过改变函数输入来影响输出;但函数参数保持不变,大模型本身未改变。换言之,关于用户的“记忆”体现在提示词中,大模型对用户并无真实记忆。

3.智能体

该阶段的核心特征是,AI可规划步骤、调用工具、连接电脑系统并根据反馈调整执行;不等于完全无人化,更务实的形态是有边界的半自动执行,AI在明确规划、权限与审批节点下自主运行,关键决策仍需人工审批。

当前媒体上对智能体存在不少夸大与失实表述。智能体未改变大模型“在概率层面生成下一个Token”的基础功能;智能体能反复调用大模型,但不改变模型权重设置。智能体改变的是大模型的调用方式及模型与电脑系统间的互动,相关创新被概括为“上下文工程”。首先,大模型的输出包含对电脑系统的调用指令。其次,若用户授权或批准,这些指令将在用户系统上被执行并产生实际影响,使大模型从“空谈”转向“实干”。进而,这些实际影响又被纳入提示词,作为新一轮输入调用大模型。如此循环,使大模型能在人类指令、授权与审批下分步执行复杂任务。

该阶段还得益于“模型上下文协议”MCP、“智能体间协议”A2A等标准化连接协议,使多智能体相互调用、协同作业成为可能。

智能体落地依赖一系列前置条件。第一,工具接口:智能体需通过标准化接口连接用户电脑系统。第二,权限分级:智能体可访问与操作的范围必须严格限定。第三,审批节点:涉及资金划转、客户信息修改或对外通讯等关键步骤必须人工审批。第四,日志追踪:智能体的每一步决策与操作必须完整记录,支持事后审计。第五,评估机制:需对智能体输出质量与行为合规性持续监测。第六,人工兜底:智能体遇到无法处理的情况必须有明确的升级与回退路径。

1.作为工具赋能个体

首先,法务、合规、客服、代码开发及文档处理等中后台岗位因任务高频、标准化程度高,AI落地速度较快。其次,对知识密集型前台岗位(如投研),AI将替代部分重复性劳动,改变工作流程中获取信息与整理材料的速度,但不改变决策环节的责任归属。在该层次,所有业务风险、合规要求及最终决策责任仍由人类员工完全承担。

2.作为助手“理解”角色、上下文与客户

首先是面向员工的助手。助手可围绕员工岗位持续工作,跟进员工正在维护的客户关系,记忆上周讨论的交易条款、在员工筹备下次客户会谈前整理相关资料。其次是面向客户的助手。从答疑延伸至协助处理具体事务,AI开始参与账单查询、转账确认及轻量级服务流程。在该层次,尽管核心判断权仍保留在人类员工手中,但当AI基于多维数据追踪提供个性化建议时,责任边界开始模糊。

3.智能体开始参与完整业务流程

AI在明确边界内接手多步骤任务,以释放人力聚焦于异常事件处理与关键判断。目前看,智能体主要适用于两类场景。首先是规则驱动型流程场景。例如,反洗钱、制裁合规、KYC审查与合规报送等,具有规则清晰、步骤标准与数据