标签

AI赋能金融业的深层逻辑解析

发布时间:2026-05-31 20:20来源:微信阅读:6

本文系作者在国家金融与发展实验室科研例会上的分享,分为两个部分。第一部分以银行业为切入点,探讨人工智能在金融信息处理领域的实际应用。人工智能作为一种高效的信息处理工具,是金融资源配置、风险管理、内部管理及客户服务的基础。AI在金融业的落地始于信息处理,其他应用均以此为基石。第二部分将在此基础上,进一步剖析AI应用于金融业的三个层级及其深远影响。

人工智能应用于金融业的内在逻辑

01

人工智能与银行信息处理

针对AI在银行信息处理中的实践,现实观察可归纳为三点。首先,生成式AI已从大语言模型演进为能处理图文音视的多模态模型,当前主要应用于文档生成(如会议纪要、客服话术、尽调报告、离任审计及合同解析等)、代码编写、文档核验、知识库构建及智能问答。然而,受限于“幻觉”问题,大模型尚难直接介入面向客户的决策及核心业务判断。其次,解释型AI结合替代数据,能高效精准地评估借款人的还款意愿与能力,已在银行信贷评估中普及。再次,在资本监管要求下,内部评级法(核心在于评估违约概率PD)仍主要依赖线性回归、逻辑回归等传统“小模型”。

国际清算银行(BIS)2024年12月发布的一份研究报告对全球银行业AI应用情况进行了调研,数据详见表1:

表1:全球银行业使用人工智能的情况

表1数据显示,除反洗钱(AML)/反恐融资(CFT)中的“分析可疑活动”、“实时监测未授权信用卡使用”及“评估放贷”等场景主要属于解释型AI外,其余应用场景多属生成式AI。

由此引出三个待探讨的问题。第一,在银行信息处理中,“小模型”、解释型AI与生成式AI将各扮演何种角色?第二,这对银行模型风险管理有何影响?第三,这对信贷评估及审批流程将产生何种改变?

需说明的是,尽管将解释型与生成式AI并列讨论,二者并非对立。第一,两者底层均为人工神经网络,但架构不同。当前生成式AI多采用基于注意力机制的Transformer架构,而解释型AI的神经网络架构更为多样。第二,虽主要分析数据类型有别,但两者均利用人工神经网络估测数据概率分布。解释型AI主攻分类问题(如判定违约与否或信用评级),预测特定类别的概率;生成式AI内核则是在概率层面预测下一个Token(可指词元、像素组、音频或视频段),输出前会先给出词表中的概率分布。换言之,生成式AI内嵌了解释型AI的分类问题。

银行与借款人存在信息不对称,银行信息处理的核心在于评估还款意愿与能力。尽管银行处理信息形态各异,但主要分为两类:第一,硬信息,通常以数字形式呈现,具有定量、结构化特征,不含主观判断;第二,软信息,通常以文本形式呈现,具有定性、非结构化特征,主观判断与观察不可剥离,需结合语境理解。对应这两类信息,银行主要有两种放贷技术:第一,交易型放贷,依赖财务报表和信用评分等硬信息;第二,关系型放贷,依赖长期多渠道接触积累的软信息,此类信息无法从财报或公开渠道获取。从本文视角看,以下两个等式近似成立:

硬信息≈ 结构化数据→交易型放贷

软信息≈ 非结构化数据→关系型放贷

针对结构化数据,已有成熟分析方法,一般分四步:第一,假设数据背后存在待估计的数据生成过程,可基于理论因果(结构化模型)或统计相关性(简约化模型)构建,包含未知参数及误差项;第二,利用样本数据估计参数,实际应用更侧重预测而非假设检验;第三,利用模型进行样本外预测;第四,评估预测效果,若不理想则调整模型设定或参数。

银行业中,结构化数据分析的典型场景包括:身份识别(基于生物特征)、信用评估(违约概率预测)及异常交易检测(欺诈识别)。

长期以来,文本、图片、音视频等非结构化数据被认为仅能由人脑生成。大模型的发展证明其内在规律丰富。首先,通过嵌入或词元化将非结构化数据转化为词向量,使其可被神经网络处理,代表性方法包括Word2Vec等;其次,以ChatGPT为代表的大模型利用Transformer架构,通过统计学习识别非结构化数据中的隐含模式;接着,大模型在概率层面预测数据的合理延续,体现为对提示词的回复。

无论处理结构化还是非结构化数据,银行本质上都在对数据建模。模型选择取决于可解释性和预测误差这两个关键特征,可纳入模型风险管理框架。

模型可解释性分两个维度:对内解释模型运作机制(How问题),对外解释结果成因(Why问题)。通常数据生成过程越复杂、参数越多,可解释性越低。因此,基于神经网络的AI在可解释性上天然不及线性回归等“小模型”,具有“黑盒”特征。

结构化数据模型的预测误差易测度。连续变量可用均方误差衡量,离散变量可用两类错误及ROC曲线下面积(AUC)衡量。

对处理非结构化数据的大模型,“幻觉”对应预测误差。大模型基于概率预测下一个Token,生成内容偏离实情属其固有特征,非单纯改进架构或增加算力可修复,而是内在属性。使用大模型意味着需接受幻觉风险。现实中常通过“检索增强生成”(RAG)和知识图谱等技术缓解,本质是在低风险容忍场景采用其他方法,而非修复大模型本身。此外,非结构化数据理解含主观因素,评估难度大于结构化数据,SFT和RLHF等对齐技术旨在解决此问题。

从模型风险管理看,存在可解释性或误差问题不代表模型不可用,而需结合场景与风险容忍度管理。不同银行及场景容忍度各异,如内部信用评估模型AUC达0.65即可接受。模型风险管理可适用“三道防线”框架。

解释型与生成式AI均可纳入主流风险分析框架。微观审慎监管下,AI风险体现为:信用风险(低估违约概率或损失)、网络安全风险(外部依赖增加、数据投毒)、声誉风险(运营失败、不公平对待)、战略风险(核心功能失控)、法律风险(侵权、回复不当)及数据隐私风险(信息泄露)。

宏观审慎监管下,AI风险体现为:不同银行使用相同基础模型导致的“羊群”效应,以及第三方供应商造成的市场集中与关联。目前全球大银行多依赖头部公司研发的基础模型,集中化趋势明显。

综上,不同模型应依场景发挥优势,实现协同。“小模型”、解释型与生成式AI非替代关系,而是互补。大模型因“幻觉”难直接面向客户,但可作为员工“副驾驶”辅助处理信息和生成报告,其输出亦可作为“小模型”输入,显著提升非结构化数据处理效率。

生成式AI目前多用于银行内部辅助场景。尽管解释型AI在信贷评估中表现良好,监管仍偏好可解释性强的“小模型”。如巴塞尔协议中,风险资本计量核心为VaR,信用风险计量基础为单因子模型,内部评级法主流工具仍为回归模型。因此,AI在银行业呈现图1所示的渗透顺序。

图1 人工智能在银行业的渗透顺序

由图1可见:第一,模型可解释性与预测效力呈反向关系,生成式AI预测力最强但可解释性最低;第二,AI渗透顺序是从内部辅助逐步深入至资本监管等核心场景。

图2展示了AI对银行放贷技术的影响。随着ICT发展,数字化信息(硬信息)占比提升,成为可分析对象。大模型显著增强了非结构化数据分析能力,促使部分关系型放贷转向交易型放贷,信贷审批权可上收,此趋势已在现实中显现。

图2 人工智能对银行放贷技术的影响

02

人工智能应用于金融业的三个层次及其影响

基于金融信息处理,AI在金融业前景广阔。一方面,金融业特性适配AI;另一方面,AI从“工具→助手→智能体”的演进将深化应用。两者合力下,AI应用将呈现三个层次,产生深远影响。

金融业与AI的适配性体现在:第一,行业特征匹配。金融业信息密集,大量工作涉及处理研报、合同等非结构化文本,与大模型能力契合,提升效率;金融业流程密集,环节清晰,便于AI从辅助步骤到参与全流程,替代手工操作;金融业规则密集,为AI划定明确边界。“流程+规则”密集促使AI深度嵌入业务,从处理信息到处理资金。第二,成本效率、客户竞争、合规压力及人才培养四重压力推动机构部署AI,我国银行业在净息差下行背景下动力尤强。

最强基础模型多由头部科技公司开发,但金融业数据安全要求高,不能直连公共API。经探索,金融业收敛至三种数据安全方案:第一,“防火墙网关”模式:自建平台接入外部模型,请求经内部网关加密、脱敏、权限检查后发送;第二,混合云架构:按敏感度分层,最敏感数据留私有云,中等任务用公有云加密隔离,非敏感负载用开放云;第三,完全本地化部署:使用开源模型在自有设施运行,数据内部处理。

AI从“工具→助手→智能体”演进的核心非技术代际更替,而是人机关系变化,体现为四大边界拓展:能力边界(能做什么)、权限边界(访问哪些系统)、流程边界(嵌入深度)及责任边界(责任归属)。

1.工具或“副驾驶”

此阶段特征为“人发起、人主导、人审核”;AI提供建议、补充信息、加速产出,不主动行动、不连接系统、不执行操作;每次交互独立。典型应用为聊天机器人,大模型主要发挥生成下一个Token的基础功能。

2.助手

此阶段特征为“人分配任务、AI持续协作、人保留关键判断权”;AI“知晓”用户身份、任务及历史,能持续跟进、记忆偏好,嵌入工作流,但不自主行动、不直接操作系统。

此阶段得益于“检索增强生成”(RAG)技术。大模型输出结合搜索结果、知识图谱及专家知识,缓解幻觉,提高准确性与时效性。

AI“记忆”基础在于过往交互记录纳入提示词。但这不改变模型权重,无真正“学习”。若视大模型为函数,权重为参数,纳入记录仅是改变输入以改变输出,参数不变,模型本身未变。换言之,“记忆”在提示词中,模型对用户无记忆。

3.智能体

此阶段特征为:AI可规划步骤、调用工具、连接系统并根据反馈调整;非完全无人化,而是有边界的半自动执行,在明确规划、权限和审批下自主运行,关键决策需人工审批。

目前媒体对智能体存在夸大。智能体未改变大模型生成Token的基础功能,也不改变权重,而是改变调用方式及与系统的互动,即“上下文工程”。首先,输出含系统调用指令;其次,经授权后在系统执行产生真实影响;再次,真实影响纳入提示词作为新输入调用AI。如此循环,使AI能在人类指令下分步执行复杂任务。

此阶段还得益于MCP、A2A等标准化协议,使多智能体协作成为可能。

智能体落地需前提条件:第一,工具接口(标准化连接系统);第二,权限分层(严格限定范围);第三,审批节点(资金、信息修改等关键步骤需人工审批);第四,日志追踪(完整记录支持审计);第五,评估机制(持续监测质量与合规);第六,人工兜底(明确升级回退路径)。

1.作为工具增强个人

首先,法务、合规、客服、代码开发等中后台岗位因任务高频、标准化高,落地快。其次,对投研等知识密集型前台岗位,AI替代部分重复劳动,改变信息获取与整理速度,但不改变决策责任。此层次所有风险、合规及决策责任仍由人类承担。

2.作为助手“理解”角色、上下文和客户

首先是面向员工的助手,围绕岗位持续工作,跟进客户关系,记忆交易条款,整理会面材料。其次是面向客户的助手,从答疑延伸至协助查账单、转账确认及轻量服务。此层次虽核心判断权在人类,但AI基于多维数据给出个性化建议时,责任边界开始模糊。

3.智能体开始参与完整业务流程

AI在明确边界内接手多步骤任务,释放人力聚焦意外与关键判断。目前智能体主要适用两类场景:首先是规则驱动型流程,如反洗钱、制裁合规、KYC审查及合规报送等,具有规则清晰、步骤标准和数据