AI赋能金融业的深层逻辑解析

发布时间：2026-05-31 20:20阅读：25

本文系作者在国家金融与发展实验室科研例会上的分享，分为两个部分。第一部分以银行业为切入点，探讨人工智能在金融信息处理领域的实际应用。人工智能作为一种高效的信息处理工具，是金融资源配置、风险管理、内部管理及客户服务的基础。AI在金融业的落地始于信息处理，其他应用均以此为基石。第二部分将在此基础上，进一步剖析AI应用于金融业的三个层级及其深远影响。

人工智能应用于金融业的内在逻辑

人工智能与银行信息处理

针对AI在银行信息处理中的实践，现实观察可归纳为三点。首先，生成式AI已从大语言模型演进为能处理图文音视的多模态模型，当前主要应用于文档生成（如会议纪要、客服话术、尽调报告、离任审计及合同解析等）、代码编写、文档核验、知识库构建及智能问答。然而，受限于“幻觉”问题，大模型尚难直接介入面向客户的决策及核心业务判断。其次，解释型AI结合替代数据，能高效精准地评估借款人的还款意愿与能力，已在银行信贷评估中普及。再次，在资本监管要求下，内部评级法（核心在于评估违约概率PD）仍主要依赖线性回归、逻辑回归等传统“小模型”。

国际清算银行（BIS）2024年12月发布的一份研究报告对全球银行业AI应用情况进行了调研，数据详见表1：

表1：全球银行业使用人工智能的情况

表1数据显示，除反洗钱（AML）/反恐融资（CFT）中的“分析可疑活动”、“实时监测未授权信用卡使用”及“评估放贷”等场景主要属于解释型AI外，其余应用场景多属生成式AI。

由此引出三个待探讨的问题。第一，在银行信息处理中，“小模型”、解释型AI与生成式AI将各扮演何种角色？第二，这对银行模型风险管理有何影响？第三，这对信贷评估及审批流程将产生何种改变？

需说明的是，尽管将解释型与生成式AI并列讨论，二者并非对立。第一，两者底层均为人工神经网络，但架构不同。当前生成式AI多采用基于注意力机制的Transformer架构，而解释型AI的神经网络架构更为多样。第二，虽主要分析数据类型有别，但两者均利用人工神经网络估测数据概率分布。解释型AI主攻分类问题（如判定违约与否或信用评级），预测特定类别的概率；生成式AI内核则是在概率层面预测下一个Token（可指词元、像素组、音频或视频段），输出前会先给出词表中的概率分布。换言之，生成式AI内嵌了解释型AI的分类问题。

银行与借款人存在信息不对称，银行信息处理的核心在于评估还款意愿与能力。尽管银行处理信息形态各异，但主要分为两类：第一，硬信息，通常以数字形式呈现，具有定量、结构化特征，不含主观判断；第二，软信息，通常以文本形式呈现，具有定性、非结构化特征，主观判断与观察不可剥离，需结合语境理解。对应这两类信息，银行主要有两种放贷技术：第一，交易型放贷，依赖财务报表和信用评分等硬信息；第二，关系型放贷，依赖长期多渠道接触积累的软信息，此类信息无法从财报或公开渠道获取。从本文视角看，以下两个等式近似成立：

硬信息≈ 结构化数据→交易型放贷

软信息≈ 非结构化数据→关系型放贷

针对结构化数据，已有成熟分析方法，一般分四步：第一，假设数据背后存在待估计的数据生成过程，可基于理论因果（结构化模型）或统计相关性（简约化模型）构建，包含未知参数及误差项；第二，利用样本数据估计参数，实际应用更侧重预测而非假设检验；第三，利用模型进行样本外预测；第四，评估预测效果，若不理想则调整模型设定或参数。

银行业中，结构化数据分析的典型场景包括：身份识别（基于生物特征）、信用评估（违约概率预测）及异常交易检测（欺诈识别）。

长期以来，文本、图片、音视频等非结构化数据被认为仅能由人脑生成。大模型的发展证明其内在规律丰富。首先，通过嵌入或词元化将非结构化数据转化为词向量，使其可被神经网络处理，代表性方法包括Word2Vec等；其次，以ChatGPT为代表的大模型利用Transformer架构，通过统计学习识别非结构化数据中的隐含模式；接着，大模型在概率层面预测数据的合理延续，体现为对提示词的回复。

无论处理结构化还是非结构化数据，银行本质上都在对数据建模。模型选择取决于可解释性和预测误差这两个关键特征，可纳入模型风险管理框架。

模型可解释性分两个维度：对内解释模型运作机制（How问题），对外解释结果成因（Why问题）。通常数据生成过程越复杂、参数越多，可解释性越低。因此，基于神经网络的AI在可解释性上天然不及线性回归等“小模型”，具有“黑盒”特征。

结构化数据模型的预测误差易测度。连续变量可用均方误差衡量，离散变量可用两类错误及ROC曲线下面积（AUC）衡量。

对处理非结构化数据的大模型，“幻觉”对应预测误差。大模型基于概率预测下一个Token，生成内容偏离实情属其固有特征，非单纯改进架构或增加算力可修复，而是内在属性。使用大模型意味着需接受幻觉风险。现实中常通过“检索增强生成”（RAG）和知识图谱等技术缓解，本质是在低风险容忍场景采用其他方法，而非修复大模型本身。此外，非结构化数据理解含主观因素，评估难度大于结构化数据，SFT和RLHF等对齐技术旨在解决此问题。

从模型风险管理看，存在可解释性或误差问题不代表模型不可用，而需结合场景与风险容忍度管理。不同银行及场景容忍度各异，如内部信用评估模型AUC达0.65即可接受。模型风险管理可适用“三道防线”框架。

解释型与生成式AI均可纳入主流风险分析框架。微观审慎监管下，AI风险体现为：信用风险（低估违约概率或损失）、网络安全风险（外部依赖增加、数据投毒）、声誉风险（运营失败、不公平对待）、战略风险（核心功能失控）、法律风险（侵权、回复不当）及数据隐私风险（信息泄露）。

宏观审慎监管下，AI风险体现为：不同银行使用相同基础模型导致的“羊群”效应，以及第三方供应商造成的市场集中与关联。目前全球大银行多依赖头部公司研发的基础模型，集中化趋势明显。

综上，不同模型应依场景发挥优势，实现协同。“小模型”、解释型与生成式AI非替代关系，而是互补。大模型因“幻觉”难直接面向客户，但可作为员工“副驾驶”辅助处理信息和生成报告，其输出亦可作为“小模型”输入，显著提升非结构化数据处理效率。

生成式AI目前多用于银行内部辅助场景。尽管解释型AI在信贷评估中表现良好，监管仍偏好可解释性强的“小模型”。如巴塞尔协议中，风险资本计量核心为VaR，信用风险计量基础为单因子模型，内部评级法主流工具仍为回归模型。因此，AI在银行业呈现图1所示的渗透顺序。

图1 人工智能在银行业的渗透顺序

由图1可见：第一，模型可解释性与预测效力呈反向关系，生成式AI预测力最强但可解释性最低；第二，AI渗透顺序是从内部辅助逐步深入至资本监管等核心场景。

图2展示了AI对银行放贷技术的影响。随着ICT发展，数字化信息（硬信息）占比提升，成为可分析对象。大模型显著增强了非结构化数据分析能力，促使部分关系型放贷转向交易型放贷，信贷审批权可上收，此趋势已在现实中显现。

图2 人工智能对银行放贷技术的影响

人工智能应用于金融业的三个层次及其影响

基于金融信息处理，AI在金融业前景广阔。一方面，金融业特性适配AI；另一方面，AI从“工具→助手→智能体”的演进将深化应用。两者合力下，AI应用将呈现三个层次，产生深远影响。

金融业与AI的适配性体现在：第一，行业特征匹配。金融业信息密集，大量工作涉及处理研报、合同等非结构化文本，与大模型能力契合，提升效率；金融业流程密集，环节清晰，便于AI从辅助步骤到参与全流程，替代手工操作；金融业规则密集，为AI划定明确边界。“流程+规则”密集促使AI深度嵌入业务，从处理信息到处理资金。第二，成本效率、客户竞争、合规压力及人才培养四重压力推动机构部署AI，我国银行业在净息差下行背景下动力尤强。

最强基础模型多由头部科技公司开发，但金融业数据安全要求高，不能直连公共API。经探索，金融业收敛至三种数据安全方案：第一，“防火墙网关”模式：自建平台接入外部模型，请求经内部网关加密、脱敏、权限检查后发送；第二，混合云架构：按敏感度分层，最敏感数据留私有云，中等任务用公有云加密隔离，非敏感负载用开放云；第三，完全本地化部署：使用开源模型在自有设施运行，数据内部处理。

AI从“工具→助手→智能体”演进的核心非技术代际更替，而是人机关系变化，体现为四大边界拓展：能力边界（能做什么）、权限边界（访问哪些系统）、流程边界（嵌入深度）及责任边界（责任归属）。

1.工具或“副驾驶”

此阶段特征为“人发起、人主导、人审核”；AI提供建议、补充信息、加速产出，不主动行动、不连接系统、不执行操作；每次交互独立。典型应用为聊天机器人，大模型主要发挥生成下一个Token的基础功能。

2.助手

此阶段特征为“人分配任务、AI持续协作、人保留关键判断权”；AI“知晓”用户身份、任务及历史，能持续跟进、记忆偏好，嵌入工作流，但不自主行动、不直接操作系统。

此阶段得益于“检索增强生成”（RAG）技术。大模型输出结合搜索结果、知识图谱及专家知识，缓解幻觉，提高准确性与时效性。

AI“记忆”基础在于过往交互记录纳入提示词。但这不改变模型权重，无真正“学习”。若视大模型为函数，权重为参数，纳入记录仅是改变输入以改变输出，参数不变，模型本身未变。换言之，“记忆”在提示词中，模型对用户无记忆。

3.智能体

此阶段特征为：AI可规划步骤、调用工具、连接系统并根据反馈调整；非完全无人化，而是有边界的半自动执行，在明确规划、权限和审批下自主运行，关键决策需人工审批。

目前媒体对智能体存在夸大。智能体未改变大模型生成Token的基础功能，也不改变权重，而是改变调用方式及与系统的互动，即“上下文工程”。首先，输出含系统调用指令；其次，经授权后在系统执行产生真实影响；再次，真实影响纳入提示词作为新输入调用AI。如此循环，使AI能在人类指令下分步执行复杂任务。

此阶段还得益于MCP、A2A等标准化协议，使多智能体协作成为可能。

智能体落地需前提条件：第一，工具接口（标准化连接系统）；第二，权限分层（严格限定范围）；第三，审批节点（资金、信息修改等关键步骤需人工审批）；第四，日志追踪（完整记录支持审计）；第五，评估机制（持续监测质量与合规）；第六，人工兜底（明确升级回退路径）。

1.作为工具增强个人

首先，法务、合规、客服、代码开发等中后台岗位因任务高频、标准化高，落地快。其次，对投研等知识密集型前台岗位，AI替代部分重复劳动，改变信息获取与整理速度，但不改变决策责任。此层次所有风险、合规及决策责任仍由人类承担。

2.作为助手“理解”角色、上下文和客户

首先是面向员工的助手，围绕岗位持续工作，跟进客户关系，记忆交易条款，整理会面材料。其次是面向客户的助手，从答疑延伸至协助查账单、转账确认及轻量服务。此层次虽核心判断权在人类，但AI基于多维数据给出个性化建议时，责任边界开始模糊。

3.智能体开始参与完整业务流程

AI在明确边界内接手多步骤任务，释放人力聚焦意外与关键判断。目前智能体主要适用两类场景：首先是规则驱动型流程，如反洗钱、制裁合规、KYC审查及合规报送等，具有规则清晰、步骤标准和数据

← 上一篇：AI赋能安全生产与应急管理的实践探索下一篇：告别繁琐手动修图！全新AI智能自动化图片处理工具震撼登场 →