AI驱动金融:效率提升与风险管控并重
吴轲,中国人民大学财政金融学院应用金融系主任、教授
【导读】当前,人工智能正从简单的问答助手演进为能够自主操作工具、处理流程的智能体,在投资研究、风险控制及辅助决策等关键领域展现出巨大价值;然而,随之而来的信息泄露、滥用攻击等安全挑战也日益凸显,迫使技术革新与制度监管必须同步进行。本文详细阐述了基于大语言模型研发的“人大-新华”A股行业分类体系,并探讨了利用生成式AI挖掘隐性关联、结合图神经网络构建企业风险传导网络的前沿成果。此外,文章还强调了防范过度挖掘、算法违规、版权纠纷、智能体安全及就业结构冲击等隐患的重要性,主张在深化AI应用的同时,建立健全的风险治理框架,旨在为金融行业在提升效率与管控风险之间寻找平衡,促进人工智能的稳健发展提供理论参考与实操指南。
01 金融领域为何迫切需要人工智能?
当前,我们正处于AI技术飞速迭代的关口。自2022年11月ChatGPT问世以来,通用人工智能取得重大突破,为金融非结构化数据分析开辟了新路径;2025年初DeepSeek-R1的发布,大幅降低了高质量推理成本,彰显了中国AI研发的韧性。通义千问开源系列的持续优化,增强了中文金融文本的处理能力。国家层面,中央金融工作会议提出建设金融强国,国务院及央行相继出台政策,将AI确立为核心技术,推动风险管理向智能化转型。产业实践中,AI已从概念验证走向落地。中行、工行、北京银行及腾讯云等机构纷纷加大投入,通过本地化部署和“All in AI”战略,实现了信贷尽调周期大幅缩短、资讯分析效率提升数倍,欺诈识别准确率显著提高。同时,AI正经历从“对话”到“智能体”的范式革命,虽然OpenClaw等框架展现了强大的自动化能力,但API泄露、源码暴露等安全隐患也引发关注,我国已对特定场景下的应用进行限制。金融行业天然具备海量信息处理的特性,大语言模型使得系统化分析全市场文本成为可能,但也需警惕模型幻觉等风险。
02 AI如何重构行业边界:基于大模型的A股行业分类体系
在学术层面,LLM在市场预测、风险计量及企业网络构建等方面成果丰硕。针对A股现有分类标准更新慢、同质化高、方法不透明等问题,本团队提出了一种新思路:根据年报业务描述的相似度进行分类。该方法追求客观、准确和实时,通过收集52702份MD&A文本,采用嵌入、聚类、命名和测试四步法构建体系。嵌入阶段使用Qwen模型生成2048维向量;聚类阶段利用层次算法构建26/102/271个层级嵌套的行业分类;命名阶段采用“局部摘要-全局命名”策略避免人工偏差;测试阶段通过财务指标和资产定价模型验证,结果显示该体系在区分度(如营业利润率标准差)和相似度(R²)上均优于申万和万得分类,且在资产定价组合中产生了显著的超额收益。该数据集已于2026年3月发布。
03 AI如何洞察风险传导:基于生成式AI的企业关联网络
企业关联网络对于理解系统性风险至关重要。东方园林违约事件表明,单一风险可通过隐性链条迅速扩散。现有研究多局限于单一维度,难以捕捉多维度关联。本项目利用LLM从年报中挖掘多维度隐性关联,并结合图神经网络(GNN)构建复合网络。该方法首先对文本单元进行多维度评分,其次提取高分段落构建邻接矩阵,最后通过GNN融合多维度信息。研究计划在股票收益率预测、风险指标(NCSKEW等)及投资组合优化等方面进行检验,涵盖中美市场。
04 AI应用面临的严峻挑战
AI在赋能金融的同时,其固有的风险也不容小觑。前瞻性偏差是普遍存在的难题,大模型可能利用未来信息分析过去数据,导致预测失真。虽然学术界尝试通过文本匿名化(去除实体标识)来缓解,但最新研究表明,匿名化会显著削弱情感信号的解释力,导致信息流失严重,降低了模型的预测效能。