银行AI算账:百亿Token背后的收益博弈
商业银行正每日消耗百亿词元(Token),驱动数字化转型。
今年6月,招商银行(36.830, 0.23, 0.63%)首席信息官周天虹在股东会上披露:截至5月底,招行日均Token消耗达330亿,大模型成本收入比稳定在20%左右。
这意味着,招行每投入20元AI成本,可创造100元收益。
同期,多家银行相继公布Token使用数据:
邮储银行(4.940, -0.02, -0.40%)日均大模型调用超600万次,Token输入输出总量破百亿;
微众银行日均Token消耗从2亿飙升至超50亿;
兴业银行(17.010, -0.05, -0.29%)上线超200个智能体,日均Token约41亿;
浦发银行(8.690, -0.01, -0.11%)日均Token约60亿;
民生银行(3.280, 0.01, 0.31%)日均Token约40亿。
Token作为AI核心计量单位,正成为银行评估数字金融成效的关键指标,甚至涉及商业机密。
因硬件、模型、API或自建网关差异,Token成本可相差百倍,估算极为复杂。粗略估计,日均百亿Token的银行,每日成本已达数万元级别。
从早期“砸钱买卡、拼场景”的上半场,头部银行已迈入“精算Token、追问ROI”的下半场。
Token算力狂欢
2025年,银行业AI投入“不计成本”。15家披露金融科技投入的A股银行合计投入近1900亿元,六大国有行均超百亿,工商银行(7.040, -0.01, -0.14%)以285.88亿元居首,招行以129.01亿元领跑股份行。
除互联网行业外,金融可能是传统行业中AI应用最深的领域。
某银行信息技术负责人对21世纪经济报道表示,金融行业数据密集、系统成熟、团队完备,天然适合大模型落地。
他指出,算力投入成本极高,除GPU外,还需多机互联、高速网络设备,如400G以上交换机价格远超传统设备。随着计算密度上升,开支持续攀升。
巨额AI投入的背后,是银行净息差持续承压、利润增长放缓的现实。
数据显示,中国银行(5.560, -0.02, -0.36%)业净息差已连续六年下滑,2025年末整体降至1.42%,虽企稳但处历史低位,股份行去年净利润同比下滑。
近期Uber四个月烧光全年Token预算的案例引发全球关注:AI消耗激增,却难证明其与用户体验提升存在直接关联。
作为传统机构,银行无法仅靠想象估值,成本压力已无法回避。
在此背景下,科技公司与金融行业纷纷转向“精打细算”。
PNC金融服务集团CEO Bill Demchak直言:AI带来的效率提升,可能被Token成本完全吞噬。
当前,银行更关注在预算有限下,优先赋能哪些业务,并以最少Token消耗达成同等目标。
上述负责人称,该行AI投入分两部分:一是硬件,占最大成本,涵盖数千张AI算力卡并持续扩容;二是研发,重点投入推理框架、训练优化与模型微调,提升应用效率。
他补充,大模型“能力密度”持续提升,即在相同参数下性能更强,或在同等效果下可减小模型规模。对时效要求高的业务,可选用更小模型,兼顾效率与成本。
Token竞赛成本压力
梳理主要银行数据,可见AI落地速度之快。
工商银行2026年初日均Token达百亿级,较两年前增长近百倍。“工银智涌”体系落地500余个AI应用,覆盖30余业务领域,AI数字员工年承担5.5万人年工作量。个人金融AI助理将产品匹配时间从1小时缩短至2-3分钟,外汇智能询价率超96%。
邮储银行已落地超370个大模型场景,日均调用超600万次,Token超百亿,目标2026年底突破300亿。零售智能体已触达5400万高潜客户。
股份行中,招行日均Token达330亿;兴业银行上线200+智能体,日均41亿,董事长亲自推动;浦发银行日均60亿,调用超400万次;民生银行日均40亿,覆盖260场景;光大银行(2.980, 0.01, 0.34%)将Token增长作为AI深度应用核心指标。
微众银行全面推进“AI原生银行”,日均Token从2亿跃至超50亿,构建70余个数字员工与800+智能体。
国家数据局数据显示,2024年初全国日均Token调用量为1000亿,2026年3月突破140万亿,两年增长超千倍,银行业是主要推手。
与此同时,采购逻辑悄然转变。2026年5月底至6月初,江苏农商行、广州银行、中国银行安徽分行、邮储山东分行、秦皇岛银行等密集发布AI采购公告,不再聚焦底层平台,而是全面转向“智能体”招标,核心变为:如何以最少Token达成目标。
神州信息(10.270, 0.16, 1.58%)AI创新中心总经理晋梅博士将银行AI演进划为三阶段:2025年上半年,DeepSeek引发“算力焦虑”,银行抢购服务器;下半年转向“智能体”与“场景”,项目季度翻倍;2026年,不再比拼场景数量,转而追问ROI。
成本会否吞噬业务
在“算账潮”中,招行提供股份行样本。
周天虹指出,Uber Token超支主因是科技部门用AI写代码,而非业务端用于经营。
招行据此采取“业务积极、开发审慎”策略。
他称,AI编程成本高昂,因模型架构能力弱,易生成“面条式代码”,存在性能与安全风险。因此,招行用于编程的算力仅占总算力5%,330亿Token消耗主要来自业务。
此前,招行已建立完整成本收益体系:成本含研发人力与Token费用;收益设六大维度,涵盖银行与客户双视角。
“当前成本收入比约20%,即20元投入换100元收益。”周天虹坦言,成本可精准测算,收益因银行价值链复杂而难量化。
此外,招行引入“AI贡献比”——AI处理工时与人工工时之比,从2025年底1:13.5提升至2026年5月近1:9。全年替代1556万小时人工,相当于8000+全职人力。
零售端,“RM小助”服务超万名金葵花经理,人均有效触客提升14%,客均交易增长20%;对公端,小企业尽调报告82%由AI完成,在线风控审批信贷近6000亿元,同比增长44%。
2025年,招行科技总投入约130亿元,算力采购占比不高,未来仍有较大提升空间。
下半场的胜负手
2025年是银行业AI从试点走向规模化关键年。2026年,竞争逻辑重构。
周天虹称,招行愿景是打造智能银行,但路径复杂,仍需持续优化指标体系。
尽管短期算力成本上升,长期看,AI仍是降本利器。麦肯锡预测,AI全面应用后,银行整体成本可净降15%-20%。
上述负责人指出,技术趋势明确:Token成本将持续下降,有预测称年降幅达10倍,当前趋势吻合。
“成本越低,ROI越高,尤其在需多轮交互的场景,如私行资产配置。”
他透露,该行每百万Token成本已低于公有云,但部分机构因技术能力弱,成本为公有云数倍,难以规模化。
Token经济学,正成为银行AI时代的必修课。率先建立成本收益体系、敢晒“20元赚100元”账本的银行,正赢得下一个五年的制高点。
(文章来源:21世纪经济报道)