如何量化企业AI水平:代理指标与工具变量指南
一起读文献
企业的人工智能水平究竟如何衡量?用哪些指标才能让审稿人认可?内生性问题又该如何破解?本文系统梳理AI研究中的两大核心工具:代理指标与工具变量。感谢阅读与关注!
学术帮帮社团
导航
一起读|学术动态|python|学小帮|机器学习
一、六类AI代理指标
方法一:企业AI专利数量(最主流之一)
核心逻辑:专利是企业技术研发成果的直接体现,AI专利数量反映了企业在人工智能领域的技术积累。
识别方式:
IPC分类号法:依据《关键数字技术专利分类体系(2023)》筛选AI相关IPC分类号
大语言模型法(BERT) :利用BERT等模型对专利摘要进行语义识别和分类
推荐文献:何小钢等(《数量经济技术经济研究》2026年第5期)、李玉花等(《中国工业经济》2024年第10期)、黄远浙等(《东南大学学报》2026年第2期)
方法二:年报文本分析法(应用最广泛)
核心逻辑:上市公司年报,尤其是“管理层讨论与分析”(MD&A)部分,会披露企业的AI战略与实际应用情况。
技术演进:
1.0 词典法:构建AI关键词词典,统计词频
2.0 机器学习法(Word2vec) :基于种子词扩展生成更全面的AI词典
3.0 大语言模型法(ERNIE/BERT) :对AI相关语句进行语义分类,仅保留“真实反映企业应用”的内容,有效排除策略性披露
推荐文献:姚加权等(《管理世界》2024年第2期)、董萍(《财经研究》2026年第5期)、付业辉等(《科技进步与对策》2026年第8期)
方法三:企业AI渗透度(任务法)
核心逻辑:利用美国职业信息网络(O*NET)数据计算各职业的AI渗透度,再以企业员工职业结构为权重,加总至企业层面。
推荐文献:陈琳等(《管理世界》2024年第6期)
方法四:准自然实验(政策冲击)
核心逻辑:将国家AI相关政策试点作为外生冲击,构建双重差分模型(DID)。
推荐文献:权小锋、李静蕾(《世界经济》2025年第8期)、张清燕、杨兴全(《上海财经大学学报》2025年第5期)
方法五:工业机器人密度
核心逻辑:利用IFR提供的行业机器人安装数据,除以行业员工数。
推荐文献:吕越等(《中国工业经济》2020年第5期)
方法六:AI相关招聘广告
核心逻辑:通过识别企业招聘的AI相关岗位数量,反映其对AI人才的需求。
推荐文献:姚加权等(《管理世界》2024年第2期)
二、五类工具变量
类型一:Bartik工具变量(应用最广)
核心思路:用“初始份额 × 总体增长率”构造外生预测值。
基本公式:IV = 企业初始AI水平 × 全样本整体增长率
优势:宏观增长率不受单个企业决策影响,有效切断反向因果。
推荐文献:何小钢等(2026)、李玉花等(2024)
类型二:历史/地理变量 × 宏观趋势
核心思路:用外生的历史或地理特征“搭乘”当代宏观趋势。
类型三:行业/同行平均水平
核心思路:同一行业其他企业的AI平均水平影响本企业,但与单个企业的结果变量不直接相关。
推荐文献:陈琳等(《管理世界》2024)
类型四:宏观政策冲击
核心思路:利用国家政策文件作为外生冲击,构建广义DID。
推荐文献:陈琳等(《管理世界》2024,利用2017年《新一代人工智能发展规划》)
类型五:构建性工具变量
核心思路:利用解释变量的函数变换构建IV,如“行业-省份AI水平差额的三次方”。
推荐文献:付业辉等(《科技进步与对策》2026)
三、方法选择建议
欢迎关注我们
往期回顾
2026年JCR期刊分区正式发布:颠覆与争议中的科研评价新秩序
顶刊DID的N种玩法:带你打开政策评估新思路
2026年度教育部人文社科一般项目申报启动!六大重点方向,7月12日截止
学小帮No.20|机器学习预测——梯度提升回归模型完整实战
学小帮No.19|机器学习预测——随机森林模型完整实战
学小帮No.18|机器学习——梯度提升回归树(GBRT)因果推断,让误差指引发现之路
学小帮No.17|机器学习因果推断4——基于Lasso的解决方案