标签

如何量化企业AI水平:代理指标与工具变量指南

发布时间:2026-06-20 06:22阅读:1

一起读文献

企业的人工智能水平究竟如何衡量?用哪些指标才能让审稿人认可?内生性问题又该如何破解?本文系统梳理AI研究中的两大核心工具:代理指标与工具变量。感谢阅读与关注!

学术帮帮社团

导航

一起读|学术动态|python|学小帮|机器学习

一、六类AI代理指标

方法一:企业AI专利数量(最主流之一)

核心逻辑:专利是企业技术研发成果的直接体现,AI专利数量反映了企业在人工智能领域的技术积累。

识别方式:

IPC分类号法:依据《关键数字技术专利分类体系(2023)》筛选AI相关IPC分类号

大语言模型法(BERT) :利用BERT等模型对专利摘要进行语义识别和分类

推荐文献:何小钢等(《数量经济技术经济研究》2026年第5期)、李玉花等(《中国工业经济》2024年第10期)、黄远浙等(《东南大学学报》2026年第2期)

方法二:年报文本分析法(应用最广泛)

核心逻辑:上市公司年报,尤其是“管理层讨论与分析”(MD&A)部分,会披露企业的AI战略与实际应用情况。

技术演进:

1.0 词典法:构建AI关键词词典,统计词频

2.0 机器学习法(Word2vec) :基于种子词扩展生成更全面的AI词典

3.0 大语言模型法(ERNIE/BERT) :对AI相关语句进行语义分类,仅保留“真实反映企业应用”的内容,有效排除策略性披露

推荐文献:姚加权等(《管理世界》2024年第2期)、董萍(《财经研究》2026年第5期)、付业辉等(《科技进步与对策》2026年第8期)

方法三:企业AI渗透度(任务法)

核心逻辑:利用美国职业信息网络(O*NET)数据计算各职业的AI渗透度,再以企业员工职业结构为权重,加总至企业层面。

推荐文献:陈琳等(《管理世界》2024年第6期)

方法四:准自然实验(政策冲击)

核心逻辑:将国家AI相关政策试点作为外生冲击,构建双重差分模型(DID)。

推荐文献:权小锋、李静蕾(《世界经济》2025年第8期)、张清燕、杨兴全(《上海财经大学学报》2025年第5期)

方法五:工业机器人密度

核心逻辑:利用IFR提供的行业机器人安装数据,除以行业员工数。

推荐文献:吕越等(《中国工业经济》2020年第5期)

方法六:AI相关招聘广告

核心逻辑:通过识别企业招聘的AI相关岗位数量,反映其对AI人才的需求。

推荐文献:姚加权等(《管理世界》2024年第2期)

二、五类工具变量

类型一:Bartik工具变量(应用最广)

核心思路:用“初始份额 × 总体增长率”构造外生预测值。

基本公式:IV = 企业初始AI水平 × 全样本整体增长率

优势:宏观增长率不受单个企业决策影响,有效切断反向因果。

推荐文献:何小钢等(2026)、李玉花等(2024)

类型二:历史/地理变量 × 宏观趋势

核心思路:用外生的历史或地理特征“搭乘”当代宏观趋势。

类型三:行业/同行平均水平

核心思路:同一行业其他企业的AI平均水平影响本企业,但与单个企业的结果变量不直接相关。

推荐文献:陈琳等(《管理世界》2024)

类型四:宏观政策冲击

核心思路:利用国家政策文件作为外生冲击,构建广义DID。

推荐文献:陈琳等(《管理世界》2024,利用2017年《新一代人工智能发展规划》)

类型五:构建性工具变量

核心思路:利用解释变量的函数变换构建IV,如“行业-省份AI水平差额的三次方”。

推荐文献:付业辉等(《科技进步与对策》2026)

三、方法选择建议

欢迎关注我们

往期回顾

2026年JCR期刊分区正式发布:颠覆与争议中的科研评价新秩序

顶刊DID的N种玩法:带你打开政策评估新思路

2026年度教育部人文社科一般项目申报启动!六大重点方向,7月12日截止

学小帮No.20|机器学习预测——梯度提升回归模型完整实战

学小帮No.19|机器学习预测——随机森林模型完整实战

学小帮No.18|机器学习——梯度提升回归树(GBRT)因果推断,让误差指引发现之路

学小帮No.17|机器学习因果推断4——基于Lasso的解决方案