如何量化企业AI水平：代理指标与工具变量指南

发布时间：2026-06-20 06:22阅读：1

一起读文献

企业的人工智能水平究竟如何衡量？用哪些指标才能让审稿人认可？内生性问题又该如何破解？本文系统梳理AI研究中的两大核心工具：代理指标与工具变量。感谢阅读与关注！

学术帮帮社团

导航

一起读|学术动态|python|学小帮|机器学习

一、六类AI代理指标

方法一：企业AI专利数量（最主流之一）

核心逻辑：专利是企业技术研发成果的直接体现，AI专利数量反映了企业在人工智能领域的技术积累。

识别方式：

IPC分类号法：依据《关键数字技术专利分类体系（2023）》筛选AI相关IPC分类号

大语言模型法（BERT）：利用BERT等模型对专利摘要进行语义识别和分类

推荐文献：何小钢等（《数量经济技术经济研究》2026年第5期）、李玉花等（《中国工业经济》2024年第10期）、黄远浙等（《东南大学学报》2026年第2期）

方法二：年报文本分析法（应用最广泛）

核心逻辑：上市公司年报，尤其是“管理层讨论与分析”（MD&A）部分，会披露企业的AI战略与实际应用情况。

技术演进：

1.0 词典法：构建AI关键词词典，统计词频

2.0 机器学习法（Word2vec）：基于种子词扩展生成更全面的AI词典

3.0 大语言模型法（ERNIE/BERT）：对AI相关语句进行语义分类，仅保留“真实反映企业应用”的内容，有效排除策略性披露

推荐文献：姚加权等（《管理世界》2024年第2期）、董萍（《财经研究》2026年第5期）、付业辉等（《科技进步与对策》2026年第8期）

方法三：企业AI渗透度（任务法）

核心逻辑：利用美国职业信息网络（O*NET）数据计算各职业的AI渗透度，再以企业员工职业结构为权重，加总至企业层面。

推荐文献：陈琳等（《管理世界》2024年第6期）

方法四：准自然实验（政策冲击）

核心逻辑：将国家AI相关政策试点作为外生冲击，构建双重差分模型（DID）。

推荐文献：权小锋、李静蕾（《世界经济》2025年第8期）、张清燕、杨兴全（《上海财经大学学报》2025年第5期）

方法五：工业机器人密度

核心逻辑：利用IFR提供的行业机器人安装数据，除以行业员工数。

推荐文献：吕越等（《中国工业经济》2020年第5期）

方法六：AI相关招聘广告

核心逻辑：通过识别企业招聘的AI相关岗位数量，反映其对AI人才的需求。

推荐文献：姚加权等（《管理世界》2024年第2期）

二、五类工具变量

类型一：Bartik工具变量（应用最广）

核心思路：用“初始份额 × 总体增长率”构造外生预测值。

基本公式：IV = 企业初始AI水平 × 全样本整体增长率

优势：宏观增长率不受单个企业决策影响，有效切断反向因果。

推荐文献：何小钢等（2026）、李玉花等（2024）

类型二：历史/地理变量 × 宏观趋势

核心思路：用外生的历史或地理特征“搭乘”当代宏观趋势。

类型三：行业/同行平均水平

核心思路：同一行业其他企业的AI平均水平影响本企业，但与单个企业的结果变量不直接相关。

推荐文献：陈琳等（《管理世界》2024）

类型四：宏观政策冲击

核心思路：利用国家政策文件作为外生冲击，构建广义DID。

推荐文献：陈琳等（《管理世界》2024，利用2017年《新一代人工智能发展规划》）

类型五：构建性工具变量

核心思路：利用解释变量的函数变换构建IV，如“行业-省份AI水平差额的三次方”。

推荐文献：付业辉等（《科技进步与对策》2026）

三、方法选择建议

欢迎关注我们

往期回顾

2026年JCR期刊分区正式发布：颠覆与争议中的科研评价新秩序

顶刊DID的N种玩法：带你打开政策评估新思路

2026年度教育部人文社科一般项目申报启动！六大重点方向，7月12日截止

学小帮No.20|机器学习预测——梯度提升回归模型完整实战

学小帮No.19|机器学习预测——随机森林模型完整实战

学小帮No.18|机器学习——梯度提升回归树（GBRT）因果推断，让误差指引发现之路

学小帮No.17|机器学习因果推断4——基于Lasso的解决方案

← 上一篇：预算AI：赋予智能体省钱、规划与管理的智慧下一篇：极端分化格局！三千多股飘绿，AI算力吸金助推科创50刷新历史峰值 →