生成式AI能否弥合教育水平带来的生产力鸿沟？

发布时间：2026-05-03 11:59阅读：30

编者按：EEL优选栏目致力于精选国内外教育经济学领域的最新研究成果和经典文献，旨在为学术研究、教育实践及政策制定提供有价值的参考。敬请关注，我们将持续为您带来更多精彩内容！

推文作者｜张博文（安徽大学本科生）

作者信息

Guillermo Cruces：任职于圣安德烈斯大学经济系及诺丁汉大学经济学院，其研究领域涵盖劳动经济学、收入分配与不平等问题，以及公共项目成效评估。

Diego Fernández Meijide：来自圣安德烈斯大学，专注于劳动经济学及公共政策的实证研究。

Sebastian Galiani：就职于马里兰大学经济系及NBER，研究重点包括发展经济学、劳动经济学、公共经济学及应用微观经济学。

Ramiro H. Gálvez：任职于托尔夸托·迪特拉大学，研究方向涉及应用经济学，以及自然语言处理和机器学习在经济与社会现象中的应用。

María Lombardi：就职于托尔夸托·迪特拉大学及NBER，研究领域包括发展经济学、教育经济学和劳动经济学，尤其关注拉丁美洲公共政策的评估。

原文信息

Cruces G, Meijide D F, Galiani S, et al. Does Generative AI Narrow Education-Based Productivity Gaps? Evidence from a Randomized Experiment[R]. National Bureau of Economic Research, 2026.

一

引言

二

实验设计

三

样本、依从性与估计策略

本次实验共随机选取了1795名符合条件的参与者，其中1174人成功完成了所有实验环节，完成率为65%。实验组和控制组的完成率相近，分别为64%和66%，并且在不同教育水平的群体内部也保持了良好的均衡性。样本在各项可观测特征上表现出高度一致性，实验组与控制组在年龄、性别、就业状况及工作经验等关键变量上均未显示出显著差异。

实验组中AI助手的实际使用率高达84%。控制组中也存在部分参与者使用了外部AI工具的情况。研究团队通过页面监控、快照记录以及词数突变检测等方法进行判断，估计约有13%的控制组参与者可能借助了外部AI的辅助。这使得本研究估算出的处理效应可能偏于保守，低估了AI助手可能带来的真实提升效果，但仍能清晰地揭示AI接入对生产力差距的影响。

本研究的核心目标在于探究AI接入如何影响基于教育背景的生产力差距，为此采用了以下回归模型进行估计：

其中，𝑌𝑖代表参与者𝑖的标准化工任务得分，𝐻𝑖𝑔ℎ 𝑒𝑑𝑢𝑐𝑎𝑡𝑖𝑜𝑛𝑖是一个虚拟变量，用于标识高教育水平群体（以低教育水平群体作为参照基准），𝑇𝑟𝑒𝑎𝑡𝑚𝑒𝑛𝑡𝑖则是一个虚拟变量，标识实验组参与者。系数𝜷₃是我们最为关注的交互项，它衡量了AI接入对教育生产力差距的改变作用。所有回归分析均使用了异方差稳健标准误。

四

实验结果

本研究取得的关键性发现是：生成式AI显著提升了所有参与者的任务表现，尤为重要的是，低教育水平群体的绩效增幅远超高教育水平群体，从而极大地缩小了因教育背景产生的生产力差距。

图2直观展示了AI助手对整体任务得分的处理效应。在未获得AI辅助的情况下，高教育水平群体的绩效比低教育水平群体领先0.548个标准差。引入AI助手后，低教育水平群体的任务得分提升了1.242个标准差，而高教育水平群体则提升了0.834个标准差，两组的提升均在1%的统计显著性水平上。低教育水平群体的增幅显著高于高教育水平群体，交互效应达到了0.408个标准差。这一显著提升将最初的教育生产力差距从0.548SD大幅缩小至0.139SD，缩减幅度高达75%。值得注意的是，在获得AI辅助后，低教育水平群体的平均表现甚至超越了高教育水平控制组的水平。

图3进一步展示了得分分布的变化情况。在没有AI辅助时，两组的得分分布均呈现出明显的离散特征，且低教育水平控制组的分布明显偏向左侧；引入AI辅助后，两组的得分分布均显著向右移动，但分布的离散性依然存在，并未出现向满分趋近的现象，这表明AI的提升作用是实质性的，而非人为设定的上限导致。

表1详细列出了所有主要结果的回归估计值。数据显示，AI使得低教育水平群体的整体得分提高了1.242个标准差，高教育水平群体提高了0.834个标准差，交互效应为−0.408个标准差，从而将最初的教育生产力差距压缩了75%。此外，AI助手在内容质量和写作质量两个维度上均带来了显著的改进，同时也提高了参与者准确识别问题根源的概率。任务完成时间有所缩短，但两组在时间上的差异并不显著。后续的跟进测试结果表明，AI使用带来的部分收益具有一定的持续性：在后续的无AI模块测试中，低教育水平群体的得分提升了0.171个标准差，高教育水平群体也略有正向但不显著的提升。然而，即使在没有AI辅助的环境下，高教育水平群体依然领先低教育水平群体0.200个标准差，这表明人力资本带来的生产力差异仍然是客观存在的。

图4展示了参与者对任务难度的感知变化。引入AI辅助后，两组中报告任务“非常容易”或“容易”的比例均上升了约7个百分点，任务的主观难度显著下降，但教育组之间的感知难度差异并未完全消除。

五

机制分析

尽管AI助手显著缩小了不同教育水平群体间的生产力差距，但在实验组内部，高教育水平参与者的绩效依然略高于低教育水平参与者。为了解释这一剩余的差距，本研究重点考察了实际使用AI助手的参与者与AI进行交互的方式和策略上的差异。

表2报告了实验组内部低教育水平群体与高教育水平群体在使用AI助手行为上的系统性比较。两组在使用强度上表现高度一致：平均发送消息数量约为3条，总字符数以及请求帮助的任务组件比例均无显著差异。然而，在使用质量和整合方式上存在显著的差异。高教育水平群体在提示词中更倾向于提供详细的推理指导（prompting for reasoning +0.183 SD）和具体内容指示（content-specific instructions +0.145 SD），并且更擅长组织结构化的对话流程（structured workflows +0.075 SD）。高教育水平群体还更倾向于将AI生成的内容与自身写作相结合，而非完全照搬；相比之下，低教育水平群体完全复制AI输出的比例显著更高。

这些行为上的差异表明，高教育水平的参与者能够更有效地将AI作为提升生产力的辅助工具，而非仅仅是替代品。进一步的研究发现，所有AI使用模式指标共同解释了实验组内部任务得分变异的约52%。由此可见，即便在拥有同等AI接入条件的情况下，不同教育背景个体在提示词质量、输出整合能力以及对话组织能力上的差异，仍然会持续性地影响最终的绩效表现。这一机制有效地解释了为何AI虽然大幅压缩了教育生产力差距，但未能完全消除群体间的差异。

六

结论

本研究通过一项在企业外部进行的随机对照实验，深入检验了生成式AI对不同教育背景个体生产力差距的影响。研究结果表明，生成式AI显著提升了所有参与者的任务绩效，但低教育水平群体的增益幅度远大于高教育水平群体，成功将初始的教育生产力差距从0.548 SD缩小至0.139 SD，缩减幅度高达75%。然而，AI并未完全消除教育背景的作用：即便在AI的辅助下，高教育水平群体的绩效仍略高于低教育水平群体；在后续的无AI辅助的跟进测试中，这一差距同样持续存在。机制分析显示，两组在AI使用强度上相似，但在提示词的质量（如是否详细指导AI进行思考）、AI生成内容的整合方式（如是否结合自身想法进行修改）、以及对话的组织结构（如是否系统化、有条理）等方面存在显著差异，高教育水平群体更倾向于将AI作为提升生产力的补充工具。

考虑到本研究刻意剥离了企业、薪酬以及组织任务分配等现实因素，实验室中观察到的这种趋于平等的效应能否转化为劳动力市场的公平，仍取决于实际使用AI的人数、公司与政策是否提供必要的培训、个体是否能够正确且高效地使用AI，以及整体的政策环境和宏观背景是否给予支持等多种因素。理解实验中针对单一任务的AI平等化效应，在现实环境中如何受到使用障碍、企业组织设计以及劳动力市场长期调整等多方面因素的影响，仍将是未来研究的重要方向。

END

EEL优选推文小组招新 | 加入我们，一起传播教育经济学前沿吧！

EEL优选｜消除壁垒还是重塑不平等？异地高考改革对流动学生高等教育机会的影响

EEL优选｜Jaffe最新综述：大学如何影响创新与经济增长？

EEL优选｜起点定输赢？农村高职学生的教育轨迹对其发展之影响

EEL优选｜高等教育扩张下的教育抱负与不平等：来自韩国的经验证据

EEL优选｜看视频影响儿童发展？来自20年的调查证据

← 上一篇：高校AI改革与教育教学热点盘点下一篇：AI训练数据：著作权问题的焦点解析 →