AI素养测评：如何科学衡量这一核心能力？

发布时间：2026-06-09 23:42阅读：11

近些年，生成式AI在办公、校园及日常生活中极速普及。无论是ChatGPT还是各类智能推荐，AI早已超越专业领域的工具范畴，演变为大众无法回避的社会基石。

然而，随之而来的核心疑问是：我们该如何评估一个人是否真正掌握了“AI素养”？

为何AI素养备受瞩目？

AI已全方位重塑了我们的工作、求学、交流及决策模式。它既能赋能增效，改善生活品质，却也潜藏偏见、虚假信息及社会不公的风险。因此，关键不在于是否熟练操作ChatGPT，而在于能否洞察AI的本质原理，明晰其边界，批判性地审视其产出，并在实际应用中做到负责任与合规。

本文参考Long与Magerko（2020）的观点，将AI素养定义为：“一种能够让人批判性审视AI技术、高效协作AI，并在网络、家庭及职场中恰当应用AI的能力集合。” 这一概念突出了三个核心维度：

理解AI：知晓AI的本质、功能及运作机制。

运用AI：能安全、高效地操作AI工具。

反思AI：拥有伦理观念与批判性思维。

AI素养具体包含哪些能力维度？

通过梳理现有文献，研究确立了Long与Magerko提出的五维模型，将AI素养细化为五个关键议题：

什么是AI：识别AI、理解智能概念、区分通用与专用AI，并甄别日常技术中的AI应用。

AI的能力边界：理解AI的长短板，构想未来应用场景，明确其擅长模式识别但非全能。

AI的运作原理：掌握数据、机器学习及决策逻辑，明确人类在其中的作用，理解AI是基于数据训练而非人类般的认知。

AI的伦理应用：关注隐私、偏见、透明度及责任，评估AI应用的公平性与可信度。

人们对AI的认知：纠正误解与拟人化思维，明确AI并非具备意识的“智能生命”。

该框架的一大亮点在于不要求全员成为AI专家。编程非必修，但基本认知、批判思维与实践应用能力不可或缺。

既往AI素养研究存在哪些不足？

作者对文献的梳理极具参考价值。目前多数研究依赖“自我评估问卷”，即让学生主观评价“我认为自己懂AI”。

此类测量存在显著缺陷，反映的更多是自我效能感或自信度，而非真实水平。主观偏差难以避免，如性别差异可能导致评价系统性失真，女性往往更为审慎。

因此，作者强调AI素养亟需“客观测量”，而非单纯依赖主观感知。

一套真正“可测量”的AI素养测试

研究团队构建了一套多选题测试，流程严谨。基于理论框架拟定57题，经AI专家审核，通过“出声思维”观察解题思路，经预测试筛选，定稿30题。该测试涵盖基础概念至伦理判断，并能有效区分不同学科背景及学习经验的学生。

针对德国六所大学1286名学生的样本，研究运用项目反应理论（IRT）进行验证，结果如下：

测试具备良好的内部一致性（Cronbach α = 0.82）

能有效区分不同能力水平的学生

题目难度分布均衡。

大学生的AI素养水平究竟如何？

结果略显“熟悉且尴尬”。德国样本显示，学生平均得分约19/31，虽有基础，但整体水平受限。

值得注意的是，计算机与工程类学生得分最高，其他STEM学科次之，社科与非技术学科学生明显偏低。

此外，有AI正式课程背景或丰富自学经验的学生，素养显著更高。这表明AI素养不会因身处数字时代而自动习得，高度依赖学习机会。

跨国对比：德、美、英三国谁更懂AI？

第二项研究将测试扩展为英文版，并在三国开展大规模比较。

结果颇具启发性：

国家 AI素养自信与兴趣负面态度

德国最高中等较低

美国略低于德国最高中等

英国最低较低最高

德国学生在客观知识测试中表现最佳，且更频繁地使用AI及参与课程。美国学生虽知识水平未必最高，但自我效能感与兴趣最强，非正式学习也更多。英国学生则表现出更高的负面态度。

这组结果警示我们：“自以为会用AI”与“真正理解AI”存在本质区别。

AI素养不仅是“认知能力”

Affective（情感）：兴趣、态度、自我效能感；

Behavioral（行为）：AI使用频率、学习经历；

Cognitive（认知）：AI知识与理解。

研究发现，AI自我效能感不仅由知识决定，更受兴趣、使用经验及积极态度的综合影响。

作者还归纳出三类典型学生画像：

AI支持者（AI Advocates）：高知识、高兴趣、高自信；

谨慎批评者（Cautious Critics）：低自信、低知识、负面态度较高；

务实观察者（Pragmatic Observers）：各方面表现居中。

这表明，仅开设技术课程远远不够。有效的AI教育还需关注学生的情感体验与内在动机。

对高校教育有何启示？

本文的巨大价值或许不在于“产出了一套试题”，而在于推动AI教育从“概念倡议”迈向“证据驱动”。

过去许多高校推进AI教育时，往往流于口号：“学生需具备AI素养”；“各专业必修AI”。

但具体学什么、学到何种程度、谁最需支持、课程是否有效，往往缺乏可靠数据支撑。

本研究提供了一条可操作的路径：明确AI素养的能力结构——实施客观测量——据此设计与评估课程。

这一思路对正推进AI通识教育、教师培训及跨学科课程建设的高校，极具参考价值。

一个值得深思的问题

研究中隐含着重要判断：AI素养不足可能催生新的“AI鸿沟”。

善用、善评、善协作AI的人将获益更多；缺乏能力者可能在求学、就业及社会参与中处于劣势。AI素养不仅是技术教育问题，更是公平问题。本研究最大价值在于将“AI素养”从模糊口号转化为可定义、可测量、可比较的能力结构。

它警示我们AI教育不能止步于工具培训，“自我感觉良好”不等于真有能力。AI素养是知识、态度与行为的综合体，不同群体存在差异，需设计更精准的教育方案。

在AI成为“默认基础设施”的时代，关键不在于谁最会生成提示词，而在于谁能基于对AI机制与局限的理解，做出更理性、更负责任的判断。

参考文献：

Hornberger, M. (2025). The Measurement and Promotion of AI Literacy in Higher Education: Development and International Validation of an AI Literacy Test. Technical University of Munich.

← 上一篇：AIVA：让AI成为汽车的灵魂下一篇：AI视频创作实战营第三期：从创意火花到成片落地 →