标签

AI素养测评:如何科学衡量这一核心能力?

发布时间:2026-06-09 23:42来源:微信阅读:1

近些年,生成式AI在办公、校园及日常生活中极速普及。无论是ChatGPT还是各类智能推荐,AI早已超越专业领域的工具范畴,演变为大众无法回避的社会基石。

然而,随之而来的核心疑问是:我们该如何评估一个人是否真正掌握了“AI素养”?

为何AI素养备受瞩目?

AI已全方位重塑了我们的工作、求学、交流及决策模式。它既能赋能增效,改善生活品质,却也潜藏偏见、虚假信息及社会不公的风险。因此,关键不在于是否熟练操作ChatGPT,而在于能否洞察AI的本质原理,明晰其边界,批判性地审视其产出,并在实际应用中做到负责任与合规。

本文参考Long与Magerko(2020)的观点,将AI素养定义为:“一种能够让人批判性审视AI技术、高效协作AI,并在网络、家庭及职场中恰当应用AI的能力集合。” 这一概念突出了三个核心维度:

理解AI:知晓AI的本质、功能及运作机制。

运用AI:能安全、高效地操作AI工具。

反思AI:拥有伦理观念与批判性思维。

AI素养具体包含哪些能力维度?

通过梳理现有文献,研究确立了Long与Magerko提出的五维模型,将AI素养细化为五个关键议题:

什么是AI:识别AI、理解智能概念、区分通用与专用AI,并甄别日常技术中的AI应用。

AI的能力边界:理解AI的长短板,构想未来应用场景,明确其擅长模式识别但非全能。

AI的运作原理:掌握数据、机器学习及决策逻辑,明确人类在其中的作用,理解AI是基于数据训练而非人类般的认知。

AI的伦理应用:关注隐私、偏见、透明度及责任,评估AI应用的公平性与可信度。

人们对AI的认知:纠正误解与拟人化思维,明确AI并非具备意识的“智能生命”。

该框架的一大亮点在于不要求全员成为AI专家。编程非必修,但基本认知、批判思维与实践应用能力不可或缺。

既往AI素养研究存在哪些不足?

作者对文献的梳理极具参考价值。目前多数研究依赖“自我评估问卷”,即让学生主观评价“我认为自己懂AI”。

此类测量存在显著缺陷,反映的更多是自我效能感或自信度,而非真实水平。主观偏差难以避免,如性别差异可能导致评价系统性失真,女性往往更为审慎。

因此,作者强调AI素养亟需“客观测量”,而非单纯依赖主观感知。

一套真正“可测量”的AI素养测试

研究团队构建了一套多选题测试,流程严谨。基于理论框架拟定57题,经AI专家审核,通过“出声思维”观察解题思路,经预测试筛选,定稿30题。该测试涵盖基础概念至伦理判断,并能有效区分不同学科背景及学习经验的学生。

针对德国六所大学1286名学生的样本,研究运用项目反应理论(IRT)进行验证,结果如下:

测试具备良好的内部一致性(Cronbach α = 0.82)

能有效区分不同能力水平的学生

题目难度分布均衡。

大学生的AI素养水平究竟如何?

结果略显“熟悉且尴尬”。德国样本显示,学生平均得分约19/31,虽有基础,但整体水平受限。

值得注意的是,计算机与工程类学生得分最高,其他STEM学科次之,社科与非技术学科学生明显偏低。

此外,有AI正式课程背景或丰富自学经验的学生,素养显著更高。这表明AI素养不会因身处数字时代而自动习得,高度依赖学习机会。

跨国对比:德、美、英三国谁更懂AI?

第二项研究将测试扩展为英文版,并在三国开展大规模比较。

结果颇具启发性:

国家 AI素养 自信与兴趣 负面态度

德国 最高 中等 较低

美国 略低于德国 最高 中等

英国 最低 较低 最高

德国学生在客观知识测试中表现最佳,且更频繁地使用AI及参与课程。美国学生虽知识水平未必最高,但自我效能感与兴趣最强,非正式学习也更多。英国学生则表现出更高的负面态度。

这组结果警示我们:“自以为会用AI”与“真正理解AI”存在本质区别。

AI素养不仅是“认知能力”

Affective(情感):兴趣、态度、自我效能感;

Behavioral(行为):AI使用频率、学习经历;

Cognitive(认知):AI知识与理解。

研究发现,AI自我效能感不仅由知识决定,更受兴趣、使用经验及积极态度的综合影响。

作者还归纳出三类典型学生画像:

AI支持者(AI Advocates):高知识、高兴趣、高自信;

谨慎批评者(Cautious Critics):低自信、低知识、负面态度较高;

务实观察者(Pragmatic Observers):各方面表现居中。

这表明,仅开设技术课程远远不够。有效的AI教育还需关注学生的情感体验与内在动机。

对高校教育有何启示?

本文的巨大价值或许不在于“产出了一套试题”,而在于推动AI教育从“概念倡议”迈向“证据驱动”。

过去许多高校推进AI教育时,往往流于口号:“学生需具备AI素养”;“各专业必修AI”。

但具体学什么、学到何种程度、谁最需支持、课程是否有效,往往缺乏可靠数据支撑。

本研究提供了一条可操作的路径:明确AI素养的能力结构——实施客观测量——据此设计与评估课程。

这一思路对正推进AI通识教育、教师培训及跨学科课程建设的高校,极具参考价值。

一个值得深思的问题

研究中隐含着重要判断:AI素养不足可能催生新的“AI鸿沟”。

善用、善评、善协作AI的人将获益更多;缺乏能力者可能在求学、就业及社会参与中处于劣势。AI素养不仅是技术教育问题,更是公平问题。本研究最大价值在于将“AI素养”从模糊口号转化为可定义、可测量、可比较的能力结构。

它警示我们AI教育不能止步于工具培训,“自我感觉良好”不等于真有能力。AI素养是知识、态度与行为的综合体,不同群体存在差异,需设计更精准的教育方案。

在AI成为“默认基础设施”的时代,关键不在于谁最会生成提示词,而在于谁能基于对AI机制与局限的理解,做出更理性、更负责任的判断。

参考文献:

Hornberger, M. (2025). The Measurement and Promotion of AI Literacy in Higher Education: Development and International Validation of an AI Literacy Test. Technical University of Munich.