标签

成绩飙升背后的隐忧:OECD报告深度剖析AI教育的核心困境

发布时间:2026-05-11 19:33来源:微信阅读:6

设想这样一种场景:孩子借助人工智能完成功课,成绩节节攀升,每次考试都名列前茅。然而某一天,当撤除AI辅助后——成绩急转直下,甚至不如使用AI前的水平。

这听起来像假设,但它确实正在发生。

OECD最新发布的《Digital Education Outlook 2026》报告指出,全球正大力推进教育领域的人工智能化进程,但一个被忽视的严峻问题正在浮出水面:学生的分数确实上去了,可真正的学习能力,却在悄然流失。

当全球都在拥抱AI教育

数据是最有力的佐证。

截至2025年4月,聊天机器人占据生成式人工智能平台月度流量的95%。ChatGPT仍占据主导地位,市场份额约78%——虽然从2023年的89%有所回落,但用户规模却在急剧扩大。过去一年,ChatGPT独立用户增长42%,人均访问量增加50%,平均会话时长从7分钟翻倍至15分钟。

这说明什么?人们并非偶尔使用AI,而是在深度依赖它。

在年轻群体中,AI工具的渗透更加惊人。67%的美国15至17岁青少年已在使用AI聊天机器人。法国高等教育机构的学生使用率从2023年的55%跃升至2025年的82%。德国94%的大学生使用AI工具,其中65%每天或每周都在使用。爱沙尼亚的调查数据更为极端:74%的初中生、90%的高中生都在使用AI工具。

教师群体也在快速跟进。OECD TALIS 2024数据显示,36%的初中教师已在使用AI。新加坡和阿联酋走在前列,约75%的教师使用AI;法国和日本则相对保守,不到20%。

然而,繁荣背后藏着一道深深的裂缝。

高收入国家占据全球生成式AI使用量的60%,较2024年的55%进一步上升。中等收入国家占39%,而低收入国家不到1%。数字鸿沟不是在缩小,而是在扩大。

各国ChatGPT用户占互联网用户比例(2024-2025增长热力图)

一个被所有掌声掩盖的真相

就在全球为AI教育的突飞猛进欢呼时,土耳其的一项千人随机对照试验揭示了一个令人不安的真相。

土耳其实验:用GenAI完成练习≠学习发生(柱状图对比两种条件下练习成绩vs闭卷考试成绩)

研究人员让一组学生使用GPT-4的标准界面进行练习,作业成绩提升了48%。另一组学生使用经过优化的辅导版界面,成绩提升高达127%。

听起来太棒了,对吧?

但故事的另一半才是真正的问题所在——当研究人员撤走AI之后,第二组学生的成绩反而比对照组低了17%。那些被AI"喂"得最好的学生,在失去AI之后,退步得也最厉害。

这个结果让教育研究者们倒吸一口凉气。

报告将这种现象定义为"元认知参与度下降"。元认知,简单来说就是"对自己学习过程的学习"——知道自己哪里不懂、为什么不懂、如何去弄懂。当学生过度依赖GenAI时,他们跳过了这个痛苦但必要的反思过程,直接获得了答案。长此以往,学生变得越来越擅长使用AI,却越来越不擅长学习。

更令人担忧的数据来自欧洲:31%的学生用AI直接获取任务答案,只有20%的学生将AI用于自我调节学习。

报告毫不讳言地写道:用GenAI完成任务,不等于学习发生。

这可能是这份报告最核心、也最令人不安的发现。

为什么你的AI助手可能帮了倒忙?

你可能会问:AI不是应该帮助学习吗?为什么反而会伤害学习?

答案藏在工具的设计逻辑里。

我们日常使用的通用聊天机器人,比如ChatGPT,它们的设计目标是"生成有用的回复",而不是"帮助你学会思考"。这两件事有时候是矛盾的。

当一个学生遇到一道数学题不会做,他有几个选择:

选项A:向AI直接要答案。AI秒给答案,学生秒交作业,皆大欢喜——表面上。

选项B:向AI请教思路,但自己动手演算。慢一点,但知识可能真的变成了自己的。

选项C:绞尽脑汁想很久,即使想不出来也在努力。痛苦,但这是学习最真实的模样。

通用聊天机器人默认的交互模式,就是让选项A变得越来越容易。而一旦学生习惯了这种"秒答"模式,他们的耐心阈值会越来越低,反思意愿会越来越弱,深度思考的肌肉会越来越萎缩。

报告因此特别强调:混合系统比通用聊天机器人更有效。所谓混合系统,就是将生成式AI与明确的教学模型相结合——比如结构化辅导策略、以证据为中心的评估设计。这类系统不会直接给答案,而是引导学生一步步思考,同时在关键时刻提供支持。

报告呼吁开发者基于教育研究和教学知识来设计专用教育GenAI工具,并让教师和其他利益相关者深度参与设计过程。

哈佛物理课实验:教育型AI辅导优于课堂主动学习

老师与AI:不是替代,而是合作

那么,教师在这场AI变革中应该扮演什么角色?

报告梳理出三种协作路径,每一种都值得深思。

第一种是替代。某些重复性任务确实可以由AI来承担,比如自动批改客观题、生成练习题库等。但这需要极其谨慎,因为过度替代会侵蚀师生之间宝贵的互动——那些眼神交流、即时反馈、情感连接,是任何AI都无法复制的。

第二种是互补。将AI的高效率与人类的判断力配对。比如AI负责初步筛选和批改,教师负责最终的评判和个性化的成长反馈。

第三种是增强。这是报告最为推崇的模式:教师与AI协同工作、相互评议、持续优化。在这个过程中,AI不是教师的竞争对手,而是教师的专业伙伴。

英格兰的一项研究为"增强"模式提供了有力证据。259名教师参与了随机对照试验,他们获得了AI实践指导后,备课时间从81.5分钟减少到56.2分钟,降幅达31%。而教学质量经过评估,并未受到任何负面影响。

更有意思的是AI助教的局限性。研究表明,AI助教在清晰度、准确性和专业性方面与人类助教相当,但在动机激发和成长引导方面明显较弱。好的教育不仅仅是传递知识,更在于点燃火焰——而这,依然需要人来完成。

当AI走进小组讨论

协作学习是教育的经典场景,AI能在这里发挥什么作用?

报告归纳出GenAI在协作学习中的四大角色:信息枢纽(快速提供所需信息)、个性化材料生成者(根据每个学生的学习进度生成适配内容)、教师反馈提供者(实时监测并给予指导)、以及小组任务中的同伴贡献者(作为虚拟成员参与讨论)。

研究显示,在有AI参与的学习小组中,学科学习有"小到中等"的改善,而批判性思维和团队合作则有"较大"的改善。

但也有例外。当学生使用AI只是为了走捷径——比如让AI帮忙写报告的主要部分——学习的价值就会大打折扣。

GenAI对创造力的影响也呈现出双重面孔。报告指出,"慢用"AI——用于支持迭代探索和反思——确实有益于创造力发展。但"快用"AI——快速生成内容、直接给出答案——可能会削弱原创思维。

这再次印证了一个朴素的道理:工具没有错,错的是使用方式。

从首尔到阿姆斯特丹:全球在行动

面对AI教育的机遇与挑战,各国政府已经开始系统性的布局。

韩国走的是"国家主导"路线。教育部为教师和学校提供与国家课程深度对齐的AI辅导系统,确保技术应用服务于统一的教学目标。

爱沙尼亚则推出了雄心勃勃的"AI Leap计划"(2025-2026),系统性地整合基础设施、课程开发和教师培训三大要素。作为全球数字化程度最高的国家之一,爱沙尼亚试图将AI能力渗透到教育体系的每一个细胞。

荷兰选择了"多方共建"的路径。荷兰国家AI实验室(NOLAI)联合政府、学界、产业界和学校的力量,共同设计教育GenAI工具。这种多元参与的治理模式,旨在确保技术发展不偏离教育本质。

英国(英格兰)的做法另辟蹊径。教育部打造了一个"内容库",整合课程指导、教案和匿名学生评估数据,用于训练AI模型。这种以真实教学数据为基础的方法,有望让AI更好地理解和融入实际课堂。

法国则着重开发"教育主权AI",辅助教师备课,在利用AI提升效率的同时,确保数据和算法的主权可控。

希腊采取了更激进的实验姿态,在选定的高中试点ChatGPT Edu,探索大规模应用的可能性。

这些探索路径各异,但都指向一个共识:AI教育不能是野蛮生长,需要系统性规划。

技术能否弥合那道数字鸿沟?

一个令人欣慰的发现是,AI在弥合教育不平等方面展现出潜力。

巴西农村地区进行了一项大规模实验。即使在间歇性网络连接和设备极度匮乏的条件下,AI依然能够为学生提供有意义的反馈和指导。研究人员发现,移动设备上可以离线运行的小语言模型是一个有前景的方向——这意味着,即使在最偏远的地区,即使没有稳定的网络连接,AI辅助教育也并非遥不可及。

当然,我们不能因此盲目乐观。低社会经济地位家庭的学生往往缺乏使用AI工具的指导和支持,而高收入家庭的孩子可能有家长或私人家教的帮助。这种"AI鸿沟"如果处理不当,可能会加剧而不是缩小教育不平等。

系统变革:AI在机构层面的应用

GenAI的影响不仅限于课堂。

在系统和机构管理层面上,AI正在开辟新的可能。嵌入模型可以映射课程和项目之间的等价关系,使招生、转学、学分认定等行政流程更加高效。在评估领域,GenAI可以大规模生成试题,设计更真实的交互式任务。语言学习平台多邻国已经利用GenAI推出了全新的互动写作和口语评估功能。

更令人兴奋的是合成数据在教育研究中的应用。GenAI可以生成隐私保护的合成数据集,为教育研究开辟新的可能性——研究者可以在保护学生隐私的前提下,更大规模、更高质量地研究学习过程。

六条政策建议:回归教育本质

报告最终提出了六条核心政策建议,每一条都直指当前AI教育应用的核心问题:

第一,警惕形式主义。用GenAI完成教育任务,不等于学习发生。教育者和政策制定者必须警惕"做了等于学会了"的幻觉。

第二,夯实基础能力。在关键学科中,不依赖通用GenAI来获取和展示基础知识和技能,仍然至关重要。数学的基本运算、写作的基本表达、科学的基本原理——这些能力的获得,不能绕过人脑的艰苦努力。

第三,设计学习场景。GenAI工具应在教师有意设计的学习场景中使用,而不是简单地扔给学生自由发挥。

第四,保持专业判断。教师必须继续行使专业判断,对AI生成内容进行评估、修改或认可。教师的专业价值不仅不会贬值,反而会因为AI的存在而更加凸显。

第五,参与式设计。开发者应基于教育研究和教学知识设计专用教育GenAI工具,让教师、家长、学生等利益相关者深度参与设计过程。

第六,持续追踪影响。需要国际科研合作,追踪评估GenAI对师生学习和福祉的长期影响。这需要开放的跨国数据共享和持续的追踪研究

在线阅读:https://www.oecd.org/en/publications/oecd-digital-education-outlook-2026_062a7394-en.html

本文核心数据