智评新境：AI赋能学生综合素质评价的国际视野与演进路径

发布时间：2026-06-28 11:34阅读：3

点击蓝字了解更多精彩

全球视野下AI技术对学生综合素质评价的演变特征与前瞻

基于CiteSpace及Vosviewer的图谱可视化解析

马欣欣、武小鹏、赵莉莉

摘要：人工智能正以前所未有的速率重塑教育生态，综合素质评价作为深化教育评价改革的关键引擎，备受学界瞩目，相关文献呈爆发式增长。从纷繁复杂的学术成果中梳理脉络、锁定热点、预判走向已成为当务之急。本文运用文献计量学方法，借助CiteSpace与Vosviewer工具，深入剖析研究增长轨迹、国际协作网络、焦点分布及未来动态，进而揭示人工智能在学生综合素质评价领域的研究全貌。系统分析表明，当前研究已由单一技术应用转向多元技术融合，构建了智能评价综合体系；由标准化评价迈向个性化评价，实现了学习路径的智能适配；由离线评价升级为实时评价，达成了智能监测与即时干预。

关键词：人工智能，综合素质评价，知识图谱，CiteSpace，Vosviewer，文献计量

近年来，伴随着智能技术的迅猛崛起，人工智能、大数据、区块链等前沿科技正加速与教育教学深度融合，驱动教育信息化向纵深迈进。与此同时，中共中央、国务院印发的《深化新时代教育评价改革总体方案》及教育部办公厅发布的《关于开展信息技术支撑学生综合素质评价试点工作的通知》均明确要求，需充分依托信息技术推动学生综合素质评价的改革与创新。在此宏观背景下，人工智能在学生综合素质评价中的应用实践引发了广泛关注。然而，目前针对该领域研究进展的系统性综述尚显不足，现有成果亟待整合与梳理，以支撑人工智能驱动学生综合素质评价的深入研究。

本研究计划利用CiteSpace与VOSviewer知识可视化软件，对2000年至2024年间国内外关于人工智能在学生综合素质评价方面的研究成果进行综合分析。通过系统整合既有文献，重点回应两个核心议题：一是如何全面系统地梳理当前该领域的研究进展；二是探析人工智能在此领域的未来发展趋势。以此揭示人工智能如何在学生综合素质评价中展现其智能特性，旨在推动技术与评价的深度融合。

一、研究设计

(一)数据收集

本研究选定中国知网（CNKI）与Web of Science核心合集数据库作为文献检索源。在CNKI中，采用专业检索构建如下检索式：SU%=人工智能+AI+机器学习+深度学习+智能系统+神经网络+认知计算AND SU%=学生评价+学生评估+学生综合素质评价+学生全面评价，时间跨度为2000-2024年，共检索到313篇有效文献。在WOS核心合集中，采用主题检索法，构建检索式：TS=Artificial Intelligence OR AI OR Machine Learning OR Deep Learning OR Intelligent Systems OR Neural Networks OR Cognitive Computing AND TS=Student evaluation OR Student comprehensive quality evaluation，限定语种为英语，文献类型为期刊文章（article）和综述（review），时间跨度为2000-2024年，获得1821篇有效学术期刊结果。为确保文献质量，经系统主题阅读，剔除会议纪要、课题介绍、书评等非相关条目，最终确立有效文献2134篇。

(二)研究工具

本研究采用文献计量法与内容分析法，结合定量与定性研究，旨在厘清人工智能在学生综合素质评价领域的研究进展。其中，文献计量法基于数学统计与可视化技术，选用Vosviewer1.6.20和CiteSpace 6.2R6作为分析工具，通过对关键词等要素的可视化处理构建知识图谱，定量呈现该领域的发表年份、期刊分布及合作网络等布局；借助Origin 2024绘制发文量图谱，并通过关键词聚类、突现检测等技术探析研究热点及后续趋势。同时，通过对文献文本的深度研读、总结与提炼，概括该领域的核心观点。

（三）数据处理

本研究将筛选出的2134篇有效文献分别按知网“Refworks格式”与WOS“纯文本格式”保存，利用CiteSpace内置转换器进行格式转换，随后导入CiteSpace生成知识图谱。参数设置如下：时间跨度2000-2024年，时间切片为1年，节点类型设为“关键词”，裁剪方法采用“Pruning Merged Network”，其余默认。最终生成反映人工智能在学生综合素质评价领域最新研究态势的知识图谱。

二、人工智能在学生综合素质评价中的研究特征

（一）发文趋势：技术变革驱动下的繁荣演进

伴随人工智能技术的持续革新与成熟，2000至2024年间该领域研究呈现显著的阶段性特征，并随技术进步不断深入。基于CNKI与WOS数据库的发文量统计，可将该领域发展划分为三个阶段：2000—2010年的探索萌芽期、2011—2019年的稳步发展期以及2020—2024年的繁荣增长期。

探索萌芽期（2000—2010年），人工智能在学生综合素质评价领域的研究刚刚起步。从发文数据可见，2000年CNKI仅1篇，WOS为7篇，随后几年增长缓慢。尽管数据有所波动，但整体平稳，反映了早期学者对该领域的初步尝试与探索。

稳步发展期（2011—2019年），这九年期间，CNKI与WOS的发文量均显著攀升。从2012年的CNKI 11篇、WOS 23篇，逐步增长至36、34、37篇，研究热度持续上升。特别是2018、2019年出现激增，从二三十篇跃升至43、79篇，标志着该应用从起步迈向快速发展，学者们展开了更广泛的探索。

繁荣增长期（2020—2024年），四年来，伴随AI技术成熟及教育信息化2.0等政策推动，研究热度高涨，发文量持续攀升。CNKI数据显示，2020至2023年发文量分别为39、43、38、42篇，2024年上半年已达16篇，增长与国内政策及技术发展紧密相关。WOS数据库中，2020与2021年成为转折高点，发文量分别达112篇和216篇，显示研究进入高峰，AI技术已成为该领域的重要工具与热点。随着技术深化，相关探索正趋向多样化与精准化细分。

（二）作者分布：群智汇聚下的共创格局

在AI应用于学生综合素质评价的研究中，作者贡献与发文量是衡量影响力的关键指标。基于CNKI与WOS的作者合作网络分析，得出图2。

计量分析显示，该领域研究呈现三大特征。首先，核心贡献者稀缺。尽管国内外学者均有所建树，但整体核心力量有限，尚未形成具有广泛影响力的学术领袖。其次，核心作者群尚未成型。虽有杜毓贞、陈丽、柴唤友、Mitrovic等高产作者，但未形成稳定的核心群体，合作网络尚不成熟。最后，系统性学术对话缺失。分析表明，多数研究仍呈零散探讨状态，文献间关联密度不足。

总体而言，目前发文量超过4篇的学者如李革、陈静、Mitrovic、Suebnukarn等，在推动领域发展中扮演了关键角色。他们的研究不仅拓展了AI在教育领域的理论基础，还通过实证验证了技术的有效性，为未来评价体系提供了新方法与视角。

（三）合作对话：多方协作下的协同效应

在合作对话研究中，重点分析了期刊合作、机构发文及国际合作三个维度。期刊合作可视化分析（图3）从发文量、被引频次、链接强度三个角度展示期刊间互动。首先，《IEEE Access》（72篇）在该领域发文量领先。其次，《Computers & Education》以3356次被引频次居首，显示其全球影响力。最后，IEEE Access的高链接强度（2295）表明其与其他期刊合作紧密，在国际引用中作用显著。

机构合作分析中，华中师范大学、Univ Pittsburgh、Carnegie Mellon Univ等在发文量上居首。从被引频次看，Carnegie Mellon Univ、Univ Pittsburgh等机构在国际网络中占据重要位置，合作力度强劲。

国际合作是成果交流的关键。基于Vosviewer的国家合作网络（图5）显示，美国、中国、澳大利亚和英国贡献突出，不仅在发文和被引上表现优异，且链接强度高，合作紧密。西班牙、加拿大、德国等国也发挥重要作用。沙特阿拉伯、印度、意大利等国虽起步较晚，但近年发展迅速，贡献不容忽视。

三、人工智能在学生综合素质评价中的趋势分析

通过对共现关键词进行突现检测，可识别前沿热点并展现演进趋势。利用CiteSpace的“Burstness”功能生成突现知识图谱（图6），考察高突现关键词的历史曲线。

CiteSpace结果显示，前25名突现关键词及其重要性指数、起止年份，反映了研究重点的演变。从模糊神经网络到深度学习，从个人信用到综合素质评价，从智能辅导系统到形成性评价，再到近期的智能评价与算法应用，各阶段关键词映射了AI技术在评价领域不断探索与应用的过程。

（一）从单一技术应用到多元技术融合，构建智能评价体系

研究早期，学者多聚焦于单一AI技术的探索，尝试利用机器学习、数据挖掘等技术量化分析学生成绩、表现及行为，涵盖从简单记录到复杂系统。如郑旭东提出利用区块链技术确保数据真实性与透明度[1]；柴唤友探讨通过数字化工具记录行为表现，提供客观依据[2]。此阶段多停留于技术选择，应用场景有限，面临门槛高、接受度低等挑战，传统模型难以捕捉创新、协作等非量化因素，但为技术化奠定了基石。

随着技术发展，评价手段转向多元融合，构建更智能、全面的评价体系。多元融合弥补了单一技术不足，促进评价创新。“伴随大数据、AI兴起，评价走向智能化，能实时收集分析数据，提供科学证据[3]。”陈丽指出，构建智能系统可实现动态监测与及时反馈，促进学生全面发展[4]。多元技术相互补充，共同推动评价体系智能化。

（二）从标准化评价到个性化评价，实现智能路径推荐

研究初期，学者多聚焦标准化评价，通过量化指标衡量综合素质，追求客观公正。统一标准如考试分数、等级评定提升了效率与可比性。然而，靳玉乐指出，单纯依赖标准化评价难以全面反映个体差异，忽视了情感、价值观等非量化因素[5]。随着需求多样化，学者开始反思其局限，探索更全面、科学的个性化评价方式。

伴随AI技术迅猛发展，个性化评价成为新路径。AI通过大数据分析、机器学习挖掘个性化特征，提供定制方案。柴唤友等指出，整合多源数据，通过算法分析学业、行为、兴趣等信息，可量身定制成长规划[6]。陈丽强调，智能技术使评价更精准高效，能实时跟踪轨迹，提供即时反馈，促进全面发展[7]。这些探索突破了传统框架，实现智能适配路径推荐，为个性化发展开辟广阔前景。

（三）从离线评价到实时评价，实现智能监测与即时干预

早期评价依赖离线模式，根植于传统框架，侧重教师主观观察记录及期末总结，形成综合评价报告。然而，该模式存在局限：首先，过程耗时，增加教师负担[8]；其次，依赖个人经验与主观判断，易受偏见影响，削弱客观性[9]；再者，周期长，难以即时反映动态变化，有效性受质疑。

随着AI技术深入应用，实时评价成为新路径。“AI技术引入显著提升数据采集、处理与分析能力[10]。”“通过智能设备部署，实时捕捉多元场景数据，实现智能监测与即时干预[11]。”这种方式提升了全面性与精准度，为教师提供即时反馈，助力调整策略。柴唤友强调，AI带来革命性变化，推动评价向科学高效方向发展[12]。

四、结语

人工智能在学生综合素质评价领域的研究正朝着智能化、个性化、实时化方向演进。通过机器学习与大数据分析，我们能更全面把握学习历程，实现智能综合评价；通过全程数据跟踪，实现基于大数据的个性化适配；通过过程监控，评价从“审判官”转变为“引导员”，实现实时指导。未来，随着技术进步与应用拓展，系统将更深入挖掘学生潜力，优化个性化路径。然而，伦理与隐私问题仍需重点关注。如何在保障数据安全与算法公正前提下提升教育质量，是亟待解决的挑战。教育界需跨学科合作与严谨监管，确保技术与教育价值结合，为评价与发展提供可持续支持。

参考文献

[1] 郑旭东，杨现民。基于区块链技术的学生综合素质评价系统设计[J].现代远程教育研究，2020(1): 23-32.

[2] 柴唤友，郑勤华，胡天慧，等。基于信息技术的表现性评价：概念解析、构成要素及分类框架[J].中国电化教育，2024(2): 1-7.

[3] 柴唤友，陈丽，郑勤华，等。技术赋能学生综合素质评价：进展、挑战与路向[J].中国电化教育，2023, 35(3): 40-54.

[4] 陈丽。智能技术支撑学生综合素质评价：改革与创新[J].现代教育技术，2023, 33(12): 5-13.

[5] 靳玉乐。高质量基础教育体系建设的内在诉求[J].中国电化教育，2022(1): 5-13.

[6] 柴唤友，陈丽，郑勤华，等。技术赋能学生综合素质评价：进展、挑战与路向[J].中国电化教育，2023, 35(3): 40-54.

[7] 陈丽。智能技术支撑学生综合素质评价：改革与创新[J].现代教育技术，2023, 33(12): 5-13.

[8] 刘丽群，屈花妮。我国普通高中学生综合素质评价的两难困局[J].课程·教材·教法，2016, 36(10): 95-100.

[9] 王小明，丁念金。历史与嬗变：普通高中学生综合素质评价改革十年[J].现代教育管理，2015(11): 74-79.

[10] 陈丽。以信息技术为支撑推进学生综合素质评价改革[J].中国考试，2024(1): 19-20.

[11] 杨鸿，朱德全，宋乃庆，等。历史与嬗变：普通高中学生综合素质评价改革十年[J].现代教育管理，2015(11): 74-79.

[12] 柴唤友，郑勤华，胡天慧，等。基于信息技术的表现性评价：概念解析、构成要素及分类框架[J].中国电化教育，2024(2): 1-7.

[13] 储朝晖。深化教育评价改革的思考与建议[J].河北师范大学学报 (教育科学版), 2021(5): 11-16.

[14] 刘志军。关于综合素质评价若干问题的思考[J].课程·教材·教法，2016(1): 40-44.

[15] 靳玉乐，倪哲。中小学综合素质评价相关制度的建立及其运用[J].西南师范大学学报（自然科学版）, 2014(2): 147-151.

[16] Parshall C G, Harmes J C, et al. Innovative items for computerized testing[M]. New York: Springer, 2010: 215-230.

[17] Siddiq F, Hatlevik O E, et al. Taking a future perspective by learning from the past - A systematic review of assessment instruments that aim to measure primary and secondary school students' ICT literacy[J]. Educational Research Review, 2016, 19: 58-84.

[18] 余丽芹，索峰，等。小学中高段学生信息素养测评模型构建与应用研究——以四、五年级学生为例[J].中国电化教育，2021(5): 63-69.

[19] Claro M, Preiss D D, et al. Assessment of 21st century ICT skills in Chile: Test design and results from high school level students[J]. Computers & Education, 2012, 59(3): 1042-1053.

[20] Aesaert K, van Nijlen D, et al. Direct measures of ICT validation of an ICT competence scale[J]. Computers & Education, 2014, 76: 168-181.

[21] Eshet-Alkali Y, Amichai-Hamburger Y. Experiments in digital literacy[J]. Cyberpsychology & Behavior, 2004, 7(4): 421-429.

往期回顾：

研修志 | 聚焦融合教育锤炼科研实战能力

一点谈｜超越知识，教育才能赢得未来——芬兰教育研修随感之二

成果荟｜幼儿园男教师的职业价值认知现状调查——以浙江省杭州市为例 / 张引江等

悦读记 | 俯下身，听见儿童思想的河流

杭州市教育科研标兵陈万勇工作室第十一次培训活动举行

← 上一篇：AI Agent 重塑数据库：金仓智能运维的真实实力下一篇：AI提示词真的无关紧要吗？ →