智能技术赋能物理教学：PRPER特刊研究全景与本土化思考

发布时间：2026-05-10 11:18阅读：13

引文格式：

刘俊慈,朱和国,武慧慧,童大振.人工智能在物理教育中的应用综述与启示——基于PRPER特刊的研究脉络分析[J].中学物理,2026,44(09):8-12.

自2022年末ChatGPT推出后，生成式人工智能（GenAI）已迅速成为物理教育技术领域的焦点议题。国际物理教育权威期刊《Physical Review Physics Education Research》（PRPER）因此发布了主题为“人工智能工具在物理教学与物理教育研究中的应用”特刊征文通知。本文立足特刊收录的12篇研究文献，从“教—学—评—研”四大维度全面梳理AI赋能物理教育的研究脉络，为我国物理教育数字化转型提供明确方向与实践借鉴。

一、GenAI助力教师发展

当前，教育范式持续演变，教师角色重塑与专业成长已成为推动教育改革的中心议题与主要挑战。现有研究主要围绕两方面展开：一方面聚焦突破“教师接纳—模型局限”这一宏观落地难题；另一方面则深入微观教学环节，通过追踪学生学习轨迹，为教师教学改进提供支撑。

宏观维度

Wattanakasiwich等人面向泰国物理教师的调研显示：青年教师、博士学位持有者及高校教师更易接受GenAI，年长教师使用意愿相对较低。教师面临的主要障碍包括认知不足、操作不熟练、内容存疑、担忧影响学生思维，以及泰语处理能力受限。目前教师主要将GenAI用于评估任务设计与课程规划，较少用于个性化教学，且多数教师仅使用免费版本，同时面临语言、资源与制度等方面的制约。研究建议开展针对性培训、加大资源投入，推动GenAI融入物理教学。

微观维度

Wyrwich团队通过识别学生在能量概念理解中的最优学习路径，为教师开展能量教学提供指引。研究表明，智能技术有助于教师深入洞察学生的学习路径，教师应重点关注学生在早期教学阶段的表现，及时发现处于低效学习轨迹的学生并给予鼓励。但需警惕的是，当前GenAI提供的分析往往忽视了课堂互动变量，因而难以捕捉真实情境中学生的认知发展动态。

未来教师发展不应仅局限于技术培训，更需解决心理接受度与技术伦理等深层问题。

二、GenAI服务学生学习

GenAI正深刻改变学生的学习方式。它不再只是提供信息的检索工具，而是能够个性化、创造性、全天候服务学生的“全能型学习伙伴”。现有研究不仅实证检验了定制AI聊天机器人对学生学习体验的多维影响，也深入分析了人机协作的效能及其带来的教学挑战。

学习材料对学生的影响维度

Lademann等人探讨了人工智能定制聊天机器人在教育环境中的整合效果。研究证实AI定制聊天机器人能依据学生知识水平动态调整语言复杂度与表述方式，对学习者的积极情绪、情境兴趣和自我效能感有显著影响。同时与单纯使用传统教科书学习相比，GenAI生成的结果能减轻学生的认知负担。然而，该干预对学习者学业成绩的影响未显现出明显变化。

开放探究场景维度

Kilde-Westberg团队探究了GenAI在物理实验中的应用。研究发现，学生普遍认为GenAI工具仅适合回答概念性问题，不适合处理实验设备操作问题；学生对ChatGPT的信任度与其先验知识及对AI工作原理的理解密切相关；而ChatGPT在某些情形下能帮助学生拓展思维，但当学生缺乏批判性思维时，也可能强化错误概念。研究强调，需对学生进行培训以高效利用GenAI促进物理学习。

GenAI作为“学伴”

童大振等人探究了ChatGPT-4o在多大程度上可作为“学伴”协助学生进行科学问题解决。研究表明，尽管ChatGPT-4o在部分任务中表现优异，但在实际互动中，学生多将其视为“获取答案的工具”而非“学习伙伴”。学生缺乏深入讨论与批判性思考，这就限制了人机深度协作学习的潜力。此外，GenAI在图像识别、问题分析与回复一致性方面仍存在挑战。

GenAI融入学习过程的关键在于通过教学设计使学生从被动接收转向批判性交互。

三、GenAI变革教育评价范式

传统教育评价多依赖纸笔测验，而GenAI的出现革新了传统教育评价范式，它凭借自动评分与反馈生成可大幅提升测评效率，但研究发现评分过程需建立人机协同的质量把控机制。

GenAI在评分中的潜力

Chen和Wan开发的零样本评分系统在无需参考答案的情况下实现解题思路合理性评估，该系统评分一致性几乎达到人类水平。该系统指导教师定向复核高风险答卷，形成“AI初筛—人工复核”的协同工作流程，反馈生成功能被证实具有高实用性。

人工监督的必要性

Kortemeyer和Nöhl探讨了人工智能在评估手写热力学考试答案方面的应用潜力。研究结果显示，目前手写识别技术（OCR）在面对非标准布局或含有图形元素的情形时，其表现存在局限。研究表明，通过优化考试设计可显著提升OCR准确率以及GenAI评分的效率，但在高风险测试评分中，人工监督仍不可或缺。在此基础上，他们进一步探讨了在高风险物理考试中使用人工智能辅助评分的可靠性。其研究指出GenAI在处理书写模糊或解法多样性问题时需要保留人工监督环节。通过贝叶斯预测能力，系统可动态决策GenAI评分与人工复核的触发条件，同时借助RAG技术接入课程知识库以提升其判断的准确性。

GenAI在诊断与预测学习表现的潜力

Dinc等人探究了学生在物理学习中的理解过程。本研究发现学生在学习阶段的眼动数据具备预测未来表现的能力，但其预测性始终低于测试阶段的数据。研究指出，无论是测试还是学习过程，学生对图表的注视停留时间都是预测表现的核心特征。这些发现为设计下一代眼动自适应学习系统提供了实证依据，需优先嵌入实时诊断任务，聚焦于图表交互的深度分析，以更好捕捉学生的理解动态。

未来评价系统的开发，需在利用GenAI处理大规模文本数据的同时，重点攻克手写与图形识别的算法瓶颈，并建立人机协同的信任机制。

四、GenAI推动教育研究革新

GenAI服务于物理教育研究领域实现了研究方法与范式的双重突破。现有研究不仅探讨了物理学特定术语对GenAI输出的影响，也分析了不同类型GenAI在物理视觉表征与物理教育研究分类中的表现。

语言输入的影响

Dunlap等人探究了GenAI在应对经典物理问题“物体沿斜面下滑”时的表现。研究发现，即使输出答案正确，GenAI通常也无法阐释解答所需的必要假设，更不能指出问题中的矛盾信息。研究还指出GenAI对几何术语的解析能力优于日常抽象对象。此外，GenAI对“无摩擦”等明确物理术语的敏感度高于“无滑动”等提示词。这表明用户在向GenAI输入提示词时需考虑特定术语的影响以确保其规范输出。

视觉理解能力

Polverini等人的研究评估了ChatGPT-4和ChatGPT-4o在简明电磁学评估（BEMA）中的表现。研究指出，相较于ChatGPT-4，ChatGPT-4o在视觉解释上有所改进但仍存在一定问题；并且ChatGPT-4o的整体表现优于ChatGPT-4和大学生样本的平均成绩。但ChatGPT-4o在视觉解释、陈述物理规律、空间协调与应用物理原理时仍存在一定困难。

选择适用的模型

Fussell等人通过比较多种模型在物理教育研究分类中的表现，探究了如何对比不同大语言模型（LLM）在监督分析学生实验笔记中的有效性。该研究从技术选型角度指出模型规模与精度的关系：轻量级模型（如LLaMA）虽降低了部署成本，但其在技能频率估计等任务中的绝对误差超出了不确定性范围；高性能模型（如ChatGPT-4）需要更强硬件支持，仅适用于高精度研究场景。

未来研究应深入探讨在特定物理情境下，如何建立基于GenAI辅助的可靠研究范式。

五、研究启示

以上对GenAI在物理教育中应用的梳理，为我国物理教育未来发展提供以下启示。

技术的教育价值，最终依靠教师实践实现。当前我国物理教育研究多聚焦学生体验与工具效能，忽视教师主体，成为GenAI落地的重要障碍，研究重“辅助学生”、轻“赋能教师”。随着国内大模型快速发展，亟需提升教师数智素养，开展专项AI教学培训，支持教师借助AI优化备课、学情分析与教学改进。未来研究应关注不同教师的AI采纳动因与应用挑战，推动生成式AI真正融入物理教育。

GenAI的兴起，不只是为学生提供便捷答题工具，更是学习理念与方式的深刻变革。此前学生多依赖搜题软件获取答案，缺少思维过程；如今GenAI如同在线学习伙伴，可通过对话对物理难题进行阶梯式引导、梳理物理学史，并用正向反馈提升学生学习内驱力。未来应将GenAI作为思考伙伴融入学习，引导学生学会高质量提问、甄别信息真伪，将AI成果转化为自身见解。

GenAI能显著降低教育评价的成本与难度，提升测评效率，减轻教师负担并提供即时反馈。未来可开发融入本土智慧的测评工具，利用主流教材、考题及学生典型错误进行训练。在课堂上，AI可自动批改客观题、分析学情；在关键评价中，需教师监督以确保准确性。通过与高校合作迭代优化，有望打造具有中国特色的智能测评生态。

GenAI为物理教育研究范式变革提供了新动力，国内大模型的发展更是重要支撑。未来可构建专用分析模型，自动化处理学生思维、作业等非结构化数据，开发自适应学习系统，为学生定制个性化学习路径。同时可深入研究物理概念复杂性对AI输出的影响，对比不同大模型在物理知识解析、作业评估中的效能差异。借助这些路径，GenAI将推动物理教育研究从经验导向转向数据与模型驱动的全新范式。

【END】

← 上一篇：AI具身智能与特种机器人产业发展提速，国产供应链迎来重要机遇期下一篇：多场景AI智能体开源演示系统，基于OpenAI大模型实现免费可二次开发 →