AI 倒逼教育回归：苏格拉底式口试的复兴

发布时间：2026-05-18 11:22阅读：14

在埃及神话里，发明之神透特向法老塔木斯呈上文字，自诩这是份厚礼，称其能强化记忆、传播智慧。

然而塔木斯断然拒绝。他认为，文字带来的并非真知灼见下的记忆，仅是记忆的幻象，更是遗忘的帮凶。

掌握文字者看似博学，实则内心空虚，因为他们摄取的是他人的思想残渣，而非经过自身消化后的真知。

这段典故由苏格拉底转述给斐德罗。苏格拉底一生拒斥书写，其哲学实践全在于口头追问，在于对话、辩难与再追问的循环往复。

两千余载后，苏格拉底的幽灵以一种略带荒诞的姿态，重返大学校园。

康奈尔大学生医工教授 Chris Schaffer 规定，学生提交书面作业后，须接受 20 分钟面对面口试。理由很直白：「AI 无法帮你通过口试。」

塔木斯当年对文字的忧虑，在今日以一种超乎想象规模的方式，彻底应验了。

近期，《教育周刊》披露了对美一千三百个学区数据的分析，显示约五分之一学生与生成式 AI 的交互「涉及作弊、自残、霸凌及不当行为」。

学生提交的报告完美无瑕，文笔流畅，结构严谨，堪称教科书范本。可当教授随意追问细节，空气瞬间凝固。有人紧盯桌面默不作声，有人反复嗫嚅「这个……我觉得……」，声浪渐低。

皮尤研究中心数据显示，超半数青少年学业中启用 AI，约一成受访者坦言几乎所有作业皆由 AI 代劳。

卡内基梅隆大学、麻省理工、加州大学洛杉矶分校及牛津大学学者开展了一组随机对照实验，涉及 1222 名参与者，任务涵盖数学推理与阅读理解。

结论显示，仅使用 AI 10 至 15 分钟，便足以在可测层面侵蚀人的坚持力。一旦移除 AI，使用者在同类问题上表现显著下滑，且更易轻言放弃。

研究者特别强调「持久力」这一概念。它是技能习得的基石，亦是预测长期学习成效的关键指标之一。AI 虽助人短期跨越障碍，却也在悄然磨损让人真正成长的能力——即在困境中坚持不懈的韧性。

人工智能会削弱无辅助表现与持久力

塔木斯担忧文字让人仅存记忆假象。今日之弊更甚，AI 让人连维持假象的努力都省去了。答案触手可及，理不理解已无关紧要，只需打开对话框，一切自会重现。

苏格拉底之法无关答案本身。它旨在让人在被逼问中，惊觉自身无知，从而开启真正的思考之旅。

其弟子柏拉图称之为「助产术」，意在助人诞出潜藏于内的知识，而非从外灌输现成结论。

一个常被遗忘的事实是：口试曾是大学教育的标准形态。

学生曾被要求以辩论捍卫所学。书面考试于 19 世纪成为主流，非因其更优，纯粹因其可规模化、可远程、可留痕。当招生规模膨胀至工业级，无人能逐一当面追问，纸笔文字遂成替代。

颇具讽刺意味的是，人类发明 AI，AI 击溃了书面考试，于是人类重拾 2400 年前苏格拉底的旧法来应对 AI。

Schaffer 的课堂有 70 名学生，助教分担部分面谈，书面作业不再单独计分，考核核心转为口试。他称，此举旨在「激励」学生真做作业，或理解到足以阐释的程度。

帕诺斯·伊佩罗蒂斯教授于 2026 年 3 月 4 日在纽约大学斯特恩商学院的课程中与 AI oral agent 对话 🔗 https://apnews.com/article/college-oral-exam-ai-chatgpt-77954a19f5304bfc6e76dc92d4bef3ad

康奈尔大学教学创新中心已将 Schaffer 案例纳入新的「口头评估工作坊」，参与者还包括一位以 30 分钟「期末对话」取代传统考试的宗教学教授，以及一门为 180 人大课每位学生提供 4 分钟模拟面试的工科课程。

佐治亚理工学院研究者指出：口试对学习的促进作用已有充分研究支持，能深化理解、锻炼批判性思维与表达，但人工口试难以规模化。

一位教授面对 600 学子，即便加上助教也难以为继。而 AI 让规模化口试在技术上成为可能。该团队开发的系统，名为「苏格拉底之心」。

用 AI 防范 AI 作弊，魔法互搏，现实竟如此荒诞。

口试作为应对之策，在技术层面几近无懈可击。

你无法将 Claude 带入现场即兴作答，追问无需太深，即刻便能暴露学生真实理解度。

但我存有一丝疑虑，无关口试本身，而在我们赋予它的期待。

我们似已默认，只要考核形式足够严苛，真实学习便会发生。但这假设未必经得起推敲。

考核形式之变仅能矫正行为偏差，无法撼动驱动此偏差的底层结构——那是一个视分数远重于理解的体系。

GPA 左右奖学金，奖学金影响留学申请，留学申请决定职业起点。在此链条上，「你真懂了吗？」是个昂贵之问，许多人在作答前，须先回答另一问题：「这门课成绩关乎我的未来吗？」

若根源不动，堵此一漏洞，彼处必生新隙。

口试本质亦是即兴表演测试，而表演力与理解深度未必等同。有些人在一对一审问中天然占优，非因懂得更多，而是因其不怯场、善组织、会应变。有些人虽真懂材料，却在压力下崩溃，难成完整语句。

斯坦福学者明确反对校内大规模使用 AI 检测工具，理由是此类工具准确率极不稳定，误判将重伤无辜学生，并在校园制造弥漫的不信任感。

口试虽无此误判之忧，却存另一隐患：它评估的是「你在压力下即兴表达理解的能力」，这不完全等同于「你真理解了」。

更大问题或许不在考核形式，而在我们从未认真作答之间：学习之事，应赋予人什么？

有研究者希冀此项工作能激励整个领域思考，不仅优化「人们在有 AI 时能做什么」，亦关注「人们在没有 AI 时能做什么」。

图源：纽约客

这一代学生正被要求为一个轮廓未明的未来做准备。我们告知他们批判性思维、坚持与独立思考至关重要。这些固然真心。但我们鲜少坐下细问：你觉得自己在学什么？这些东西将来用得上吗？

或许这才是真正的苏格拉底之问。不再问「作业是否亲为」，而去问「你为何来修此课」。

塔木斯拒斥文字，是忧一种替代性假象，忧人拥智慧之形，却失智慧之实。

但苏格拉底当年反对文字，终未阻止文字成为文明基石，未阻止其与人类智识生活共生出新关系。

AI 能否经历类似驯化？此问尚无定论。当 AI 令完美表象变得廉价，这迫使教育直面一个搁置已久的追问：何为「真正学会」？

我想，它绝非 AI 能输出之物，非一篇结构工整之作。

它更应如是：在被人当面追问时，你能从自身真实经历过的思考中，调出些属于你的东西。哪怕不够完整，哪怕需要停顿，哪怕措辞笨拙。

那停顿，那句「我想想」，那笨拙措辞，才是学习真正发生过的痕迹。

苏格拉底的广场上，大抵也充满了这般停顿。

参考：https://www.adn.com/nation-world/2026/04/22/perfect-homework-blank-stares-why-colleges-are-turning-to-oral-exams-to-combat-ai/

← 上一篇：AI Agent驱动的个人革命下一篇：AI产业周报：巨头同框引爆热议，AI营销与人才大战白热化 →