AI 倒逼教育回归:苏格拉底式口试的复兴
在埃及神话里,发明之神透特向法老塔木斯呈上文字,自诩这是份厚礼,称其能强化记忆、传播智慧。
然而塔木斯断然拒绝。他认为,文字带来的并非真知灼见下的记忆,仅是记忆的幻象,更是遗忘的帮凶。
掌握文字者看似博学,实则内心空虚,因为他们摄取的是他人的思想残渣,而非经过自身消化后的真知。
这段典故由苏格拉底转述给斐德罗。苏格拉底一生拒斥书写,其哲学实践全在于口头追问,在于对话、辩难与再追问的循环往复。
两千余载后,苏格拉底的幽灵以一种略带荒诞的姿态,重返大学校园。
康奈尔大学生医工教授 Chris Schaffer 规定,学生提交书面作业后,须接受 20 分钟面对面口试。理由很直白:「AI 无法帮你通过口试。」
塔木斯当年对文字的忧虑,在今日以一种超乎想象规模的方式,彻底应验了。
近期,《教育周刊》披露了对美一千三百个学区数据的分析,显示约五分之一学生与生成式 AI 的交互「涉及作弊、自残、霸凌及不当行为」。
学生提交的报告完美无瑕,文笔流畅,结构严谨,堪称教科书范本。可当教授随意追问细节,空气瞬间凝固。有人紧盯桌面默不作声,有人反复嗫嚅「这个……我觉得……」,声浪渐低。
皮尤研究中心数据显示,超半数青少年学业中启用 AI,约一成受访者坦言几乎所有作业皆由 AI 代劳。
卡内基梅隆大学、麻省理工、加州大学洛杉矶分校及牛津大学学者开展了一组随机对照实验,涉及 1222 名参与者,任务涵盖数学推理与阅读理解。
结论显示,仅使用 AI 10 至 15 分钟,便足以在可测层面侵蚀人的坚持力。一旦移除 AI,使用者在同类问题上表现显著下滑,且更易轻言放弃。
研究者特别强调「持久力」这一概念。它是技能习得的基石,亦是预测长期学习成效的关键指标之一。AI 虽助人短期跨越障碍,却也在悄然磨损让人真正成长的能力——即在困境中坚持不懈的韧性。
人工智能会削弱无辅助表现与持久力
塔木斯担忧文字让人仅存记忆假象。今日之弊更甚,AI 让人连维持假象的努力都省去了。答案触手可及,理不理解已无关紧要,只需打开对话框,一切自会重现。
苏格拉底之法无关答案本身。它旨在让人在被逼问中,惊觉自身无知,从而开启真正的思考之旅。
其弟子柏拉图称之为「助产术」,意在助人诞出潜藏于内的知识,而非从外灌输现成结论。
一个常被遗忘的事实是:口试曾是大学教育的标准形态。
学生曾被要求以辩论捍卫所学。书面考试于 19 世纪成为主流,非因其更优,纯粹因其可规模化、可远程、可留痕。当招生规模膨胀至工业级,无人能逐一当面追问,纸笔文字遂成替代。
颇具讽刺意味的是,人类发明 AI,AI 击溃了书面考试,于是人类重拾 2400 年前苏格拉底的旧法来应对 AI。
Schaffer 的课堂有 70 名学生,助教分担部分面谈,书面作业不再单独计分,考核核心转为口试。他称,此举旨在「激励」学生真做作业,或理解到足以阐释的程度。
帕诺斯·伊佩罗蒂斯教授于 2026 年 3 月 4 日在纽约大学斯特恩商学院的课程中与 AI oral agent 对话 🔗 https://apnews.com/article/college-oral-exam-ai-chatgpt-77954a19f5304bfc6e76dc92d4bef3ad
康奈尔大学教学创新中心已将 Schaffer 案例纳入新的「口头评估工作坊」,参与者还包括一位以 30 分钟「期末对话」取代传统考试的宗教学教授,以及一门为 180 人大课每位学生提供 4 分钟模拟面试的工科课程。
佐治亚理工学院研究者指出:口试对学习的促进作用已有充分研究支持,能深化理解、锻炼批判性思维与表达,但人工口试难以规模化。
一位教授面对 600 学子,即便加上助教也难以为继。而 AI 让规模化口试在技术上成为可能。该团队开发的系统,名为「苏格拉底之心」。
用 AI 防范 AI 作弊,魔法互搏,现实竟如此荒诞。
口试作为应对之策,在技术层面几近无懈可击。
你无法将 Claude 带入现场即兴作答,追问无需太深,即刻便能暴露学生真实理解度。
但我存有一丝疑虑,无关口试本身,而在我们赋予它的期待。
我们似已默认,只要考核形式足够严苛,真实学习便会发生。但这假设未必经得起推敲。
考核形式之变仅能矫正行为偏差,无法撼动驱动此偏差的底层结构——那是一个视分数远重于理解的体系。
GPA 左右奖学金,奖学金影响留学申请,留学申请决定职业起点。在此链条上,「你真懂了吗?」是个昂贵之问,许多人在作答前,须先回答另一问题:「这门课成绩关乎我的未来吗?」
若根源不动,堵此一漏洞,彼处必生新隙。
口试本质亦是即兴表演测试,而表演力与理解深度未必等同。有些人在一对一审问中天然占优,非因懂得更多,而是因其不怯场、善组织、会应变。有些人虽真懂材料,却在压力下崩溃,难成完整语句。
斯坦福学者明确反对校内大规模使用 AI 检测工具,理由是此类工具准确率极不稳定,误判将重伤无辜学生,并在校园制造弥漫的不信任感。
口试虽无此误判之忧,却存另一隐患:它评估的是「你在压力下即兴表达理解的能力」,这不完全等同于「你真理解了」。
更大问题或许不在考核形式,而在我们从未认真作答之间:学习之事,应赋予人什么?
有研究者希冀此项工作能激励整个领域思考,不仅优化「人们在有 AI 时能做什么」,亦关注「人们在没有 AI 时能做什么」。
图源:纽约客
这一代学生正被要求为一个轮廓未明的未来做准备。我们告知他们批判性思维、坚持与独立思考至关重要。这些固然真心。但我们鲜少坐下细问:你觉得自己在学什么?这些东西将来用得上吗?
或许这才是真正的苏格拉底之问。不再问「作业是否亲为」,而去问「你为何来修此课」。
塔木斯拒斥文字,是忧一种替代性假象,忧人拥智慧之形,却失智慧之实。
但苏格拉底当年反对文字,终未阻止文字成为文明基石,未阻止其与人类智识生活共生出新关系。
AI 能否经历类似驯化?此问尚无定论。当 AI 令完美表象变得廉价,这迫使教育直面一个搁置已久的追问:何为「真正学会」?
我想,它绝非 AI 能输出之物,非一篇结构工整之作。
它更应如是:在被人当面追问时,你能从自身真实经历过的思考中,调出些属于你的东西。哪怕不够完整,哪怕需要停顿,哪怕措辞笨拙。
那停顿,那句「我想想」,那笨拙措辞,才是学习真正发生过的痕迹。
苏格拉底的广场上,大抵也充满了这般停顿。
参考:https://www.adn.com/nation-world/2026/04/22/perfect-homework-blank-stares-why-colleges-are-turning-to-oral-exams-to-combat-ai/