AI时代史学何为?史学家主体性不可被剥夺
AI大模型作为人类文明的里程碑,正全方位重塑社会。史学作为研究过往的学科,无法独善其身,吸纳其为新法是必然趋势。这便是所谓的“预流”。然而,如何精准预判这股浪潮?虽已有学理探讨和个案尝试,但技术迭代迅速,未来走向难测。本文将立足操作层面,探讨AI对史学工作的潜在影响。
近三四十年间,数字技术对史学的影响主要呈现三波浪潮。首波始于90年代初的“换笔”,即从手写转为键盘输入。这一过程漫长,受限于当时的计算机技术和社会经济水平,如五笔字型难记、字库不全。尽管如此,前辈学者为“驯服”键盘付出了巨大努力,大多积极拥抱。
虽然首波影响不及后续强烈,却十分深入。个人写作习惯被迫调整,思路表达亦受影响,但效率显著提升。笔者当年撰写博士论文,每改一次需誊录半月,身心俱疲。总之,“换笔”让我们摆脱手工,迈向机器时代,迈出了关键一步。
第二波次始于90年代末的全文数据库应用。文渊阁《四库全书》、中国基本古籍库及知网等数据库的建立,极大便利了资料搜集。特别是对新一代学者,无需依赖强记即可广征博引,罕见文献亦常见于学位论文。在此基础上衍生的“数字人文”(如文本挖掘、可视化)虽存在,但全文检索仍是主流。资料极大丰富,检索变得易如反掌,研究面貌焕然一新。
新技术影响总是双面的。常被诟病的是,它改变了阅读习惯,从全篇阅读变为片段检索,导致对整体寓意的理解产生隔阂,甚至形成言不及义的“检索体”。这种碎片化的知识结构具有普遍性,且目前未见改善趋势。
第三波次是近两年兴起的AI大模型。与前两次局限于技术不同,它似乎具备自主思维能力,正试图取代史学家的部分职能。
面对AI浪潮,史学应何去何从?首先需界定其影响力边界。当前技术发展迅猛,前景未明,我们只能立足于史学本位,试探性提出预判。
对比前两次,第二波次仅限于关键词统计与浅层分析,而第三波次的AI大模型已超越字符串对应。ChatGPT、DeepSeek等工具不仅能搜寻归纳,还能按逻辑连缀成文,甚至为求完整而杜撰“AI幻觉”。它们似乎具备了“思考”能力。范丁梁指出,数字人文处理的是符号形式,而AI能表达语义。计算机运作基于算法分解与概率统计,大语言模型本质是统计性而非认知性的过程。它将历史文本的缺陷(如事实隔阂、表述失衡、场景平面化)一并复制,因此常被戏称为“高级复读机”。
若要更好地应用,需在数据库与语言逻辑上加大投入。目前通用大模型多基于公开网络数据,对史学专业性不足。如李宗翰、柳立言所言,DeepSeek因无法利用全文数据库而存在致命伤。以中国古代史为例,文献数字化程度高,知网已覆盖大部分刊物。若能引入AI模型,技术难度不大。真正的阻碍在于数据库背后的资本运作,如何平衡商业利益与学术公益是关键。将学术专著数据化,依然任重道远。
语言逻辑同样关键。古代汉语语法与现代汉语存在差异且随时代演进。现代逻辑的AI处理古汉语虽有共通性,但易产生隔阂,甚至曲解信息。需技术人员与古汉语专家合作,建立不同时期的语言模型。如元代白话公牍等特殊资料,差异更大。困难主要不在技术,而在资本投入。不过,期待政策性投入跟进,技术层面的挑战相对容易应对。
当数据与逻辑条件具备,AI究竟能帮多大忙?它与真史家的分界线在于,AI对语料库是平面化阅读。它无法体察研究对象的主观意图,理解思想脉络,也无法通过算法体现非理性因素。它无法“移情”,更谈不上形成历史意识。
其一,当文本未直接反映历史信息时,该如何解读?文本是外观且有限的,词元串联下蕴含多重寓意。AI虽能处理简单联系(如范仲淹姓名与表字),但对隐匿的底层信息,史学家需多方考证才能揭示。从概念借用、反讽转喻到作者语气,需全篇贯穿以理解心境,即“移情”。这需超越文本数量与历史真实的失衡,AI难以企及。
其二,技术性路径在于对历史现象的观察、勾连与比较,发现与既有认识的落差,创造新知识。这种勾连涉及复杂的信息结构与跨度,AI难以将不同信息联系起来思考,这是人脑的独特任务。
“得间”若仅指具体史实,AI尚可尝试;但若指揭示前人未见的历史现象,提出新见解,则更为重要。学术创新依赖灵感闪现,AI大模型能否自主产生灵感?
史学研究分两道工序:史实复原与现象阐释。史学家基于认知、性情和偏好获取灵感,结合天赋、眼界和生命体验,最终实现灵光一闪。AI难以具备这些特质,无法取代史学家。
总之,史学虽重积累,但真正发现离不开天才想象力触发的灵光一闪。从目前看,AI难以企及。且AI应用需研究者设定主题,立意高下全在人为。
结合现有实例,AI在技术层面(古籍整理、翻译、史实铺叙)将大展身手。它将重构学术生态,学者应尽快掌握这一新方法。
除了部分人的兴奋,多数学者仍困惑。这非守旧,而是认真谨慎。革新影响复杂,需重视三点:首先,议题提出的主观性:AI助长关注细节,可能忽略整体把握,放大主观性。其次,学术生态:AI易助长重复劳动和投机取巧,催生大量铺叙文章。需引导其向知识创造方向,避免投机。最后,基础技能:文献释读、写作、逻辑训练仍是基础。应限制学生使用AI,教师也需掌握AI以引导学生。
总之,AI大模型不过是新技术,非“类人”生物,不会剥夺主体性,反而会凸显其价值。它能完成重复性工作,减少“匠气”,让史学家投入深刻思维。不应阻碍了解掌握它。认识局限性是为了更好应用。管理部门需协调各方,助推史学进步。
[1]参见王涛:《大语言模型时代的历史书写》,《历史研究》,2025年第5期;范丁梁:《概率与空间:大语言模型对史学思维的刺激》,《社会科学战线》,2026年第1期;等等。
[2]参见李宗翰、柳立言:《以DeepSeek仲裁黄庭坚与苏轼读〈远近景图〉的争议》,包伟民、刘后滨主编:《唐宋历史评论》第15辑,社会科学文献出版社2025年版,第3-58页。
[3]范丁梁:《概率与空间:大语言模型对史学思维的刺激》,《社会科学战线》,2026年第1期。
[4]李宗翰、柳立言:《以DeepSeek仲裁黄庭坚与苏轼读〈远近景图〉的争议》,包伟民、刘后滨主编:《唐宋历史评论》第15辑,第53-54页。
[5]王涛:《大语言模型时代的历史书写》,《历史研究》,2025年第5期。
[6]参见包伟民:《数字人文及其对历史学的新挑战》,《史学月刊》,2018年第9期。
[7]参见包伟民:《前言》,《史学问津》,浙江人民出版社2025年版,第1页。
[8]郭辉:《大数据时代史学研究的趋势与反思》,《史学月刊》,2017年第5期。
[9]邓小南:《走向“活”的制度史——以宋代官僚政治制度史研究为例的点滴思考》,《浙江学刊》,2003年第3期。
本文转自“史学集刊”,原载《史学集刊》2026年第3期"新时代史学研究的挑战与回应主题论坛"。旨在知识分享,如涉版权问题,联系小编删除。