数字人文视界|AI如何重塑文化遗产研究

发布时间：2026-06-20 07:09阅读：1

人工智能究竟怎样改变文化遗产研究？

2024年，剑桥大学图书馆主导推出了“文化遗产人工智能中心”（简称ARCH）计划，耗时14个月，协同数学系及校内多家博物馆与档案馆，致力于以负责任的态度挖掘人工智能在文化遗产领域的应用潜力。

该计划由剑桥大学图书馆研究负责人 Emily Roper、资深开发者 Jenny Fletcher 及剑桥大学动物学博物馆藏品主管Matthew Low 等人联手推动。

ARCH 计划的核心要义在于：面对文化遗产机构堆积如山的未编目、未转录及未数字化馆藏，AI能否作为一种“负责任”的干预手段，在提升获取便利性的同时，确保人文学者与文化机构专家的批判性介入。

Website: https://www.lib.cam.ac.uk/research-institute/projects/arch

主要难题

其一，“释放难以获取的数据”（unlocking inaccessible data）。海量馆藏因语言壁垒、缺乏编目或内容未转录而陷入“隐形”境地。

其二，“构建馆藏间的互通”（making connections between collections）。相同主题的资料散落于各个机构，人工查找极难达成跨库关联。

其三，“维持专业人员的深度介入”（keeping practitioners embedded in the process）。这就需要 AI 工具的设计务必支撑人机协同，而不是取代人类的决断。

Emily Roper着重指出，该难题具有“全局性”，甚至比前两项更具根本意义。

案例剖析

卡片目录转录与结构化处理（剑桥大学图书馆）

该计划处理大批尚未录入线上目录的手写及打字卡片。在技术路线上，团队研发批量处理工具，把卡片图像转换为结构化数据。

研究表明低分辨率扫描即可得到较高品质的转录效果，这给大规模数字化项目的成本收益带来重要参考。计划还拟推出手机应用，让一线馆员能直接拍下卡片并上传解析。

该案例的普适价值在于，多数文化遗产机构至今依然留存大量未数字化的卡片目录。

纳瓦特尔语拉丁语祈祷书解析（剑桥大学图书馆）

针对16世纪阿兹特克语言手稿，计划设定两个具体研究目标：一是侦测手稿里涂改液状白色物质的分布，二是追踪变体图像符号（glyphs）在不同页面的出现。

由于该案例需要专属的图像识别与模糊匹配能力，超出了通用 Hub 平台的处理极限，团队转而与数学系协作研发专属算法。

这一变动揭示了通用平台与专属方法间的矛盾，该案例同时也成为计划检验文化偏见的关键场域。

Website: https://cudl.lib.cam.ac.uk/view/MS-BSS-00375

《亡灵书》纸莎草碎片复原（菲茨威廉博物馆）

该计划处理数千块未归位的纸莎草碎片。团队摒弃基于文字内容的匹配策略，转而剖析纤维纹理模式（fiber patterns），由数学系研发专属模型来判定碎片的方向与潜在拼接可能。

目前该研究已获阶段性成果，能判定碎片方向，但完整复原仍属后续工作。

该案例展现了 AI 在模式识别方面的独有长处，同时也表明文化遗产问题的繁杂度超出了通用 AI 工具的应对边界。

Website: https://fitzmuseum.cam.ac.uk/learn-with-us/look-think-do/book-of-the-dead-of-ramose

“会说话的藏品”与图像生成装置（斯科特极地研究所）

计划研发两项公众互动装置：一是依特定藏品数据训练的“对话式物件”，允许公众向藏品发问并获取AI生成的答复；二是依约150幅鲸骨雕刻图像训练的图像生成器。

该案例探寻了 AI 在公众参与和博物馆教育里的创新用法，收集到包含“吸引儿童重访博物馆”在内的积极回馈。这些装置仅靠单台高配笔记本运行轻量模型，环境影响甚微。

Website: https://fitzmuseum.cam.ac.uk/research/projects/talking-objects-high-quality-talk-through-museum-collections

Website: https://www.spri.cam.ac.uk/museum/catalogue/scrimshaw/

动物学博物馆入藏登记册与历史信札（剑桥大学动物学博物馆）

该案例是计划里方法论深度最足的部分。动物学博物馆藏有约220万件标本、3000封历史信札及大量手写登记册。据测算，起码15%的标本有额外信息“封存”于纸质档案里。

计划初期，登记册的 AI 转录精准率仅约20%；经团队成员数月提示词工程迭代，终达约80%的可用精准率。这一从受挫到可用的历程，构成整个计划最具方法论启迪的环节。

Matthew Low 还展示具体实例：一只1902年采集的鲸头鹳标本，其精准采集日期和地点信息原本仅存于手写登记册中，经AI转录后才得以步入研究视野。

Website: https://www.museum.zoo.cam.ac.uk/collections-research/collections-archives

Website: https://www.herbarium.plantsci.cam.ac.uk/

ARCH Hub 的设计理念

Jenny Fletcher 牵头的 Hub 平台构成了计划的技术中枢。其设计依循三项准则：

第一，安全沙盒准则。

平台保证用户上传的馆藏内容受保护，不被用于训练外部模型。这直接回应文化遗产机构对知识产权与数据主权的担忧，在当前大型科技公司大肆抓取网络数据训练模型的态势下，极具特殊意义。

第二，工具聚合与可比准则。

Hub 把多种 AI 工具集成于单一环境，方便用户发掘、测试与对比不同工具在特定任务上的成效。“工具集市”的设计思路，削减了文化机构专家的技术试错代价。

第三，人机协同准则。

平台设计侧重迭代测试与提示词调优，而非一次性自动化处置。这体现计划团队对“黑箱化” AI 运用的防备，力求在技术便利与专业掌控间维持平衡。

技术落地方面，Hub 主要调用 OpenAI 系列模型展开批量处理，同时摸索更小规模模型的适用性。平台当下处概念验证期，代码拟开源。计划团队已察觉依赖大型商业模型的环境代价，正积极谋求向小型化、本地化模型的转变。

提示词工程与转录伦理

动物学登记册案例揭示了历史档案 AI 转录里的深层方法论难题。Jenny Fletcher 表示，大语言模型的“合理补全”偏好，与档案转录讲究的“字面复现”之间存在根本矛盾。

大语言模型被训练成生成“合理”的文本，而档案工作者需严格忠于原始资料的转录，含错别字、涂改及残缺信息。该矛盾本质上折射出生成式 AI 的预测逻辑与档案学的证据逻辑之间的交锋。

登记册资料的特殊性更激化此难题：多种相异笔迹、历史数据、表格格式、淡写与涂抹、领域专属知识及过时术语，皆给模型带来严峻考验。

为应对此难题，团队衍化出三项对策：

其一，结构化不确定性表达。

当模型对某手写片段存疑时，要求以“[难以辨认]”等标记标出，而非臆测。这试图把 AI 的“盲区”显性化，为后续人工核查提供明确指引。

其二，多阶段处置。

把繁杂任务拆解为连续步骤，压降单一步骤的认知负荷与失误几率。“分而治之”的办法，既契合软件工程的优解，也贴合档案处置的精细诉求。

其三，参考数据注入。

把特定历史阶段的物种名录等外部知识库嵌入提示词，以拔高专业术语的识别精准率。这是在把领域知识“硬编码”进提示词，以填补通用模型在专业领域的知识空白。

Matthew Low 指出，AI 转录在此情境里充当了“老花镜”的作用：对人工难辨的文本，AI 同样难识；但对人工勉强可辨却极耗精力的文本，AI 能大幅拉升辨识效能。

据测算，志愿者借 AI 工具的信札转录速率跃升 3-4 倍。这精准框定 AI 在文化遗产工作里的辅助定位：它非替代人眼，而是强化人眼；非取代判断，而是提速判断。

Low 强调，AI 在处置信札上表现格外亮眼，任何人工难辨的信札，AI 同样难识，这反倒强化了使用者对工具局限的清醒认知。

文化偏见、环境代价与责任运用

计划对 AI 伦理秉持高度自觉，表露于三个维度：

文化偏见维度。Emily Roper 强调，借由挑选纳瓦特尔语等“非主流”语言作测试案例，团队得以检验模型偏见并邀该语言的“活态知识持有者”加入结果阐释。

同时，规模化处置卡片目录被认为利于发掘被传统编目实操边缘化的群体（如女性作曲家），在某种程度上修正既有偏见。计划也坦陈“我们未握全部答案”，此谦逊姿态在 AI 研究里尤为难得。

环境代价维度。Matthew Low 从自然保护视角持续诘问 AI 计算的碳排放与水耗难题。Jenny Fletcher 回应称，当下 Hub 用的 OpenAI 模型属较大规模模型，团队正积极寻觅更小规模的替代选项，并拟未来研发自有模型以全盘掌控环境影响数据。Emily Roper 补充，斯科特极地研究所的装置仅靠单台笔记本运行轻量模型，印证了低环境影响的技术路径是可行的。

责任运用维度。团队强调“AI 已无处不在”并非放任用的借口，核心在于挑拣适配模型、秉持批判意识，并在“百年手工转录”与“即时 AI 处置”间谋求折中。Matthew Low 指出，当濒危物种研究急需即时获取历史生态数据时，技术介入便具紧迫性。此情境化的伦理判别，规避了单纯的技术乐观主义或悲观主义。

理论建树与学术锚定

ARCH计划的理论建树可从三个向度锚定：

在数字人文方法论向度，计划给出“通用平台加专属方法”双轨并行的实操模型，证实大语言模型在文化遗产批量处置里的可行性，同时暴露其在专属图像识别、碎片复原等任务里的短板，为后续研究指明人机协同的优化路向。计划对“提示词工程”的摸索，为数字人文领域奉献可操作的中间层方法论。

在博物馆学向度，计划把 AI 重新锚定为“辅助利器”而非“替代选项”，强调 80% 准确率的转录虽无法取代人工核查，却能收窄检索圈，让“大海捞针”式的档案查询化为现实。计划还展示 AI 在公众参与维度的创新可能，为博物馆教育的数字化转型拓宽思路。

在知识生产政治向度，计划触碰 AI 时代文化遗产研究的权力分配议题：谁有权界定“可及性”？谁的偏见被放大或修正？计划对“活态知识持有者”的吸纳、对边缘化群体的关切，彰显批判性数字人文的自觉。

← 上一篇：AI的道德素养可经后天习得？OpenAI实验揭示反直觉结论下一篇：AI 席卷职场：人类会被淘汰还是迎来新生？ →