数字人文视界|AI如何重塑文化遗产研究
人工智能究竟怎样改变文化遗产研究?
2024年,剑桥大学图书馆主导推出了“文化遗产人工智能中心”(简称ARCH)计划,耗时14个月,协同数学系及校内多家博物馆与档案馆,致力于以负责任的态度挖掘人工智能在文化遗产领域的应用潜力。
该计划由剑桥大学图书馆研究负责人 Emily Roper、资深开发者 Jenny Fletcher 及剑桥大学动物学博物馆藏品主管Matthew Low 等人联手推动。
ARCH 计划的核心要义在于:面对文化遗产机构堆积如山的未编目、未转录及未数字化馆藏,AI能否作为一种“负责任”的干预手段,在提升获取便利性的同时,确保人文学者与文化机构专家的批判性介入。
Website: https://www.lib.cam.ac.uk/research-institute/projects/arch
主要难题
其一,“释放难以获取的数据”(unlocking inaccessible data)。海量馆藏因语言壁垒、缺乏编目或内容未转录而陷入“隐形”境地。
其二,“构建馆藏间的互通”(making connections between collections)。相同主题的资料散落于各个机构,人工查找极难达成跨库关联。
其三,“维持专业人员的深度介入”(keeping practitioners embedded in the process)。这就需要 AI 工具的设计务必支撑人机协同,而不是取代人类的决断。
Emily Roper着重指出,该难题具有“全局性”,甚至比前两项更具根本意义。
案例剖析
卡片目录转录与结构化处理(剑桥大学图书馆)
该计划处理大批尚未录入线上目录的手写及打字卡片。在技术路线上,团队研发批量处理工具,把卡片图像转换为结构化数据。
研究表明低分辨率扫描即可得到较高品质的转录效果,这给大规模数字化项目的成本收益带来重要参考。计划还拟推出手机应用,让一线馆员能直接拍下卡片并上传解析。
该案例的普适价值在于,多数文化遗产机构至今依然留存大量未数字化的卡片目录。
纳瓦特尔语拉丁语祈祷书解析(剑桥大学图书馆)
针对16世纪阿兹特克语言手稿,计划设定两个具体研究目标:一是侦测手稿里涂改液状白色物质的分布,二是追踪变体图像符号(glyphs)在不同页面的出现。
由于该案例需要专属的图像识别与模糊匹配能力,超出了通用 Hub 平台的处理极限,团队转而与数学系协作研发专属算法。
这一变动揭示了通用平台与专属方法间的矛盾,该案例同时也成为计划检验文化偏见的关键场域。
Website: https://cudl.lib.cam.ac.uk/view/MS-BSS-00375
《亡灵书》纸莎草碎片复原(菲茨威廉博物馆)
该计划处理数千块未归位的纸莎草碎片。团队摒弃基于文字内容的匹配策略,转而剖析纤维纹理模式(fiber patterns),由数学系研发专属模型来判定碎片的方向与潜在拼接可能。
目前该研究已获阶段性成果,能判定碎片方向,但完整复原仍属后续工作。
该案例展现了 AI 在模式识别方面的独有长处,同时也表明文化遗产问题的繁杂度超出了通用 AI 工具的应对边界。
Website: https://fitzmuseum.cam.ac.uk/learn-with-us/look-think-do/book-of-the-dead-of-ramose
“会说话的藏品”与图像生成装置(斯科特极地研究所)
计划研发两项公众互动装置:一是依特定藏品数据训练的“对话式物件”,允许公众向藏品发问并获取AI生成的答复;二是依约150幅鲸骨雕刻图像训练的图像生成器。
该案例探寻了 AI 在公众参与和博物馆教育里的创新用法,收集到包含“吸引儿童重访博物馆”在内的积极回馈。这些装置仅靠单台高配笔记本运行轻量模型,环境影响甚微。
Website: https://fitzmuseum.cam.ac.uk/research/projects/talking-objects-high-quality-talk-through-museum-collections
Website: https://www.spri.cam.ac.uk/museum/catalogue/scrimshaw/
动物学博物馆入藏登记册与历史信札(剑桥大学动物学博物馆)
该案例是计划里方法论深度最足的部分。动物学博物馆藏有约220万件标本、3000封历史信札及大量手写登记册。据测算,起码15%的标本有额外信息“封存”于纸质档案里。
计划初期,登记册的 AI 转录精准率仅约20%;经团队成员数月提示词工程迭代,终达约80%的可用精准率。这一从受挫到可用的历程,构成整个计划最具方法论启迪的环节。
Matthew Low 还展示具体实例:一只1902年采集的鲸头鹳标本,其精准采集日期和地点信息原本仅存于手写登记册中,经AI转录后才得以步入研究视野。
Website: https://www.museum.zoo.cam.ac.uk/collections-research/collections-archives
Website: https://www.herbarium.plantsci.cam.ac.uk/
ARCH Hub 的设计理念
Jenny Fletcher 牵头的 Hub 平台构成了计划的技术中枢。其设计依循三项准则:
第一,安全沙盒准则。
平台保证用户上传的馆藏内容受保护,不被用于训练外部模型。这直接回应文化遗产机构对知识产权与数据主权的担忧,在当前大型科技公司大肆抓取网络数据训练模型的态势下,极具特殊意义。
第二,工具聚合与可比准则。
Hub 把多种 AI 工具集成于单一环境,方便用户发掘、测试与对比不同工具在特定任务上的成效。“工具集市”的设计思路,削减了文化机构专家的技术试错代价。
第三,人机协同准则。
平台设计侧重迭代测试与提示词调优,而非一次性自动化处置。这体现计划团队对“黑箱化” AI 运用的防备,力求在技术便利与专业掌控间维持平衡。
技术落地方面,Hub 主要调用 OpenAI 系列模型展开批量处理,同时摸索更小规模模型的适用性。平台当下处概念验证期,代码拟开源。计划团队已察觉依赖大型商业模型的环境代价,正积极谋求向小型化、本地化模型的转变。
提示词工程与转录伦理
动物学登记册案例揭示了历史档案 AI 转录里的深层方法论难题。Jenny Fletcher 表示,大语言模型的“合理补全”偏好,与档案转录讲究的“字面复现”之间存在根本矛盾。
大语言模型被训练成生成“合理”的文本,而档案工作者需严格忠于原始资料的转录,含错别字、涂改及残缺信息。该矛盾本质上折射出生成式 AI 的预测逻辑与档案学的证据逻辑之间的交锋。
登记册资料的特殊性更激化此难题:多种相异笔迹、历史数据、表格格式、淡写与涂抹、领域专属知识及过时术语,皆给模型带来严峻考验。
为应对此难题,团队衍化出三项对策:
其一,结构化不确定性表达。
当模型对某手写片段存疑时,要求以“[难以辨认]”等标记标出,而非臆测。这试图把 AI 的“盲区”显性化,为后续人工核查提供明确指引。
其二,多阶段处置。
把繁杂任务拆解为连续步骤,压降单一步骤的认知负荷与失误几率。“分而治之”的办法,既契合软件工程的优解,也贴合档案处置的精细诉求。
其三,参考数据注入。
把特定历史阶段的物种名录等外部知识库嵌入提示词,以拔高专业术语的识别精准率。这是在把领域知识“硬编码”进提示词,以填补通用模型在专业领域的知识空白。
Matthew Low 指出,AI 转录在此情境里充当了“老花镜”的作用:对人工难辨的文本,AI 同样难识;但对人工勉强可辨却极耗精力的文本,AI 能大幅拉升辨识效能。
据测算,志愿者借 AI 工具的信札转录速率跃升 3-4 倍。这精准框定 AI 在文化遗产工作里的辅助定位:它非替代人眼,而是强化人眼;非取代判断,而是提速判断。
Low 强调,AI 在处置信札上表现格外亮眼,任何人工难辨的信札,AI 同样难识,这反倒强化了使用者对工具局限的清醒认知。
文化偏见、环境代价与责任运用
计划对 AI 伦理秉持高度自觉,表露于三个维度:
文化偏见维度。Emily Roper 强调,借由挑选纳瓦特尔语等“非主流”语言作测试案例,团队得以检验模型偏见并邀该语言的“活态知识持有者”加入结果阐释。
同时,规模化处置卡片目录被认为利于发掘被传统编目实操边缘化的群体(如女性作曲家),在某种程度上修正既有偏见。计划也坦陈“我们未握全部答案”,此谦逊姿态在 AI 研究里尤为难得。
环境代价维度。Matthew Low 从自然保护视角持续诘问 AI 计算的碳排放与水耗难题。Jenny Fletcher 回应称,当下 Hub 用的 OpenAI 模型属较大规模模型,团队正积极寻觅更小规模的替代选项,并拟未来研发自有模型以全盘掌控环境影响数据。Emily Roper 补充,斯科特极地研究所的装置仅靠单台笔记本运行轻量模型,印证了低环境影响的技术路径是可行的。
责任运用维度。团队强调“AI 已无处不在”并非放任用的借口,核心在于挑拣适配模型、秉持批判意识,并在“百年手工转录”与“即时 AI 处置”间谋求折中。Matthew Low 指出,当濒危物种研究急需即时获取历史生态数据时,技术介入便具紧迫性。此情境化的伦理判别,规避了单纯的技术乐观主义或悲观主义。
理论建树与学术锚定
ARCH计划的理论建树可从三个向度锚定:
在数字人文方法论向度,计划给出“通用平台加专属方法”双轨并行的实操模型,证实大语言模型在文化遗产批量处置里的可行性,同时暴露其在专属图像识别、碎片复原等任务里的短板,为后续研究指明人机协同的优化路向。计划对“提示词工程”的摸索,为数字人文领域奉献可操作的中间层方法论。
在博物馆学向度,计划把 AI 重新锚定为“辅助利器”而非“替代选项”,强调 80% 准确率的转录虽无法取代人工核查,却能收窄检索圈,让“大海捞针”式的档案查询化为现实。计划还展示 AI 在公众参与维度的创新可能,为博物馆教育的数字化转型拓宽思路。
在知识生产政治向度,计划触碰 AI 时代文化遗产研究的权力分配议题:谁有权界定“可及性”?谁的偏见被放大或修正?计划对“活态知识持有者”的吸纳、对边缘化群体的关切,彰显批判性数字人文的自觉。