标签

档案行业拥抱AI:安全、有序、智能升级指南

发布时间:2026-05-06 08:54来源:微信阅读:5

为确保人工智能在档案领域的安全、稳妥与有序应用,并加速档案工作的数字化、智能化转型,国家档案局办公室发布了《关于推进人工智能在档案行业应用的意见》(下称《意见》),现就相关情况进行说明。

背景与历程

当前,人工智能已成为驱动新一轮科技革命和产业变革的关键力量。党中央、国务院高度重视人工智能发展,国务院发布的《关于深入实施“人工智能+”行动的意见》旨在推动人工智能与各行各业的深度融合。《“十四五”全国档案事业发展规划》中明确提出要“积极探索知识管理、人工智能、数字人文等技术在档案信息深层加工和利用中的应用”。即将出台的档案事业发展“十五五”规划也将落实国家部署,提出实施“人工智能+档案”战略。经过多年信息化建设,档案行业已积累了相当规模的信息化基础设施和丰富的数字档案资源,为人工智能的应用奠定了坚实基础。实践中,人工智能技术已与档案整理、鉴定、编研、利用、保存等业务深度融合并取得显著成效。2025年7月,国家档案局成立起草组,初步拟定了《意见》草案。在已建成高水平数字档案馆的单位中征求意见后,于12月提交国家档案局馆局长办公会审议。2026年1月,根据办公会要求,面向全国档案部门广泛征求意见,并根据反馈意见形成《意见(报批稿)》,最终于3月经国家档案局馆局务会审议通过后正式印发。

指导思想与发展方向

《意见》深入贯彻落实党中央、国务院的相关政策精神,紧密结合档案行业当前的人工智能应用现状,立足档案行业信息化发展的需求,并着眼于人工智能应用的未来目标任务,提出了一系列具体业务要求,旨在进一步丰富和深化人工智能与档案行业的融合。具体要求涵盖了加快典型应用场景的建设,依托档案科研攻关提升人工智能技术创新应用的时效性和质量,重点加强档案数字化建设,推进高质量数据集的构建,完善档案数据安全管控体系,构建算力基础设施,以及创新应用场景建设等方面,为档案行业规范应用人工智能提供了明确的指引。《意见》还针对在建设过程中普遍存在的挑战,如数据集质量不高、算法安全监控措施不足、算力资源保障乏力、档案数据汇聚风险防范不强、智能应用场景数量有限、相关制度标准体系不健全、云资源使用管理不规范等问题,提出了相应的管理要求和解决方案。

整体架构与核心内容

《意见》共包含四大部分,共计十条内容。

第一部分为“总体要求”,明确了档案行业推进人工智能应用工作的指导思想、基本原则和具体业务要求。

第二部分“有序推进应用”,针对人工智能应用中涉及到的数据、算力、算法、场景和安全等方面,提出了具体的落实要求,指出了重点任务,明确了发展方向,并强调了安全保障措施。

第三部分“强化安全支撑”,着重强调了人工智能应用过程中存在的安全风险,并从安全管理制度建设、安全管控机制构建、以及防范档案数据失泄密风险等方面提出了管理要求。

第四部分“统筹组织实施”,要求各级部门落实主体责任,确保人工智能应用的有效落地。同时,强调要加强科研支持,整合科研力量,重点攻克共性技术难题;加强制度标准体系建设,围绕系统框架、功能需求、应用场景、数据管理、评估审核等方面制定和完善相关制度规范;坚持需求导向,避免重复建设和资源浪费,提升大模型建设与复用能力;并着重强调档案部门的职责履行,不能过度依赖人工智能而忽视自身职责,必须加强工作人员对人工智能应用结果的审核把关。

面临问题与应对策略

《意见》围绕档案行业的实际应用需求,从基础能力建设、应用场景赋能、关键技术供给、以及创新模式应用等多个维度,细化了工作重点和发展方向,并为部分普遍存在的共性难题指明了解决路径。

1.关于高质量档案数据集建设的挑战

高质量的数据语料是深度应用人工智能的基石,缺乏数据将无法实现智能应用。若数据质量不高或语料受到污染,将直接影响大模型的判断结果,可能导致算法出现“幻觉”并引发安全风险。因此,必须坚持“存量数字化”战略,持续推进档案数字化工作,将馆藏纸质档案转化为数字成果,并按照标准规范要求构建档案目录数据库,确保目录与原文的准确挂接,从而保证目录数据和数字化成果的质量。同时,要大力推进档案数字化成果的OCR识别,加速非结构化档案数据向结构化数据的转化,加强重要档案的文字、语音、图像识别力度,并利用人工智能技术提升识别的效率和质量。此外,还需加强档案数据质量管理,做好数据收集、清洗和去重工作,形成具备完整性、准确性、安全性、可追溯性等特征,并包含文字、视频等多模态信息的高质量档案数据集。

2.关于档案业务典型应用场景建设的挑战

业务场景创建的质量直接决定了档案业务与人工智能技术融合的成效。《意见》坚持以需求为导向,以档案工作的实际需求为牵引,针对档案收集、管理、保存、利用等主要业务环节,明确了人工智能业务场景的建设方向,并提出了10余个典型场景的应用方向。要求不断深化数据分析、深度学习、多模态、知识图谱、大模型等新技术的应用,在档案整理、档案著录、档案脱密脱敏、数据清洗、开放审核、档案编研、档案检索、专题库构建、影像档案修复、档案知识问答等典型应用场景建设方面取得更大进展,从而更好地赋能档案业务发展。鼓励在现有实践基础上进一步创新和丰富档案业务场景,推动档案业务全过程的数智化建设,并将分散的单点场景进行整合,实现整体性、系统化的场景构建,覆盖档案业务的全过程和各个方面。

3.关于档案部门算力等资源建设与使用问题

国家正积极推进全国一体化算力网络的建设,旨在整合算力、数据等基础设施资源。各级档案部门应抓住这一机遇,积极争取算力资源,并鼓励探索人工智能基础设施的共建共享新模式。对于具备条件的单位,支持其建设档案智能算力平台,为档案部门提供算力支持、模型训练、语料处理和推理研究等服务。同时,必须在确保档案数据安全的前提下,规范使用云算力资源。在使用人工智能云算力服务时,应符合档案部门使用政务云等相关政策的要求。在部署人工智能应用时,严禁未经档案部门授权私自访问、修改、披露、利用、转让或销毁档案数据。此外,《意见》明确了档案部门的安全底线,即不得将档案数字资源总库部署在非自建算力平台上。

4.关于人工智能算法安全管控的挑战

《意见》要求各级档案部门必须充分认识算法安全风险,在应用人工智能时,应根据相关部门的风险监测和安全预警信息,及时开展算法安全风险排查,做到防患于未然。要加强对人工智能算法备案情况的审核,做好相关应用的合规性审查,确保其通过工信、公安、保密等部门的准入审批。在应用上线前和使用过程中,要做好算法漏洞、数据泄露、数据污染、后门嵌入等风险的防范工作。同时,要高度重视人工智能算法带来的伦理风险,并对潜在的负面影响进行预见性风险评估。

5.关于档案数据安全管理的挑战

《意见》坚持底线思维,高度重视安全问题,并对档案数据安全管理提出了明确的禁止性要求。针对人工智能应用中可能调用大量档案数据进行语料喂养、模型训练、关联分析、数据挖掘等操作所带来的安全风险隐患,提出了相应的防范失泄密管理要求。具体措施包括制定完善保密管理制度,规范人工智能技术从选型、部署、训练、使用到废止的全过程保密管理。同时,要采取技术手段对档案数据进行筛查,拦截涉密和敏感信息,严禁将涉密档案、敏感档案数据用于开放大模型的训练。要有效防止档案数据被非法获取、篡改和泄露,严禁未经审核审批进行多维度档案数据的交叉关联和深度挖掘,防止因数据汇聚和关联引发泄密风险。在与第三方合作开发人工智能场景时,严禁将档案数据用于测试。

6.关于人工智能应用支撑保障的挑战

《意见》要求加强统筹协调,强化组织实施,并夯实保障支持措施,形成上下联动的协同工作格局,以确保人工智能应用的有效落地和实际成效。要加强科研支撑,整合科研机构、高等院校和企业的技术优势与资源,对人工智能应用的基础模型、关键技术、核心算法、业务场景等进行深入研究攻关,推动人工智能在档案领域的应用算法模型创新,加快模型研发与推广。同时,要审慎评估档案业务应用人工智能的必要性,注重场景、模型、算力的兼容适配,推动大模型能力的复用,尽量采用轻量化解决方案,避免为“追热点”而盲目投入,造成资源浪费。

档案行业的数字化转型和智能化升级,需要各级档案部门的共同努力。国家档案局科技信息化司将紧密围绕档案工作数字化转型和升级的目标任务,进一步加强人工智能应用的顶层设计、政策供给和业务指导,全力抓好《意见》的贯彻落实和各项工作的推进。

END

文章