档案领域AI发展蓝图发布
近期,国家档案局办公室发布了《关于推进人工智能在档案行业应用的意见》(简称《意见》),旨在稳妥有序地推动人工智能在档案行业的应用。《意见》着眼于宏观规划,兼顾发展与安全,系统地规划了实施路径,对于促进档案工作的数字化转型和智能化升级,以及为“十五五”时期档案事业的良好开局奠定基础具有深远意义。
充分认识制定出台《意见》的重要意义
1.制定出台《意见》是贯彻落实习近平总书记对档案工作重要指示批示精神的重要举措
《意见》以习近平新时代中国特色社会主义思想为指导,全面贯彻落实习近平总书记对档案工作的重要指示批示精神,紧扣党中央、国务院关于“人工智能+”的部署要求,坚持积极探索应用、确保安全保密、突出重点培育、不搞一哄而上、注重实效节约的工作原则,准确把握人工智能发展趋势,密切结合档案行业实际,规范推动人工智能在档案工作中的有效应用,为档案部门深入践行“三个走向”“四个好”“两个服务”谋划了科学发展方向。
2.制定出台《意见》是巩固发展人工智能在档案行业应用成果的重要方法
全国档案局长馆长会议报告中肯定了多地在模型开发、智能著录等领域的探索成效,全国在推进数字档案馆(室)建设工作中也对人工智能技术的应用提出了具体要求。《意见》的出台,有助于提炼总结机器学习、深度学习、自然语言处理、计算机视觉等技术在档案业务中应用的成熟经验,引导档案部门在下一步工作中科学有序地推进人工智能应用场景落地实施。
3.制定出台《意见》是推动“十五五”档案事业开好局、起好步的重要保障
人工智能技术加速迭代演进,引发经济社会各领域、各行业深刻变革,给档案事业发展带来了新机遇新挑战。当前,档案行业对人工智能的应用需求日益凸显, “十五五”时期是“人工智能+档案”加速落地应用的关键窗口期,亟须加强政策引导和统筹实施。《意见》的出台,为档案部门夯实数据基础、打造应用场景、加强资源配置、强化安全保障提供了详细指引,是档案部门推动档案工作数字转型和智能升级的重要遵循。
准确把握《意见》的突出特点
1.突出基础
《意见》把夯实档案数字资源建设作为首要任务,提出了从档案数字化到数据标准化,再到高质量档案数据集建设的要求,为人工智能应用提供坚实数据基础。《意见》强调,要加强人工智能基础设施建设,探索共建共用和自建专用相结合的算力平台建设模式,多措并举加强算力资源供给,为档案智能应用提供算力支撑。
2.突出应用
《意见》以场景建设为驱动、以技术应用为支撑,提出了覆盖档案业务主要流程和关键应用的11类优先建设场景,精准对接档案接收、整理、著录、保管、利用、编研等核心业务需求,解决档案工作面临的实际问题。
3.突出融合
《意见》鼓励整合各类优质资源,推动“产学研用”协同创新,对人工智能的应用模式、关键技术、核心算法、业务场景等开展联合科研攻关,推动人工智能创新成果在档案行业的落地推广。
4.突出集约
《意见》聚焦算力、算法、数据等各类基础资源统筹规划,加强基础设施共享和开发成果复用,坚持资源与应用相匹配的原则,鼓励档案部门优先使用轻量化解决方案,避免重复建设和“追热点”盲目投入。
5.突出安全
《意见》统筹高质量发展和高水平安全,强调压实档案部门主体责任,加强人工智能算法应用安全评估和隐患排查,强化档案数据安全管理和失泄密风险防控,确保安全、可靠、可控。
切实抓好《意见》的贯彻落实
1.筑牢数据基础
坚持“增量电子化、存量数字化、资源数据化”,全面推进档案资源向数字化、数据化转型。加强立档单位电子文件归档能力和档案馆电子档案接收、管理、长期保存能力建设,推进承载电子档案全过程管理的信息系统相互衔接,鼓励开展结构化数据归档,加大可直接面向人工智能应用的电子档案资源供给力度。持续推进传统载体档案数字化,开展档案文本、图像、音频、视频内容识别,加强多模态数据采集与整合,为历史档案智能化应用提供基础数据支撑。打造适用于人工智能发展的档案数字资源流转全链条,推动档案数据流转从形成、采集、汇聚等传统环节向清洗、标注、训练等新领域延伸。坚持以需求为导向分层分类建设高质量档案数据集,围绕革命历史档案、社会主义革命和建设时期档案、重大活动和突发事件档案等编研、资政、利用较集中的领域优先建设档案专题知识库。聚焦实现文书档案语义结构化、内容知识化的核心需求,研究制定文书类档案语义结构化标注基本规则,解决文书档案标注过程中术语不统一、流程不规范、质量难控制、成果难复用等问题。
2.强化算力底座
主动融入数字政府建设大局,在落实档案数字资源总库不得部署在非自建算力平台等要求的前提下,探索依托共享算力池等数字政务共性支撑能力,保障档案部门模型训练、应用推理等算力需求。加强与有关主管部门就档案资源管理、安全保密等相关领域的政策沟通,在精准核算成本的基础上,积极争取政务信息化项目和资金落地,支撑自建算力平台建设,最大范围实现档案数据与算力、算法的有机融合。科学优化算力配置策略,推动算力资源精准适配应用需求,提升资源利用效率,保障各类应用高效稳定运行。
3.坚持应用引领
聚焦《意见》提出的智能化档案接收检查、档案著录、档案编研、档案检索、档案盘库、开放审核、档案数据脱密脱敏、数据清洗、专题库构建、音像档案修复、档案知识服务等典型应用场景,结合档案部门实际,优先打造投资少、见效快、使用率高的应用场景,重点解决人力资源供需矛盾突出的业务问题,不断推动人工智能赋能档案工作全流程各环节,助力提升档案管理效率,减轻基层档案部门工作压力。以应用场景建设为平台,积极培育适数化档案干部队伍,推动档案工作者数字思维和应用能力提升,通过岗位练兵、工作实训等方式培养一批档案事业发展急需的“人工智能+档案”复合型人才。
4.优化模型算法
综合考虑应用场景和数据特点,科学选用语言、图像、音频、视频、多模态等针对性强的算法模型,合理选择部署方式,满足智能应用与安全保障的双重需要。探索开发档案垂直模型,依托档案专业数据和专家知识,开展模型训练、微调、优化,结合提示词工程不断提升模型对档案业务的理解能力与处理精准度。注重对算法模型的轻量化改造,通过量化、剪枝、蒸馏等模型压缩方法降低运算复杂度,充分挖掘算力资源潜力。实施关键数据隔离策略,将档号、文件编号、开放状态等重要元数据存储在传统数据库,通过接口实现与模型之间的安全调用,避免模型输入输出的关键信息出现瑕疵。
5.开展安全治理
落实人工智能有关安全评估和备案管理制度,开展人工智能算法备案情况审查,加强算法安全风险前瞻评估、预警处置、应急响应,防范化解数据污染、算法漏洞等安全隐患。合理制定人工智能全流程数据权限策略,严格实施身份认证、访问控制、操作审计,阻断非授权访问和越权操作,防止档案数据被非法获取、篡改和泄露。加强保密管理,提升档案数据汇聚、关联风险识别和管控水平,采取技术手段识别、拦截涉密敏感信息输入输出。开展档案信息系统中人工智能应用及算法安全风险评估标准研究,聚焦代码安全风险、数据安全风险、模型安全风险、供应链安全风险、隐私保护风险、法律与合规风险、操作与管理风险、长期风险等维度,设计制定完整、科学、有效的评估规范。
6.加强标准供给
科学设计档案行业人工智能标准体系框架,明确技术要求、操作规程、应用指南、治理规范等不同维度标准之间的层级架构、逻辑关系、适用边界、协同机制,提升标准体系对人工智能应用实践的指导能力。坚持问题导向和急用优先,定期编制、更新和发布档案标准立项指南,引导档案部门、科研机构、高等院校、企业和其他组织聚焦重点发展方向,联合开展研究制定工作。强化标准应用推广,加大标准宣贯培训力度,推动标准落实融入人工智能应用各领域全过程,不断提升科学化、规范化水平。
7.推动落地实施
加强工作组织协调,建立档案接收、保管、利用、编研等业务部门和信息化、保密、财务等综合部门工作协同机制,明确工作牵头部门和职责分工,共同研究解决推进人工智能应用中的重点、难点、堵点问题,切实把政策举措转变为行动成效。坚持试点先行、典型带动,适时组织开展人工智能应用试点,发挥基层首创精神,激发档案部门创新活力,探索推进人工智能在档案行业应用的有效路径,形成可复制、可推广的典型经验。
推进人工智能在档案行业的应用,是新时代档案事业发展的必然选择,是进一步挖掘档案价值,更好发挥档案工作存史资政育人作用的重要举措。各级档案部门要以《意见》为指导,坚持守正创新、安全为先、务实节约、协同推进,结合自身实际做好资源建设、算力保障、应用实施、技术优化、安全治理、标准支撑等各项工作,推动人工智能赋能档案事业现代化,为党和国家事业发展贡献档案力量。
作者单位:山东省档案馆
文章