数字档案长期保存的风险评估与对策分析
葛雪梅
盐城市委党校 224007
摘要:数字档案承载了历史记忆、法律凭证和科研价值,对数字档案进行长期保存是一项重要的研究。专家学者及技术人员对数字档案长期保存的策略以及风险进行了多样化的研究活动,对政府相关部门、居民端、企业端的档案管理会产生积极作用。在本文中将会重点分析数字档案长期保存的风险以及策略。
关键词:数字档案;长期保存;风险评估;有效策略
互联网的出现和普及使得地球各个角落之间的联系日益紧密,数字化浪潮席卷全球。据不完全统计全球每年产生约64.2 ZB数据,但数据的保存殊为不易,丢失率较高。数字档案的长期保存尤为重要,需要从技术、管理、环境等多维度分析潜在风险,提出应对策略,保障数字档案的完整性、安全性、利用率,实现技术标准规范化、档案管理动态化以及全周期管理。从而显著降低数字档案的长期保存风险。在本文中将首先分析数字档案长期保存的风险评估情况,在此基础上提出可操作的风险缓解策略与方案。
一、数字档案长期保存的风险评估
(一)网络攻击和信息泄漏风险
数字档案在长期保存的过程中有可能遭受网络攻击,或者被刻意泄露,如勒索软件、篡改数据、非法访问等等。从而造成大量的经济损失和其他损失。例如,从2001年至2021年美国国家档案馆和各州档案馆遭受勒索软件攻击的次数高达121次。此外管理人员和访问者有意或无意行为也有可能导致信息被泄露,如未及时更新访问权限或加密密钥丢失。
(二)自然灾害与意外事故风险
纸质档案保存场所以及数字档案存储地的选址和建设都尤为重要,在数字档案长期保存的过程中有可能遭受自然灾害的侵袭,如地震、洪水、泥石流。也有可能遭受意外事故的影响,如电力突然中断、火灾侵扰。这些均属不可抗力因素,对于数字档案的保存以及管理可能造成不可逆损失,如存储设备物理损坏、数据信息丢失,使得数字档案管理功亏一篑。
(三)技术和设备过时带来的数据安全风险
档案长期保存相关的旧技术的使用范畴在缩小,技术人员的数量在不断减少,对原有数据库和档案资料进行日常管理,对新产生的数据进行登记管理,有时需要采取旧技术,伴随着时间的推移出错的概率便会越大。例如,NASA 1976年“海盗号”火星探测数据因磁带驱动器淘汰,耗资数百万美元才恢复。此外,数字技术更新迭代的时间周期更短,文件格式有可能过时,专有格式或非标准格式可能因软件停更无法解析,微软Word 1.0格式(1983年)在当前仍然可以识别和读取,但是仅能通过模拟器操作。技术虽然在更新换代但是兼容性问题无法妥善解决,如存储格式和相关技术会随着时间推移而变得不再兼容,可能导致档案无法读取或损坏。如果存储设备遭受破坏也有可能导致档案丢失。现阶段常见的存储介质有机械硬盘、LTO磁带、蓝光光盘,理论使用年限分别为3~5年、30年、50年,实际使用寿命有可能达到5~10年、10~20年、20~30年。
(四)法律法规与档案管理相关的风险
很多数字档案的敏感度较高,涉及大量的知识产权、数据隐私和电子证据。如果信息无法读取或者存储介质损毁,有可能引发法律纠纷以及相应的合规问题。如果管理方未获得长期保存的合法授权而将信息进行长期保存,有可能造成版权问题。档案信息管理团队的人员会调整,信息优先级会调整,如果管理模式和方法变动剧烈有可能导致档案管理不善,团队专业性下降,影响到部分数字档案的长期储存。档案管理需要相应的资金保障,数据长期存储、迁移、维护所耗甚巨,如果资金匮乏则有可能降低档案管理的质量,从而面临更多不确定风险的影响。
二、数字档案长期保存的风险应对策略
(一)强化技术管理和应用活动,应对数字档案长期保存风险
数字档案长期保存过程中有可能遭受网络攻击风险、信息泄漏风险、自然灾害与意外事故风险、技术风险以及法律法规风险要进行及时的应对。做好技术层次的管理和防范工作,可以从以下几方面开展探究活动:
第一,不断采取新的技术手段和设备对存储介质进行动态更新。工作人员可以尝试设置多介质冗余备份,严格遵循321原则,即三份数据、两种介质和一份异地备份。如运用本地硬盘、云存储、 LTO磁带离线存储等多种技术手段和设备来进行信息的存储与管理活动,同时还要组织技术团队定期对机械键盘以及磁带等介质进行检测,提前更换老化设备或失效设备。
第二,不断更新数据存储格式,确保答案长期保存的标准化。工作人员要尽量采取国际通用的开放式格式来进行数据的存储工作,如PDF/A、TIFF,尝试每3~5年检测文件格式的兼容性,及时地迁移至新格式。
第三,不断进行数据完整性的检验活动以及损坏数据的恢复活动。工作人员可以使用SHA-256、MD5等算法生成哈希值,对于数据进行检测,看是否被篡改或者是否损坏;还可以探讨将数据进行分块存储的技术可行性,为数据损坏修复寻求技术支持。
第四,不断运用人工智能技术、虚拟现实技术对答案数据进行挖掘和抢救。工作人员可以通过模拟旧版操作系统或软件环境来访问历史文件,将其纳入现行管理系统;运用浏览器仿真技术运行旧版本软件来抢救和挖掘档案信息;利用人工智能工具预测硬件故障或格式淘汰风险;运用基于人工智能驱动的格式转换工具来进行数据挖掘和整理等等。
技术人员和专家团队需要从技术研发和实践运用的角度出发来进行实践探究活动,对面向未来的存储技术研究情况进行密切关注,探讨将其应用于数据保护工作的可行性。
(二)加强数字档案保存与管理机制建设,应对长期保存风险
为对数字档案长期保存过程中的安全隐患进行有效应对,管理人员需要探讨建设完善的数字档案录入、保存和查阅全流程管理机制,细化管理流程与环节,探索更为完善的风险评估和应对流程。如建立评估框架以识别风险;通过概率评估、影响评估及优先级排序来对风险分析;通过更换介质、淘汰旧技术、使用云存储、制定应急计划来形成风险应对策略。下面就具体内容进行分析:
管理团队应建立数字档案全周期管理框架,明确数字档案从创建到消失的各个步骤,包括格式选择、迁移周期、备份策略等关键细节。还要尝试对文件的来源、格式、权限、迁移历史等关键信息进行管理。
管理团队应定期开展动态风险评估与审查活动,每年进行一次全面的档案数据风险评估活动,用具体参数来进行衡量。如技术过时概率、存储介质退化速度等等,确保对数据进行实时监测,提高数据的完整度以及调阅和使用的速度。
管理团队还应当加强自身的建设工作,档案管理人员、工程师、法律顾问以及相关专家学者可以共同组成管理团队,共同完善团队管理守则。抓好风险评估工作、介质管理工作、技术服务工作、档案更新与调阅工作等。
管理团队还应当加强对防火墙的建设工作为数字档案长期保存提供技术性的保障,阻止网络黑客非法访问网络。通过过滤防火墙、代理防火墙、状态检测防火墙来强化数据的保存与管理机制建设活动,形成区域性的安全网。
(三)加强安全管理与数据防护工作,应对数字档案长期保存风险
政府相关部门和企业的职能部门在进行数字档案长期保存时还需要严抓安全问题以及数据的防护问题,防范网络攻击和数据泄露。可以从如下几方面出发来展开工作。
第一,提高数据的安全防护等级,对访问权限进行高效管理。数字档案管理部门可以将档案进行分级管理,对于部分重要程度较高且较为敏感的档案进行加密存储,如使用AES-256加密,如数据泄露也能保证无法被正确读取。在权限的控制方面,工作人员可以通过分层的方式来设置访问的权限,最大限度地限制非法访问。
第二,制定灾难后数据恢复计划,进行数据长期保存风险演练。管理团队要提前制定灾难后数据的保护和恢复计划,设立异地容灾中心,对需要长期保存的数据设置备份并且做到异地保存,防范自然灾害所带来的伤害和影响。管理团队可以每半年或每三个月模拟数据丢失场景、网络攻击场景、其他的问题场景,组织人员来开展抗风险演练活动,测试恢复流程的效率。
第三,为数据长期保存与管理寻求法律保障。管理团队要与版权方签订长期保存协议,在获取版权以后开展数据保存以及管理活动,最大限度地避免法律纠纷。对于和公民直接相关的部分数据要强化隐私保护,如实施脱敏工作,进行匿名化和假名化管理,严格遵循《中华人民共和国个人信息保护法》的相关要求。
管理人员只有通过加强安全管理工作以及数据的保护工作,才能更好地抵御数字档案长期保存风险。
(四)强化成本管理与基础设施建设活动,助力数字档案长期保存工作
针对数字档案长期保存和管理过程中所出现的成本攀升管理质量和效率下降等问题也要进行及时地解决。首要任务是获取资金支持并进行长期资金规划活动,打造预算分配模型。如将总资金的20%用于硬件更新,30%用于数据迁移,50%用于日常运维。 同时寻求更多的技术支持,开展低成本云存储活动,降低长期存储的成本。管理人员还可以根据档案的价值来划分存储的等级,对于高价值的数据采用高性能存储的方式,而部分低价值数据则可以将其运用廉价介质来保存,做好整体的成本控制和管理活动。
在环境和基础设施方面,档案管理团队需要做好物理环境控制以及基础设施建设等诸多工作,对于数字档案存储媒介要进行妥善管理,为其营造良好的物理环境。如保持恒温恒湿,即将存储环境温度控制在18—22℃,湿度40%~50%,尽可能地延长介质寿命。此外,还要对部分较为敏感的设备和介质要进行电磁屏蔽保护,防止存储的数据因受到磁场干扰而损坏。这一活动主要面向磁带设备而开展,技术团队还可以尝试着将绿色节能技术运用于环境营造等方面,形成冷存储方案,采用更多低能耗的存储设备来减少能源消耗,实现数字档案的绿色节能式保存。
结束语
总而言之,在本文中针对数字档案长期保存的风险进行了评估,并且制定了数字档案长期保存的策略,对档案管理工作将会产生积极影响。作为数字档案管理人员要围绕着提高档案管理的质量效率和安全性来开展相应的实践探究活动。在进行后续的研究活动时,需要围绕着相应的信息技术手段、管理模式、相关政策开展工作,建立档案信息系统管理标准与模型,借鉴国内外关于数字档案长期保存方案和指南来形成数字档案长期保存范式,降低数字档案长期保存成本。还要尝试着运用AI技术来进行自动化的风险评估活动,实现“技术+制度+资金”三轨并行。
参考文献:
[1]张瑜.数字档案长期保存风险的识别与应对策略[D].武汉大学,2017.
[2]陈慧君.全媒体时代数字档案个人信息安全风险分析与对策研究[D].湘潭大学,2021,DOI:10.27426/d.cnki.gxtdu.2021.000580.
[3]朱玲飞。数字档案信息安全的问题与对策分析[J]。档案管理理论与实践-浙江省基层档案工作者论文集,2016(00):278-283.