缩略图

数智化背景下档案数据要素化研究

作者

胥静

中国电子科技集团公司第二十九研究所

〖摘要〗档案信息化建设已然取得了相当的成绩,具备了档案信息资源共享的重要条件和基础,档案数据要素化成为档案信息资源建设的重要步骤,本文就数智化背景下,档案数据要素化的背景、定义、实现方式、挑战与解决方案等做了相应论述。

〖关键词〗档案数据 数据要素化 档案信息资源 档案信息化

一、档案数据要素化的背景

数智化是数字化与智能化的结合体,其中数字化是指将传统业务、生产和管理等各种活动通过数字技术转化为数字形态的过程,而智能化则是在数字化的基础上,通过人工智能技术对数据进行分析、挖掘和处理,实现业务自动化、流程优化、智能决策等目标。

随着信息技术的快速发展,特别是云计算、大数据、人工智能等技术的成熟,使社会和企业具备了实现数智化的技术基础。而在国内外激烈的市场竞争中,企业需要提高效率、降低成本、提升产品和服务质量,从而赢得用户的现实需求是推动数智化的根本动力。各国政府纷纷出台相关政策,鼓励企业加快数字化转型,推动数字经济发展,为数智化创造了有利条件。

发展数字经济是党中央布局中华复兴的核心战略,数据要素是推动数字经济加快腾飞的核心节点[1],是我国数智转型和数字中国建设的焦点内容,而档案数据作为一种重要的信息资源,其价值逐渐得到认可和重视。

二、档案数据要素化的定义

档案数据要素化是指将档案中的信息内容转化为数据要素的过程,这些数据要素可以参与到社会信息资源大数据或企业的研发和生产经营活动中,并发挥重要作用。它强调数据的价值性和资产特性,是社会和企业的信息资产,这使档案数据成为推动社会经济发展的重要数字资源。

三、档案信息化与档案数据要素化的区别与联系

档案作为数据源,是记录历史、传承文明的重要载体,蕴含着大量丰富的信息资源。而这些资源需要经过数据化处理,转化成数据要素的重要来源。

随着大量企业信息化建设的推进,档案信息化建设取得了较大进展,大量纸质及特殊介质档案通过数字化扫描,具备了信息共享的基础条件,但档案里的大量信息仍未得到开发利用,而档案数据要素化将是档案信息资源开发利用,并融入数字化、智能化经济的重要一步。

在档案领域里,档案信息化与档案数据要素化是两个不同的概念,两者既有区别又有重要关联。

档案信息化和档案数据要素化在定义、特点、重要性上各有内涵(表格1),同时两者的重要关系也清晰可见:

档案信息化为档案数据要素化提供了基础。通过信息化手段,将纸质及特殊介质档案转化为数字档案,为数据的采集、清洗、加工、分析和应用提供了可能。

档案数据要素化是档案信息化的高级阶段和深化应用。在信息化的基础上,进一步挖掘档案数据的价值,实现数据的增值和赋能,真正意义上实现档案信息化、数字化,并融入数字经济的发展中。

综上所述,档案信息化与档案数据要素化在档案领域都发挥着重要作用,它们相互促进、相互补充,共同推动档案事业的转型升级和数智化发展。

四、档案数据要素化的实现途径

数据产生于人类活动,数据的发展与人类的科技进步相适应[2]。档案数据要素化是一个复杂而重要的过程,也是数智经济发展的必然过程。

第一阶段:档案数字化,将纸质及特殊介质档案转化为数字图像或文本格式,使其可以被计算机识别和处理。这一阶段数据高度依赖物质载体,尤其是纸质载体。在很大程度上,数据可以看作一种记录经济社会信息的工具,需要将档案数据与物质载体分离。这是档案数据要素化的基础步骤。

第二阶段:数据清洗与整合,数据要素化要求档案数据具有可机读性、可交换性和可操作性,因此,需要对档案数据进行标准化、规范化处理,对数字化后的档案数据进行清洗和整合,去除重复、错误和无效的数据,提高数据的质量和可用性。

第三阶段:数据标注与分类,对档案数据进行标注和分类,挖掘档案数据中的价值信息,以便更好地理解和利用档案数据,并为其后续应用提供便利。

第四阶段:数据集化,对海量多源异构的档案数据进行采集、清洗、整合、集成、关联等处理,构建可查找、可访问的数据原则,建立数据资源的分级、分类体系,设计数据访问标准[3],降低数据流通、共享、使用门槛,形成高质量的数据资产,形成要素效应,提升数据供给能力。

第五阶段:数据开发与利用,基于已标注和分类的档案数据集,开发各种数据产品和服务,实现档案数据的价值增值。移动电子设备及网络APP的大规模普及,使数据量呈现指数级增长,数据活跃度及利用率呈指数上涨,并在价值创造活动中的中心地位日益凸显,数据不仅成为联系现有生产要素的桥梁,也作为独立的生产要素融入实体经济运行[4],要求各行各业各类数据均进入互联网经济循环,成为数字经济发展的筑基石,促使社会经济产出增加、效率提升。

综上,档案数据要素化的实现需要经过数字化、数据筛选、分类标注、数据集化等阶段,从而进入档案数据开发利用阶段。从档案到档案数据要素,数据的生产、储存、处理、流通发生了巨大的变化,适应并融入变化,是档案数据要素化得以实现的必然之路。

五、档案数据要素化面临的挑战与解决方案

档案数据要素是大数据要素的不可或缺的组成部分,档案数据要素化、智能化分析尚处于初期阶段,汇入数字经济大数据的道路面临诸多挑战。如档案数据权属边界不清晰;档案数据格式多样,处理复杂度高;档案数据资源散乱,档案数字要素化标准尚未制定;数据分析盲乱难以凝聚数据要素,数据分析局限于企业内部,未形成实际有效的智能化分析,未实现平台化共享和开放,未实现统一的数据应用管理;档案数据的安全性和隐私性保护难度大,难以开展联动机制,对产业数字化的支撑不足等。

面对以上挑战和难题,已有初步解决方案。如引入先进的图像处理、OCR图文识别等技术手段,提高档案数据处理的效率和准确性。明确档案数据的产权归属,完善分层分类的权属规则,保障数据流通和交易的合法性。数据脱敏,对涉及国家秘密、商业秘密和个人隐私等的档案数据进行脱敏处理,以保护敏感信息。建立完善的数据质量管理体系,对档案数据进行质量检测和监控。加强数据安全和隐私保护技术研究和应用,对数据进行校验与四性检测(真实性、完整性、可用性、安全性),确保档案数据在传输、存储和处理过程中的准确性和可靠性。健全隐私保护制度,通过如区块链分布式授权、隐私安全、隐私保护等技术,解决数据授权和确权方面的问题,确保档案数据在流通和交易过程中的隐私安全[5],增强档案数据共享信心等。

六、结语

综上所述,档案数据要素化是一个具有重要意义的过程。档案数据要素化可以提高档案信息的利用价值,促进档案信息的共享和交流。通过将档案数据要素化,充分挖掘和利用档案数据的价值,为提高生产效率和创新能力,推动数字经济的发展提供不可或缺的支持。同时,档案数据要素化是档案转型升级的发展趋势,是档案事业发展的下一重要任务,这个过程需要不断面临挑战和问题,并在实践中找到解决方案。

[1] 金柳.面向下一代交通基建互联网的数据要素化发展研究.互联网周刊.2022.10.5

[2] 陆瑶 卢超 董克 夏伊彤 李文妍.从幕后到台前: 数据要素化带来图情学科发展机遇与挑战.图书情报知识.2021年第6期

[3][5] 程学旗.数据要素化发展思考.软件与集成电路 2022年第9期

[4]王建冬 童楠楠.数字经济背景下数据与其他生产要素的协同联动机制研究[J].电子政务,2020(3):22-31