人工智能技术在档案整理利用中的应用分析
朱晴晴
上海大学文化遗产与信息管理学院 上海大学宝山校区 201900
0 引言
档案是记录社会活动的实物或电子化的信息载体,是社会历史和文化的重要组成部分,是国家和社会的宝贵财富。档案的整理与利用是档案管理环节中的核心之一,不仅彰显了档案的固有价值,还体现了其社会价值。此环节旨在维护、贮藏及挖掘档案资源,以信息支撑和服务的形式,为国家与社会多元化发展赋能。具体工作包括系统化组织、数字化转换、公开访问、高效检索、编纂研究及高效利用等。
人工智能(AI)技术的崛起与应用,为这一领域带来了前所未有的机遇与考验 [1]。AI 技术作为模拟人类智慧的先进手段,包括自然语言解析、图像智能识别、机器学习算法及大规模语言模型等多元技术体系,能够智能化地剖析档案内容、优化处理流程、促进内容生成与利用,显著提升档案整理与利用的效率与质量,拓宽应用范围与深度,加速档案资源的深度挖掘与高效利用。
目前,国内外对于AI 技术在档案整理利用中的实践探索已初具规模,特别是聚焦于档案开放前的智能审核等领域,这些探索不仅揭示了AI 技术在该领域的广泛应用前景与巨大潜力,也揭露了当前存在着技术可靠性、安全防控、决策透明度等亟待解决的难题与挑战,需要进行深入的科学研究与技术革新[2]。.
1. 人工智能技术在档案整理与利用中的应用场景
人工智能在档案管理与利用中的核心应用场景非常广泛,包括档案开
自动化审核、数字化成果的智能化处理、档案整理的辅助优化等[3]。当前传统的档案整理工作环节面临着挑战,人工智能技术作为一种强有力的辅助工具,在促进档案资源深度挖掘和广泛利用的同时,对于提高档案工作效率和精准度方面将该起到关键作用。
1.1 辅助档案整理和档案智能检索
档案整理是档案管理的基础和关键,包括档案的归档分类、保管期限鉴定、涉密筛查等工作。档案整理中存在诸多挑战,如档案数量庞大、档案内容复杂、
档案特征提取困难、分类标准不明确等问题,传统的档案整理工作依靠人工逐字逐句地对档案内容进行分析、判断、标注,面对庞大的工作量,效率往往显得低下且易出错。人工智能技术在此环节中具有较强的应用优势,可以实现关键词自动提取、档案自动摘要、档案自动分类等操作,对档案文本内容进行深入的挖掘
和分析,形成文本特征标签,辅助档案管理人员进行档案整理工作。例如借助自然语言处理(NLP)技术,我们能够精准抽取出档案文本中的特征信息档案智能检索是档案管理的核心和突破口,它可以实现对档案目录、全文、图像、声音等多种形式的档案进行智能化的检索和推荐,提升用户的检索体验和满意度。
1.2 辅助档案开放审核和档案编研
档案开放审核是档案利用的前提,也是档案工作中的一大挑战。传统的档案开放审核依靠人工逐字逐句审核、判断,工作量大,工作效率低,严重制约了档案开放的进程。AI 技术可以对档案文本内容进行深入的挖掘和分析,形成文本特征标签,实现关键词自动提取、档案自动摘要、档案自动分类等操作,这一技术能够有效辅助档案管理人员进行档案开放审核工作。
例如,深度学习技术可以构建档案开放审核模型,并通过不断的训练和学习,优化开放审核模型,协助档案鉴定人员开展档案开放审核工作,提出开放审核建议,提高审核效率和准确性、规范审核标准和流程等。在档案编研工作中,AI 技术能够为档案编研提供丰富且高质量的素材,显著提升档案编研的质量与效率[5]。
1.3 声像档案及数字化成果处理
声像档案处理工作包括对这类特殊档案的数字化采集、修复、增强与识别等一系列操作流程,其核心目的在于优化档案质量及增强可利用性。然而,在实际操作过程中,发现声像档案面临着数量稀缺、内容识别挑战大、信息提取难度大等问题。人工智能技术,特别是其中的图像处理、图像增强、图像着色、人脸识别和语音识别等技术,可以为声像档案处理提供新的思路和方法,实现对声像档案的处理,追求自动化、智能化与高效化的目标[6]。
数字化成果处理是指对声像档案数字化后的数据进行质量检测、条目著录、全文识别、元数据构建、存储格式转换等工作,以提升数字 量与可利用性,并确保档案数据的安全性和完整性。人工智能技术中的图像识别、OCR 识别、自然语言处理、知识图谱等技术,可以为数字化成果处理提供新的思路和方法,实现对数字化成果的自动化、智能化、高效化的处理。
2 人工智能技术在档案整理利用中的应用模型设计
针对档案整理利用的各个应用场景,利用人工智能技术的原理、技术和方法,可以构建档案整理利用相关的智能化、自动化和高效化的应用模型,提高档案整理利用的质量和效率,拓展档案整理利用的范围和领域,加速档案资源的开发与利用进程,进一步助推档案事业的蓬勃发展与创新进步。
2.1 基于自然语言处理的档案开放审核模型
档案开放审核模型基于自然语言处理技术,利用中文分词、词性标注、关键词提取等技术,对档案文本内容进行分析,提取档案的文本特征标签。人工智能技术可以辅助人工,根据文本特征标签,利用深度学习算法,构建档案开放审核模型,并通过不断的训练和学习,优化开放审核模型,判断档案是否可以开放给公众,以及开放的程度和范围。此模型能为档案鉴定人员提供有力支持,显著提升档案开放审核的效率与准确性,从而推动档案开放审核流程实现自动化、智能化与高效化的目标[8]。
目前,基于自然语言处理的开放审核模型还处于研究阶段,未开发出正式投放使用的产品或应用。然而,一些档案馆和研究机构已经开始试验这种模式,并产生了初步成果。
2.2 基于自然语言处理的档案自动分类和智能检索模型
通过AI 辅助建立基于自然语言处理的档案自动分类和智能检索模型,该模型能够对档案全文内容进行特征提取,根据档案分类的标准,自动将档案分配到相应的类别,给出档案的分类结果和置信度,同时提供档案的摘要和关键词,方便档案整理人员进行整理,也便于进一步的智能检索服务。
这种基于语义的档案数据智能分类方法,可以通过采用 LDA 模型提取文档的主题特征向量。进一步地采用 K-means 算法对档案的主题特征执行聚类分析,旨在发掘档案之间的潜在关联 [9]。中国移动通信集团江苏有限公司引入了 TextCNN 算法— 一种基于卷积神经网络的文本分类技术,以优化档案保管期限的鉴定流程。
2.3 基于图像识别的档案数字化加工质量评价模型
该模型能够对扫描的档案图像进行质量评价,根据档案数字化加工的标准,自动检测图像的清晰度、完整度、倾斜度、噪声等指标,给出图像的质量等级和改进建议,同时提供图像的预处理和后处理功能,提高图像的质量和可用性。
数字罗塞塔计划包括对档案数字化加工质量评价模型的研究, 利用图像识别技术在质检过程中对图像是否有噪点、是否倾斜、是否倒置等 自动检测 时自动进行去噪、纠偏、旋转处理,大幅度降低质检工作量 [10]。在档案 OCR 工作中,人工智能技术的应用涵盖了档案数字化加工质量评价模型的使用。
2.4 模型优化与性能评估
在后期的展开研究中,可以利用实际的档案数据集对模型进行训练、验证和测试,对模型的性能、效果和准确度进行评估,与传统的档案整理利用方法进行比较,分析模型的优缺点,优化模型的参数和算法,改进模型的可靠性、安全性、适应性和可解释性等方面。
3 人工智能技术在档案管理中应用的保障措施
人工智能技术在档案整理利用领域的应用,使工作效率和得到了很大的提高,为档案管理带来了前所未有的创新与变革,但在实际应用过程中也面临很多挑战,比如法律法规的不健全、技术发展不均衡造成的应用范围受限、监管考核体系的不健全等等[11],这些都会在不同方面上影响人工智能技术在档案整理和利用领域的应用程度。
3.1 强化法律法规与标准框架的构建与优化
人工智能技术应用在档案管理方面,易涉及到安全隐私权益受损等法律问题,因而需要有相应的法规规范对其进行约束和引导。具体地说,对于各个环节要有明确的界定,例如对人工智能技术在不同应用方向下的使用范围和条件作出规范,对档案数据的所有权、使用权、许可权等进行明确的划分,从而做到有法可依。与此同时,监管和标准框架必须随着技术的进步和应用的扩展而不断地动态调整,以适应新的需要。
3.2 人工智能创新技术的深入研发
要想使人工智能与档案管理更好地结合,就必须根据档案的特点对现有技术进行改进,包括对人工智能应用模型和算法进行定制,使之在满足档案的多样化需求的同时,能够以最先进的技术提高处理效率与质量,通过不断的试验和迭代,使得人工智能能够准确可靠地有效处理各类型档案。
3.2.1 加强技术创新和研发投入
增强自主创新能力,实现关键核心技术的自主控制,是促进国家信息安全及产业发展的重中之重。所以,在档案管理的人工智能技术上加强自主创新能力是十分必要的,重点突破智能识别、自然语言处理、大数据分析等关键技术,在自主研发的基础上,形成具有自主知识产权的技术体系,进而有效提高档案管理的智能化水平。通过这种方式,不仅可以提高档案管理的效率和准确性,而且可以为政府及企业决策提供更为可靠的数据支撑[13]。
3.2.2 培育高水准技术人才
良好的人才培养体系是相关高水平技术人员涌现的坚实基础,应鼓励以高中教育和职业培训为基础,培养通晓人工智能技术和档案管理的综合性人才,高校可以开设人工智能与档案管理的交叉学科,对人才进行培养与储备,以促进技术创新运用在档案管理中,从而开发出更智能和自动化的档案管理系统[14]。
3.3 应用领域的拓展与实践深化
3.3.1 应用领域的广泛拓展
人工智能技术不仅在档案分类、索引、搜索服务等传统领域显示出了自己的优势,而且在档案识别、修复和保护等新兴领域,人工智能技术也在逐渐扩 用于档案管理,使档案管理智能化水平得到全面提升。例如,NLP 技术 对档案处理规则和自动化组织进行了机器学习算法优化;OCR 技术快速地将纸质 数字文字;基于语义特征,深度学习算法自动排序和分类文档内容。这些应用使 能化、 高效化,为档案保管和修复工作提供了强大的技术保障。
3.3.2 实践深化与跨学科创新
各级档案部门要从实际应用出发,积极采用人工智能技术开展档案管理实践,对发现的问题及时进行技术效果验证,不断增强档案管理效能,促进档案管理工作良性发展。同时建立人工智能档案管理资源库,为档案管理工作的探索提供丰富的数据支撑,在实践中不断摸索出一套行之有效的人工智能档案管理模式,为以后的档案管理工作的发展奠定坚实的基础[16]。
3.4 监管与评价体系的建立与发展
为确保人工智能在档案管理中的安全高效运行,需构建全面的监管与评价体系,有预见性地发现并纠正潜在问题,保障技术的可靠性与透明度。同时,强化问责制与反馈机制,激励技术的持续优化与改进。
3.4.1 监管框架的构建
建立完善的人工智能技术监管机制,是保障档案管理安全有序的重要关键,在推进技术应用过程时需做到主体与职责的清晰分配,建立健全的监管规则和流程,加大系统安全和风险评估工作的力度,对安全隐患做到早发现早处置。对系统进行经常性的监督和考核,对技术运用过程环节进行审查与评价,及时发现问题并加以解决,使其在保证安全运行的基础上持续改进和提高,最终形成一套完整的监督评价机制,保证技术运用的顺利与平稳进行[17]。
3.4.2 评估机制的完善
科学客观的考核制度对保证人工智能技术运用的效果必不可少,需综合考核 AI 技术在档案管理中的实际运用情况,包括档案数据安全度、用户体验感等方面,进行相应实地调研,收集用户反馈进行数据分析。同时,还要结合安全审查与风险评估,对技术水平进行综合考核,建立统一的评价标准和指标体系,对性能效率与安全性等各个方面的指标进行综合评定,并对评价结果进行及时反馈,进行持续的优化与改进,以促进档案管理智能化水平的不断提高,以应对日益复杂多变的档案管理需求。
4 总结
作为当代科技进步的重要力量,人工智能技术正深刻改变着档案管理的面貌,为档案整理、智能检索、开放审核、编研工作、声像档案处理等领域带来了前所未有的机遇与挑战。人工智能技术在档案管理中的应用具有广阔的前景和潜力,但也面临着技术不成熟、标准不统一、人才不足等问题 [19],需要档案部门与科技企业加强合作,不断创新和完善相关技术和标准,培养和引进复合型人才,促进人工智能技术在档案管理领域的深度融入与持续演进,拓宽其应用范围并深化技术革新。
参考文献
[1]于海娟 .AI 赋能:探索人工智能在档案开放审核中的应用 [J]. 档案天地 ,2024,(07):22-24.
[2]周美玲 .AI+ 档案利用——人工智能技术驱动下智慧档案馆利用服务和效能分析 [J]. 兰台世界 ,2024,(01):108-111.DOI:10.16565/j.cnki.1006-7744.2024.01.29.
[3]贾晓英 . 试论人工智能与档案管理体系的十大关系 [J]. 档案 ,2023,(08):70-74+79.
[4]马骥 . 大数据背景下电子信息档案管理创新研究 [J]. 电子元器件与信息技术 ,2024,8(02):133-136.DOI:10.19772/j.cnki.2096-4455.2024.2.033.
[5]周海 . 生成式人工智能辅助档案编研工作的实现路径构建 [J]. 北京档案 ,2024,(06):45-48.
[6]钱爃 . 人工智能图像识别技术赋能档案管理的应用场景研究 [J]. 云南档案 ,2023,(06):47-49.DOI:10.14074/j.cnki.yunnan.archives.2023.06.042
[7]魏丽维 . 基于 AI 技术的声像档案语音识别检索应用研究 [J]. 机电兵船档案 ,2024,(01):22-24+34.
[8]聂博馨 , 曹月 . 利用人工智能及自然语言技术辅助档案分级开放审核研究 [J]. 黑龙江档案 ,2024,(02):14-17.
[9]霍光煜 , 张勇 , 孙艳丰 , 等 . 基于语义的档案数据智能分类方法研究 [J]. 计算机工程与应用 ,2021,57(06):247-253.
[10]张建明, 高黎娟. 基于AI 深度学习的超分辨率重建技术在图像档案修复中的