数据挖掘技术在软件工程中的应用分析
吴丹
惠州市技师学院,516000
摘要:本文深入分析了数据挖掘技术,探讨了数据挖掘技术的主要技术流程,从数据处理效率、信息采集速度等方面,总结出了数据挖掘技术在软件工程中应用的意义。同时,从信息挖掘、软件漏洞挖掘、软件执行记录以及开源软件代码等角度出发,探讨了数据挖掘技术在软件工程中的具体应用方法,以此来促进软件工程产业的发展。
关键词:软件;数据;应用;挖掘;工程;技术
软件工程是目前计算机技术产业发展的重要基础,尽管计算机技术在社会产业中的应用越来越广泛,但是对软件工程的开发研究进行强化,以软件系统来提升计算机数据分析的效率,更是成为了其产业发展的基础。而数据挖掘技术是一种现代计算机科学,如果将数据挖掘技术与软件工程结合起来,还可以促进软件工程开发行业的发展。
一、数据挖掘技术概述
计算机资料探勘技术是一种现代的计算机科技。它主要是通过某种算法,从大量的数据中发现隐含的信息。在运用计算机数据采掘技术进行数据采掘时,其技术流程可分为如下七个部分:
①定义问题。在进行数据挖掘之前,必须先对所需的资料情况及所要处理的问题有一个清晰的认识,并对所要处理的问题有一个明确的认识,进而对所要处理的问题有一个明确的认识。②构建基于数据采集、行为描述、数据筛选、数据质量评估、数据整理等多个环节的数据挖掘数据库,并进行归并和整合,构建元数据,并进行数据加载和维护。③数据分析。数据分析是计算机数据挖掘技术中的重要技术流程,需要功能强大的计算机工具以及软件系统共同完成;④准备数据。数据准备工作是一个非常重要的数据准备环节,它包括了四个步骤,分别是:选择变量,选择记录,创建新变量,转换变量;⑤模型建立。建模是一个重复的数据运用过程,在这个环节中,要综合地分析不同的模型,选择最好的数据模型。在建模时,首先用一部分数据对所建模型进行建模,再用剩余数据对所建模型进行验证。在建模过程中,由于模型本身的特征会对检验集合产生一定的影响,因此,在建模过程中,需要用到独立的数据集合对检验结果进行全面的检验;⑥模型评估。在计算机数据挖掘技术中,在建立了模型之后,模型评价是最重要的一部分,它是用来评估得到的结果以及解释模型的价值。在数据模型构建完毕并通过了验证之后,它的应用方式主要有两种:一是为分析者提供一个参考;第二,将该模型用于多种类型的数据,充分利用该模型的优势。
二、数据挖掘技术的应用
将数据挖掘技术运用到软件工程领域,将会对新时代的计算机行业起到积极的促进作用。而在对数据挖掘技术的实际应用过程中,也需要以软件工程的实际需求为依据,对其具体应用内容及方法展开研究,这就充分体现了数据挖掘技术在软件工程中的重要性。当前用于软件工程的数据挖掘技术具体应用有:
1.信息挖掘应用
在进行数据挖掘的过程中,通过数据挖掘技术可以将项目参与方和协编方统一起来,从而获得整体信息。在实际应用中,数据挖掘技术可以挖掘出软件工程中的变更信息模块,并分析出系统之间的内在关系,从而可以有效地减少系统的维护费用,这对计算机软件系统的运营有着积极的作用。
2.系统漏洞挖掘
对软件缺陷进行探测,可以发现一系列的缺陷,并在最短的时间内对其进行修补,因此,该系统是可靠的。在漏洞检测中,一般都会使用数据挖掘技术,它不仅要对软件进行测试,还需要符合用户的需求,总结出软件测试后的具体内容,最终决定要使用哪一种测试方式来进行测试,并制定出对应的解决方案;手机中的漏洞资料,整理资料,分析资料,取出相关资料,将无用资料清除完毕后,在对缺失的条目进行补救,转化成数字表达。选择合适的数据模型,用于训练和检验。对挖掘方法进行了选择,并将其作为试验样本,对其进行了对比,得出了最符合实际情况的方法。并对软件的缺陷进行描述和分类,将缺陷数据应用到软件数据库中,找到对应位置的缺陷,并对其进行进一步的分类。
3.执行记录挖掘
当将数据挖掘技术运用到软件工程中时,可以对程序的运行轨迹进行分析和归纳,从而分析出程序间的关联关系。本质就是跟踪软件系统的执行路径,以便于软体系统之程式维护与程式理解。在对软件工程执行记录的数据挖掘中,数据挖掘技术的第一项工作就是分析系统,记录软件的变量,再经过筛选,最后获得有关的执行记录信息数据。
4.开源软件挖掘
开源软件具有开掘、开放等特性,因此在开发这类软件时,必须与其它软件相区别。在常规条件下进行软件的开发,并将参加会议的相关报道和申请文件保存好。开发者形成了社交网络,由于其开放的特性,使得开发者总是处于不断变化的过程中。其次,对开放源码软件的动态挖掘,使得开放源码项目的管理变得更加便利。
而在软件工程的实际应用中,数据挖掘技术的应用方法也比较多,主要包括了以下几个方面:①关联法。关联分析方法中的规律指的是在数据中存在的相互关联的信息,其一是支持度,其二是置信度。②分类方法。分类法是利用分类表号来操纵软件工程,在分类法中应用数据挖掘技术的先决条件,就是要构建相应的模型,来描述和分类数据集。在分类方法中,最常见的分类方法是判定树法,包含了网络分类法和支持向量机法。③聚类法。聚类法应用就是将数据分为多种类型,保证数据之间的相似度,不同类型的数据挖掘对象会具有明显的特征,划分法、基于密度法、模型法、网格法、层次法都属于聚类法的应用范畴。
结论:总之,将数据挖掘技术运用到软件工程领域是非常有意义的,该方法可以有效地提高软件工程中的数据处理效率与质量。在将数据挖掘技术应用到实践中的过程中,还必须重视对它的应用内容和方法进行进一步的研究,只有这样,才能将数据挖掘技术应用到软件工程中去。
参考文献
[1]王彬彬.“互联网+”时代下数据挖掘技术在软件工程中的应用研究[J].北京印刷学院学报,2021,29(4):148-151.
[2]张金丹.基于大数据时代下软件工程技术的应用研究[J].数字通信世界,2020(7):178-178.
[3]张海霞.数据挖掘在软件工程领域中的应用探讨[J].现代信息科技,2020,4(21):13-16.
[4]王鹏,胥司禄,陈梦杰,孙晓康,金蔓.关于数据挖掘技术在软件工程中的应用分析[J].电脑知识与技术:学术版,2020,16(25):207-208.