基于Pi-Sigma高阶神经网络模型的大学生心理健康异常数据筛选研究
李玄玄 胡玉县 李跃
昆明学院
摘 要:在现代社会转型和教育改革的背景下,大学生的心理健康数据问题引来社会各界高度重视。大学生的心理健康数据是复杂性、多样性的,为此我们要关注“大学生心理健康数据治理”。大学生心理健康数据治理是数据规划、数据获取、数据质量、数据共享、数据标注等心理数据管理的整个生命周期,是心理数据分析领域“智能决策”应用的关键支撑。在心理健康数据筛查工作中,关注异常数据是关键点,对异常数据的处理是确保数据质量和数据准确性的前提。为此,本文将神经网络和心理健康教育研究相结合,通过收集症状自评量表(SCL-90)数据,提出一种基于Pi-Sigma高阶神经网络的心理健康判断模型的异常数据筛查方法。 此方法相比传统的神经网络,不仅增强了非线性能力,有效地克服了“维数灾难”问题;为非线性资料的处理提供了一种新思路,模型具有良好的非线性处理能力,判断结论明确,本文所提方法可以有效的筛选出异常数据点,可使大学生心理健康数据分析与判断的结果更加精确,具有一定的适应能力。
关键词:Pi-Sigma高阶神经网络;大学生;心理健康;异常筛选;SCL-90
引言
大学生受到的负面情绪的影响和心理压力不断堆积,慢慢的便会患上或轻或重的心理疾病,因此,大学生心理健康是正常学习和生活的重要保障之一。一个个鲜活的生命无时无刻不在告诫着高校和社会,大学生心理健康应该成为与之重视的话题[1-3]。为解决这一情况,通过在网上查找官方、权威的筛查心理健康问题的问卷调查和问卷答题分数所对应的心理健康数据情况分析,以SCL-90的因子得分作为建立数学模型的基本数据,构建神经网络模型来筛查出患有心理疾病的大学生。
一、模型的构建
1.首先编写出一套主要针对大学生年龄阶段的问卷调查试题,并在普通心理健康调查试卷基础之上做出两点改进:①在编写问卷调查时设置答题时间限制,以防存在有人在短时间内草草完成电子问卷的填写;②当学生提交了问卷调查之后,我们利用自己编写的程序对数据做出“清洗”的步骤。以上两点能尽可能地规避因学生主观因素而造成的数据异常。
2.其次发展了异常信息智能筛选技术,其特点就是①通过找出数据集的中心数据。测量子元素和总体数据集间的数据偏移率,选择出偏移量最小的结果,即为中心数据;②设置中心半径。以中心数据为圆心,选取一个合适的内切圆周半径,使得整个圆周运动范围的信息量超过了总体数据的信息总和的一半;③数据标注。把圆遮盖的数据,添加标注为0(表示数据正常);把圆没有遮盖的数据,添加标注为1(表示数据异常);④获取平衡数据集。从标注为零的数据集中随机抽取一半的数据,首先归入训练集,接着又从标注为一的数据集中随机抽取一半的数据归入训练集,由此得到最终的训练数据集;把标注为零的数据集中和标注为一的数据集中剩下各一半的结果归入测试集,由此得到测试数据集;⑤训练方式。通过使用Pi-Sigma高阶神经网络[4]的训练方法,能够寻找到对最优权向量的判断阈值;⑥识别异常的方式。根据待确定的数据,从通过训练后的Pi-Sigma神经网络中,可以计算出输出数值,当输出数值不小于判定阈值时,则认为该数据准确,无需进一步处理;当实际输出数值小于判定阈值时,则认为该数据为异常;
最后,自动抽取、存储异常数据。通过计算机系统把判断为异常的数据,提取并存储起来。
第三章 案例应用
3.1 数据预处理
编写问卷调查试题:①设置时间限制;②数据清洗;以上两点都能尽可能地规避因学生主观因素而造成的数据异常,从而最终得到数据集X,X=(X1,X2,L,X,L,,X12),数据集X包含12个数据。
实施例:以某同学的心理健康答卷分数为例 (因为结果要求不同,我们的数据在预处理时要加上负号)
3.2 具体实施方式
通过计算子元素Xi与总体数据集X的各个均值与协方差矩阵,得到子元素Xi与总体数据集X的数据偏移量:
根据最小原则,确定出中心数据:X11。
采用Pi-Sigma高阶神经网络模型进行心理健康数据的异常数据筛选:①寻找数据集的中心数据;②设置两个中心半径;③数据标注。将圆遮盖的所有数据,全都标注为0(表示数据正常)。剩下数据标注为1(表示数据异常);④获取平衡数据集。从标注为零的数据集中随便抽取一半的数据,归入训练集(H0),再从标注为一的数据集中随便抽取一半的数据,归入训练集;剩余一半数据归入测试集(H1),由此得到训练数据集(H0)和测试数据集(H1),
⑤训练模式:将Pi-Sigma高阶神经网络用来训练模型,然后求出最优权向量和所需要的确定阈值;⑥检测结果是否异常:将实际输出值与阈值对比。
然后保持w*不变,把H1数据输入后,得出实际输出值,
当判断阈值为A*=0.5015时,大学生心理健康数据判断结果准正确率最高为83.33%。
判断异常数据结论:
另外列出以下三个数据:X13=[-23,-22,-19,-27,-14];X14=[-27,-34,-31,-25,-14];X15=[-33,-29,-41,-18,-21],然后再将以上数据各自输入到已经训练好的Pi-Sigma模型里面,得到结果:y13=0.5008;y14=0.5012;y15=0.5017。
因为y13<A*,所有X13数据异常,说明X13的心理健康可能存在问题,需要引起重视和关注。
因为y14<A*,显示X14数据异常,并且原始数据异常,所有X14数据异常,说明X14的心理健康可能存在问题,需要引起重视和关注。
因为y15>A*,显示数据正常,但是X15数据有一项异常,所以X15正常。说明X13的心理健康正常,不存在心理问题。
(从X15的分数可看出,一个人的心理测评五个方面有一个方面显示异常时,这个人的心理还是较为健康的,但是X14的测评结果中四个方面都出现了异常,所以这个人的心理大概率出现了问题,所以X14的判断正确)
3.3 分析与结果
针对大学生心理健康收集的数据,先输入训练好的Pi-Sigma神经网络中,再计算出输出值,当输出值大于等于判断阈值时,则判断该数据正常,无需处理;当输出值小于判断阈值时,则判断该数据异常;最后,得出的结果就可以判别该大学生的心理健康存在问题,对于所得异常数据教育工作者需要引起重视和关注。
第六章 总结
本次研究对于之前有关新冠疫情对大学生的心理健康的影响、新媒体时代下大学生的心理健康和基于SCL-90、UPI量表的体质健康与心理健康的相关性等实验研究进行验证与补充,我们的研究结果与新冠疫情对大学生的心理健康的研究结果一致,并且我们对学校人群基数大的问题进行优化,避免了抽查有可能带来的实验结果偏差。同时我们采取经过国际标准认证的SCL-90心理健康预测表,使得研究结果更加具有说服力。本次研究还只是对心理健康有问题的学生进行初步筛查,并将异常数据保存以便于后面的研究,对心理异常的学生进行一对一的谈话,才能确定学生心理健康问题的严重程度。这是我们目前还需要进行改进的地方。以上就是我们的实验成果,以及对前人研究的完善和改进,以及目前存在的问题。
参考文献
[1]王倩.教育大数据的数据挖掘分析及问题研究[J].中国教育信息化,2018(13):7.
[2]亓文娟.黄书城.统计分析及关联挖掘在大学生心理健康中的应用[J].计算机系统应用,2014(10):229.李云飞.异常观测数据的统计检验方法研究[D].四川:电子科技大学,2005.
[3]廖燕萍.互联网时代高校关于大学生心理健康工作策略探析[J].青年与社会,2019,19:205~206
[4]聂永,邓伟.Pi-sigma神经网络混合学习算法及收敛性分析[J].计算机工程与应用,2008,44(35):56-58.
课题信息:云南省大学生创新创业训练计划项目,项目编号:S202311393002