缩略图

基于时间序列预测与线性回归的养老行业关联分析

作者

刘芸菲

辽宁大学 辽宁沈阳 110036

一、全国老龄化程度的描述

1. 描述性统计

在探讨老龄化程度的预测与关联度分析前,研究有必要对全国老龄化程度进行细致的描述,以此令读者对我国老龄化有一个初步的了解。

研究发现,在 21 世纪之前,全国与辽宁省老年抚养比基本持平,但在此之后,辽宁省的老年抚养比进入快速增长阶段,远超全国平均水平,证明近20 年来,辽宁省的养老负担较全国其他地区更为严峻。

2. 区域差异性

2.1 聚类模型的应用

通过查阅大量文献,本文为聚类定义了三个维度,即老年人口、经济水平、社会环境。

三项指标单位不同,在聚类之前必须进行标准化操作。

使用 Z-score 标准化:将各样本按欧式距离聚为 k 类,计算各类的质心样本,以此作为聚类中心,重复上述操作,进行30 次迭代。

本文采用肘部图来取定最合适的 k 值,使得 k 值下的误差平方和取最小。

将得到的 SSE 数据绘制成肘部图,发现当 k=6 时,SSE 出现显著下降趋势,因此本文将各省老龄化情况分为6 类

2.2 聚类结果

根据聚类谱系图,本文将各省分为以下六类:

第一类:北京、上海;

第二类:天津、浙江;

第三类:河北、湖北等;

第五类:江苏、山东;

第六类:广东。

本文通过老年人口、经济水平、社会环境将中国各省市划分为六类,辽宁省属于其中的第三类,与中国众多省份处于相似的老龄化社会阶段。

二、全国老龄化程度的预测

1. 序列的检验

本文将从平稳性、白噪声两方面对时间序列进行检验。

1.1 平稳性检验

通过观察时序图,即随着延迟期数的增加,平稳序列的自相关系数始终在 0 上下浮动,并且很快的衰减到 0,在 95% 的置信水平下,相关系数趋于0,证明该时间序列是平稳序列。

1.2 白噪声检验

平稳性检验通过后,还要进行白噪声检验。白噪声指序列完全随机,即过去对未来不产生作用,若序列为非白噪声序列,便失去了预测的本质目的了,因此,白噪声检验是有必要的。

在这里,笔者使用Ljung-Box 检验对序列进行检验。

建立检验统计量,Ljung-Box 检验统计量近似服从于自由度为 m的 x2 分布。

该序列的显著性 p 值为 0.974,符合 p>0.05 的情况,接受原假设,该序列为白噪声序列,序列的残差是随机的,证明本研究的预测是有意义的。

2. 时间序列模型的应用

笔者查阅相关资料,得到指数平滑法的预测公式,对过去时刻的数据进行加权平均作为未来时刻的预测结果,过去时刻的权重和为1。从拟合结果来看,指数平滑法的拟合优度 R2 为 0.996,平稳 R2 为 -0.054,且检验的离群数为0,说明序列的拟合效果极佳。

三、地区养老行业发展的关联性

1. 基于相关系数模型的分析

在这里,笔者选用 Pearson 相关模型进行分析,但在此之前,需要对数据进行正态性检验,否则该模型无意义。

1.1 正态性检验

绘制Q-Q 图,来验证数据的正态性。

1.2 峰度偏度检验

接下来,笔者将通过判断两组变量的偏度和峰度,来判断数据的对称性。

将数据代入公式中,发现两组数据的系数均在区间 (-1.96,1.96) 之间,数据符合正态分布。

1.3Pearson 相关系数模型的应用正态检验通过后,开始进行Pearson 相关分析。

计算 Pearson 相关系数,在显著性水平 a=0.05 的情况下,显著性水平小于 0.05,证明两变量之间有显著的相关性,其 Pearson 相关性系数为 -0.406,呈现较为显著的负相关关系,说明某省份地区生产总值越高,其用床率越低。

这一现象是很好理解的,某地经济水平越高,代表该地有能力建造更多养老相关的基础设施,其床位也就越多,单个床位所需服务的人数也就越少,其用床率也就越低。

2. 基于线性回归模型的分析

通过相关性分析已经得到了地区经济水平与养老行业发展情况存在着较为显著的关系,至于两变量之间的关系要如何用函数关系来量化,这便是接下来要探讨的内容。

将数据导入至 SPSS 中,对两变量应用线性回归模型。首先,检验回归模型的合理性。

R 为 0.406,与 Pearson 相关系数相一致,调整后的 R2 为 0.131,接近于0,证明该线性模型拟合效果良好。

最后,得到两变量之间的线性关系。

整理形成函数关系如下: ω=65.397-0.650⋅gdp

至此,地区经济水平与养老行业发展情况的相关性可以使用函数进行量化。方便了研究的后续开展。经济水平较为落后的地区,其养老基础设施必然较差,相关企业可以入驻当地,占领更多养老市场。

参考文献

1. 中华人民共和国国家统计局. 中国统计年鉴[J]. 北京: 中国统计出版社 , 2022.

2. 辽宁省统计局 . 辽宁统计年鉴 [J]. 北京 : 中国统计出版社 ,2022.

3. 曾如明. K-means 聚类算法的改进及其应用研究[D]. 西华师范大学 ,2023.DOI:10.27859/d.cnki.gxhsf.2022.000453.

4. 姜启源 , 谢金星 , 叶俊 . 数学建模 [M]. 第 4 版 , 北京 : 高等教育出版社.

5. 司奎守 , 孙玺菁 . 数学建模算法与应用 [M]. 北京 : 国防工业出版社 ,2012.

作者简介:刘芸菲,女,2004.09.06 辽宁省本溪市,在校学生,数学与应用数学专业。