缩略图
Mobile Science

主成分分析法在空气污染物数据分析中的应用

作者

余瑾怡

福建师范大学经济学院 福建福州 350108

1. 引言

本文通过对聊城市 2021 年测得的 6 种空气污染物数据,即 PM2.5 、 PM10 、SO2 、CO、 03 、 NO2 年均值浓度数据,运用主成分分析,主要对各乡镇、街道以及园区进行分析,分析出了受空气质量综合影响的主要区域,以期对聊城市空气质量的改善提供参考,也可以为进一步研究污染生成的天气学条件及其预报提供科学依据 [1]。

2. 数据来源与研究方法

2.1 数据来源

空气污染物数据由聊城市生态环境局网站提供,包括聊城市 2021 年1月1日到2021 年12 月31 日主要大气污染物( SO2 、 NO2 、CO、 03 、 PM10 、 PM2.5 )质量浓度日数据,每个监测站点会记录每日每小时的 PM2.5 、 PM10 、 SO2 、CO、O3 、 NO2 指标数值,各站点各指标当日均值通过当天每时均值获得,可在每日均值的基础上计算出各站点月均值和年均值 [2]。对相应站点均值进行平均计算,可得到整个聊城市各个监测站点对应时间段均值。为研究聊城市不同区域的空气质量问题,根据聊城市各区地理位置及政府相关文件,将聊城市域划分为多个县区域。各个区域的空气质量可通过对区域内所有监测站点值取均值获得。

2.2 研究方法

主成分分析(Principal Component Analysis,PCA)是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法,又称主分量分析 [3]。本文主成分分析法的具体步骤: ① 对空气污染物数据进行标准化处理; ② 计算相关系数,建立相关系数矩阵; ③ 进行KMO 检验和Barlett(巴特利)检验; ④ 计算各主成分特征值和特征向量; ⑤ 识别主成分的贡献率和累计贡献率; ⑥ 计算各个主成分的得分; ⑦ 计算综合得分 [4]。

3. 结果与分析

本文以聊城市生态环境局网站提供的 2021 年空气污染物浓度年均值的数据为研究对象,利用主成分分析法 (PCA) 根据 SO2 均值浓度、 NO2 均值浓度、PM10 均值浓度、 PM2.5 均值浓度、C0 浓度、 03 浓度等空气污染物指标对聊城市142 个监测站点进行排序评估。并确定 SO2 均值浓度、 NO2 均值浓度、 PM10 均值浓度、 PM2.5 均值浓度、C0 浓度、 03 浓度作为统计分析变量,得到一个原始样本数据矩阵。运用 SPSS 统计分析软件对数据进行主成分分析。为了消除由于量纲不同可能引起的不利影响,对原始数据进行标准化处理。

运用 SPSS 软件对数据矩阵进行相关性分析,得到空气污染物的线性相关系数矩阵。在通过 SPSS 软件用主成分分析法提取主成分,并按照特征值大于 1的原则,提取 3 个主成份,其特征值分别是 2.140、1.540、1.154,且累计方差贡献率为80.55780,故可以提取前3 个主成分。进一步计算各主成分的特征向量.

计算结果如:SO2 均值浓度(成分1 :0.329,成分 2:-0.228 ,成分 3 :0.395)、NO2 均值浓度(成分 1:-0.270 ,成分 2:0.233 , 成 分 3 :0.342)、PM10 均值浓度(成分 1:0.174 ,成分 2:0.567 ,成分 3:-0.034 )、PM2.5 均值浓度(成分 1:0.332 ,成分 2:0.401 ,成分 3:-0.009 )、CO 浓度(成分1 :0.368,成分 2:-0.234 ,成分 3:0.126 )、 03 浓度 (成分 1:-0.099 ,成分 2:0.082 ,成分 3:0.759 )

本文以各主成分的特征向量为系数,计算各主成分得分。

本文最终以三个主成分的特征值为权,对三个主成分进行加权综合,得出各个监测站点的综合得分 . 前三排序为:鱼邱湖街道( , y2:1.67 ,y3 :0.21,y:1.63),燕店镇(y1 :1.2, y2 :0.88,y3 :2.24,y:1.35),老赵庄镇(y1 :1.57, y2:0.57 ,y3 :1.11,y:1.14)。

注:因数据太多,只列出了排名前5 的站点。

本文根据 SPSS 计算的各个主成分的得分及综合得分,可以发现鱼邱湖街道在聊城市 142 个站点中综合排名为第一。其中由中的各站点的原始数据知,鱼邱湖街道 2021 年的 NO2 年均值浓度为 37μg/m3 , PM10 年均值浓度为 87μg/ m3 , PM2.5 均值浓度为 48μg/m3 。而 GB 3095-2012《环境空气质量标准》规定的 NO2 的二级标准为年平均浓度不超过 40μν/m3 , PM10 的二级标准为年平均浓度不超过 , PM2.5 的二级标准为年平均浓度不超过 35μg/m3 , PM2.5 的二级标准为年平均浓度不超过 35μg/m3o 通过鱼邱湖街道的原始数据与《环境空气质量标准》规定的浓度限值进行比较可知,鱼邱湖街道的环境空气质量并不完全达标,其还存在着一定的不足。并且将表 6 中的其他站点的原始数据与《环境空气质量标准》规定的浓度限值进行比较,发现聊城市 142 个监测站点的数据中 PM2.5 与 PM10 的年均值浓度大都不符合《环境空气质量标准》。

4. 结论

本文通过对空气污染物指标进行主成分分,对聊城市 142 个监测站点进行排序评估。通过计算 SO2 、 NO2 、 PM10 、 PM2.5 、C0、 03 六种空气污染指标的各主成分得分及综合得分,得出聊城市鱼邱湖街道这一地方其空气污染物综合得分最高,从整体来看,主要需要降低 PM2.5 、 PM10 这2 种污染物的浓度,通过将原始数据与《环境空气质量标准》规定的浓度限值进行比较,发现 PM2.5 和 PM10 已经超标,是影响空气质量最为重要的因素。 PM10 、 PM2.5 对人体健康和大气环境都会产生巨大影响,因此,聊城市政府在未来的空气质量改善工作中,应尤为重视对这两种排放物的改善治理。

参考文献:

[1] 王晓丽 , 刘畅 , 关文玲 . 基于主成分分析法的城市大气主要污染物关系研究 [J]. 天津理工大学学报 ,2015,31(2):20-23

[2] 金仁浩, 曾国静, 赵欣然. 北京地区空气质量影响因素分析及预测研究[J].黑龙江科学 ,2022,13(8):46-50

[3]Hotelling, Harold.“Analysis of a complex of statistical variables into principal components.”Journal of Educational Psychology 24 (1933): 498-520.

[4] 张剑 . 湘潭市岳塘区水资源——环境承载能力评价研究 [D]. 河北 : 河北农业大学 ,2017.