- · 《长江丛刊》栏目设置[05/29]
- · 《长江丛刊》收稿方向[05/29]
- · 《长江丛刊》投稿方式[05/29]
- · 《长江丛刊》征稿要求[05/29]
- · 《长江丛刊》刊物宗旨[05/29]
基于多元统计分析的长江仪征段水质评价
作者:网站采编关键词:
摘要:水是生命之源,也是不可替代的资源,水环境的质量一直备受关注,许多专家学者也一直在从事水质方面的研究[1-9].本文根据2014年长江仪征段水质监测的有关数据,利用主成分分析和聚
水是生命之源,也是不可替代的资源,水环境的质量一直备受关注,许多专家学者也一直在从事水质方面的研究[1-9].本文根据2014年长江仪征段水质监测的有关数据,利用主成分分析和聚类分析的方法[10-11],找出影响长江仪征段水质的主成分,将样本水质进行分类,给出样本水质综合得分,并对长江仪征段2014年水质进行综合评价.
1 水质样本
长江仪征段设立小河口上游3个监测点、仪征化纤取水口3个监测点、泗源沟下游3个监测点共9个监测断面,断面编号分别为Y101-1、Y101-2、Y101-3、Y102-1、Y102-2、Y102-3、Y103-1、Y103-2、Y103-3,本文取2014年的监测数据作为水质样本,监测变量为溶解氧DO、高锰酸盐指数CODMn、五日生化需氧量BOD5、氨氮NH4-N、化学需氧量CODCr、总氮含量TN、总磷含量TP,监测数据见表1.
表1 2014年长江仪征段水质监测数据断面月DOCODMnBOD5NH4?NCODCrTNTPY101-117.83.12.00..750.1238.32.21.20..780.1757.62.21.10.0.010.1276.41.70.90..810.1296.82.41.00.06382.560.09117.72.51.30.0.830.10Y101-217.53.22.00..790.1238.32.21.40..330.1657.62.11.10.06692.190.1376.41.60.80..130.1196.82.21.10.06882.520..72.51.30.0.900.10Y101-317.63.32.20..280.1238.32.31.30..460.1757.62.21.00.06392.20.1376.41.60.80..350.1096.82.31.10.06582.510..72.61.30.0.860.10Y102-118.13.62.50..360.1138.22.31.60..470.1657.82.51.20.04492.450.1276.51.60.80..160.1096.62.61.20.04982.360..72.61.40.0.950.10Y102-218.03.52.10..610.1138.22.31.60..210.1657.82.21.00.04992.20.1376.51.60.80..450.1096.62.41.20.04682.380..72.41.20.0.970.10Y102-317.83.62.10..800.1138.22.21.50..470.1757.82.41.10.04692.170.1476.51.50.80..910.1396.62.41.10.04682.430..72.51.20.0.000.10Y103-117.73.92.50..740.1238.22.21.20..470.1757.62.21.00.06892.010.1576.61.60.80.0.920.1096.72.31.00.04982.430..72.61.30.0.410.11Y103-217.93.92.30..640.1238.22.21.20..430.1657.62.31.10.07192.170.1476.61.60.80.0.860.1296.72.21.00.04682.470.09117.72.51.30.0.370.11
Y103-318.03.72.30..370.1238.22.31.20..530.1657.62.21.00.06692.380.1376.61.70.80.0.850.1096.72.01.00.04982.430..72.41.20.0.400.10
2 多元统计的主成分分析方法
2.1 主成分分析的基本思想[12]
主成分分析是采取一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关.一般将原来的变量做线性组合作为新的综合变量,选取的第一个线性组合即第一个综合变量记为 F1,F1是方差最大的,故称F1为第一主成分.如果第一主成分不足以代表原来p个变量的信息,再考虑选取F2,即第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1F2)=0,称F2为第二主成分,依此类推可以构造出第三、四……第p个主成分.
2.2 主成分分析的数学模型[12]
对于一个样本资料,观测p个变量x1,x2,…,xp,n个样品的数据资料阵为:
,
其中,p.
主成分分析就是将p个观测变量综合成为p个新的变量(综合变量),即
简写为Fj=aj1x1+aj2x2+…+ajpxp ,j=1,2,…,p.
要求模型满足以下条件:
(1)Fi,Fj互不相关(i≠j,i,j=1,2,…,p);
(2)F1的方差大于F2的方差,F2的方差大于F3的方差,依次类推;
,p.
于是,称F1为第一主成分,F2为第二主成分,依此类推,有第p个主成分.主成分又叫主分量,这里aij称为主成分系数.
上述模型可用矩阵表示为F=AX,其中
A称为主成分系数矩阵.
2.3 主成分分析的计算步骤[12]
样本观测数据矩阵为:
(1) 对原始数据进行标准化处理
,
其中).
(2)计算样本相关系数矩阵
为方便,假定原始数据标准化后仍用X表示,则经标准化处理后的数据的相关系数为
).
(3)求相关系数矩阵R的特征值(λ1,λ2,…,λp)和相应的特征向量ai=(ai1,ai2,…aip),i=1,2,…,p.
文章来源:《长江丛刊》 网址: http://www.cjckzzs.cn/qikandaodu/2020/1227/513.html