• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      城市空氣污染數(shù)據(jù)的分析與研究

      2016-03-14 06:51:08楊小雷湯鳳香
      高師理科學(xué)刊 2016年12期
      關(guān)鍵詞:二階方差空氣質(zhì)量

      楊小雷,湯鳳香

      (佳木斯大學(xué) 理學(xué)院,黑龍江 佳木斯 154007)

      城市空氣污染數(shù)據(jù)的分析與研究

      楊小雷,湯鳳香

      (佳木斯大學(xué) 理學(xué)院,黑龍江 佳木斯 154007)

      針對(duì)日益嚴(yán)重的大氣污染問題,基于現(xiàn)有數(shù)據(jù)與相關(guān)研究,采用相關(guān)分析法,對(duì)AQI指標(biāo)之間的相關(guān)性進(jìn)行了定量分析.利用主成分分析,確定PM10為被解釋變量,其它4種污染物為解釋變量,應(yīng)用逐步回歸分析方法及多元回歸分析,通過逐層分析比較得到了PM10與PM2.5,CO,SO2,NO2的最優(yōu)二次回歸模型.

      空氣污染;相關(guān)分析;主成分分析;逐步回歸分析

      1 問題背景

      1.1 問題的提出

      近年來,隨著城市空氣污染的加劇以及廣大民眾對(duì)生活環(huán)境與質(zhì)量要求的日益提高,空氣質(zhì)量(AQI)越來越受到廣大民眾與政府相關(guān)部門的重視.AQI主要指標(biāo)有PM10,PM2.5,CO,NO2,SO2,探究這些污染物之間關(guān)系對(duì)空氣污染的治理具有一定的現(xiàn)實(shí)意義.

      1.2 模型假設(shè)

      假設(shè)1 監(jiān)測(cè)數(shù)據(jù)是用統(tǒng)一的設(shè)備配置與標(biāo)準(zhǔn)獲得的;

      假設(shè)2 所有空氣質(zhì)量數(shù)據(jù)的誤差均相互獨(dú)立,并且服從正態(tài)分布

      假設(shè)3 空氣質(zhì)量的5個(gè)指標(biāo),其監(jiān)測(cè)是相互獨(dú)立的.

      1.3 符號(hào)說明

      本文中2σ為方差;α為顯著性水平,一般設(shè)為0.05或更小,本文設(shè)為0.01;y表示PM10的值;x1表示PM2.5的值;x2表示CO的值;x3表示NO2的值;x4表示SO2的值.

      2 模型求解

      2.1 預(yù)備知識(shí)

      2.1.1 相關(guān)分析 在直線相關(guān)條件下,相關(guān)系數(shù)是2個(gè)變量x和y之間相關(guān)關(guān)系的方向和密切程度的綜合性指標(biāo)[1],記為r,則有

      其中:n為樣本容量;r取正值或負(fù)值決定于分子協(xié)方差;r的絕對(duì)值在0與1之間,其絕對(duì)值大小可說明現(xiàn)象之間相關(guān)關(guān)系的緊密程度,具體標(biāo)準(zhǔn)為:當(dāng)時(shí),變量x和y沒有關(guān)系;當(dāng)時(shí),變量x和y低程度相關(guān);當(dāng)時(shí),變量x和y呈顯著相關(guān);當(dāng)時(shí),變量x和y呈高度相關(guān).

      2.1.2 主成分分析 主成分分析也稱主分量分析[2-3],旨在利用降維的思想(本文利用其性質(zhì)即貢獻(xiàn)率)把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo).

      具體分析步驟為:

      Step3 對(duì)m個(gè)主成分進(jìn)行綜合評(píng)價(jià).對(duì)m個(gè)主成分進(jìn)行加權(quán)求和,即得最終評(píng)價(jià)值,權(quán)數(shù)為每個(gè)主成分的方差貢獻(xiàn)率.

      Step4 求KMO測(cè)度.

      該方法是SPSS提供的判斷原始變量是否適合作主成分分析的統(tǒng)計(jì)檢驗(yàn)方法之一,它比較了觀測(cè)到的原始變量間的相關(guān)系數(shù)和偏相關(guān)系數(shù)的大小.一般而言,KMO測(cè)度大于0.5意味著因子分析可以進(jìn)行,當(dāng)KMO的測(cè)度大于0.7時(shí),則其是令人滿意的值.

      對(duì)于n組獨(dú)立觀測(cè)值,設(shè),其中:相互獨(dú)立.設(shè)最小二乘法就是選擇β0和β1的估計(jì)和,使得,而此時(shí)yi所對(duì)應(yīng)的值稱為回歸值,記為.

      回歸直線與各觀測(cè)點(diǎn)的接近程度稱為回歸直線對(duì)數(shù)據(jù)的擬合優(yōu)度.為了說明直線的擬合優(yōu)度,引進(jìn)判定系數(shù)

      (2)當(dāng)R2=1時(shí),原始數(shù)據(jù)的總變異完全可以由擬合值的變異來解釋,并且殘差為零,即擬合點(diǎn)與原始數(shù)據(jù)完全吻合;

      (3)當(dāng)R2=0時(shí),回歸方程完全不能解釋原始數(shù)據(jù)的總變異.

      判定系數(shù),一方面反映了解釋的變異占總變異的百分比,從而說明回歸直線擬合的優(yōu)良程度;另一方面,它從相關(guān)性的角度,說明原因變量y與擬合變量的相關(guān)程度,從這個(gè)角度看,擬合變量與原變量y的相關(guān)度越大,擬合直線的優(yōu)良度就越高.

      2.1.4 多元回歸分析 多元回歸分析可以看成是一元線性回歸分析的擴(kuò)展[5].多重判定系數(shù)2R是多元回歸中回歸平方和占總平方和的比例,它是度量多元回歸方程擬合程度的一個(gè)統(tǒng)計(jì)量,反映在因變量y的變差中被估計(jì)的回歸方程所解釋的比例.

      對(duì)于多重判定系數(shù)有一點(diǎn)需要注意:給模型增加自變量時(shí),多重判定系數(shù)也隨之增大,然而多重判定系數(shù)的代價(jià)是殘差自由度的減少,因?yàn)闅埐钭杂啥鹊扔跇颖緜€(gè)數(shù)與自變量個(gè)數(shù)之差.自由度小意味著估計(jì)和預(yù)測(cè)的可靠性低.這表明,當(dāng)一個(gè)回歸方程涉及的自變量很多時(shí),回歸模型的擬合從表面上看是良好的,而區(qū)間預(yù)測(cè)和區(qū)間估計(jì)的幅度卻變大,以致失去實(shí)際意義.為此,利用樣本量n和自變量的個(gè)數(shù)k去調(diào)整,計(jì)算出調(diào)整的多重判定系數(shù),記為,其計(jì)算公式為

      2.2 數(shù)據(jù)的預(yù)處理與被解釋變量的確定

      2.2.1 數(shù)據(jù)的處理與相關(guān)分析模型的求解 本文采用廣東省東莞、深圳和廣州3個(gè)地區(qū)從2014-06-01—2015-05-31的空氣質(zhì)量監(jiān)測(cè)數(shù)據(jù).由于收集的數(shù)據(jù)有缺漏,存在一些缺省值,所以在分析時(shí)首先利用SPSS對(duì)其缺省值進(jìn)行了直接剔除,得到可用于統(tǒng)計(jì)分析的數(shù)據(jù)集(見表1)(由于篇幅限制,僅示意性列出最前2次與最后1次觀測(cè)值).3個(gè)城市的空氣質(zhì)量數(shù)據(jù)經(jīng)預(yù)處理后,由SPSS Pearson[6-8]求得AQI的5種指標(biāo)之間的相關(guān)矩陣表(見表2).

      表1 廣東省東莞、深圳和廣州3個(gè)地區(qū)空氣污染數(shù)據(jù)

      表2 5種空氣質(zhì)量指標(biāo)間的相關(guān)矩陣

      由表2可以看出,聯(lián)系最為緊密的監(jiān)測(cè)指標(biāo)組依次為:(PM2.5,PM10),(PM10,NO2),(PM10,CO),(PM2.5,NO2),且PM10與PM2.5間相關(guān)系數(shù)為0.929,呈高度正相關(guān),且相關(guān)系數(shù)相對(duì)較大;PM10與CO,NO2,SO2間相關(guān)系數(shù)分別為0.683,0.706,0.572,呈顯著正相關(guān),且除了SO2與CO之間的相關(guān)系數(shù)低于0.572以外,其余各指標(biāo)之間相關(guān)系數(shù)均超過0.572,且均在α=0.01水平上顯著,因此各指標(biāo)之間顯著相關(guān).

      2.2.2 運(yùn)用主成分分析求解AQI的被解釋變量 利用主成分分析法對(duì)AQI中5項(xiàng)監(jiān)測(cè)指標(biāo)求解KMO,進(jìn)行Bartlett的檢驗(yàn),并求取解釋的總方差(見表3~4).

      表3 KMO和Bartlett的檢驗(yàn)

      表4 解釋的總方差

      由表3可以看出,KMO測(cè)度為0.805>0.7,表示變量之間的相關(guān)性很好;而Bartlett球形度檢驗(yàn)中的顯著性水平值為0,達(dá)到了極其顯著水平,這表明原變量之間具有明顯的結(jié)構(gòu)性和相關(guān)性,可以進(jìn)行主成分分析.

      由表4可以看出,PM10的特征值為3.476,方差貢獻(xiàn)率為69.523%,是方差貢獻(xiàn)率最大的一個(gè)主成分.因此,可以確定PM10為被解釋變量,PM2.5,NO2,CO,SO2為解釋變量.

      2.3 求解PM10最優(yōu)回歸模型

      2.3.1 PM10與PM2.5,CO,NO2,SO2多元一次及二次線性回歸模型求解 由于PM10與PM2.5,CO,NO2,SO2等指標(biāo)之間具有一定的相關(guān)性和獨(dú)立性,應(yīng)用Matlab的regress(Y,X,α)函數(shù)[9],對(duì)多個(gè)候選回歸模型進(jìn)行逐步回歸,分別求得多元一次回歸方程

      與多元二次方程

      2.3.2 PM10與PM2.5,CO,NO2,SO2多元二階多項(xiàng)式回歸模型求解 考慮到兩兩因素之間的交互關(guān)系,應(yīng)用Matlab對(duì)PM10的多元二階多項(xiàng)式回歸模型進(jìn)行求解,得

      3 模型評(píng)價(jià)

      3.1 模型的優(yōu)點(diǎn)

      (1)通過逐層比較,建立了相對(duì)優(yōu)化的多元二階多項(xiàng)式回歸模型,得出了令人滿意的結(jié)果;

      (2)通過所求多元二階多項(xiàng)式回歸模型的置信區(qū)間可以用來判斷一些數(shù)據(jù)的真實(shí)性;

      (3)利用多元二階多項(xiàng)式回歸模型可以通過控制變量來預(yù)測(cè)某一數(shù)據(jù)或數(shù)據(jù)走勢(shì);

      (4)可以做出關(guān)于PM10的多元二階非線性回歸模型(3)的殘差分析圖,直觀感受模型的擬合程度;

      (5)所有樣本信息結(jié)合在一起分析,增加了分析的可靠性.

      3.2 模型的缺點(diǎn)

      (1)通過網(wǎng)絡(luò)搜集到的數(shù)據(jù)本身可能存在不真實(shí)性,從而導(dǎo)致建立的模型不能準(zhǔn)確地辨別出不真實(shí)的數(shù)據(jù);

      (2)由于地域差異性的存在,使得建立的模型不能適應(yīng)所有地區(qū)的空氣質(zhì)量數(shù)據(jù);

      (3)PM10與PM2.5,CO,NO2,SO2的多元高階回歸模型可能效果更佳,因此還可以繼續(xù)探究PM10與PM2.5,CO,NO2,SO2的多元高階關(guān)系.

      [1]賈俊平,何曉群,金勇進(jìn).統(tǒng)計(jì)學(xué)[M].北京:中國(guó)人民大學(xué)出版社,2012:30-31

      [2]張志涌.MATLAB教程[M].北京:北京航空航天大學(xué)出版社,2010:20-25

      [3]杜強(qiáng),賈麗艷.SPSS統(tǒng)計(jì)分析從入門到精通[M].北京:人民郵電出版社,2011:18-20

      [4]何曉群,劉文卿.應(yīng)用回歸分析[M].北京:中國(guó)人民大學(xué)出版社,2015:48-55

      [5]何曉群.多元統(tǒng)計(jì)分析[M].北京:中國(guó)人民大學(xué)出版社,2004:21-23

      [6]謝志英,劉浩,唐新明.北京市近12年空氣污染變化特征及其與氣象要素的相關(guān)性分析[J].環(huán)境工程學(xué)報(bào),2015,9(9):4471-4478

      [7]鄧霞君,廖良清,胡桂萍.近10年中國(guó)主要城市空氣API及與氣象因子相關(guān)性分析[J].環(huán)境科學(xué)與技術(shù),2013,36(9):70-75

      [8]楊光霞,謝華.SPSS數(shù)據(jù)統(tǒng)計(jì)與分析[M].北京:清華大學(xué)出版社,2014:54-60

      [9]司守奎,孫璽菁.數(shù)學(xué)建模算法與應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2012:45-50

      Analysis and study of urban air pollution data

      YANG Xiao-lei,TANG Feng-xiang
      (School of Science,Jiamusi University,Jiamusi 154007,China)

      Aiming at increasingly serious air pollution problems,use correlation analysis to make an quantitative analysis for the correlation between the AQI indicators based on existing data and the related research, and principal component analysis is used to determine that PM10is the explained variable,the other four kinds of pollutants are explained variable.Using stepwise regression analysis method and multiple regression analysis,through analysis step by step and comparison get the optimal quadratic regression model between PM10and PM2.5,CO,SO2,NO2.

      air pollution;correlation analysis;principal component analysis;stepwise regression analysis

      O213.1

      A

      10.3969/j.issn.1007-9831.2016.12.003

      2016-07-30

      佳木斯大學(xué)科研項(xiàng)目(13Z1201585)

      楊小雷(1991-),男,安徽宿州人,在讀本科生.E-mail:577560628@qq.com

      湯鳳香(1978-),女,黑龍江安達(dá)人,講師,碩士,從事應(yīng)用數(shù)理統(tǒng)計(jì)研究.E-mail:54993661@qq.com

      1007-9831(2016)12-0012-05

      猜你喜歡
      二階方差空氣質(zhì)量
      方差怎么算
      概率與統(tǒng)計(jì)(2)——離散型隨機(jī)變量的期望與方差
      一類二階迭代泛函微分方程的周期解
      計(jì)算方差用哪個(gè)公式
      一類二階中立隨機(jī)偏微分方程的吸引集和擬不變集
      二階線性微分方程的解法
      一類二階中立隨機(jī)偏微分方程的吸引集和擬不變集
      方差生活秀
      “空氣質(zhì)量發(fā)布”APP上線
      車內(nèi)空氣質(zhì)量標(biāo)準(zhǔn)進(jìn)展
      汽車與安全(2016年5期)2016-12-01 05:22:14
      澄迈县| 九江市| 阳江市| 繁峙县| 武安市| 山西省| 马山县| 诸城市| 凤阳县| 林口县| 彭山县| 连山| 民乐县| 本溪市| 奉化市| 铜鼓县| 来宾市| 灵台县| 温宿县| 开鲁县| 台安县| 大石桥市| 沅江市| 石泉县| 台江县| 紫金县| 承德县| 清河县| 新乐市| 林芝县| 宁化县| 廊坊市| 昭通市| 商水县| 石首市| 信阳市| 弋阳县| 卓资县| 芦山县| 如皋市| 白河县|