曹青 吳哲紅 陳貞宏 徐良軍
摘?要:對安順市2015—2019年包括日平均氣溫、平均相對濕度、平均本站氣壓、日照時數(shù)等18個地面氣象觀測要素和污染累積基礎(chǔ)(前一日AQI值)與當(dāng)日AQI作相關(guān)性分析,選用強相關(guān)因子建立四季多元線性逐步回歸模型,運用等級評分、準(zhǔn)確率、標(biāo)準(zhǔn)化平均誤差(NME)等6種參數(shù)對4個模型預(yù)報效果進(jìn)行評估。得出以下主要結(jié)論:四季AQI與氣象要素值均表現(xiàn)出明顯相關(guān)關(guān)系,春、夏季預(yù)報效果優(yōu)于秋、冬季,四季AQI預(yù)報模型均可以滿足實際運用需求。
關(guān)鍵詞:AQI;相關(guān)性;多元線性回歸;效果評估
中圖分類號:X513?文獻(xiàn)標(biāo)識碼:A
Abstract:Correlation analysis was conducted for 18 meteorological observation elements,including daily average temperature,average relative humidity,average atmospheric pressure,sunshine duration,and pollution accumulation basis(AQI of the previous day)and AQI of the current day in Anshun from 2015 to 2019,and a multiple linear regression model was established with strong correlation factors.Six parameters,such as grade score,accuracy and normalization mean error(NME),were used to evaluate the prediction effects of the four models.The main conclusions are as follows:AQI in four seasons shows obvious correlation with meteorological element values,the forecast effect of spring and summer is better than that of autumn and winter,and the forecast model of AQI in four seasons can meet the practical application requirements.
Keywords:AQI;correlation;multiple linear regression;effect assessment
安順市作為中國優(yōu)秀旅游城市,空氣環(huán)境質(zhì)量是影響旅游發(fā)展關(guān)鍵因素之一[1]。通過對空氣質(zhì)量與氣象條件的關(guān)系研究,可以依據(jù)對有關(guān)氣象要素的預(yù)報在一定程度掌握空氣質(zhì)量發(fā)展趨勢[2]。
國內(nèi)外學(xué)者開展了許多相關(guān)研究,對各類模型進(jìn)行對比分析,葉斯琪等[3]闡述了統(tǒng)計模型在城市空氣質(zhì)量預(yù)報中的應(yīng)用優(yōu)勢,結(jié)果表明:多元回歸模型平均準(zhǔn)確率在4種模型中最高;宋丹等[4]運用多元線性逐步回歸和BP神經(jīng)網(wǎng)絡(luò)方法,對貴陽市2015—2016年AQI建立模型,結(jié)果表明回歸模型優(yōu)于BP神經(jīng)網(wǎng)絡(luò)與CUACE模式;Shams等[5]使用2015年每日空氣污染指數(shù)和氣象要素建立空氣污染指數(shù)多元回歸預(yù)測模型,顯示與非線性模型相比,多元逐步回歸模型預(yù)測AQI的效果較好;Gogikar[6]對在印度阿格拉地區(qū)2011—2015年建立的PM2.5預(yù)報模型,得出多元線性回歸優(yōu)于其他兩種模型的結(jié)論。
本文對安順市2015—2019年每日地面氣象要素與當(dāng)日空氣質(zhì)量指數(shù)(AQI)作相關(guān)性分析,建立多元線性逐步回歸模型,并檢驗?zāi)P皖A(yù)報準(zhǔn)確率,對模型預(yù)報效果進(jìn)行評估。
1 數(shù)據(jù)來源與分析
1.1 數(shù)據(jù)采集
日氣象觀測數(shù)據(jù)來自安順國家基本氣象觀測站,該站為集成式新型自動氣象站,在每日氣象觀測要素值中選出連續(xù)性較好且對氣象條件具有代表性的因子共18個,分為8類,其中平均氣溫、日最高氣溫、日最低氣溫作為氣溫類代表因子,平均濕球溫度、平均相對濕度、平均露點溫度、平均水汽壓作為濕度類代表因子,平均風(fēng)速、最大風(fēng)速、最大風(fēng)速的風(fēng)向(正北向記為1,順時針每30°記為1個整數(shù),以最接近方向記為整數(shù)1到12)表征風(fēng)要素,平均本站氣壓、日最高本站氣壓、日最低本站氣壓、平均海平面氣壓表征氣壓要素,降水量、平均總云量、最小能見度、日照時數(shù)則各自表征降水情況、云量、能見度和日照輻射情況。
每日AQI值由安順市4個國控空氣監(jiān)測站點6種大氣污染物(SO2、NO2、O3、CO、PM2.5、PM10)每日24小時濃度均值計算得出。
1.2 數(shù)據(jù)分析方法
1.2.1 相關(guān)性分析
相關(guān)分析主要是研究兩個變量間線性相關(guān)程度的強弱,即密切程度。本文主要使用了Pearson與Spearman系數(shù),Pearson系數(shù)主要用于定距變量(間隔變量)間相關(guān)分析,計算公式(1)如下:
Spearman系數(shù)主要用于定序變量間相關(guān)分析,計算公式如下:
1.2.2 多元線性回歸方程
在線性回歸中,如果有多個自變量與因變量呈線性關(guān)系,則稱為多元線性回歸分析,多元線性回歸的數(shù)學(xué)模型為:
其中ε表示由于隨機誤差或其他因素的變化引起的y的線性變化部分,其余部分表示由于x的變化引起的y的變化部分。根據(jù)相關(guān)數(shù)據(jù)求得線性方程后,再對方程進(jìn)行F、t檢驗。
1.2.3 模型效果評估
等級評分用于衡量對空氣質(zhì)量等級預(yù)報準(zhǔn)確率:
等級評分=RARA+RB+RC+RD+RE+RF×100%(4)
其中RA表示預(yù)報等級正確的天數(shù),RB、RC、RD、RE、RF分別表示預(yù)報等級絕對誤差為1~5級的天數(shù)[4]。
準(zhǔn)確率用于評價預(yù)報值與實測值之間量化差異[7]:
準(zhǔn)確率=1-預(yù)測值-實測值實測值×100%(5)
標(biāo)準(zhǔn)化平均偏差(NMB)反映的是模型預(yù)報值與實測值的平均偏離程度:
其中cf表示模型預(yù)報值,c0表示實測值。
標(biāo)準(zhǔn)化平均誤差(NME)表示兩者之間平均絕對誤差:
均方根誤差(RMSE)表示模型預(yù)報值與實測值偏離程度,越接近0,表示預(yù)測效果越好[8]:
Pearson相關(guān)系數(shù)(R)來評價模型預(yù)報值與實測值變化趨勢的相關(guān)程度與擬合效果,越接近1,擬合效果越好,R的計算見公式(1)。
2 結(jié)果與討論
2.1 四季AQI相關(guān)性分析
除選用18個日氣象觀測要素值外,將前一日AQI值作為濃度基礎(chǔ)的代表自變量。作相關(guān)性分析,結(jié)果如表1,其中“**”表示雙側(cè)檢驗的顯著性結(jié)果Sig值小于0.01,兩者呈強相關(guān)關(guān)系,“*”表示雙側(cè)檢驗的顯著性結(jié)果Sig值大于0.01小于0.05,兩者呈較強相關(guān)關(guān)系,其余表示兩者相關(guān)性較弱。
四季AQI與氣象要素值均表現(xiàn)出明顯相關(guān)關(guān)系:春季隨著氣溫類別因子、日照時數(shù)和前一日AQI值的升高,空氣質(zhì)量越差;AQI隨著氣壓類別因子、濕度、降水量、云量的增大而減小,空氣質(zhì)量變好;偏東方向的最大風(fēng)速風(fēng)向能使春季空氣質(zhì)量得到改善。夏季隨著日最低氣溫、濕度類別因子、風(fēng)速、降雨量、云量的增大而減小,空氣質(zhì)量得到改善,且偏西方向最大風(fēng)速風(fēng)向有利于大氣污染的擴散。秋季AQI隨著日最高氣溫、氣壓類別因子、日照、前一日AQI增大,空氣質(zhì)量呈下降趨勢;隨著濕度類別因子、風(fēng)速、降水量和云量的增大,空氣質(zhì)量好轉(zhuǎn)。與冬季AQI隨濕度、平均水汽壓、風(fēng)速、降水量、云量的增大而降低,隨著氣溫類別因子、氣壓類別因子、最小能見度、日照、前日AQI的增大而增大。
2.2 四季AQI預(yù)報模型的建立
選定18個因子與前一日AQI值作為自變量,當(dāng)日AQI值為因變量開展分析。除去個別含缺測數(shù)據(jù)的天數(shù),春季共有460組數(shù)據(jù),運用SPSS軟件,選取400組數(shù)據(jù)作相關(guān)性分析并建模,60組數(shù)據(jù)對模型預(yù)報效果進(jìn)行評估;夏季共460組數(shù)據(jù),其中400組建模,60組檢驗;秋季455組數(shù)據(jù),400組建模,55組檢驗評估;冬季450組數(shù)據(jù),400組做分析、建模,50組對模型進(jìn)行檢驗。運用Excel中RAND函數(shù)對數(shù)據(jù)打亂,隨機選取各季分別用于建模與檢驗的數(shù)據(jù)。
運用SPSS軟件建立四季AQI預(yù)報模型分別為:
Y(春)=90.312-0.690E+0.370S+0.945R-0.001Q
Y(夏)=128.141+0.389S-0.708E-3.992C+1.710B-0.618J-2.640H
Y(秋)=94.185+0.506S-0.644E-7.491H-0.258O
Y(冬)=122.444+0.456S-0.833E-7.248H-0.001Q-1.103O
對四季模型進(jìn)行F、t檢驗,F(xiàn)顯著性檢驗值均小于0.05,可知模型回歸效果高度顯著,對各回歸系數(shù)t檢驗顯著性高,表明各因子回歸系數(shù)可用,綜上,模型顯著性高,可作為預(yù)報方程。
2.3 模型預(yù)報效果評估
從模型評估結(jié)果(表2)來看,春季等級評分稍低,未達(dá)70%,其余季節(jié)均在70分以上,主要原因是春季AQI在臨界值50左右的天數(shù)較多,預(yù)測值凡超過50則被記入等級預(yù)報有偏差的天數(shù),造成等級評分較低;NMB除秋季外均體現(xiàn)出預(yù)測值偏高于觀測值,但總體偏差低于10%;NME在15%左右,NME與RMSE秋、冬季均高于春、夏季,但RMSE均小于20mg·m-3;四季模型預(yù)測值與實測值相關(guān)系數(shù)高于0.7,在置信度為0.01時顯著相關(guān)。從評估結(jié)果來看,四季模型均可以滿足實際預(yù)報需求。
3 結(jié)論
(1)四季均與AQI呈強相關(guān)關(guān)系的有5個因子:日最高氣溫、平均相對濕度、降水量、日照時數(shù)和前一日AQI值。四季隨著日最高氣溫、日照時數(shù)、前一日AQI值的升高,大氣污染物之間進(jìn)一步反應(yīng),空氣質(zhì)量呈下降趨勢;而降水量、平均相對濕度、云量的增大,對大氣污染物起到濕沉降作用,同時抑制了光化學(xué)反應(yīng),空氣質(zhì)量趨于好轉(zhuǎn)。
(2)對建立的四季模型預(yù)報效果進(jìn)行評估,等級評分在68%~85%,準(zhǔn)確率在70%~85%,NMB在-0.5%~7%,NME在15%~32%,RMSE在8.5%~17%,R在0.708~0.925,春、夏季預(yù)報效果優(yōu)于秋、冬季,四季AQI預(yù)報模型均可以滿足實際運用需求。
參考文獻(xiàn):
[1]伍小飛.安順城市旅游發(fā)展?jié)摿υu價[J].合作經(jīng)濟與科技,2017,32(06):42-43.
[2]張岳軍,張懷德,朱凌云,何俊琦,韓照宇,馮坤.太原市PM2.5預(yù)報統(tǒng)計修正模型及其應(yīng)用檢驗[J].環(huán)境科學(xué)研究,2018,31(07):1207-1213.
[3]葉斯琪,黃思遠(yuǎn),陳多宏,李紅霞,徐偉嘉,謝敏,沈勁,汪宇,潘月云,嵇萍.統(tǒng)計模型在城市空氣質(zhì)量預(yù)報中的應(yīng)用[J].環(huán)境工程,2018,36(S):309-314.
[4]宋丹,夏曉玲,何玉龍,張蕾,杜正靜.貴陽市空氣質(zhì)量預(yù)報方法與效果檢驗[J].氣象與環(huán)境科學(xué),2019,42(01):95-102.
[5]Shams R,Jahani A.Evaluation of the validity of multiple regression models in forecasting the air quality index(AQI)of Tehran[C].2018.
[6]Gogikar P,Tripathy M R,Rajagopal M,Paul K K,Tyagi B.PM2.5 estimation using multiple linear regression approach over industrial and non-industrial stations of India[J].Journal of Ambient Intelligence and Humanized Computing,2020,12(3):2975-2991.
[7]張婷.秦皇島市空氣質(zhì)量預(yù)報方法研究[D].沈陽:東北大學(xué)資源與土木工程學(xué)院,2014.
[8]沈勁,鐘流舉,何芳芳,陳多宏.基于聚類與多元回歸的空氣質(zhì)量預(yù)報模型開發(fā)[J].環(huán)境科學(xué)與技術(shù),2015,38(02):63-66.
作者簡介:曹青(1989—?),女,漢族,貴州貴陽人,碩士,助理工程師,研究方向:大氣環(huán)境。