摘要:近年來,伴隨著城市高速發(fā)展,我國眾多城市面臨著嚴重的空氣質量問題。掌握空氣質量的變化發(fā)展趨勢對于控制空氣污染和指導生產生活有著重要的意義。本文利用2017年1月1日至2019年10月24日的西安市空氣質量指數(AQI)歷史數據,基于ARIMA加法模型對西安市空氣質量指數進行分析并做出短期預測。
關鍵詞:ARIMA模型;空氣質量指數;預測
中圖分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2019)35-0262-02
目前,我國大氣污染的形勢日益嚴峻,北方地區(qū)的霧霾天氣日趨增多。西安屬于典型的內陸城市,正處于城市高速發(fā)展期,但是在經濟建設和城市建設的同時,環(huán)境問題日益突出,加之本身地形特征不利于污染物擴散,東北方向外來污染的輸入和氣象等因素,進一步使得城市中的污染物濃度增高,大氣污染問題嚴重,污染程度在全國各大城市中居于前列。因此,了解西安市空氣質量的現(xiàn)狀并對空氣質量的發(fā)展趨勢進行預測,這對預警和及時采取有效的措施進行治理有著重要的意義。
空氣質量指數是定量描述空氣狀況的數值,它是將常規(guī)監(jiān)測的幾種空氣污染物濃度簡化成為單一的概念性指數值形式。目前對空氣質量指數的預測多采用神經網絡模型,灰色模型以及時間序列模型。吳慧靜(2019)利用遺傳算法改進的神經網絡對許昌市AQI進行預測[1];常恬君(2019)對上海市2013-2017年逐日空氣質量指數進行分析,在此基礎上建立了Prophet-隨機森林優(yōu)化模型[2]。本文利用2017年1月1日至2019年10月24日的西安市空氣質量指數歷史數據,基于ARIMA加法模型對西安市空氣質量指數進行分析并對2019年10月25日至30日空氣質量指數進行預測。
1 ARIMA加法模型
ARIMA加法模型是指序列中季節(jié)效應和其他效應之間是加法關系,即:
季節(jié)加法模型實際上就是通過趨勢差分、季節(jié)差分將序列轉化為平穩(wěn)序列,再對其進行擬合。它的模型結構如下:
2 西安市空氣質量指數特征的統(tǒng)計分析
本文對2017年1月1日至2019年10月24日的西安市空氣質量指數(AQI)進行分析,其時序圖如圖1所示。
由圖1可以看出,西安市的空氣質量指數數據呈明顯的周期性波動特征,統(tǒng)計2017-2019年各月空氣質量指數的平均值,繪制折線圖見圖2。近三年西安市空氣質量數據波動趨勢較一致,具有明顯的周期性,2019年空氣質量明顯優(yōu)于往年。由圖3可以直觀看到,西安市AQI具有明顯季節(jié)性,冬季污染程度最為嚴重,春季次之,夏秋AQI優(yōu)良比例較高。
3 西安市空氣質量指數的預測
3.1序列的預處理
3.1.1平穩(wěn)性檢驗
由前述分析,西安市空氣質量指數序列具有以年為周期的季節(jié)效應,因此需要提取其周期信息。對該序列進行步長為365的季節(jié)差分消除季節(jié)性的影響,差分后時序圖見圖4.
從圖4可以看出,該序列始終在一個常數值附近隨機波動,無明顯趨勢或周期,波動穩(wěn)定,因而可以初步認定序列是平穩(wěn)的。為了進一步確認序列的平穩(wěn)性,使用ADF檢驗。檢驗結果見表1,類型二和類型三各種延遲模型的τ統(tǒng)計量的P值都小于顯著性水平0.05,所以該序列平穩(wěn)。
3.1.2純隨機性檢驗
由于平穩(wěn)序列通常具有短期相關性,這里構造延遲6期和12期的Q統(tǒng)計量,如表2。
由表2可知,在各延遲階數下Q檢驗統(tǒng)計量的P值都很小,所以可以確定該序列屬于非白噪聲序列。平穩(wěn)性檢驗和純隨機性檢驗顯示該序列為平穩(wěn)非白噪聲序列,可以使用ARMA模型擬合差分后的序列。下面考察該序列的自相關圖和偏自相關圖的特征,對模型定階。
3.2模型識別
從圖5可以看出,差分后序列的偏自相關圖顯示除了1-2階的相關系數在2倍標準差范圍之外,其他階數的偏自相關系數都在2倍標準差范圍內波動,可以將其看成是2階截尾。從而將模型初步認定為:AR(2).
3.3參數估計
由最小二乘法對參數進行估計,對西安市AQI序列建立的模型為:
(1-0.794111B+0.220975B2)▽365Xt=εt
3.4模型檢驗
對所擬合模型,分別進行殘差白噪聲檢驗和參數檢驗,模型殘差相關圖見圖6,模型檢驗結果見表3。
從圖6可以看出,模型的自相關函數值均在二倍標準差范圍內,Q統(tǒng)計量的P值都遠遠大于0.05,檢驗結果見表3。
LB統(tǒng)計量的P值都大于顯著性水平0.05,可以認為殘差序列為白噪聲序列,模型信息提取比較充分。參數的顯著性檢驗顯示兩參數均顯著非零,因此說明ARIMA(2,(0,365),0)模型對該序列擬合良好。
3.5預測
下面對2019年10月25日-30日西安市空氣質量指數的預測值與實際值進行比較,對比結果見表4。
由表4可知,未來三天的預測相對誤差在20%左右,這說明用ARIMA(2,(0,365),0)對西安市空氣質量指數進行模擬是適合的,并且預測的精度相對較高。
4 結束語
本文利用ARIMA模型對西安市空氣質量指數進行分析預測。從預測結果來看,相對誤差在20%左右,說明了該模型的擬合程度較好,預測精度較為滿意。這些說明該模型能較好地反映西安市空氣質量狀況的發(fā)展規(guī)律。
從預測結果來看,未來六日AQI呈持續(xù)增加趨勢。利用時間序列模型對空氣質量進行預測,根據序列自身的變化規(guī)律進行建模,方法簡便可行,避免了因影響因素考慮不周全造成的預測結果不穩(wěn)定,具有一定的參考價值。
參考文獻:
[1]吳慧靜,赫曉慧.基于GA-BP神經網絡的空氣質量指數預測研究[J].安徽師范大學學報:自然科學版,2019(4).
[2]常恬君,過仲陽,徐麗麗.基于Prophet-隨機森林優(yōu)化模型的空氣質量指數規(guī)模預測[J].環(huán)境污染與防治,2019(7).
[3]劉杰.北京大氣污染物時空變化規(guī)律及評價預測模型研究[D].北京科技大學,2015.
[4]易丹輝,王燕.應用時間序列分析[M].中國人民大學出版社,2019.
【通聯(lián)編輯:唐一東】
收稿日期:2019-08-20
作者簡介:袁芳(1985-),女,陜西富平人,講師,碩士,主要研究方向為數據分析。