,,
(華北水利水電大學 a.數學與信息科學學院; b.水利學院,鄭州 450045)
降水量是衡量干旱程度的重要指標,關于降水預測的方法有很多,如文獻[1-3]分別運用Markov預測降水量或徑流量;嚴華升等[4]運用非線性動力統(tǒng)計模擬對降水進行了預測;崔德友[5]利用遺傳算法針對降雨量數據進行預測;文獻[6-7]運用時間序列模型對杭州市降雨量進行了預測;韓萍等[8]建立多尺度標準化降水指數的ARIMA(Autoregressive Integrated Moving Average Model)模型,預測了陜西未來降水的變化及干旱等級;李才媛[9]運用灰色理論預報了湖北省梅雨期的分級降雨。這些研究大多是在未對序列進行多尺度非平穩(wěn)性、獨立性檢驗的條件下直接對降水量進行預測。而長序列數據中隱藏著豐富的信息,若對其進行序列分解,則可從中挖掘出更多信息。
降水的形成與氣壓、氣溫、日照和風速有關,有其自身的物理機制,并非單純的隨機序列。本文主要是從數學方法的角度,對隨機非平穩(wěn)序列進行延展預測:首先小波分解降水序列,通過游程分析檢驗分解序列之間是否相互獨立;而后運用ARIMA模型對相互獨立的分解序列分別進行預測;最后小波重構預測結果。以黃河鄭州站為例,檢驗上述預測模型與傳統(tǒng)ARIMA模型的預測精度。
小波分解是將原始序列分解為一系列小波函數的疊加,小波重構是小波分解的逆變換。設原始序列為X={X1,X2,…,XN},采用正交、高效的Mallat算法進行小波分解。令C0=X1,Mallat算法如下[10-11]:
(1)
當分解到L層時,原始序列被分解為L個細節(jié)序列和1個近似序列,對分解得到的L+1個序列分別運用Mallat重構算法,即
(2)
小波分解是將具有周期項、趨勢項及不規(guī)則變動項構成的乘法模型轉化為加法模型。使用加法模型的前提是各個因素對序列的影響是相互獨立可加的,因此需對序列{D1,D2,…,DL,CL}作獨立性檢驗。
設其中2個序列分別為Y={Y1,Y2,…,YN}和Z={Z1,Z2,…,ZN},通過游程分析檢驗2序列間的獨立性。游程檢驗的步驟[12]為:
(3)
(4)
(3) 統(tǒng)計V中元素1的數目m和游程數目r,計算V的狀態(tài)概率pz和遷移樣本容量nz,即
(5)
(4) 計算V的游程分布的平均變差pdF,即
(6)
(5) 設定置信水平α滿足式(7),即
|pdF|≤α。
(7)
若式(7)成立,則接受序列Y和Z相互獨立的假設;否則,拒絕序列相互獨立的假設。
設通過游程檢驗的序列為Xi,t={Xi,1,Xi,2,…,Xi,N},若Xi,t與序列值Xi,t-1,Xi,t-2,…,Xi,t-p以及隨機擾動項αi,t-1,αi,t-2,…,αi,t-q存在一定的關系則是平穩(wěn)時間序列,可以建立ARMA(p,q)模型。
若含有趨勢的非平穩(wěn)序列,則以d次差分轉化為平穩(wěn)序列建立ARMA模型。模型形式為
(8)
式中:B為延遲算子,BXi,t=Xi,t-1;=(1-B)為差分算子;|B|≤1;?(B)與φ(B)互質;αi,t為白噪聲序列。
建模與預測的步驟,如圖1所示。建模過程需遵循以下原則[8-13]:
圖1 建模流程圖
(1) 在置信水平α=0.05下,運用QLB統(tǒng)計量進行白噪聲檢驗,當QLB的概率值(P)小于0.05時,序列不是白噪聲,序列包含有效信息,通過檢驗,需要建立模型。
(2) 時序圖顯示時間序列觀測值圍繞均值上下波動,無明顯的上升或下降的趨勢,且在ACF(Autocorrelation Function)圖中隨著延遲的增加,自相關系數在2倍標準差內很快衰減到0,認為序列平穩(wěn),通過平穩(wěn)性檢驗。
(3) 若序列ACF拖尾,PACF(Partial Autocorrelation Function)在p步截尾,則建立AR(p)模型;若序列ACF在q步截尾,PACF拖尾,則建立AR(q)模型;若序列ACF在q步拖尾,且PACF在p步拖尾,則建立ARMA(p,q)模型。
(4) 在置信水平α=0.05下采用極大似然估計法對得到的參數再次估計,計算t檢驗統(tǒng)計量,統(tǒng)計量概率值小于0.025的參數被認為顯著有效。
(5) 在(1)的置信水平與統(tǒng)計量下進行模型檢驗,當QLB的概率值大于0.05,序列為白噪聲序列,殘差序列不包含有效信息,通過檢驗。
(6) 模型優(yōu)化中,以AIC與SBC達到最小為優(yōu)化準則。
運用式(2)對各層時間序列分別進行單支重構[11]為
X=D1+D2+…+DL+CL。
(9)
式中:D1={D1,1,D1,2,…,D1,N},D2={D2,1,D2,2,…,D2,N},…,DL={DL,1,DL,2,…,DL,N}分別是第1層,第2層,…,第L層的細節(jié)序列單支重構結果;CL={CL,1,CL,2,…,CL,N}是第L層的近似序列的單支重構結果。因此
Xi=D1,i+D2,i+…+DL,i+CL,i。
(10)
(11)
利用平均絕對誤差MAE(Mean Absolute Error)與均方誤差MSE(Mean Squared Error)描述擬合、預測結果的精度:
(12)
(13)
選取鄭州站1951—2007年的月均降水量數據[14],利用上述耦合模型預測2008—2012年月均降水量,通過和實際降水量進行比較,計算其預測精度,若精度較高,則預測2013—2015年鄭州市月均降水量。
圖2 近似序列和細節(jié)序列
小波分解的關鍵是小波函數的選擇與分解尺度的確定。小波函數的選擇主要取決于小波變換的目的,并沒有統(tǒng)一的一般性規(guī)律[15-16]。分解尺度與氣壓、氣溫、日照和風速等復雜的自然因素有關,分解尺度越大,序列的頻率劃分就越細,近似序列和細節(jié)序列的平滑性與平穩(wěn)性也越好,但誤差會越大,這種誤差會影響預測精度;分解尺度過小,則不能達到使近似序列和細節(jié)序列平滑與平穩(wěn)的效果。
考慮降水量序列受多種自然因素的影響,波動幅度大、隨機性程度強的特點,經過多次試驗對比分析和序列獨立性游程檢驗發(fā)現,選擇Daubechies中的db3小波對原始序列進行2尺度分解效果較好,單支重構到原尺度上得到1個近似序列cA2和2個細節(jié)序列cD1,cD2,如圖2所示。
置信水平α=0.05,以均值為截取水平,對序列cA2,cD1,cD2作游程獨立性檢驗,結果如表1所示。
表1 cD1,cD2,cA2的獨立性指標檢驗
表1表明:cD1和cA2相互獨立,cD1和cD2相互獨立,cA2和cD2相互不獨立。在相同置信水平下,對cA2和cD2之間的相關性進行Pearson檢驗,2序列的相關系數為0.077,2序列線性無關。這說明通過小波分解與單支重構,已成功地將降水序列的周期項、趨勢項與隨機擾動項分離,可以對cA2,cD1,cD2分別建模預測。
依據上文步驟對cA2,cD1,cD2進行白噪聲檢驗,計算出延遲6,12,18期的檢驗結果,如表2所示。
表2表明:3序列QLB的概率值均小于0.05,通過白噪聲檢驗,均包含有效信息,符合建模預測條件。
表2 cA2,cD1,cD2的白噪聲檢驗
從序列cA2,cD1,cD2的時序圖,如圖2所示,可以看出序列cD1和cD2沒有明顯上升或下降的趨勢,不能判斷cA2的趨勢。進一步觀察自相關函數與偏自相關函數圖,結果顯示序列cD1和cD2為平穩(wěn)序列。序列cA2為非平穩(wěn)序列,如圖3所示,結合cA2兩次差分后的時序圖,如圖4所示,可以看出序列沒有明顯上升或下降的趨勢,差分序列平穩(wěn)。
圖3 cA2的自相關與偏自相關函數
圖4 cA2兩次差分后時序圖
由圖3知:偏自相關函數(PACF)雖然在延遲8期、16期有微弱突變,但就整體而言,在延遲4期以后迅速衰減至0,說明偏自相關函數4步截尾,而自相關函數逐漸衰減至0,呈現拖尾性,故可選用ARIMA(4,2,0)模型,同時試用模型ARIMA(4,2,1),ARIMA(8,2,0),IMA(2,4)進行對比研究。
分別采用上述4個模型對cA2序列建模與檢驗。因模型ARIMA(4,2,1)不能通過殘差白噪聲檢驗,則舍去該模型。ARIMA(4,2,0)的AIC(Akaike Information Criterion)與SBC(Schwarz Bayesian Criterion)值最小,見表3,選定模型ARIMA(4,2,0)。由于模型ARIMA(4,2,0)參數?的t統(tǒng)計量概率值只有系數?4的概率值小于0.025,顯著有效,對預測結果影響較大,其他系數顯著為0,對預測結果基本無影響,故舍去其它參數,確定最優(yōu)模型ARIMA(0,2,0)(1,0,0)4。
表3 cA2模型的AIC與SBC值
模型ARIMA(0,2,0)(1,0,0)4的殘差白噪聲檢驗統(tǒng)計量QLB的概率值均大于0.05,說明殘差通過白噪聲檢驗,為純隨機序列,不包含有效信息,該模型通過檢驗。按照上述方法對序列cD1和cD2進行相同操作,得到殘差檢驗結果與最優(yōu)模型,如表4所示。
表4 cA2 ,cD1和cD2模型及殘差檢驗結果
根據選定模型,對序列cA2,cD1,cD2分別進行擬合并預測2008—2012年月均降水量,利用式(11)對3序列的擬合預測結果進行重構。同時,對降水序列建立傳統(tǒng)的ARIMA模型,比較2模型的相對誤差,結果表明:基于小波與游程耦合的ARIMA模型的相對誤差小于傳統(tǒng)的ARIMA模型,且耦合ARIMA模型的預測值與實際觀測值之間的相對誤差均在5%上下浮動,小于7%,具有較高的預測精度,見表5。
表5 預測結果比較
為了進一步直觀地比較2模型的預測精度,繪制出2種模型的擬合、預測結果與實際觀測數據的曲線圖,如圖5所示,利用式(12)、式(13)可得傳統(tǒng)ARIMA模型與耦合ARIMA模型的平均絕對誤差MAE與均方誤差MSE,結果如表6所示。可以看出:相對于傳統(tǒng)的ARIMA模型,基于小波與游程耦合的ARIMA模型的擬合預測曲線更加逼近于實際觀測值,平均絕對誤差與均方誤差更小,具有較高的預測精度。
圖5 2種模型的觀測與預測時序圖
表6 擬合結果誤差
根據1951—2012年月均將水量的數據,利用基于小波與游程的ARIMA模型預測2013—2015年鄭州市月均降水量,如表7所示。由圖5及表7可知未來2年鄭州市降水量變化將處于趨勢性谷底位置,即預測月均降水量會明顯減少。
表7 2013—2015年鄭州月均降水量
(1) 本文依據降水序列隨機非平穩(wěn)的特點,選擇小波理論將序列分解為相互獨立的序列,通過分別建模預測,最后重構擬合預測結果,探索性地研究了隨機非平穩(wěn)序列難以高精度預測的問題。
(2) 結合鄭州站降水序列,檢驗模型的適用性,對比分析小波與游程耦合的ARIMA模型與傳統(tǒng)ARIMA模型的預測精度發(fā)現:耦合模型的平均絕對誤差、均方誤差與相對誤差均小于傳統(tǒng)ARIMA模型,具有較高的預測精度。
(3) 在小波分解降水序列時,小波函數的選擇與分解尺度的確定主要依賴于分解目的,沒有統(tǒng)一的一般性標準,如何確定小波函數與分解尺度的標準仍有待進一步研究。
參考文獻:
[1] 秦 松.基于加權的滑動平均-馬爾科夫預測模型及其應用[J].水資源與水工程學報, 2013, 24(1): 185-188.(QIN Song.Markov Prediction Model and Its Application Based on the Weighted Sliding Average[J].Journal of Water Resources & Water Engineering, 2013, 24(1): 185-188.(in Chinese))
[2] 孫才志,林學鈺.降水預測的模糊權馬爾可夫模型及應用[J].系統(tǒng)工程學報, 2003, 18(4): 294-299.(SUN cai-zhi, LIN Xue-yu.Research on Fussy Markov Model with Weights and Its Application in Application in Predicting the Precipitation State[J].Journal of System Engineering, 2003, 18(4): 294-299.(in Chinese))
[3] 吳健華,李培月,錢 會.西安市氣象要素變化特征及可利用降雨量預測模型[J].南水北調與水利科技, 2013, 11(1): 30-35.(WU Jian-hua, LI Pei-yue, QIAN Hui.Variation Characteristics of Meteorological Elements and Prediction Model of Available Precipitation in Xi’an City[J].South and North Water Transfers and Water Science & Technology, 2013, 11(1): 30-35.(in Chinese))
[4] 嚴華生,曹 杰,謝應齊,等.降雨年際氣候變化的非線性動力統(tǒng)計模擬預測[J].氣象學報,1998,57(4):502-508.(YAN Hua-sheng, CAO Jie, XIE Ying-qi,etal.Nonlinear Dynamical/Statistical Simulation and Prediction of Interannual Climatic Evolution in Rainfall[J].Acta Meteorologica Sinica, 1998, 57(4): 502-508.(in Chinese))
[5] 崔德友.組合模型在降雨量預測中的應用[J].計算機仿真,2012, 29(8):163-166.(CUI De-you.Application of Combination Model in Rainfall Prediction[J].Computer Simulation, 2012, 29(8): 163-166.(in Chinese))
[6] 張書文,李占甫.時間序列分析在預測年降水量中的應用[J].水資源研究,1996, 17(4): 7-11.(ZHANG Shu-wen, LI Zhan-pu.Application of Time Series Model in Rainfall Prediction[J].Journal of Water Resources Research, 1996, 17(4): 7-11.(in Chinese))
[7] 孫映宏.基于均生函數模型的杭州市年降雨量預測[J].水電能源科學,2009, 27(2): 14-16.(SUN Ying-hong.Forecasting of Annual Precipitation on Model of Average-growing Function in Hangzhou City[J].Water Resources and Power, 2009, 27(2): 14-16.(in Chinese))
[8] 韓 萍,王鵬新,王彥集,等.多尺度標準化降水指數的ARIMA模型干旱預測研究[J].干旱地區(qū)農業(yè)研究,2008, 26(2): 212-218.(HAN Ping, WANG Peng-xin, WANG Yan-ji,etal.Drought Forecasting Based on the Standardized Precipitation Index at Different Temporal Scales Using ARIMA Models[J].Agricultural Research in the Arid Areas, 2008, 26(2): 212-218.(in Chinese))
[9] 李才媛.湖北省梅雨期分級降水預報試驗[J].氣象, 1996, 22(1): 49-52.(LI Cai-yuan.The Experiment of Classification Rainfall Forecast in Hubei During Rainy Seasons[J].Meteorological Monthly, 1996, 22(1):49-52.(in Chinese))
[10] 王俊麗,張德生.基于小波變換的水文預報 FAR 模型[J].水資源與水工程學報,2011, 22(4): 140-143.(WANG Jun-li,ZHANG De-sheng.FAR Hydrologic Forecast Model Based on Wavelet Transformation [J].Journal of Water Resources & Water Engineering, 2011, 22(4): 140-143.(in Chinese))
[11] 劉明才.小波分析及其應用[M].北京:清華大學出版社,2005.(LIU Ming-cai.Wavelet Analysis and Its Application[M].Beijing: Tsinghua University Press, 2005.(in Chinese))
[12] 馬秀峰,夏 軍.游程概率統(tǒng)計原理及其應用[M].北京:科學出版社,2011.(MA Xiu-feng, XIA Jun.Run Probability and Statistics Principles and Applications[M].Beijing: Science Press, 2011.(in Chinese))
[13] BOX G E P, JENKINS G M, REINSEL G C.Time Series Analysis Forecasting and Control[M].Beijing: Posts & Telecom Press, 2011.
[14] 中國氣象科學數據共享服務網[EB/OL].(2013-01-01)[2013-02-15].http:∥cdc.cma.gov.cn/home.do.(China Meteorological Data Sharing Service System[EB/OL].(2013-01-01)[2013-02-15].http:∥cdc.cma.gov.cn/home.do.(in Chinese))
[15] 桑燕芳,王 棟.水文序列小波分析中小波函數選擇方法[J].水利學報,2008, 39(3): 295-300.(SANG Yan-fang, WANG Dong.Wavelet Selection Method in Hydrologic Series Wavelet Analysis[J].Journal of Hydraulic Engineering, 2008, 39(3): 295-300.(in Chinese))
[16] 王文圣,丁 晶,李躍清.水文小波分析[M].北京:化學工業(yè)出版社, 2005.(WANG Wen-sheng, DING Jing, LI Yue-qing.Hydrology Wavelet Analysis[M].Beijing: Chemical Industry Press, 2005.(in Chinese))