陸靜良
(遼寧省鐵嶺水文局,遼寧 鐵嶺 112000)
水資源量的準(zhǔn)確預(yù)測(cè)將直接對(duì)農(nóng)業(yè)灌溉及人類(lèi)生產(chǎn)生活產(chǎn)生直接影響,其中地下水、地表水資源主要是依靠降水量進(jìn)行補(bǔ)給。隨著科技的發(fā)展與進(jìn)步,降水量時(shí)間序列預(yù)測(cè)的方法發(fā)生巨大的變化,基于人工智能的人工神經(jīng)網(wǎng)絡(luò)、SVR支持向量回歸機(jī)等方法在降水量預(yù)測(cè)分析中得到廣泛的應(yīng)用[1]。研究表明,相對(duì)于傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)法支持向量回歸機(jī)對(duì)降水量預(yù)測(cè)分析表現(xiàn)出更優(yōu)異的使用性能[2]。但是,降水量受氣候、自然環(huán)境等作用影響,其過(guò)程是一個(gè)非線(xiàn)性的高度負(fù)責(zé)系統(tǒng),在時(shí)間序列內(nèi)往往包含著眾多極其負(fù)責(zé)的條件信息。據(jù)此,通過(guò)采取一定的方法和途徑有必要對(duì)時(shí)間序列所包含的不同信息進(jìn)行提取和處理。目前,對(duì)非穩(wěn)態(tài)、非線(xiàn)性即混沌信號(hào)進(jìn)行處理的有效方法是進(jìn)行SSA奇異譜分析,可準(zhǔn)確地對(duì)時(shí)間序列的準(zhǔn)周期或變化趨勢(shì)成分進(jìn)行提取,并將時(shí)間序列化解為獨(dú)立的、可解釋的組分,SSA法在金融時(shí)序預(yù)測(cè)、交通流量預(yù)測(cè)以及徑流量預(yù)測(cè)等領(lǐng)域已得到廣泛的應(yīng)用。該方法與SVR向耦合并應(yīng)用于降雨量預(yù)測(cè)的的研究相對(duì)較少。據(jù)此,本文基于奇異譜分析-支持向量回歸機(jī)的耦合作用關(guān)系,構(gòu)建了應(yīng)用降水量預(yù)測(cè)的耦合模型,并以遼寧省某氣象站點(diǎn)為研究對(duì)象,對(duì)所構(gòu)建的預(yù)測(cè)模型的有效性和科學(xué)性進(jìn)行了可靠驗(yàn)證[3- 7]。
分解與重構(gòu)是奇異譜分析的兩個(gè)主要階段,設(shè)定T={x1,x2,,xn}為長(zhǎng)度N>2的時(shí)間序列,進(jìn)行-L×K介軌跡矩陣的轉(zhuǎn)化形式如下所示:
(1)
式中,L(L≤N/2)—序列窗口長(zhǎng)度;K=N-L+1。
對(duì)軌跡矩陣X按照下述公式進(jìn)行奇異值的分解(SVD):
X=USVT
(2)
式中,S—與X相對(duì)應(yīng)的奇異值,并與矩陣XXT的特征值的平方根相等價(jià);U—與X相對(duì)應(yīng)的左奇異向量,并與矩陣XXT的特征向量相等價(jià);V—與X相對(duì)應(yīng)的右奇異向量,并與XTX的特征向量相等價(jià)。
利用奇異譜對(duì)時(shí)間序列T進(jìn)行展開(kāi)分析:
(3)
式中,Ekj—XXT的特征向量,其中E為時(shí)間經(jīng)驗(yàn)正交函數(shù);aik—時(shí)間序列主成分。
(4)
利用對(duì)角平均法,通過(guò)對(duì)原序列進(jìn)行分解,可得到具有M個(gè)長(zhǎng)度的N個(gè)新序列。
引入一組訓(xùn)練樣本集,表達(dá)式如下:
(x1,y1),(x2,y2),,(xl,yl)
(5)
式中,xi—第i個(gè)樣本的輸入列向量;yi—第i個(gè)樣本的輸出值;l—訓(xùn)練樣本集中的樣本總個(gè)數(shù)。
對(duì)輸入樣本xp進(jìn)行支持向量回歸機(jī)的預(yù)測(cè),其輸出值可采用下式進(jìn)行表述:
(6)
式中,α、α*—均為拉格朗日乘子;b—拉格朗日偏置;K(xpxi)—核函數(shù)。
本研究利用的核函數(shù)為RBF,其公式如下所示:
(7)
式中,γ—與核函數(shù)相對(duì)應(yīng)的參數(shù),其他字母含義同上。
本文以遼寧省東北部地區(qū)某氣象站在1966~2015年共600個(gè)的月降水量資料為依據(jù),構(gòu)建了基于時(shí)間序列的降水量預(yù)測(cè)模型,且對(duì)模型進(jìn)行訓(xùn)練的樣本數(shù)大于檢驗(yàn)樣本,其中訓(xùn)練樣本和檢驗(yàn)樣本分別占總樣本的85%和15%,即選取時(shí)間序列的前42年降水量資料為模型訓(xùn)練樣本,并構(gòu)建預(yù)測(cè)模型;時(shí)間序列的后8年降水量資料為模型檢驗(yàn)樣本,對(duì)模型的預(yù)測(cè)效果和準(zhǔn)確性進(jìn)行檢驗(yàn)。設(shè)定模型預(yù)測(cè)步長(zhǎng)分別為1、3、6個(gè)月3種預(yù)測(cè)步長(zhǎng),以此提高模型預(yù)測(cè)結(jié)果的精度和準(zhǔn)確性,并采用迭代預(yù)測(cè)法進(jìn)行降水量預(yù)測(cè)[8]。
2.1.1 輸入模型預(yù)測(cè)值
基于時(shí)間序列的降水量預(yù)測(cè)模型的輸入值往往采用偏自相關(guān)和自相關(guān)函數(shù)進(jìn)行確定,本文對(duì)氣象站的月降水量相關(guān)函數(shù)進(jìn)行繪制,如圖1所示。由圖可知,自相關(guān)函數(shù)峰值發(fā)生在第12個(gè)月處,而偏相關(guān)函數(shù)保持在置信區(qū)間范圍內(nèi)的月份發(fā)生在第12個(gè)月后,研究表明前12個(gè)月的降水量與某月降水量存在密切關(guān)系。據(jù)此,建立訓(xùn)練和檢驗(yàn)樣所需的某月降水量輸入值可取與其相對(duì)應(yīng)的前12個(gè)月的降水量。
圖1 自相關(guān)與偏自相關(guān)函數(shù)圖
2.1.2 對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理
對(duì)初始月降雨量序列進(jìn)行奇異譜分析處理,將其分解為多個(gè)香菇獨(dú)立的子序列。對(duì)子序列個(gè)數(shù)的確定將直接影響到預(yù)測(cè)結(jié)果的可靠性,若子序列分解數(shù)量太少,則不能保證初始數(shù)據(jù)序列所包含的各成分進(jìn)行全部的提取;若對(duì)子序列分解數(shù)量太多,則可導(dǎo)致預(yù)測(cè)模型的工作計(jì)算量增大,計(jì)算效率效率降低。本文首先按照20個(gè)子序列數(shù)對(duì)初始降水量數(shù)據(jù)進(jìn)行分解,然后對(duì)各子序列所占原始序列的比重進(jìn)行計(jì)算,并以此確定子序列個(gè)數(shù),如圖2所示。由圖2可知,當(dāng)子序列為8個(gè)時(shí)所占初始序列的比重極小為1.326%,可對(duì)其所包含的有效信息忽略。據(jù)此,本文對(duì)初始降水量數(shù)據(jù)進(jìn)行7個(gè)子序列的分解,可完全對(duì)初始序列所包含的有效成分和信息進(jìn)行提取,其頻率和周期等信息隨子序列的不同而存在明顯的差異,且按照由大到小1~7的順序,子序列頻率值逐漸增大。為了便于對(duì)小波分析的對(duì)比,將初始序列按照小波分析同樣可分解為7個(gè)相互獨(dú)立的子序列[9]。
2.1.3 構(gòu)建月降水量預(yù)測(cè)耦合模型
對(duì)上述采用奇異譜和小波分析分解出來(lái)的7個(gè)子序列采用支持向量回歸機(jī)法進(jìn)行分析,并構(gòu)建與各子序列對(duì)應(yīng)的預(yù)測(cè)模型。因不同評(píng)價(jià)指標(biāo)的單位和量綱存在一定的差異,為消除不同指標(biāo)間的不可通透性,需對(duì)數(shù)值進(jìn)行歸一化處理,其值取值區(qū)間為[0,1]。對(duì)核參數(shù)γ和懲罰因子C兩個(gè)關(guān)鍵性參數(shù)利用支持向量回歸機(jī)及粒子群法進(jìn)行尋優(yōu)計(jì)算。為探討數(shù)據(jù)處理法對(duì)預(yù)測(cè)模型評(píng)價(jià)結(jié)果的精度作用,對(duì)未分解處理的初始數(shù)據(jù)同時(shí)進(jìn)行支持向量回歸機(jī)耦合模型的預(yù)測(cè)分析[10]。
耦合模型對(duì)降水量預(yù)測(cè)結(jié)果精度的評(píng)判標(biāo)準(zhǔn)選取NNSE納什系數(shù)、RRMSE均方根誤差以及平均絕對(duì)誤差MMAE指標(biāo)進(jìn)行評(píng)價(jià)。采用不同預(yù)測(cè)模型分別按照1、3、6個(gè)月3種步長(zhǎng)類(lèi)型對(duì)訓(xùn)練和檢驗(yàn)樣本的評(píng)價(jià)指標(biāo)進(jìn)行計(jì)算,統(tǒng)計(jì)計(jì)算結(jié)果見(jiàn)表1。
表1 不同評(píng)價(jià)模型對(duì)各評(píng)價(jià)指標(biāo)的統(tǒng)計(jì)計(jì)算結(jié)果
由表1計(jì)算結(jié)果可知,預(yù)測(cè)步長(zhǎng)為1個(gè)月時(shí)所構(gòu)建的SVR模型對(duì)訓(xùn)練樣本和檢驗(yàn)樣本的RRMSE、MMAE、NNSE分別為25.671、15.372、0.572和28.862、17.250、0.425。WA-SVR模型以及SSA-SVR模型各精度評(píng)價(jià)指標(biāo)相對(duì)于SVR模型表現(xiàn)出較高的精度,如檢驗(yàn)樣本的RRMSE、MMAE、NNSE值分別為4.805、3.524、0.982,其RRMSE、MMAE評(píng)價(jià)指標(biāo)值相對(duì)于SVR模型分別降低了24.057和13.726,而指標(biāo)NNSE提高了0.557;SSA-SVR模型相對(duì)于SVR模型,其RRMSE、MMAE指標(biāo)值為5.131、3.026分別降低了23.695、14.224,而NNSE為0.984提高了0.559。通過(guò)對(duì)比分析SSA-SVR和WA-SVR模型的評(píng)價(jià)指標(biāo)可知,WA-SVR模型的RRMSE、MMAE評(píng)價(jià)指標(biāo)值相對(duì)較大,而NNSE值較小,表明WA-SVR模型略?xún)?yōu)于SSA-SVR模型,而兩者對(duì)月降水量預(yù)測(cè)結(jié)果的準(zhǔn)確性相差不大。
對(duì)于月降水量預(yù)測(cè)模型步長(zhǎng)為3、6個(gè)月的預(yù)測(cè)結(jié)果顯示,SVR模型對(duì)降水量預(yù)測(cè)結(jié)果仍不如期望要求,且明顯低于WA-SVR和SSA-SVR模型。以預(yù)測(cè)步長(zhǎng)為3個(gè)月的檢驗(yàn)樣本為例,WA-SVR和SSA-SVR模型的RRMSE、MMAE、NNSE計(jì)算結(jié)果值分別為15.157、8.872、0.844和8.724、4.828、0.951,WA-SVR模型的RRMSE、MMAE值相對(duì)較大,而NNSE值較小,且兩種模型的精確性評(píng)價(jià)指標(biāo)具有明顯的差異性,研究表明對(duì)于計(jì)算步長(zhǎng)為3月的預(yù)測(cè)分析,SSA-SVR對(duì)降水量預(yù)測(cè)結(jié)果優(yōu)于WA-SVR。對(duì)于模型預(yù)測(cè)步長(zhǎng)為6個(gè)月時(shí),WA-SVR和SSA-SVR模型的RRMSE、MMAE、NNSE值分別為18.764、11.916、0.752和11.341、6.561、0.916,WA-SVR模型的各參數(shù)指標(biāo)值相對(duì)較大,而其N(xiāo)NSE值相對(duì)較小,研究表明對(duì)計(jì)算步長(zhǎng)為6個(gè)月的月降水量SSA-SVR預(yù)測(cè)模型優(yōu)于WA-SVR模型,且計(jì)算精度相對(duì)于3個(gè)月計(jì)算步長(zhǎng)效果有所增大。通過(guò)對(duì)比分析不同預(yù)測(cè)步長(zhǎng)可知,WA-SVR和SSA-SVR模型對(duì)月降水量預(yù)測(cè)精度從1月至6月逐漸表現(xiàn)出降低趨勢(shì),例如對(duì)于檢驗(yàn)樣本NNSE值的SSA-SVR模型由0.984減少為0.951并降至0.916,其原因主要和預(yù)測(cè)結(jié)果的誤差積累相關(guān);而對(duì)于SVR模型其變化趨勢(shì)不明顯。
通過(guò)上述分析可知:通過(guò)對(duì)月降水量初始數(shù)據(jù)進(jìn)行預(yù)處理可明顯提高模型的預(yù)測(cè)精度;相對(duì)于短期內(nèi)的降水量預(yù)測(cè),小波分析和奇異譜分析均可明顯提高模型的預(yù)測(cè)精度,且前者略?xún)?yōu)于后者,但二者的預(yù)測(cè)精度相差不大;相對(duì)于長(zhǎng)期內(nèi)的降水量預(yù)測(cè),基于奇異譜分析的降水量預(yù)測(cè)精度明顯優(yōu)于小波分析,且優(yōu)越性相差趨勢(shì)逐漸增大,研究表明奇異譜分析法可明顯提高月降水量預(yù)測(cè)精度[11]。
為對(duì)不同模型的預(yù)測(cè)結(jié)果進(jìn)行更加直觀、準(zhǔn)確的分析,本文以步長(zhǎng)為6個(gè)月的降水量預(yù)測(cè)模型為例,對(duì)比分析了月降水量實(shí)測(cè)值和預(yù)測(cè)值結(jié)果。研究表明:基于SSA-SVR模型的月降水量實(shí)測(cè)值與預(yù)測(cè)值之間的貼近程度最好,除個(gè)別峰值與實(shí)測(cè)值相差偏大之外,其余各值均勻?qū)崪y(cè)值大致相同,進(jìn)一步表明該模型具有更好的精確性和可靠性。
本文在詳細(xì)分析了小波分析、奇異譜分析和支持向量回歸機(jī)基本理論的基礎(chǔ)之上,構(gòu)建了用于月降水量預(yù)測(cè)分析的評(píng)價(jià)模型,并以遼寧省某氣象站為例進(jìn)行降雨數(shù)據(jù)的分析。研究表明:通過(guò)對(duì)月降水量初始數(shù)據(jù)進(jìn)行預(yù)處理可明顯提高模型的預(yù)測(cè)精度;相對(duì)于短期內(nèi)的降水量預(yù)測(cè),小波分析和奇異譜分析均可明顯提高模型的預(yù)測(cè)精度,且前者略?xún)?yōu)于后者,但二者的預(yù)測(cè)精度相差不大;相對(duì)于長(zhǎng)期內(nèi)的降水量預(yù)測(cè),基于奇異譜分析的降水量預(yù)測(cè)精度明顯優(yōu)于小波分析,且優(yōu)越性相差趨勢(shì)逐漸增大,研究表明奇異譜分析法可明顯提高月降水量預(yù)測(cè)精度。