張和喜, 遲道才, 王永濤, 王富臣
(1.沈陽農(nóng)業(yè)大學(xué) 水利學(xué)院, 沈陽 110016; 2.貴州省水利科學(xué)研究院, 貴陽 550002)
基于NNBR與蒙特卡洛算法的降雨量預(yù)報(bào)模型應(yīng)用研究
張和喜1,2, 遲道才1, 王永濤2, 王富臣2
(1.沈陽農(nóng)業(yè)大學(xué) 水利學(xué)院, 沈陽 110016; 2.貴州省水利科學(xué)研究院, 貴陽 550002)
從統(tǒng)計(jì)學(xué)的觀點(diǎn)去了解和分析降雨歷史的復(fù)雜過程,并從中發(fā)現(xiàn)其存在的內(nèi)在規(guī)律,為預(yù)測未來降雨量提供理論依據(jù)。該文在分析了蒙特卡洛算法及其分布函數(shù)的基礎(chǔ)上,使用P-Ⅲ型分布函數(shù)對降雨量進(jìn)行模擬,提出了基于NNBR與蒙特卡洛算法相結(jié)合的降雨量預(yù)報(bào)模型。通過基于NNBR的蒙特卡洛預(yù)測值與實(shí)際值驗(yàn)證得出,各年的誤差均小于10%,循環(huán)次數(shù)增加,誤差逐漸變小,所以本文所建立的預(yù)報(bào)模型基本可以滿足生產(chǎn)實(shí)際要求。同時(shí),基于NNBR模型的蒙特卡洛算法優(yōu)于僅使用蒙特卡洛算法的比率為89.1%,表明本文所使用的預(yù)測效果較優(yōu)。最后,以北盤江水系50 a數(shù)據(jù)對預(yù)報(bào)模型結(jié)果進(jìn)行驗(yàn)證,并對未來5 a的降雨量開展了預(yù)測。預(yù)測結(jié)果既體現(xiàn)了降雨量的隨機(jī)性和統(tǒng)計(jì)的規(guī)律性,又反映出降雨序列的時(shí)間性,應(yīng)用效果較好。
NNBR模型; 蒙特卡洛算法; P-Ⅲ型分布函數(shù); 降雨量預(yù)報(bào)模型
降雨的發(fā)生機(jī)理是一個(gè)十分復(fù)雜的過程,不但具有隨機(jī)性和周期性,還具有復(fù)雜性,如:相似性、灰色性、混沌性、非線性等。目前,對于降雨量預(yù)報(bào)主要有天氣學(xué)方法、數(shù)值天氣預(yù)報(bào)、統(tǒng)計(jì)預(yù)報(bào)等方法,大量事實(shí)表明,這些方法富有一定的成效。但如果僅僅依靠降雨量的單一性進(jìn)行模擬預(yù)報(bào),預(yù)報(bào)結(jié)果有失客觀和準(zhǔn)確。近年來,隨著數(shù)理統(tǒng)計(jì)學(xué)的快速發(fā)展,從統(tǒng)計(jì)學(xué)的觀點(diǎn)去了解和分析歷史,并從中發(fā)現(xiàn)其存在的內(nèi)在規(guī)律,為預(yù)測未來發(fā)生事件提供有力的支持。已有研究表明單獨(dú)運(yùn)用蒙特卡洛方法預(yù)測未來降雨量,預(yù)測序列雖然很好地體現(xiàn)了研究地區(qū)降雨量發(fā)生的隨機(jī)性和統(tǒng)計(jì)規(guī)律性,但是卻不能夠準(zhǔn)確反映出降雨序列的時(shí)間性,使預(yù)報(bào)序列的排列具有多解性[1]。而用最近鄰抽樣模型(NNBR模型)來預(yù)測未來的降雨量,其假設(shè)為客觀世界的發(fā)生、發(fā)展和演變存在一定的聯(lián)系,未來的運(yùn)動軌跡與歷史具有相似性。NNBR應(yīng)用特征序列來預(yù)測下一個(gè)降水量,使降雨量的預(yù)測具有時(shí)間性[2]。故本文將蒙特卡洛和NNBR模型相結(jié)合,提出基于NNBR與蒙特卡洛算法相結(jié)合的降雨量預(yù)報(bào)模型,利用回溯算法對預(yù)測降雨量序列進(jìn)行回溯檢測,有效解決預(yù)報(bào)序列排列的多解性問題,使預(yù)報(bào)結(jié)果具有時(shí)間性,預(yù)測序列可以很好地體現(xiàn)研究地區(qū)降雨量發(fā)生的隨機(jī)性和統(tǒng)計(jì)規(guī)律性,并能夠準(zhǔn)確反映出降雨預(yù)測序列的時(shí)間性。
最近鄰抽樣回歸模型是基于數(shù)據(jù)驅(qū)動、無需識別參數(shù)的非參數(shù)模型。該模型假設(shè)客觀世界的發(fā)生、發(fā)展和演變存在一定的聯(lián)系,未來的運(yùn)動軌跡與歷史具有相似性,利用歷史數(shù)據(jù)的變化趨勢對未來數(shù)據(jù)變化趨勢進(jìn)行預(yù)測。根據(jù)研究對象的不同,將NNBR模型分為單因子模型和多因子模型兩種形式[3-5],由于預(yù)測對象包含多個(gè)因子,故本文采用多因子模型。
1.1 模型原理及算法
設(shè)有水文時(shí)間序列Xt,它是有眾多因子影響的,一般考慮其中P個(gè)主要的影響因子,記為Z1,t,Z2,t,…,Zp,t(t=1,2,…,n;n為資料的長度)。由歷史數(shù)據(jù)構(gòu)造特征矢量Dt=(Z1t,Z2,t,…,Zp,j),則Xt與Dt一一對應(yīng),可以寫成Dt=(Z1,t,Z2,t,…,Zp,t)?Xt。已知當(dāng)前矢量Di=(Z1,j,Z2,i,…,Zp,i),預(yù)測Xi的基本思路與單因子NNBR模型相同,即在n個(gè)現(xiàn)有特征矢量Dt(t=1,2,…,n)中尋找與Di最近鄰的K個(gè)特征矢量。多因子NNBR模型基本形式同(1)式:
(1)
多因子模型的基本原理反映了客觀世界的發(fā)生、發(fā)展和演變存在一定的聯(lián)系,未來的運(yùn)動軌跡與歷史具有相似性。即未來的發(fā)展模式Di=(Z1,j,Z2,j,…,Zp,j)?Xi可從已知模式Dt=(Z1,j,Z2,j,…,Zp,t)?Xt(t=1,2,…,n)中去尋找。可以看出,NNBR模型的關(guān)鍵在于確定最近鄰數(shù)K,特征矢量維數(shù)P和抽樣權(quán)重Wj(t)。
1.2 K、P和Wj(i)的確定
(2)
即特征矢量的權(quán)重與距離成反比,然后再歸一化,得到最后權(quán)重Wj(i)。
2.1 蒙特卡洛算法的概述
蒙特卡洛法又稱統(tǒng)計(jì)模擬實(shí)驗(yàn)法,隨機(jī)模擬法。近年來,由于電子計(jì)算機(jī)的發(fā)明和科學(xué)技術(shù)的不斷進(jìn)步,蒙特卡洛法逐漸作為一種獨(dú)立的方法被提出來,并首先在核武器的試驗(yàn)與研制中得到了應(yīng)用。蒙特卡洛方法是一種計(jì)算方法,但與一般數(shù)值計(jì)算方法最大的區(qū)別在于它是以概率統(tǒng)計(jì)理論為基礎(chǔ)。因?yàn)樵摲椒軌虮容^逼真地描述事物的特點(diǎn)及物理實(shí)驗(yàn)過程,解決一些數(shù)值方法難以解決的問題,因而該方法的應(yīng)用領(lǐng)域日趨廣泛[7]。
2.2 蒙特卡洛的基本應(yīng)用
通常蒙特卡洛方法大體可以分成兩類:① 求解問題本身就具有概率和統(tǒng)計(jì)性。② 對于不具有隨機(jī)性質(zhì)的確定性問題,就必須事先構(gòu)造一個(gè)人為的概率過程,將不具有隨機(jī)性質(zhì)的問題轉(zhuǎn)化為隨機(jī)性質(zhì)的問題。近年來,由于信息技術(shù)的發(fā)展,蒙特卡洛算法在現(xiàn)代化的科學(xué)技術(shù)中發(fā)揮應(yīng)有的作用。蒙特卡洛方法的一般步驟為:① 用蒙特卡洛方法模擬某一過程,產(chǎn)生各種概率分布的隨機(jī)變量。② 用統(tǒng)計(jì)方法把模型的數(shù)字特征估計(jì)出來,從而得到實(shí)際問題的數(shù)值解[8]。
由于降雨影響因素很多,因此降雨過程在時(shí)間上表現(xiàn)為隨機(jī)性。分布函數(shù)的選取應(yīng)該按照以下兩個(gè)準(zhǔn)則進(jìn)行:① 密度函數(shù)的形狀應(yīng)基本符合水文現(xiàn)象的物理性質(zhì),曲線一端或兩端應(yīng)有限,不應(yīng)出現(xiàn)負(fù)值。② 概率密度函數(shù)的數(shù)學(xué)性質(zhì)簡單,計(jì)算方便,同時(shí)應(yīng)有一定的彈性。以便有廣泛的適應(yīng)性,但又不宜包含過多的參數(shù)。國內(nèi)外的研究表明:在水文分析中P-Ⅲ型和K-M型曲線適應(yīng)性都很強(qiáng),只要參數(shù)Cv和Cs選用適當(dāng),都能與洪水資料相適應(yīng)。我國現(xiàn)行制訂的水文計(jì)算規(guī)范中規(guī)定采用P-Ⅲ型分布函數(shù)[9]。
若有隨機(jī)變量x服從P-Ⅲ型分布函數(shù),其概率表達(dá)見式(3):
(3)
式(3)直接計(jì)算復(fù)雜而困難,我們進(jìn)行變量的替換,令t=β(x-α0),代入(3)可得:
(4)
式(4)中當(dāng)P值已知時(shí),tp僅依賴α或Cs。將x用t表示可得:
(5)
(6)
由于tp是xp的數(shù)學(xué)代換,同樣服從伽瑪分布。利用matlab函數(shù)x=gaminv(P,A,B)可得:
(7)
4.1預(yù)測值的選擇
為了保持預(yù)報(bào)序列和原始序列具有相同的概率特性,需要滿足兩個(gè)原則:① 預(yù)測值生成時(shí)遵循了歷史數(shù)據(jù)的分布概率規(guī)律;② 整個(gè)預(yù)報(bào)序列年降雨量的平均值與過去資料的年降雨量平均值近似相等。
4.2 Cs,Cv的選擇與確定
4.2.2 離差平方和準(zhǔn)則的優(yōu)化適線法 離差平方和準(zhǔn)則的優(yōu)化適線法就是使經(jīng)驗(yàn)點(diǎn)據(jù)和同頻率曲線縱坐標(biāo)之差的平方和達(dá)到最小。對于P-Ⅲ型曲線,就是使下列目標(biāo)函數(shù)取最小。
(8)
即S(Q′)=minS(Q)
(9)
由于樣本通過矩估計(jì)的均值誤差很小,一般不再使用優(yōu)化適線法估計(jì)。通常只用優(yōu)化適線法估計(jì)Cv和Cs兩個(gè)參數(shù)值。圖1為同均值時(shí),離差系數(shù)Cv和偏態(tài)系數(shù)Cs的關(guān)系圖,可以看出,當(dāng)離差平方和最小時(shí),可以確定Cv=0.1110,Cs=0.7869,誤差Emin=4.0664E+004。選擇不同Cv和Cs,得到不同P-Ⅲ型曲線累積概率圖。由圖2可以看出其中當(dāng)Cv=0.1110,Cs=0.7869時(shí)得到的經(jīng)驗(yàn)累積概率和P-Ⅲ曲線累積概率圖非常接近,說明此時(shí)Cv和Cs確定的P-Ⅲ型曲線能夠模擬樣本的分布情況[11]。
圖1離差系數(shù)Cv和偏態(tài)系數(shù)Cs的關(guān)系圖2經(jīng)驗(yàn)累計(jì)和Cv、Cs確定的P-Ⅲ的累計(jì)概率
4.3 分析步驟及算法流程
5.1 研究區(qū)域降雨量特征
北盤江水系屬于珠江流域,全長450km,貴州省境內(nèi)長352km,流域面積26 538km2,貴州省境內(nèi)20 982km2,涉及威寧、水城、六枝、盤縣、普安、晴隆、興仁、安龍、貞豐、冊亨、望謨、紫云、鎮(zhèn)寧、關(guān)嶺、普定、西秀16個(gè)縣(市、區(qū))。流域內(nèi)水資源豐富,年平均降雨量約為1 280mm。但降雨時(shí)空和地域分布不平衡:南多北少,山區(qū)多于河谷,迎風(fēng)面降雨多,背風(fēng)面降雨少。同時(shí),區(qū)域土層薄,坡地土壤易侵蝕,風(fēng)化土層,土質(zhì)疏松易被沖刷,土壤蓄水保墑能力差。近年來水旱災(zāi)害頻發(fā)。干旱的大致規(guī)律為“年年有旱情、三年一小旱、五年一中旱、十年一大旱”特點(diǎn)。頻發(fā)的旱災(zāi),給區(qū)域經(jīng)濟(jì)社會帶來了巨大的損失,影響了社會的和諧穩(wěn)定。同時(shí)年降雨量作為區(qū)域干旱最為顯著的致災(zāi)因素,與眾多干旱指標(biāo)相關(guān)性最大,因此對降雨量的預(yù)報(bào)工作尤為重要。
5.2 算法驗(yàn)證
本實(shí)驗(yàn)中,根據(jù)北盤江地區(qū)1961—2010年50a降雨實(shí)測數(shù)據(jù),將數(shù)據(jù)劃分為訓(xùn)練數(shù)據(jù)(前45年)和測試數(shù)據(jù)(后5a)。在連續(xù)的45a訓(xùn)練數(shù)據(jù)中,分別計(jì)算了前m(m∈[1,2,…,m])年的均值,當(dāng)m=25時(shí),能夠很好地代表第一個(gè)歷史降雨量年均值,最小最大降雨量年平均值區(qū)間為[1 354.6mm,1 396.2mm]。訓(xùn)練數(shù)據(jù)分別使用蒙特卡洛方法和基于NNBR模型的蒙特卡洛方法對未來5a進(jìn)行預(yù)測,得到一個(gè)長度為5的預(yù)測序列,然后與測試數(shù)據(jù)(真實(shí)數(shù)據(jù))對應(yīng)計(jì)算相對誤差,最后計(jì)算整個(gè)序列與測試數(shù)據(jù)序列的總相對誤差平方和S2。為了能夠更好地比較兩種方法的結(jié)果,本實(shí)驗(yàn)循環(huán)運(yùn)行8次,并將所得的結(jié)果填入表1。其中測試數(shù)據(jù)在每次循環(huán)運(yùn)行時(shí)相同,其降雨量序列值為:1 146.8,1 406.2,1 419.9,1 046.5,1 230.1mm。
表1 蒙特卡洛和NNBR+蒙特卡洛算法的預(yù)測結(jié)果比較
*其中,S2表示預(yù)測序列相對于真實(shí)序列的相對誤差平方和。
同時(shí),基于NNBR的蒙特卡洛預(yù)測值與實(shí)際值比較可以看出,各年的誤差均小于10%,循環(huán)次數(shù)增加,誤差逐漸變小,所以本文所建立的預(yù)報(bào)模型基本可以滿足生產(chǎn)實(shí)際要求。為了能夠更好地說明上面的八次循環(huán)不是偶然的,又重復(fù)運(yùn)行1 000次,其中基于NNBR模型的蒙特卡洛算法優(yōu)于蒙特卡洛算法次數(shù)為891次,劣于蒙特卡洛算法109次。由此可以看出基于NNBR模型的蒙特卡洛算法好于蒙特卡洛算法。
5.3 未來降雨量的預(yù)測
以50 a的歷史數(shù)據(jù)對未來5 a的降雨量進(jìn)行預(yù)測,分別使用蒙特卡洛算法和基于NNBR模型的蒙特卡洛算法得到不同的預(yù)測序列數(shù)據(jù)如表2所示。
表2 蒙特卡洛和基于NNBR模型的蒙特卡洛算法對未來5年降雨量的預(yù)測值 mm
本文根據(jù)蒙特卡洛算法原理,通過P-Ⅲ型函數(shù)對歷史降雨量進(jìn)行模擬,將蒙特卡洛算法與NNBR模型相結(jié)合,采用研究區(qū)域50 a的降雨實(shí)測資料,并將其劃分為訓(xùn)練數(shù)據(jù)(前45年)和測試數(shù)據(jù)(后5年),構(gòu)建了貴州北盤江水系降雨量預(yù)報(bào)模型。基于NNBR的蒙特卡洛預(yù)測值與實(shí)際值模型驗(yàn)證結(jié)果表明,各年的誤差均小于10%,循環(huán)次數(shù)增加,誤差變小趨勢明顯。所以本文所建立的預(yù)報(bào)模型與實(shí)際情況較為相符,基本可以滿足生產(chǎn)實(shí)際要求。同時(shí),開展基于NNBR模型的蒙特卡洛方法與蒙特卡洛方法比較,基于NNBR模型的蒙特卡洛算法好于蒙特卡洛算法的比率為89.1%,表明前者優(yōu)于后者。最后利用基于NNBR與蒙特卡洛算法的降雨量預(yù)報(bào)模型來預(yù)測未來5 a降雨量,準(zhǔn)確地反映了研究區(qū)降雨量發(fā)生的隨機(jī)性和統(tǒng)計(jì)的規(guī)律性,以及降雨序列的時(shí)間性,具有重要的理論和實(shí)際意義。
[1] 韋慶,盧文喜,田竹君.運(yùn)用蒙特卡洛方法預(yù)報(bào)年降雨量研究[J].干旱區(qū)資源與環(huán)境,2004,18(4):144-146.
[2] 楊金玲,吳亞楠,謝淼,等.蒙特卡洛法在嫩江流域汛期降雨量預(yù)測中的應(yīng)用[J].南水北調(diào)與水利科技,2011,9(3):28-29.
[3] 王文圣,袁鵬,丁晶.最近鄰抽樣回歸模型在水環(huán)境預(yù)測中的應(yīng)用[J].中國環(huán)境科學(xué),2001,21(4):367-370.
[4] 王文圣,向紅蓮,丁晶.最近鄰抽樣回歸模型在水文水資源預(yù)報(bào)中的應(yīng)用[J].水電能源科學(xué),2001,19(2):8-10.
[5] 劉東,付強(qiáng).小波最近鄰抽樣回歸耦合模型在三江平原年降水預(yù)測中的應(yīng)用[J]. 灌溉排水學(xué)報(bào),2007,26(4):82-85.
[6] 焦瑞峰,吳昊,師洋.基于灰色關(guān)聯(lián)分析的蒙特卡洛法建立水庫出庫水質(zhì)預(yù)測模型[J].環(huán)境工程,2006,24(4):63-65.
[7] 張弦.基于改進(jìn)粒子濾波算法的移動機(jī)器人定位[D].北京:北京郵電大學(xué),2010.
[8] 董麗麗,徐淑琴,劉楊,等.小波隨機(jī)耦合模型在查哈陽農(nóng)場降雨量預(yù)測中應(yīng)用[J].中國農(nóng)村水利水電,2011(4):26-28.
[9] 黃顯峰,邵東國,陽書敏.降雨時(shí)間序列分解預(yù)測模型及應(yīng)用[J].中國農(nóng)村水利水電,2007(9):6-8.
[10] 周愛霞,張行南.優(yōu)化適線法在水文頻率分析中的應(yīng)用[J].人民長江,2007,38(6):38-39.
[11] 崔磊,遲道才,曲霞.基于小波消噪的平穩(wěn)時(shí)間序列分析方法在降雨量預(yù)測中的應(yīng)用[J].中國農(nóng)村水利水電,2010(9):30-35.
[12] 任曄,徐淑琴.灰色神經(jīng)網(wǎng)絡(luò)組合模型在慶安縣年降雨量預(yù)測中的應(yīng)用[J].節(jié)水灌溉,2012(9):24-25.
AppliedResearchoftheRainfallForecastModelBasedonNNBRandMonte-CarloAlgorithm
ZHANG He-xi1,2, CHI Dao-cai1, WANG Yong-tao2, WANG Fu-chen2
(1.CollegeofWaterResources,ShenyangAgriculturalUniversity,Shenyang110161,China; 2.GuizhouAcademyofHydraulicSciences,Guiyang550002,China)
From the statistical point, the complex historical process of rainfall was understood and analyzed, and the inherent law of its existence was found for the purpose of providing the theoretical basis for predicting the future rainfall. This paper had analyzed the Monte-Carlo algorithm and its distribution function, we had used the P-type Ⅲ distribution function to simulate rainfall and put forward the rainfall forecast model based on NNBR algorithm and the Monte-Carlo algorithm. Based on comparing Monte-Carlo predicted value to obserbed value, the result of error is less than 10%, the more cycling times, the less error, so the prediction model established in this paper can meet the production requirements basically. At the same time, the model based on NNBR Monte-Carlo algorithm is better than that of only using the Monte-Carlo algorithm of the ratio of 89.1%, indicating that the forecast accuracy presented in the paper is the best. Finally, with Beipaniiang drainage 50 years data,we had validated the result from the forecast model, and rainfall was predicted in the next five years. The results not only embody the randomness and statistical regularity of rainfall, but also reflect the rainfall sequence of timeliness, and the application effect is good.
model of NNBR; Monte-Carlo algorithm; P-Ⅲ distribution function; rainfall forecast model
2013-08-21
:2013-09-23
國家公益性行業(yè)(農(nóng)業(yè))科研專項(xiàng)(201303125);水利部公益性行業(yè)科研專項(xiàng)經(jīng)費(fèi)項(xiàng)目(201201025,201301039)
張和喜(1980—),男,湖北荊州人,在讀博士,主要從事節(jié)水灌溉原理與技術(shù)研究。E-mail:hexi0926@126.com
遲道才(1964—),男,遼寧沈陽人,博士生導(dǎo)師,主要從事灌溉排水原理與技術(shù)。E-mail:daocaichi@vip.sina.com
P457.6
:A
:1005-3409(2014)02-0106-05