王 澤
(臨汾市水文水資源勘測分局,山西 臨汾 041000)
中國國土面積963萬km2,現(xiàn)有2 474個國家級地面站,國家級氣象站覆蓋率較低,且現(xiàn)有氣象站數(shù)據(jù)存在蒸發(fā)量缺測現(xiàn)象,正確認識水面蒸發(fā)量與氣象因子之間的關(guān)系,建立適用于中國地區(qū)的區(qū)域性水面蒸發(fā)計算模型,對水資源利用等都具有十分重要的現(xiàn)實意義[1-3]。目前也有學(xué)者結(jié)合BP(Back-Propagation)神經(jīng)網(wǎng)絡(luò)等建立了蒸發(fā)量預(yù)測模型,但對不同氣象因子組合與蒸發(fā)量預(yù)測結(jié)果的影響極為缺乏[4-5]。
以山西省晉城市陽城氣象站2015—2016年日氣象數(shù)據(jù)為基礎(chǔ),利用灰色關(guān)聯(lián)理論,計算各影響因子對水面蒸發(fā)量的灰色關(guān)聯(lián)度,選擇關(guān)聯(lián)度較高的影響因素進行組合,作為模型輸入變量組,建立了不同氣象因子組合下的蒸發(fā)量的BP預(yù)測模型,并以該站2017年日氣象數(shù)據(jù)對模型模擬結(jié)果進行驗證,分析模型的合理性。
選擇晉城市陽城站(站碼53 975)基礎(chǔ)氣象數(shù)據(jù),數(shù)據(jù)來源中國氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng),包括2016—2017年陽城站的逐日平均氣溫(TEM)、逐日平均風(fēng)速(WIN)、逐日日照時數(shù)(SSD)、逐日平均相對濕度(RHU)、逐日20—20時累計降水量(PRE)及逐日蒸發(fā)量(EVP)數(shù)據(jù)。
灰色系統(tǒng)理論是學(xué)者鄧聚龍于1982年創(chuàng)立的預(yù)測理論,是一種解決貧信息、少數(shù)據(jù)問題的常用方法。原理是以樣本數(shù)據(jù)為依據(jù),利用灰色關(guān)聯(lián)理論,求出灰色關(guān)聯(lián)度,以此描述因素間關(guān)系的強弱和次序。利用灰色關(guān)聯(lián)理論,確定各氣象因子對蒸發(fā)量作用的大小,合理確定蒸發(fā)量預(yù)測模型的輸入因子。
利用Matlab軟件設(shè)計模型的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。所選擇的訓(xùn)練函數(shù)、輸入層激活函數(shù)、隱含層激活函數(shù)與輸出層激活函數(shù)分別為trainlm函數(shù)、sigmoid函數(shù)、tansig正切函數(shù)與purelin線性函數(shù)。設(shè)定的建模參數(shù)如表1所示。
表1 模型設(shè)定的訓(xùn)練參數(shù)
計算時,依據(jù)公式(1)限定的最小初始隱含層節(jié)點數(shù),構(gòu)建網(wǎng)絡(luò)模型。
式中:z——中間隱含層神經(jīng)元個數(shù);
f——輸入層神經(jīng)元個數(shù);
k——輸出層神經(jīng)元個數(shù);
p——介于0~10的任意常數(shù)。
蒸發(fā)量BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型拓撲結(jié)構(gòu),如公式(2)所示:
式中:net——蒸發(fā)量BP預(yù)報模型結(jié)構(gòu);
newff——Matlab工具箱中的BP神經(jīng)網(wǎng)絡(luò)函數(shù);
minmax()——輸入變量的取值矩陣;
traininput——輸入變量;
[10,2]——10為中間隱含層個數(shù),2為輸出隱含層的個數(shù);
tansig——輸入層到隱含層的傳遞函數(shù);
purelin——隱含層到輸出層的傳遞函數(shù);
trainlm——灰色BP神經(jīng)網(wǎng)絡(luò)預(yù)報模型的學(xué)習(xí)函數(shù)。
通過比較訓(xùn)練結(jié)果,決定系數(shù)R2對模型的預(yù)測效果,R2越大預(yù)測結(jié)果越好。評判系數(shù)見公式(3):
式中:N——樣本數(shù)量;
θi——實測值;
利用灰色關(guān)聯(lián)理論計算得到影響蒸發(fā)量的5個參數(shù)對蒸發(fā)量的關(guān)聯(lián)度,如表1所示。一般關(guān)聯(lián)度大于等于0.8時,子序列與母序列關(guān)聯(lián)度很好[6]。本次研究選擇的參數(shù)的關(guān)聯(lián)度均在0.80以上,因此各氣象因子的選取是合理的。
表1 各氣象因子與蒸發(fā)因子關(guān)聯(lián)度
所選輸入因子,有逐日平均氣溫(TEM)、逐日平均風(fēng)速(WIN)、逐日日照時數(shù)(SSD)、逐日平均相對濕度(RHU)、逐日20—20時累計降水量(PRE)及逐日蒸發(fā)量(EVP)。預(yù)報模型精度的提高,不僅依賴于數(shù)據(jù)挖掘技術(shù)的應(yīng)用,還取決于輸入變量的選擇。為研究不同因子組合下的模型預(yù)測效果,分別構(gòu)建不同數(shù)量因子組合下的預(yù)測模型,共計26組,對模型輸出結(jié)果進行檢驗,從而尋求最佳的模型輸入因子組合。以2015—2016年日系列氣象因子組合作為輸入變量,以2015—2016年日蒸發(fā)量作為輸出變量,構(gòu)成模型訓(xùn)練樣本,構(gòu)建BP模型。取訓(xùn)練效果最佳的BP神經(jīng)網(wǎng)絡(luò)模型,以2017年相應(yīng)的氣象因子組合,作為所建預(yù)測模型的測試樣本,得到模型的擬合結(jié)果。通過對26種因子組合樣本進行訓(xùn)練,建立了26個蒸發(fā)量預(yù)測模型,各因子組合下的訓(xùn)練效果,如表2所示。
表2 各因子組合下的模擬效果
由表2可知,各因子組合下的模型R2介于0.570與0.929之間,訓(xùn)練差距較大,表明因子組合是影響蒸發(fā)量預(yù)測精度的關(guān)鍵因素。建立的BP蒸發(fā)量訓(xùn)練模型精度最高(R2最大取為0.929)時,對應(yīng)的因子組合為TEM+WIN+SSD+RHU+PRE;其次R2為0.920時,對應(yīng)的因子組合為TEM+WIN+SSD+RHU;訓(xùn)練模型精度最低(R2最小為0.570)時,對應(yīng)的因子組合為RHU+PRE,最佳與最差訓(xùn)練結(jié)果對比見圖1。
這表明,對晉城地區(qū)的蒸發(fā)量預(yù)測,取TEM+WIN+SSD+RHU+PRE組合,進行BP模型構(gòu)建與訓(xùn)練,模型模擬結(jié)果最為可靠,更為接近實際,TEM+WIN+SSD+SSD+RHU組合次之。取RHU+PRE組合其結(jié)果較差,不能為實際提供參考。
圖1 訓(xùn)練結(jié)果對比圖
本文取TEM+WIN+SSD+RHU+PRE組合作為輸入因子訓(xùn)練得到的BP神經(jīng)網(wǎng)絡(luò)模型對晉城市2017年蒸發(fā)量進行預(yù)測,結(jié)果如圖2所示。
圖2 預(yù)測實測結(jié)果對比
得到預(yù)測值與實測值的R2為0.629,顯著性P為0.000,達到了顯著相關(guān)水平,以相對誤差在20%以內(nèi)作為判定標(biāo)準(zhǔn),該預(yù)測模型對蒸發(fā)練的預(yù)測共有231d,合格率為63.11%,可見該模型預(yù)測結(jié)果與實際情況較為一致。
基于灰色關(guān)聯(lián)與BP神經(jīng)網(wǎng)絡(luò),建立了26組由不同因子組合的晉城地區(qū)蒸發(fā)量預(yù)測模型,對模型精度進行對比分析后,得出氣象因子組合對模型訓(xùn)練效果具有重大影響。在晉城地區(qū)模型模擬精度最高時,對應(yīng)的因子組合為TEM+WIN+SSD+RHU+PRE,此時訓(xùn)練模型R2值0.929。
本研究內(nèi)容可為蒸發(fā)量預(yù)測提供新的思路:實踐中當(dāng)資料無法滿足最佳因子組合時,可根據(jù)本研究所得的因子組合精度表,選取所能得到的現(xiàn)有因子資料,進行預(yù)測精度最高的因子組合,對該地區(qū)的蒸發(fā)量進行預(yù)測。一方面,有助于提高資料充足地區(qū)的蒸發(fā)量預(yù)測精度;另一方面,可以為資料缺乏地區(qū)的蒸發(fā)量預(yù)測提供參考。建議對不同地區(qū)的季節(jié)性蒸發(fā)量預(yù)測模型進行研究,尋找區(qū)域性最佳預(yù)測因子組合,為蒸發(fā)量預(yù)測提供更多依據(jù)。