樊湘鵬,許 燕,*,周建平,李志磊
(1.新疆大學 機械工程學院,新疆 烏魯木齊 830047;2.新疆大學 工程訓練中心,新疆 烏魯木齊 830047)
參考作物騰發(fā)量(ET0)作為獲取作物需水狀況的重要根據(jù),其對于制定中長期的農(nóng)業(yè)需水預測與水文規(guī)劃具有重要的指導意義[1]。針對ET0的計算,國內(nèi)外專家學者提出經(jīng)驗公式法、水汽擴散法、能量平衡法和綜合法等計算模型[2],國際備受推崇的Penman-Monteith公式既包含了作物的生理特征,又將空氣動力學參數(shù)作為計算因子,在多種不同氣候條件和不同類型的地區(qū)都有較高精度的驗證[3-4]。由于P-M公式在計算時要求氣象條件多,在面積廣闊和天氣極端的地區(qū)尤其是在新疆地區(qū)同時測量這些氣象數(shù)據(jù)是非常困難的,該公式受到一定的限制[5]。因此若要準確計算ET0值或需要對ET0未來變化趨勢進行預測時就需要利用精度較好、能夠準確反映ET0在作物生長期內(nèi)變化的預測模型來代替基于數(shù)值計算而建立的P-M公式模型[6]。
近年來,針對人工智能和數(shù)據(jù)挖掘的研究不斷深入,如最小二乘支持向量機[7-8]、基因編程、自適應模糊神經(jīng)推理系統(tǒng)[9-11]和人工神經(jīng)網(wǎng)絡[12-16]等被引入水文科學非線性系統(tǒng)的數(shù)據(jù)預測研究中,比傳統(tǒng)的灰色預測、回歸擬合等更有優(yōu)越性[17-18],國內(nèi)外學者針對數(shù)據(jù)挖掘展開的ET0的預測模型或方法在精度方面可以滿足應用,但從ET0的物理因素上來看,由于四季更替與晝夜變化,氣候與環(huán)境表現(xiàn)出周期性的非平穩(wěn)特性,ET0在時域上也具有冬春小、夏秋大的周期性年際變化特點[19],若不采取有效的處理辦法降低時間序列的非平穩(wěn)特性,在進行建模過程中很難保證精確的預測結果和良好的收斂性能。將小波分析與神經(jīng)網(wǎng)絡相結合可有效提取非線性、非平穩(wěn)的ET0時間序列時頻分析特性,使神經(jīng)網(wǎng)絡具有更靈活的逼近能力和更強的模型識別能力與容錯能力,結合遺傳算法優(yōu)化網(wǎng)絡,能夠在精度和收斂性能上得到提高。因此,本文提出一種將遺傳算法和小波神經(jīng)網(wǎng)絡相結合的ET0預測方法,用于新疆干旱地區(qū)農(nóng)作物中長期需水預測與水文研究。
本次研究所選擇地區(qū)為新疆喀什地區(qū)。該地區(qū)位于新西北內(nèi)陸,介于E 71.39′~79.52′、N 35.28′~40.16′之間,東邊是塔克拉瑪干大沙漠,東北緊鄰阿克蘇地區(qū)。主要種植糧食作物是玉米、小麥,經(jīng)濟作物是棉花,是重要的棉花基地之一(信息來自中國地理信息中心)。
研究的數(shù)據(jù)資料來源為中國氣象網(wǎng)和新疆氣象局從2007年至2016年的喀什氣象站點的觀測資料。需要的數(shù)據(jù)類型為日最高氣溫(Tmax)、日最低氣溫(Tmin)、日照時數(shù)(Hs)、相對濕度(hr)、風標高度處的風速(Uh)等。根據(jù)站點的氣象資料利用P-M公式計算得出ET0作為標準值并對數(shù)據(jù)進行歸一化處理;在MATLAB中建立三層小波BP神經(jīng)網(wǎng)絡結構模型,小波基函數(shù)可將ET0序列分解為高頻量和低頻量,采用遺傳算法對小波BP神經(jīng)網(wǎng)絡參數(shù)值進行優(yōu)化,歸一化的數(shù)據(jù)變量進行網(wǎng)絡訓練與測試,得到與P-M標準值進行擬合的預測曲線,仿真分析比較模型的預測精度與性能并在水肥一體化實驗平臺上驗證其應用效果。
BP神經(jīng)網(wǎng)絡有良好的非線性特征和自組織學習方法,在時間序列的預測建模中有著廣泛的應用。但是單一的BP神將網(wǎng)絡在訓練中容易陷入局部極值而非全局最優(yōu)值且收斂速度慢[20]。小波分析同神經(jīng)網(wǎng)絡的組合使用,能夠將良好的時頻局部和變焦特征與神經(jīng)網(wǎng)絡自學習、自適應性、強魯棒性相結合,有效提高網(wǎng)絡模型的收斂速度和逼近能力,從而更好地實現(xiàn)預測功能[21]。但在參數(shù)優(yōu)化方面受限于固定的梯度下降法,易陷入局部極小值、引起振蕩效應[22]。小波神經(jīng)網(wǎng)絡結構如圖1所示。
遺傳算法(GA,Genetic Algorithm)是采用生物選擇和遺傳學機制的全局自適應概率的搜索算法,能提供通用的優(yōu)化框架從而避免落入局部最優(yōu)的陷阱[23]。GA優(yōu)秀的全局搜索能力可在復雜、多態(tài)性、不連續(xù)的氣象數(shù)據(jù)和ET0序列與空間里優(yōu)化小波神經(jīng)網(wǎng)絡結構和參數(shù),大大提高預測速度、精度和模型泛化能力[24],避免小波神經(jīng)網(wǎng)絡收斂速度慢和陷入局部極小、產(chǎn)生振蕩效應的缺點。GA優(yōu)化網(wǎng)絡訓練的步驟如下:
1) 初始化種群,對小波神經(jīng)網(wǎng)絡參數(shù)進行編碼;
2) 設定遺傳算法迭代次數(shù)、種群規(guī)模、交叉概率和變異概率等參數(shù);
3) 計算個體適應度并將其排序;
5) 交叉變異操作優(yōu)化群體,沒有交叉操作的個體進行直接復制;以變異概率Pm變異產(chǎn)生新的個體,采用均勻變異的方法產(chǎn)生新的種群;
6) 重復(2)~(4)直接達到最大迭代次數(shù)或達到預設值或者結束條件時,得到最優(yōu)群體,并將最優(yōu)個體解碼獲得小波神經(jīng)網(wǎng)絡參數(shù),作為最優(yōu)的網(wǎng)絡初始參數(shù);
7) 利用小波神經(jīng)網(wǎng)絡梯度下降法對(6)所得到的最優(yōu)初始參數(shù)進行二次訓練得到最優(yōu)值用于參考作物騰發(fā)量的預測。
圖1 小波神經(jīng)網(wǎng)絡結構
Fig.1 Structure of WNN
圖2 算法流程圖
Fig.2 Algorithm flow chart
段春峰等人利用偏相關分析法得到了西北地區(qū)多種氣象因子對ET0變化的重要程度,結合參考文獻[25-26]得出了影響西北干旱地區(qū)參考作物蒸散量的主要因素為:風速、太陽輻射量、氣溫和相對濕度。為提高網(wǎng)絡模型的預測精度,利用SPSS軟件對影響ET0值的因素進行相關性分析(見表1),但最高氣溫與最低氣溫具有顯著相關性,根據(jù)經(jīng)典統(tǒng)計學理論,自變量之間相關性過大會導致模型精度下降。因此選擇對ET0的值影響大較大的最高氣溫、日照時數(shù)、日均風速和相對濕度這4個因子作為模型的最優(yōu)輸入組合。
表1 各氣象因子與ET0相關系數(shù)
Tab.1 Correlation coefficients between meteorological factors and ET0
從理論上可知,單隱含層的多輸入單輸出三層神經(jīng)網(wǎng)絡能夠實現(xiàn)有界區(qū)域上的任意復雜的非線性映射問題,因此選擇單隱含層的三層神經(jīng)網(wǎng)絡建立預測模型[22]。
由Kolmogorov定理可知,對于m個輸入向量的問題,采用(2m+1)個隱層節(jié)點的神經(jīng)網(wǎng)絡,能達到非線性函數(shù)精確擬合的程度[27]。模型其他參數(shù)如表2所示。
表2 GAWNN模型參數(shù)
Tab.2 Parameters of GAWNN
參數(shù)名稱參數(shù)設置種群規(guī)模10進化次數(shù)20交叉概率0.3變異概率0.1
圖3 初始樣本序列
Fig.3 Initial sample sequence
實驗數(shù)據(jù)選自新疆喀什站點2007~2016年逐日氣象數(shù)據(jù),首先利用P-M公式對這10年內(nèi)的逐日ET0值進行計算與統(tǒng)計作為標準值或實際值,并將其中的3 140組數(shù)據(jù)序列分為2組,選擇其中的前3 000組樣本點數(shù)據(jù)作為訓練數(shù)據(jù),另外一組140組樣本序列作為預測數(shù)據(jù)進行預測。
為便于計算和提高網(wǎng)絡訓練速度對網(wǎng)絡模型的輸入數(shù)據(jù)進行歸一化變量預處理,在數(shù)據(jù)訓練和數(shù)據(jù)預測之前利用如下公式進行歸一化處理,以便將輸入值映射在[-1,1]的區(qū)間之內(nèi):
式中,x為歸一化前樣本;y為歸一化后的輸入值。
在數(shù)據(jù)歸一化處理后,利用小波變換將預測樣本序列單尺度分解和重構后得到低頻ET0量和高頻ET0量。利用遺傳算法優(yōu)化小波神經(jīng)網(wǎng)絡(GAWNN)預測模型分別進行低頻序列預測和高頻序列預測,得到的低頻ET0預測結果和高頻ET0預測結果,之后進行高頻低頻疊加預測,預測結果如圖4~6所示。
圖4 GAWNN模型預測低頻ET0擬合效果圖
Fig.4 GAWNN Model predicts low-frequency ET0fitting
圖5 GAWNN模型預測高頻ET0擬合效果圖
Fig.5 GAWNN Model predicts high-frequency ET0fitting
圖6 GAWNN模型預測疊加ET0擬合效果圖
Fig.6 GAWNN predicts superposition ET0fitting
為了表現(xiàn)遺傳算法的必要性,在不加遺傳算法的情況下利用小波神經(jīng)網(wǎng)絡(WNN)預測模型進行低頻量和高頻量的預測,得到結果如圖7所示。為便于直觀對比,又建立了WNN和GAWNN兩種模型同時預測的擬合效果對比圖。
圖7 兩種預測模型擬合效果對比
Fig.7 The comparison diagram of two prediction models
研究過程中,模型分別利用平均絕對誤差(MAE,Mean Absolute Error)、均方誤差(MSE,Mean-square Error)、均方百分比誤差(MSPE,Mean-square Percentage Error)三個指標進行評價,其計算公式為
經(jīng)過計算各項指標如表3所示,對比可知WGANN模型相對WNN模型具有更優(yōu)異的預測性能,即遺傳算法優(yōu)化小波神經(jīng)網(wǎng)絡確實提高了小波神經(jīng)網(wǎng)絡的預測精度。同時在模型的速度收斂上,給出了兩種預測模型網(wǎng)絡訓練過程結束時的性能曲線。神經(jīng)網(wǎng)絡訓練過程中,WGANN比WNN預測模型的有更快的收斂速度,更快達到設定誤差。
表3 GAWNN與WNN模型預測評價
Tab.3 GAWNN and WNN model prediction evaluation
模型類型MAERMSEMSPEWNN0.456 40.120 70.03WGANN0.180.092 30.002
為了進一步驗證遺傳算法優(yōu)化后小波神經(jīng)網(wǎng)絡的性能,在智能灌溉與水肥一體化精準控制系統(tǒng)的平臺上對模型進行實驗測試。實驗平臺主要由中央控制端、電磁閥、水泵、電磁閥、電磁流量計、水過濾器、壓力變送器和土壤溫濕度傳感器以及戶外小型氣象站組成。圖8為智能灌溉與水肥一體化精準控制系統(tǒng)樣機。
圖8 智能灌溉與水肥一體機實物模型
Fig.8 Model of intelligent irrigation and water fertilizer machine
作物需水量通過系統(tǒng)模型庫,由參照作物騰發(fā)量與相應農(nóng)作物系數(shù)相乘得到。本實驗選擇冬小麥為實驗對象,需水系數(shù)Kc在總的生長期取值為0.850,ET0由灌溉決策系統(tǒng)中的預測模型得到。水路的電磁流量計采集水量并反饋給控制端,同時在灌溉決策系統(tǒng)界面實時顯示。本實驗將P-M公式值與小波神經(jīng)網(wǎng)絡預測模型和遺傳算法優(yōu)化后的小波神經(jīng)網(wǎng)絡預測模型做比較。
實驗日期選擇為2017年10月30日到11月16日,系統(tǒng)根據(jù)設定時間讀取流量計的值,將傳感采集環(huán)境數(shù)據(jù)輸入到智能灌溉決策系統(tǒng)的預測模型中,得到ET0值。流量計的值大小代表灌水量,將流量計采樣的數(shù)據(jù)利用MATLAB繪制成曲線圖。圖9為3種預測方法得到的電磁流量曲線對比圖。
圖9 3種預測方法得到的流量曲線
Fig.9 The flow curves obtained by three prediction methods
圖9中方塊線條是利用P-M公式計算ET0時得到的電磁流量計流量值,圓圈線條是直接利用小波神經(jīng)網(wǎng)絡模型預測ET0值時得到的流量計流量值,三角形線條是經(jīng)遺傳算法優(yōu)化后的小波神經(jīng)網(wǎng)絡模型預測得到ET0時流量計流量值。通過分析圖9中P-M公式值、WNN預測值與WGANN預測值折線圖可以很清晰地看到經(jīng)遺傳算法優(yōu)化后后的小波神經(jīng)網(wǎng)絡模型得到的預測值更加接近PM計算值。
本文提出一種基于遺傳算法優(yōu)化小波神經(jīng)網(wǎng)絡的ET0預測方法,能針對ET0的周期性非平穩(wěn)特性將時間信號分解為高低頻兩種序列,得到較為平穩(wěn)的ET0時間序列,起到了降低神經(jīng)網(wǎng)絡模型在預測中的隨機誤差的效果。同時文中建立的GAWNN預測模型利用喀什地區(qū)氣象站點資料對當?shù)氐腅T0值進行訓練、預測并與WNN模型預測結果與收斂性能進行比較分析,表明遺傳算法優(yōu)化小波神經(jīng)網(wǎng)絡比不采用遺傳算法優(yōu)化的小波神經(jīng)網(wǎng)絡具有更高的精度和更小的誤差,且在預測性能上具有更快的收斂速度?;诖四P停谥悄芄喔扰c水肥一體化系統(tǒng)平臺上進行灌溉決策的實驗驗證,得到3種不同方法的作物灌水量曲線圖,充分表明了GAWNN預測模型在作物需水決策中的良好性能,為計算參考作物騰發(fā)量提供了新的思路和依據(jù)。