戰(zhàn)莘曄,呂 曉,金丹丹,康曉玉,韓艷鳳,韓國敬,徐慶喆,田 璐
(1鞍山市氣象局,遼寧鞍山 114004;2錦州市生態(tài)與農(nóng)業(yè)氣象中心,遼寧錦州 121000;3遼寧省農(nóng)業(yè)科學(xué)院植物營養(yǎng)與環(huán)境資源研究所,沈陽 110161)
南果梨屬秋子梨分支,歸類于薔薇科梨屬[1],是中國北方優(yōu)勢特色梨品種,主產(chǎn)地為遼寧省鞍山市及周邊地區(qū)。南果梨花期觀賞性強(qiáng)且風(fēng)味獨(dú)特,是中國四大名梨之一,富有“梨中之王”的盛名,并作為地標(biāo)產(chǎn)品在2019 年入選中國農(nóng)業(yè)品牌目錄[2-4]。南果梨花期為每年3—4月,受氣候條件的影響,尤其始花期與12月—翌年2月的氣象因子關(guān)系緊密[5-8]。探討氣候因子對南果梨花期的影響并建立二者的相關(guān)性、精準(zhǔn)確定南果梨的始花期及花期長短,可為鞍山地區(qū)南果梨產(chǎn)業(yè)及觀光旅游業(yè)的發(fā)展提供有價值的借鑒。
有關(guān)花期預(yù)報技術(shù)國內(nèi)外也有相關(guān)研究[9-13]。GONSAMO 等[14]模擬了植物始花期的距平變化;仲舒穎等[15]建立了基于溫度的花期時空預(yù)測模型;張?jiān)鲂诺萚16]對常見觀賞樹木的始花期進(jìn)行了特征分析;汪如良等[5]則利用有效積溫與花期的關(guān)系,建立了花期預(yù)測模型;葉海龍等[17]分析了油菜花期影響較大的氣象因子并建立了不定期預(yù)測始花期模式;李文靜等[18]分析了油菜花期特征,并利用計算出的積溫指標(biāo)來建立花期預(yù)報模型。
目前,植物觀賞花期預(yù)報主要采用有效積溫法,但此方法花期預(yù)報準(zhǔn)確率不高,大數(shù)據(jù)時代背景下,機(jī)器學(xué)習(xí)在預(yù)測模型方面初顯優(yōu)勢[19],是如今農(nóng)業(yè)氣象科研的重要工具之一[20],并且已在玉米、大豆、小麥、油菜、酥梨等農(nóng)作物自動識別及花期預(yù)測[21-24]中進(jìn)行了較好地應(yīng)用。本研究利用灰色關(guān)聯(lián)分析法在氣象因子與始花期資料當(dāng)中確定建模因子,建立基于神經(jīng)網(wǎng)絡(luò)的南果梨始花期預(yù)測模型,通過相關(guān)分析法建立始花期回歸預(yù)測模型,并對2種模型進(jìn)行比對,研究結(jié)果可為建立南果梨始花期預(yù)報模型選擇更優(yōu)算法提供新思路。
南果梨始花期資料來源于鞍山南果梨種植基地觀測資料,南果梨始花期資料來源于鞍山南國梨種植基地觀測資料,氣象資料來源于鞍山市國家基本氣象站2000—2020 年冬季12—翌年2 月逐日日最高氣溫、日最低氣溫、日均氣溫、日降水量、日照時數(shù)、日均5 cm地溫、日均相對濕度等氣象觀測資料,通過計算得到2000—2020年逐年冬季要素的日平均值,除去記錄缺失年份,共16 a。
1.2.1 灰色關(guān)聯(lián)分析方法 灰色關(guān)聯(lián)分析法是將因素之間發(fā)展趨勢的相似程度判斷為關(guān)聯(lián)程度高低的一種方法。以2000—2020年始花期作為母序列,以同期氣象觀測資料為系統(tǒng)影響因素子序列,計算母序列與各子序列之間的關(guān)聯(lián)度,選取關(guān)聯(lián)程度相對較高的因子作為神經(jīng)網(wǎng)絡(luò)的輸入因子從而建立預(yù)測模型。
1.2.2 基于灰色關(guān)聯(lián)與BP、RBF 神經(jīng)網(wǎng)絡(luò)的建模方法BP(Black Propagation)神經(jīng)網(wǎng)絡(luò)是一種多層前饋網(wǎng)絡(luò),一個3 層的BP 神經(jīng)網(wǎng)絡(luò)能較好地表征復(fù)雜的非線性問題[25-26],因此,本研究在進(jìn)行BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計時,選擇1個輸入層、1個隱層和1個輸出層,建立基于灰色關(guān)聯(lián)因子的始花期預(yù)報模型,輸入層為選取的灰色關(guān)聯(lián)度高的因子,輸出層為南果梨始花期。隱層節(jié)點(diǎn)數(shù)選擇是BP神經(jīng)網(wǎng)絡(luò)設(shè)計中的關(guān)鍵步驟,節(jié)點(diǎn)數(shù)過少可能得不到期望結(jié)果,節(jié)點(diǎn)數(shù)過多又易導(dǎo)致網(wǎng)絡(luò)訓(xùn)練復(fù)雜化,訓(xùn)練時間延長,本研究采用試湊法,確定隱層節(jié)點(diǎn)數(shù)為5[27]。
RBF(Radial Basis Function)是一種單隱層前饋網(wǎng)絡(luò),隱含層采用非線性優(yōu)化函數(shù),隱含節(jié)點(diǎn)函數(shù)對輸入信號產(chǎn)生局部響應(yīng),因此該網(wǎng)絡(luò)具有局部逼近能力[28]。本研究的徑向基網(wǎng)絡(luò)是MATLAB 函數(shù)newrbe(M,K,spread)。其中M為P×N輸入矩陣,K為T×N期望輸出矩陣,N是輸入訓(xùn)練樣本的個數(shù),P是輸入向量的維數(shù),T 是輸出節(jié)點(diǎn)數(shù)。spread是標(biāo)量,表征徑向基函數(shù)的擴(kuò)散速度,默認(rèn)值為1[29]。
1.2.3 基于相關(guān)分析的逐步回歸分析建模方法 為了與上述2種方法做對比,分析最優(yōu)模型,引入基于相關(guān)分析的逐步回歸分析法建立模型。對所選氣象因子進(jìn)行Pearson相關(guān)分析,篩選出對始花期顯著影響的3個氣象因子,再逐個引入回歸方程;并對回歸方程的所有變量進(jìn)行檢驗(yàn)。
模型檢驗(yàn)采用均方根誤差(RMSE,Root Mean Squared Error)和相對誤差(RE,Relative Error)進(jìn)行預(yù)測值和真實(shí)值檢驗(yàn),擬合精度與RMSE和RE值成反比[30]。
氣象數(shù)據(jù)平均值采用Excel 軟件進(jìn)行統(tǒng)計,始花期與氣象因子的灰色關(guān)聯(lián)度采用DPS軟件計算,氣象因子的相關(guān)系數(shù)、逐步回歸分析采用SPSS20.0,BP 和RBF神經(jīng)網(wǎng)絡(luò)模型采用MATLAB進(jìn)行預(yù)測。
2.1.1 模型輸入因子的選擇 選取2000—2015 年南果梨始花前期冬季(12 月—翌年2 月)日均氣溫、日最高氣溫、日最低氣溫、日均相對濕度、日降水量、日照時數(shù)、日均5 cm地溫等與南果梨始花期日序進(jìn)行灰色關(guān)聯(lián)度分析。
根據(jù)關(guān)聯(lián)度分析原理,關(guān)聯(lián)度越大的序列與母序列的關(guān)系越密切,從表1可以看出,南果梨始花期與冬季日均氣溫、日最高氣溫、日最低氣溫、日均相對濕度的關(guān)聯(lián)度較大,關(guān)聯(lián)系數(shù)在0.6 以上,故將這4 個因子作為BP和RBF神經(jīng)網(wǎng)絡(luò)模型的輸入層來預(yù)測南果梨始花期。
表1 始花期前氣象因子與其他因子的灰色關(guān)聯(lián)序
2.1.2 模型的構(gòu)建2000—2020年共16個樣本數(shù)據(jù)(其中2001、2010、2011、2013、2017 年缺測),12 個作為訓(xùn)練樣本,4個作為檢驗(yàn)樣本。BP神經(jīng)網(wǎng)絡(luò)的輸入層為利用灰色關(guān)聯(lián)法得到的4個主要因子,即4個節(jié)點(diǎn);隱層的節(jié)點(diǎn)數(shù)通過試湊法取5 個節(jié)點(diǎn);輸出層為南果梨始花期,即1 個節(jié)點(diǎn),故BP 神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)為{4,5,1},為防止出現(xiàn)訓(xùn)練過度,規(guī)定最大的訓(xùn)練次數(shù)為1000 次,程序運(yùn)行于matlabR2016b 中。
同樣選取灰色關(guān)聯(lián)下4 個主要因子作為輸入數(shù)據(jù),利用MATLAB 的函數(shù)newrbe (M,K,spread)能夠快速無誤差的設(shè)計一個徑向基網(wǎng)絡(luò),為了選取最佳spread值,采用循環(huán)訓(xùn)練法,研究其取不同值時對應(yīng)的預(yù)測誤差,當(dāng)spread取1.45時預(yù)測效果最好。
選擇2000—2015年始花期前冬季日均氣溫、日最高氣溫、日最低氣溫、日均相對濕度、日降水量、日照時數(shù)、日均5 cm 地溫等與始花期日序進(jìn)行相關(guān)分析,由表2 可以看出,始花期與日均相對濕度和降水量呈正相關(guān),與其他因子呈負(fù)相關(guān),其中與日平均氣溫、日均5 cm地溫、日最低氣溫、日最高氣溫呈顯著負(fù)相關(guān),相關(guān)系數(shù)分別為-0.646、-0.628、-0.638、-0.663,均通過了0.05水平的顯著性檢驗(yàn),說明前期冬季氣溫越高,始花期越提前。選擇顯著相關(guān)的氣象因子與始花期日序進(jìn)行逐步回歸分析,并對模型進(jìn)行檢驗(yàn)。
表2 始花期前氣象因子與始花期日序的相關(guān)分析結(jié)果
把灰色關(guān)聯(lián)分析后關(guān)聯(lián)性較大的4個氣象因子作為建模因子代入模型,計算得出擬合值,并把相關(guān)分析后逐步回歸方程下的擬合值也一起比較,利用2016—2020年的南果梨始花期的數(shù)據(jù)樣本,對基于灰色關(guān)聯(lián)下的BP、RBF神經(jīng)網(wǎng)絡(luò)建模方法對比傳統(tǒng)的逐步回歸建模方法進(jìn)行驗(yàn)證。
由表3可知,基于灰色關(guān)聯(lián)下的BP神經(jīng)網(wǎng)絡(luò)預(yù)測的結(jié)果誤差為1 d,基于灰色關(guān)聯(lián)下的RBF 神經(jīng)網(wǎng)絡(luò)預(yù)測的結(jié)果誤差為2.25 d,可以看出BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果更接近實(shí)況。與傳統(tǒng)的逐步回歸預(yù)測出的南果梨始花期誤差為4 d相比,通過灰色關(guān)聯(lián)度分析篩選后的氣象因子作為模型輸入的建模方法提高了花期預(yù)報精度,其中BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果更好。
表3 基于灰色關(guān)聯(lián)的BP和RBF預(yù)報模型與逐步回歸模型預(yù)測結(jié)果
由表4 可知,分別對人工神經(jīng)網(wǎng)絡(luò)這兩種方法建立的模型進(jìn)行檢驗(yàn)與評價,結(jié)果表明基于灰色關(guān)聯(lián)的BP神經(jīng)網(wǎng)絡(luò)模型RMSE為1,RE為6.34%;基于灰色關(guān)聯(lián)的RBF 神經(jīng)網(wǎng)絡(luò)模型RMSE為2.25,RE為13.13%,R2分別為0.7和0.568,綜合各項(xiàng)指標(biāo)分析認(rèn)為,灰色關(guān)聯(lián)分析法建立的BP神經(jīng)網(wǎng)絡(luò)模型比RBF模型預(yù)測南果梨始花期更準(zhǔn)確。
表4 基于灰色關(guān)聯(lián)的BP和RBF網(wǎng)絡(luò)預(yù)測模型評價
表5、6 是逐步回歸模型方差分析檢驗(yàn)結(jié)果,所擬合的回歸模型F值為7.848,對應(yīng)F臨界值表,F(xiàn)>Fa=0.05(1,10)=3.71,P=0.019<0.05 說明回歸方程統(tǒng)計學(xué)意義成立,可以認(rèn)為Y與X之間存在線性回歸關(guān)系,如式(1)所示。
表5 逐步回歸模型系數(shù)檢驗(yàn)結(jié)果
表6 模型的方差分析檢驗(yàn)結(jié)果
式中,Y為即始花期日序,X為冬季日平均最高氣溫(℃)。
(1)南果梨始花期與冬季日均氣溫、日最高氣溫、日最低氣溫、日均相對濕度的灰色關(guān)聯(lián)度較大,與日均氣溫、日均5 cm地溫、日最低氣溫、日最高氣溫呈顯著負(fù)相關(guān),說明前期冬季氣溫越高,始花期越提前。
(2)逐步回歸預(yù)測出的南果梨始花期誤差為4 d,基于灰色關(guān)聯(lián)下的BP和RBF神經(jīng)網(wǎng)絡(luò)預(yù)測的結(jié)果誤差為1 d和2.25 d,說明基于灰色關(guān)聯(lián)下的神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果更接近實(shí)況。
(3)基于灰色關(guān)聯(lián)的BP 和RBF 神經(jīng)網(wǎng)絡(luò)模型的RE分別為6.32%和13.13%,R2分別為0.7 和0.568,灰色關(guān)聯(lián)分析法建立的BP神經(jīng)網(wǎng)絡(luò)模型比RBF模型預(yù)測南果梨始花期更準(zhǔn)確。
人工神經(jīng)網(wǎng)絡(luò)具有較為準(zhǔn)確的預(yù)測能力,在花期預(yù)報等方面有較好的應(yīng)用前景。目前研究大多基于氣象因子與物候期之間的關(guān)聯(lián)性進(jìn)行分析[31],而本研究利用灰色關(guān)聯(lián)分析法提取與南果梨始花期關(guān)聯(lián)性較強(qiáng)的氣象因子,以此作為自變量建立BP和RBF神經(jīng)網(wǎng)絡(luò)下的南果梨始花期預(yù)報模型,傳統(tǒng)逐步回歸法的預(yù)報結(jié)果與實(shí)際觀測值平均相差4 d,基于灰色關(guān)聯(lián)分析的神經(jīng)網(wǎng)絡(luò)預(yù)報結(jié)果與實(shí)際觀測值平均相差1.6 d,此外BP和RBF 的RMSE分別為1 和2.25,RE分別為6.32%和13.13%,由此可見,相較于逐步回歸法,這種通過灰色關(guān)聯(lián)分析過濾后的氣象因子作為神經(jīng)網(wǎng)絡(luò)輸入因子的建模方法可以提高始花期的預(yù)報精度,其中灰色關(guān)聯(lián)分析法建立的BP 模型比RBP 模型表現(xiàn)更好。