葉勁秋,劉文波,林春花,鄭服叢,繆衛(wèi)國
(海南大學(xué)植物保護(hù)學(xué)院,海南 ???570228)
【研究意義】橡膠樹(Heaveabrasiliensis)是天然橡膠的主要來源,發(fā)展橡膠樹產(chǎn)業(yè)具有重要的經(jīng)濟(jì)價值和戰(zhàn)略意義[1]。由橡膠樹白粉菌(Oidiumheveae)侵染引起的橡膠樹白粉病是威脅橡膠生產(chǎn)的重大常見病害[2-3]。在氣候、物候適宜時,橡膠樹白粉菌通過菌絲孢子繁殖、傳播,為害橡膠樹的嫩葉(古銅期或淡綠期葉片)、嫩芽、嫩梢等幼嫩組織;造成葉片皺縮、枯萎,甚至落葉,導(dǎo)致橡膠開割時間推遲而減產(chǎn)[4]。開展橡膠樹白粉病的準(zhǔn)確預(yù)測預(yù)報,對于預(yù)防和控制橡膠樹白粉病病情具有重要意義。【前人研究進(jìn)展】橡膠樹白粉病流行趨勢主要受寄主物候、氣候條件、當(dāng)前病情三方面的因素影響[2,5-6]。其中,氣候條件中的溫度[7]、光照[5]、濕度[7]、雨量[6]是影響病害流行的重要因素?;谶@些影響因素,由植保專家和植膠農(nóng)戶結(jié)合多年的田間生產(chǎn)經(jīng)驗總結(jié)和建立了多種橡膠樹白粉病的田間預(yù)測預(yù)報方法,如:總指數(shù)法、總發(fā)病率法、嫩葉病率法、混合病率法等[4, 8]。植膠農(nóng)場在白粉病流行學(xué)專家的指導(dǎo)下,采用上述傳統(tǒng)病害預(yù)測預(yù)報方法,對于預(yù)防和控制橡膠樹白粉病病情起到了關(guān)鍵作用?!颈狙芯壳腥朦c(diǎn)】傳統(tǒng)病害預(yù)測預(yù)報方法存在預(yù)測預(yù)報高度依賴專家經(jīng)驗、準(zhǔn)確性較低、時效性較差等不足。隨著計算機(jī)技術(shù)的普及和統(tǒng)計學(xué)方法的引進(jìn),病害預(yù)測預(yù)報方法得到了進(jìn)一步發(fā)展[4, 8-9]。近年來,將神經(jīng)網(wǎng)絡(luò)應(yīng)用于植物病蟲害識別和流行預(yù)測[10],極大地促進(jìn)了植物流行病學(xué)的發(fā)展和病害預(yù)測預(yù)報實踐。神經(jīng)網(wǎng)絡(luò)(Neural Network, NN),全稱人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN),是在現(xiàn)代神經(jīng)生物學(xué)、仿生學(xué)、信息學(xué)、數(shù)學(xué)研究基礎(chǔ)上對生物神經(jīng)系統(tǒng)的功能進(jìn)行數(shù)字化建模的模擬[11]。人工神經(jīng)網(wǎng)絡(luò)基于大量樣本經(jīng)過反復(fù)訓(xùn)練的學(xué)習(xí)過程,能被賦予完成某項任務(wù)的具體功能。神經(jīng)網(wǎng)絡(luò)技術(shù)在擁有傳統(tǒng)數(shù)學(xué)模型中能處理海量多維數(shù)據(jù)的優(yōu)點(diǎn)的同時,還具有高度自由的非線性、泛化性等優(yōu)良特性[11],越來越多地被應(yīng)用到日常生活以及科學(xué)研究的多個領(lǐng)域,例如,圖像識別[12-14]、生物信息學(xué)預(yù)測[15-16]、植物病蟲害識別和流行預(yù)測[10, 17-18]等。【擬解決的關(guān)鍵問題】迄今,在包括小麥[17, 19]、黃瓜[12]、黑麥草[18]、檀香[20]、葡萄[21]等多種植物上,已經(jīng)成功建立了白粉病的神經(jīng)網(wǎng)絡(luò)預(yù)測模型,均在白粉病的預(yù)測預(yù)報方面取得了超越傳統(tǒng)方法的良好效果。然而,通過神經(jīng)網(wǎng)絡(luò)建模來預(yù)測預(yù)報橡膠樹白粉病的病害流行趨勢,尚未見報道。Abdullah 等[22]嘗試對橡膠樹各類病害建立了神經(jīng)網(wǎng)絡(luò)識別模型,該模型能通過計算機(jī)掃描葉片區(qū)分不同的病害,但不具備病害流行趨勢預(yù)測功能。構(gòu)建橡膠樹白粉病的人工神經(jīng)網(wǎng)絡(luò)預(yù)測模型,乃至建立基于神經(jīng)網(wǎng)絡(luò)模型的智能專家系統(tǒng),對于提高橡膠樹病害預(yù)測預(yù)報的準(zhǔn)確性、實現(xiàn)預(yù)測預(yù)報的自動化,減少病害發(fā)生和危害,發(fā)展我國橡膠產(chǎn)業(yè),具有重要價值。本研究以人類專家綜合利用傳統(tǒng)經(jīng)驗方法預(yù)報病害的相關(guān)經(jīng)驗數(shù)據(jù)作為樣本、采用人工神經(jīng)網(wǎng)絡(luò)建模技術(shù),建立了橡膠樹白粉病預(yù)測預(yù)報神經(jīng)網(wǎng)絡(luò)模型。該模型將能直接根據(jù)田間調(diào)查的測報因子(氣候、物候和當(dāng)前病情指數(shù))和數(shù)據(jù),做出病害防治決策,為將來結(jié)合互聯(lián)網(wǎng)技術(shù)、建立可代替人工專家決策的智能專家系統(tǒng)、實現(xiàn)橡膠樹病害預(yù)測預(yù)報的自動化奠定基礎(chǔ)。
預(yù)測參數(shù)的挑選:選取植膠農(nóng)場容易獲得且日常生產(chǎn)、病害監(jiān)控中必須采集的氣象、物候、病情數(shù)據(jù)作為測報參數(shù),包括:未來一周的平均溫度、晝夜溫差、總云量、濕度、雨量,以及當(dāng)前橡膠樹的嫩芽率、古銅葉率、淡綠葉率、老葉率、當(dāng)前病情指數(shù)等共10個影響因子,作為測報模型的輸入?yún)?shù);人類專家對這些影響因子綜合評判后推薦的施藥量作為測報模型的輸出參數(shù)。此外,為確保神經(jīng)網(wǎng)絡(luò)能輸出一個推薦藥量的取值范圍,滿足實際應(yīng)用時的選擇靈活性,在輸入?yún)?shù)中引入了一個標(biāo)記因素作為虛參數(shù)。該因素只有0、1兩種取值,當(dāng)標(biāo)記因素為0時輸出上述10個影響因子作用下最低推薦藥量;當(dāng)標(biāo)記因素為1時,則輸出最高推薦藥量。
測報數(shù)據(jù)來源與獲取方法:未來氣象數(shù)據(jù),包括溫度、總云量、濕度、雨量,通過查詢WorldWeatherOnline(https://www.worldweatheronline.com)的天氣預(yù)報獲得。物候數(shù)據(jù),主要指嫩葉率和老葉率,由各林段的觀察員直接目測獲取。白粉病病情則由各林段的觀察員采用鉤葉查病的調(diào)查方法[23]獲取。從橡膠樹上割下數(shù)條被采樣的枝條,抽樣調(diào)查統(tǒng)計各枝條上被選葉片中各病情級別葉片所占比例。病害防治數(shù)據(jù)則記錄了各農(nóng)場在病情出現(xiàn)后的防治措施及施藥量。所施藥物為325篩目硫磺粉,計量單位為kg/hm2[24]。本研究共采集了2010-2018年度云南和海南兩省63個農(nóng)場提供的共6312條數(shù)據(jù)。
1.2.1 測報數(shù)據(jù)的預(yù)處理 將原始數(shù)據(jù)處理為訓(xùn)練樣本。每條樣本由一對數(shù)據(jù)組成,分別為:輸入數(shù)據(jù),即影響病害流行的預(yù)測參數(shù);對應(yīng)的輸出數(shù)據(jù),即人類專家推薦的施藥量。將配對后的樣本數(shù)據(jù)作歸一化處理[11]。采用公式(1)歸一化樣本數(shù)據(jù)對中的輸入數(shù)據(jù)。其中,Inorm為歸一化后的值,I為歸一化前的初始值,μ為歸一化通道內(nèi)所有數(shù)據(jù)的平均值,σ為歸一化通道內(nèi)所有數(shù)據(jù)的標(biāo)準(zhǔn)差。采用了公式(2)歸一化樣本數(shù)據(jù)對中的輸出數(shù)據(jù)。其中Jnorm為歸一化后的值,J為歸一化前的初始值,Jmin為歸一化通道內(nèi)所有數(shù)據(jù)的最小值,Jmax為歸一化通道內(nèi)所有數(shù)據(jù)的最大值。
(1)
(2)
1.2.2 神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)的確定 參考通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練、建立植物病害預(yù)測模型的成功案例,本研究采用誤差反向傳播神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network, BPNN)[11]作為模版。由于樣本中有11個預(yù)測參數(shù)(10測報參數(shù)和1個虛參數(shù))作為輸入,而僅有1個輸出參數(shù)(推薦施藥量),所以神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)選用11個輸入節(jié)點(diǎn),1個輸出節(jié)點(diǎn)。隱層節(jié)點(diǎn)數(shù)量利用經(jīng)驗公式確定:“(輸入節(jié)點(diǎn)數(shù)×輸出節(jié)點(diǎn)數(shù))0.5+ a”[11],其中a為[1,10]內(nèi)的自然數(shù)。將本研究的節(jié)點(diǎn)數(shù)帶入后計算可得,隱層節(jié)點(diǎn)數(shù)在[4,13]之間都是可取的。因此可取隱層節(jié)點(diǎn)數(shù)為8。其中,神經(jīng)網(wǎng)絡(luò)的兩個隱層的激活函數(shù)都采用雙曲線正切函數(shù)Tanh,而最后的輸出層則使用單極性S函數(shù)Sigmoid作為激活函數(shù)。
1.2.3 神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法的選取 綜合考慮算法性能和安全性,本研究采用Adam算法[25]作為神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法;學(xué)習(xí)率選用0.002,一階動量為0.9,二階動量為0.999[25]。
1.2.4 神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練以及防止過擬合 為防止發(fā)生過擬合問題(韓力群,2017),維持神經(jīng)網(wǎng)絡(luò)的泛化特性,訓(xùn)練時需要使用早停止[11]以及簡單交叉驗證。隨機(jī)抽取總樣本的20%作為測試集,其余的80 %作為訓(xùn)練集。其中,訓(xùn)練集參與訓(xùn)練,直接影響神經(jīng)網(wǎng)絡(luò)權(quán)重的調(diào)整,而測試集不參與訓(xùn)練,只作為網(wǎng)絡(luò)誤差的監(jiān)測樣本。當(dāng)隨著訓(xùn)練的進(jìn)行,測試集誤差保持穩(wěn)定不下降、甚至出現(xiàn)明顯回升或震蕩時,及時停止訓(xùn)練。此時的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)即為已訓(xùn)練完畢的橡膠樹白粉病預(yù)測預(yù)報神經(jīng)網(wǎng)絡(luò)模型。
1.2.5 神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果的后處理 由于在訓(xùn)練前對樣本數(shù)據(jù)已作歸一化處理,訓(xùn)練后的模型運(yùn)行給出的輸出值也是變換后的值。因此,需要將輸出值做反歸一化[11],將其還原為原本應(yīng)表達(dá)的推薦藥量值。反歸一化通過歸一化函數(shù)公式(2)對應(yīng)的逆函數(shù)公式(3)來實現(xiàn)。
(3)
通過采用反歸一化公式(3)進(jìn)行后處理,在計算機(jī)上運(yùn)算產(chǎn)生神經(jīng)網(wǎng)絡(luò)模型輸出結(jié)果,即橡膠樹白粉病防治推薦藥量。若神經(jīng)網(wǎng)絡(luò)模型輸出低于7.5 kg/hm2的推薦藥量,應(yīng)該按照不防治處理而將輸出的推薦藥量置0。
1.2.6 預(yù)測模型田間驗證方法 選取了2015-2018年云南和海南2省6個農(nóng)場共14個調(diào)查林段的防治數(shù)據(jù)(包括10個預(yù)測參數(shù)和實際施藥量、施藥一周后的病情指數(shù)),進(jìn)行神經(jīng)網(wǎng)絡(luò)模型的驗證。將待驗證數(shù)據(jù),即田間調(diào)查的物候、病情測報參數(shù)和氣象網(wǎng)站獲取的氣象數(shù)據(jù)等輸入神經(jīng)網(wǎng)絡(luò),得到輸出后,經(jīng)后處理得到推薦施藥量。根據(jù)神經(jīng)網(wǎng)絡(luò)模型給出的推薦施藥量和實際施藥量以及實際防治效果(病情指數(shù)增長程度)綜合評判神經(jīng)網(wǎng)絡(luò)模型測報的準(zhǔn)確性。
1.2.7 預(yù)測模型田間驗證標(biāo)準(zhǔn) 傳統(tǒng)的測報方法對測報結(jié)果的準(zhǔn)確性評價標(biāo)準(zhǔn)中,預(yù)測的白粉病病指增長和實際情況相差不超過10則認(rèn)為測報結(jié)果準(zhǔn)確[8]??蓳?jù)此標(biāo)準(zhǔn)延伸出判定本神經(jīng)網(wǎng)絡(luò)模型測報準(zhǔn)確性的標(biāo)準(zhǔn)(表1)。
將未來1周的平均溫度、晝夜溫差、總云量、濕度、雨量,以及當(dāng)前橡膠樹的抽芽率、古銅葉率、淡綠葉率、老葉率、當(dāng)前病情指數(shù)等10個影響因子,以及對應(yīng)的人類專家推薦施藥量,共11個參數(shù)作為訓(xùn)練數(shù)據(jù)。采用誤差反向傳播神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和Adam算法、經(jīng)過8萬次訓(xùn)練之后,測試集的網(wǎng)絡(luò)均方誤差(Mean Square Error, MSE)已基本收斂于0.09547附近(圖1),此時的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)即為已訓(xùn)練完畢的橡膠樹白粉病預(yù)測預(yù)報神經(jīng)網(wǎng)絡(luò)模型。
表1 神經(jīng)網(wǎng)絡(luò)模型測報結(jié)果準(zhǔn)確性田間驗證評定標(biāo)準(zhǔn)
注:a:(推薦施藥量-實際施藥量)≥3 kg/hm2,即為足量施藥。所施藥物統(tǒng)一為硫磺粉。
Note: When the deviations between amount of agrochemical recommended to apply by neural network model and that applied in fact more than 3 kg/hm2, it means sufficient amount of agrochemical application.Agrochemical applied was sulphur powder.
圖1 神經(jīng)網(wǎng)絡(luò)模型均方誤差下降趨勢Fig.1 Decline curve of mean square error (vertical axis) accompany with increase of training times (horizontal axis) by neural network
圖2 實際推薦藥量與神經(jīng)網(wǎng)絡(luò)推薦藥量對比Fig.2 Comparison of amount of agrochemical application recommended by export (horizontal axis) and neural network model (vertical axis)
以測試集中所有推薦藥量數(shù)據(jù)為橫坐標(biāo),相對應(yīng)的神經(jīng)網(wǎng)絡(luò)輸出的推薦藥量數(shù)據(jù)為縱坐標(biāo),將所有點(diǎn)繪制在坐標(biāo)系中,即可得到輸出對比分布圖(圖2)。從測試集與神經(jīng)網(wǎng)絡(luò)輸出對比計算,得到其回歸方程為Y=0.9387X+0.05459,擬合優(yōu)度(Goodness of Fit,R2)為88.11 %,T值[26]為0.8670(圖2)。神經(jīng)網(wǎng)絡(luò)輸出的推薦用藥量與測試集樣本(人類專家推薦施藥量)十分接近,可以認(rèn)為成功訓(xùn)練得到了橡膠樹白粉病神經(jīng)網(wǎng)絡(luò)預(yù)測模型。
在本方法中,將嫩芽、古銅葉、淡綠葉作為3個參數(shù)進(jìn)行處理(圖1~2)。而傳統(tǒng)預(yù)報方法處理物候數(shù)據(jù)時,是將嫩芽、古銅葉、淡綠葉都無差別的合并作為“嫩葉”指標(biāo)處理。若在人工神經(jīng)網(wǎng)絡(luò)建模過程中將該3個參數(shù)合并為嫩葉率處理,則訓(xùn)練得到的均方誤差達(dá)到0.1289(圖3),擬合優(yōu)度僅為78.57 %(圖4)。若與將嫩芽、古銅葉、淡綠葉作為3個參數(shù)進(jìn)行人工神經(jīng)網(wǎng)絡(luò)建模結(jié)果進(jìn)行比較(圖1~2),可見將3個參數(shù)合并建模時,均方誤差提高了0.03343,擬合優(yōu)度下降了9.36個百分點(diǎn),T值也降低了0.1290。這說明分開處理物候指標(biāo)能獲得更好的模型效果。
圖3 合并嫩葉率參數(shù)后神經(jīng)網(wǎng)絡(luò)模型均方誤差下降趨勢Fig.3 Decline curve of mean square error (vertical axis) accompany with increase of training times (horizontal axis) by neural network when combining young leaf index
圖4 合并嫩葉率參數(shù)后實際推薦藥量與神經(jīng)網(wǎng)絡(luò)推薦藥量對比Fig.4 Comparison of amount of agrochemical application recommended by export (horizontal axis) and neural network model (vertical axis) when combining young leaf index
為檢測各預(yù)測參數(shù)對神經(jīng)網(wǎng)絡(luò)模型性能的影響,分別將單個參數(shù)從神經(jīng)網(wǎng)絡(luò)模型中剔除后建立神經(jīng)網(wǎng)絡(luò)模型,比較了訓(xùn)練后相關(guān)評價指標(biāo)(均方誤差MSE、擬合優(yōu)度R2、T值)的變化(表2)。
從表2中可知,分別將單個參數(shù)從神經(jīng)網(wǎng)絡(luò)模型中剔除后建立神經(jīng)網(wǎng)絡(luò)模型,都會導(dǎo)致均方誤差(MSE)上升、擬合優(yōu)度(R2)和T值下降,表明這些參數(shù)的缺失會導(dǎo)致神經(jīng)網(wǎng)絡(luò)預(yù)測性能下降。尤其是當(dāng)初始病指缺失時,神經(jīng)網(wǎng)絡(luò)性能下降最明顯,其次則是氣象參數(shù)中的日均溫,再次為物候參數(shù)中的嫩芽率。而對神經(jīng)網(wǎng)絡(luò)性能影響最小的則是晝夜溫差。
表2 單個測報參數(shù)缺失時各模型評價指標(biāo)變化
為驗證神經(jīng)網(wǎng)絡(luò)模型的實際使用效果,選用了2015-2018年云南和海南2省6個農(nóng)場共14個調(diào)查林段的防治數(shù)據(jù),進(jìn)行神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確性驗證(表3)。
從表3可見,根據(jù)表1給出的判定神經(jīng)網(wǎng)絡(luò)模型測報準(zhǔn)確性的標(biāo)準(zhǔn),在6個農(nóng)場14個調(diào)查林段的33個案例中,分別有29個預(yù)測準(zhǔn)確、4個預(yù)測不準(zhǔn)確。田間驗證結(jié)果表明,本研究建立的橡膠樹白粉病預(yù)測預(yù)報模型田間實際符合率為87.88 %。
通過神經(jīng)網(wǎng)絡(luò)建模來預(yù)測預(yù)報橡膠樹白粉病的病害流行趨勢,尚未見報道。傳統(tǒng)的預(yù)測預(yù)報方法中,主要考慮寄主物候、氣候條件、當(dāng)前病情3個方面的影響[2]。本研究采用了傳統(tǒng)預(yù)測預(yù)報方法中常用的10個影響因子,成功訓(xùn)練得到了橡膠樹白粉病神經(jīng)網(wǎng)絡(luò)預(yù)測模型。
表3 神經(jīng)網(wǎng)絡(luò)模型在6個農(nóng)場測報結(jié)果的準(zhǔn)確性評價
續(xù)表3 Continued table 3
農(nóng)場-林段Plantations測報日期Forecasting date初始病指Initial disease index推薦施藥(kg/hm2)Agrochemical amount recommended by model 實際施藥(kg/hm2)Agrochemical amount applied in fact藥效結(jié)束后病指Disease index after agrochemical losing efficacy病指變化Disease index alteration 測報評價Forecasting accuracy萬寧新中-南林三區(qū)NL32016/3/287.016.5~181511.4+4.4準(zhǔn)確yes萬寧新中-南林三區(qū)NL32016/3/3111.416.5~18188.7-2.7準(zhǔn)確yes萬寧新中-南林一區(qū)NL12016/3/287.816.5~18158.3+0.5準(zhǔn)確yes萬寧新中-南林一區(qū)NL12016/3/318.316.5~18184.1-4.2準(zhǔn)確yes萬寧新中-南平區(qū) NL2016/3/3125.6181532.2+6.6準(zhǔn)確yes萬寧新中-香根區(qū)XGQ2016/3/3121.8181514.0-7.8準(zhǔn)確yes保亭南茂-南島隊ND2017/2/123.19~12未防治 04.6+1.5不準(zhǔn)確no保亭南茂-南島隊ND2017/2/204.69~15未防治 05.6+1.0不準(zhǔn)確no保亭南茂-南島隊ND2017/3/25.615~18未防治 048.8+43.2準(zhǔn)確yes保亭南茂-石建村SJ2017/2/205.815~16.51未防治 08.4+2.6不準(zhǔn)確no保亭南茂-石建村SJ2017/3/28.416.5~18未防治 067.8+59.4準(zhǔn)確yes景洪熱作所-1 Jinghong 12017/2/205.815~18未防治 019.0+13.2準(zhǔn)確yes景洪熱作所-1 Jinghong 12017/2/2719.018未防治 038.2+19.2準(zhǔn)確yes景洪熱作所-2 Jinghong 22017/2/204.418未防治 022.4+18.0準(zhǔn)確yes景洪熱作所-2 Jinghong 22017/2/2722.418~19.5未防治 064.2+41.8準(zhǔn)確yes景洪熱作所-3 Jinghong 32017/2/208.216.5~18未防治 022.2+14.0準(zhǔn)確yes景洪熱作所-3 Jinghong 32017/2/2722.218未防治 054.4+32.2準(zhǔn)確yes五指山暢好-8隊 WZS2017/3/25.615~16.5未防治 054.4+48.8準(zhǔn)確yes瑞麗市經(jīng)作-板東 RL2018/3/195.216.5~18155.2±0.0準(zhǔn)確yes瑞麗市經(jīng)作-板東RL2018/3/225.218927.4+22.2準(zhǔn)確yes瑞麗市經(jīng)作-板東RL2018/3/2627.4187.544.8+17.4準(zhǔn)確yes
本研究建立的橡膠樹白粉病神經(jīng)網(wǎng)絡(luò)預(yù)測模型,盡管存在一些發(fā)散區(qū),特別在推薦藥量值較低的區(qū)域(低于7.5 kg/hm2),發(fā)散更為明顯(圖2)。但由于實際防治時不會采取低于7.5 kg/hm2的防治濃度,故不推薦施藥輸出值發(fā)散區(qū)低于7.5 kg/hm2的結(jié)果并不會對實際防治策略產(chǎn)生干擾。而在高藥量區(qū)域,模型的預(yù)測結(jié)果收斂度有上升趨勢。表明本研究建立的神經(jīng)網(wǎng)絡(luò)預(yù)測模型并不會因發(fā)散區(qū)的存在而影響預(yù)測預(yù)報的準(zhǔn)確性。
對于任何預(yù)測方法,其相關(guān)預(yù)測參數(shù)的數(shù)量越多,采集精度越高,必然能提升理論預(yù)測效果。本方法中將傳統(tǒng)的“嫩葉率”指標(biāo)拆開為“抽芽率”、“古銅葉率”、“淡綠葉率”3個指標(biāo)分別統(tǒng)計數(shù)據(jù)用于神經(jīng)網(wǎng)絡(luò)建模,取得了更好的效果。其理論基礎(chǔ)則是越幼嫩的組織越易感染白粉病,因此將不同物候階段的葉片分開統(tǒng)計提高了采樣精度,從而導(dǎo)致建模預(yù)報效果更優(yōu)。
樣本參數(shù)的來源精度仍有可以提升的空間。例如氣象參數(shù),都源于氣象預(yù)報網(wǎng)站。而氣象預(yù)報都是區(qū)域性的綜合預(yù)報,難以獲得農(nóng)場區(qū)域的局部小氣候數(shù)據(jù)。因此,若能直接在田間合理設(shè)置新型氣候站直接測量獲得氣象數(shù)據(jù),則模型精度還能進(jìn)一步提高。
分別將單個參數(shù)從神經(jīng)網(wǎng)絡(luò)模型中剔除后建立神經(jīng)網(wǎng)絡(luò)模型,都會導(dǎo)致神經(jīng)網(wǎng)絡(luò)預(yù)測性能下降,揭示了這10個影響因子在橡膠樹白粉病經(jīng)網(wǎng)絡(luò)建模中的重要性。李增平和鄭服叢[2]認(rèn)為溫度是影響橡膠樹白粉病流行最重要的因素,但是在本研究中對模型的影響明顯不如初始病情大(表2)。這有可能是因為以往的研究都是以控制變量后默認(rèn)初始病情相同為前提,此時溫度就成為影響最大的參數(shù)。而對于溫度和初始病指究竟哪個對橡膠樹白粉病流行影響更大,則未見任何報道。就本研究的結(jié)果而言,初始病指是所有因子中影響最大的參數(shù),可能是因為橡膠樹白粉病是孢子傳播的爆發(fā)性病害,初始病指直接決定了病害發(fā)展的基數(shù)和潛力。
與傳統(tǒng)建模方法相比,神經(jīng)網(wǎng)絡(luò)模型最容易被提到的優(yōu)勢是它的高精度。而這種精度源于本身的自由非線性。傳統(tǒng)的建模方式多為多元線性回歸,只能處理線性問題,而傳統(tǒng)的非線性回歸算法必須在回歸前就指定一個固定的非線性函數(shù),這意味著必須提前知道數(shù)據(jù)間的大致規(guī)律。而神經(jīng)網(wǎng)絡(luò)內(nèi)部通過矩陣積建模,理論上能低損模擬任何函數(shù)。
正因為如此,神經(jīng)網(wǎng)絡(luò)有著容易被忽略的第二類優(yōu)點(diǎn),即可以直接使用原始參數(shù)建模。而傳統(tǒng)建模方法在解決非線性問題,例如溫度對病害影響時,不得不做人工轉(zhuǎn)換,將原始的溫度參數(shù)轉(zhuǎn)換為“溫度在某范圍內(nèi)的天數(shù)”,以此將非線性問題轉(zhuǎn)換為線性問題再解決。轉(zhuǎn)換過程中由于有人為主觀參與,轉(zhuǎn)換者的專業(yè)水平就直接決定了轉(zhuǎn)換后參數(shù)的質(zhì)量,這個過程或多或少會損失客觀信息。而直接用原始參數(shù)建模不僅能省去人工強(qiáng)制轉(zhuǎn)換丟失客觀性的風(fēng)險,也在模型運(yùn)行的時候簡化了輸入數(shù)據(jù)的處理流程。
然而,神經(jīng)網(wǎng)絡(luò)這種看似“絕對的”客觀性是有缺陷的。因為神經(jīng)網(wǎng)絡(luò)唯一的信息來源就是訓(xùn)練樣本,訓(xùn)練樣本中各參數(shù)自身的數(shù)值分布情況直接決定了神經(jīng)網(wǎng)絡(luò)模型的偏向性。而傳統(tǒng)建模時人工強(qiáng)制轉(zhuǎn)換數(shù)據(jù)會引入人類的常識信息,起到修正作用,而神經(jīng)網(wǎng)絡(luò)不可能有任何常識。例如,本研究中推薦施藥為0,即不施藥的區(qū)域大面積擴(kuò)散到施藥區(qū)域;這就很可能是樣本中推薦施藥的樣本過多造成的,由于樣本整體分布偏向于施藥,神經(jīng)網(wǎng)絡(luò)的輸出也會在訓(xùn)練中得到過多施藥信息的刺激而更偏向于輸出施藥策略。
因此,樣本分布不均勻時,神經(jīng)網(wǎng)絡(luò)的精度優(yōu)勢和客觀性優(yōu)勢難以發(fā)揮,甚至?xí)赃d于傳統(tǒng)建模。但是神經(jīng)網(wǎng)絡(luò)能直接處理原始數(shù)據(jù)的優(yōu)勢仍然存在。
由于本模型使用的是人類專家針對橡膠樹白粉病的防治數(shù)據(jù),因此,本模型自身只適用于測報橡膠樹白粉病病害。但是,本模型的基本結(jié)構(gòu),即誤差反向傳播神經(jīng)網(wǎng)絡(luò)能適用于所有病蟲害的測報。只要擁有足夠數(shù)量的、分布較均勻的其他病害數(shù)據(jù)作為訓(xùn)練樣本,即可得到能針對該任何其他病害的測報模型。
本研究采用人類專家綜合利用傳統(tǒng)經(jīng)驗方法預(yù)報病害的相關(guān)經(jīng)驗數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的樣本,選用誤差反向傳播神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以Adam算法為訓(xùn)練算法,首次成功訓(xùn)練得到了橡膠樹白粉病神經(jīng)網(wǎng)絡(luò)預(yù)測模型。其擬合優(yōu)度達(dá)88.11 %,田間試驗驗證的實際符合率為87.88 %。表明本研究建立的橡膠樹白粉病神經(jīng)網(wǎng)絡(luò)預(yù)測模型在提供防治建議上已具備與橡膠樹白粉病專家相當(dāng)?shù)乃健?/p>