尹小君,寧川,張永才
(石河子大學(xué)信息科學(xué)與技術(shù)學(xué)院,新疆石河子832000)
加工番茄早疫病高光譜遙感識別研究
尹小君,寧川,張永才
(石河子大學(xué)信息科學(xué)與技術(shù)學(xué)院,新疆石河子832000)
為了快速監(jiān)測加工番茄早疫病發(fā)病率和加工番茄的產(chǎn)量和質(zhì)量,防止病蟲害的擴(kuò)大,該文基于高光譜遙感數(shù)據(jù)和田間早疫病調(diào)查數(shù)據(jù),以新疆天山北坡典型加工番茄種植區(qū)為研究區(qū),分析加工番茄早疫病的病葉光譜響應(yīng)特征,尋找早疫病的敏感波段,再利用遺傳算法優(yōu)化支持向量機(jī)的懲罰參數(shù)c和核函數(shù)參數(shù)g,對不同病害嚴(yán)重度的病葉進(jìn)行識別。結(jié)果表明:不同病害嚴(yán)重度加工番茄早疫病病葉的敏感波段為628nm~643nm和689nm~692nm;遺傳優(yōu)化算法得出支持向量機(jī)最佳懲罰參數(shù)c為0.129,核函數(shù)參數(shù)g為3.479;分別利用多項(xiàng)式核、徑向基核函數(shù)、Sigmoid核進(jìn)行分類訓(xùn)練和測試,最佳分類模型為徑向基核函數(shù)模型,訓(xùn)練準(zhǔn)確率為84.615%,預(yù)測準(zhǔn)確率為80.681%,高于默認(rèn)參數(shù)c和g的支持向量機(jī)模型。說明通過遺傳算法優(yōu)化支持向量機(jī)的識別方法具有更高的精度,支持向量機(jī)為多波段協(xié)同識別病害嚴(yán)重度提供了新的思路。
遺傳算法;支持向量機(jī);加工番茄;早疫病;病蟲害識別
病蟲害是農(nóng)業(yè)生產(chǎn)的重要生物災(zāi)害,是制約高產(chǎn)、優(yōu)質(zhì)和高效農(nóng)業(yè)的主要因素之一。新疆光熱資源豐富、晝夜溫差大,非常適合加工番茄的無支架栽培。早疫病是加工番茄生產(chǎn)過程中發(fā)生最為普遍、危害最嚴(yán)重的病害,一般年份發(fā)病率在30%左右,嚴(yán)重發(fā)生年份發(fā)病率達(dá)到50%以上[1-2],其會造成番茄葉片、莖稈及果實(shí)的壞死,從而影響番茄的產(chǎn)量和品質(zhì)[3]。為了保證加工番茄免受早疫病的危害,每年需要投入大量的殺菌劑來防治該病害的發(fā)生,大量殺菌劑的投入造成農(nóng)藥殘留和生態(tài)風(fēng)險(xiǎn),增加農(nóng)戶的生產(chǎn)成本[3]。高光譜遙感技術(shù)是一種無損測試技術(shù),即在不破壞植被結(jié)構(gòu)的基礎(chǔ)上,對植被的病害嚴(yán)重度進(jìn)行識別,以便迅速采取治理措施提高防治效果,減少殺菌劑的使用,同時(shí)為預(yù)測預(yù)報(bào)加工番茄早疫病的發(fā)生發(fā)展和擴(kuò)散提供依據(jù)[4]。
國內(nèi)外利用高光譜遙感技術(shù)對農(nóng)作物病蟲害識別已有不少的研究。Kobayashi等[5]學(xué)者研究了稻穗瘟的嚴(yán)重度,利用機(jī)載多光譜掃描儀對稻穗瘟進(jìn)行探測,運(yùn)用綠光和紅光的波段比值反演稻穗瘟的嚴(yán)重度。Wang等[6]運(yùn)用可見光和近紅外光譜識別了水稻正常穗和霉穗。李波等[7]測定了水稻受稻干尖線蟲病危害和水稻受稻縱卷葉螟危害的光譜數(shù)據(jù),利用主成分分析和概率神經(jīng)網(wǎng)絡(luò)對兩種病害進(jìn)行識別。劉占宇等[8]通過非成像光譜儀測定了水稻胡麻斑病的病葉光譜反射率,利用主成分分析和徑向基網(wǎng)絡(luò)對水稻胡麻斑病的嚴(yán)重度進(jìn)行了估測。楊昊諭等[9]采用熒光光譜技術(shù)獲得黃瓜病、蟲害光譜數(shù)據(jù),利用主成分分析和支持向量機(jī)(Support Vector Machine,SVM)對黃瓜病害和蟲害進(jìn)行識別。劉良云[10]、黃木易[11]對冬小麥條繡病的病害嚴(yán)重度進(jìn)行了反演。梁棟[12]、林卉等[13]利用SVM分別對冬小麥、小麥葉面積指數(shù)進(jìn)行高光譜遙感反演,提高了預(yù)測的效果。近年來,SVM得到了廣泛的應(yīng)用,SVM在輸入?yún)?shù)上可以融合多個波段的信息,提高遙感識別的精度。但是,SVM的性能受懲罰參數(shù)和核參數(shù)的影響。本文利用遺傳算法(Genetic Algorithm,GA)優(yōu)化SVM的懲罰參數(shù)和核參數(shù)。
本文以天山北坡典型加工番茄種植區(qū)農(nóng)八師143團(tuán)10連為研究區(qū),優(yōu)選加工番茄早疫病的多個敏感波段,融合GA算法和SVM模型,對加工番茄早疫病進(jìn)行識別,提高加工番茄早疫病病害識別精度。
2.1 試驗(yàn)材料的獲取
實(shí)驗(yàn)病譜設(shè)在石河子大學(xué)試驗(yàn)站(44°18′N,88° 03′E)加工番茄病圃區(qū),土壤為壤質(zhì)灰漠土,有機(jī)質(zhì)含量19.3g·kg-1、堿解氮77.4mg·kg-1、速效磷93g·kg-1、速效鉀315mg·kg-1。大田試驗(yàn)設(shè)在農(nóng)八師143團(tuán)10連。選用的品種是石番28。選用于加工番茄果實(shí)膨大期2013年8月12日和8月20日兩期早疫病病葉光譜數(shù)據(jù),其中8月12日共91個樣本,大田樣本為48個,試驗(yàn)站病圃區(qū)43個樣本,8月20日共88個樣本,大田樣本為45個樣本,試驗(yàn)站病圃區(qū)43個樣本。
2.2 單葉光譜測定
采用美國ASD Field Spec Pro FR2500便攜式光譜儀與ASD Leaf Clip測試夾耦合測定。ASD Leaf Clip測試夾本身帶有模擬光源,可在密閉環(huán)境下測定,操作穩(wěn)定,測量誤差小。Pro FR 2500便攜式光譜儀有512個光譜波段,波段范圍為350nm~2500nm,采用間隔(波段寬)在350nm~1000nm范圍內(nèi)為1.4nm;在1000nm~2500nm范圍內(nèi)為2nm。光譜分辨率在350nm~1000nm為3nm,1000nm~2500nm為10nm。對每片樣本葉片分中上部、左基部和右基部早疫病病害處各測2次。每次測定2條光譜曲線,每條光譜曲線掃描時(shí)間0.2s,取平均值作為該葉片的光譜反射值。
2.3 病害嚴(yán)重度等級的劃分
在加工番茄早疫病自然發(fā)病后,在實(shí)驗(yàn)站病圃區(qū)和大田中分別進(jìn)行采樣,采取加工番茄頂部倒數(shù)第3層病葉。根據(jù)董金臬病害分級規(guī)范[14],病葉嚴(yán)重度等級SL(Severity Level)按照受害面積百分比0%、0%~10%、10%~30%、30%~50%、>50%,分別分為0級(健康)、1級(輕度)、2級(中度)、3級(嚴(yán)重)、4級(極嚴(yán)重)。
2.4 GA和SVM算法
圖1 GA和SVM算法
運(yùn)用GA算法和SVM相結(jié)合對加工番茄早疫病病害嚴(yán)重度進(jìn)行識別,如圖1所示,從敏感波段的光譜反射率中,把訓(xùn)練集和測試集提取出來,進(jìn)行預(yù)處理,利用GA算法的適應(yīng)度函數(shù),進(jìn)化代數(shù)作為優(yōu)化準(zhǔn)則,搜索最佳的懲罰參數(shù)和核函數(shù)參數(shù),作為SVM的輸入向量進(jìn)行訓(xùn)練,再用得到的模型來識別測試集的早疫病病害嚴(yán)重度。
SVM是由Vapnik在1995年提出的一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)方法[15]。在分類中,建立一個分類超平面作為決策曲面,使得正例和反例之間的隔離邊緣被最大化。分類超平面如式(1)所示:
b表示偏置,w代表分類面的權(quán)重向量,φ表示輸入特征向量空間到高維空間的映射。
找出最優(yōu)分類超平面的過程轉(zhuǎn)化為解算一個最優(yōu)化問題。式(2)和式(3)分別為目標(biāo)函數(shù)和約束條件。
式中,C表示懲罰參數(shù),ξi表示松弛變量,主要解決數(shù)據(jù)集的線性不可分。利用Lagrange函數(shù)將原始優(yōu)化問題轉(zhuǎn)化為對偶優(yōu)化問題,式(4)和式(5)是表示為目標(biāo)函數(shù)和約束條件。
式中,k(xixj)=φ(xi)φ(xj)代表核函數(shù),使用核函數(shù)將輸入特征空間映射到高維空間。選擇不同的核函數(shù)可以產(chǎn)生不同的支持向量機(jī),常用的有以下幾種:多項(xiàng)式核(式(6))、徑向基核函數(shù)(式(7))和Sigmoid核(式(8))。
其中,d為多項(xiàng)式的階,b為偏置系數(shù)。
其中,γ為核函數(shù)的寬度。
其中,γ為核函數(shù)的寬度,b為偏置系數(shù)。
解算上面的對偶問題,得到最優(yōu)解,由此得出SVM分類判別函數(shù)為:
SVM以嚴(yán)格的數(shù)學(xué)理論為基礎(chǔ),克服了傳統(tǒng)經(jīng)驗(yàn)學(xué)習(xí)和啟發(fā)式學(xué)習(xí)的靠經(jīng)驗(yàn)和啟發(fā)的先驗(yàn)成份。同時(shí)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,提高了置信水平,克服了過學(xué)習(xí)的問題,得到全局最優(yōu)解[16-18]。但是,SVM的性能受懲罰參數(shù)和核函數(shù)參數(shù)的影響。
利用遺傳算法優(yōu)化支持向量機(jī)懲罰參數(shù)和核函數(shù)參數(shù)[19],首先初始種群產(chǎn)生,再進(jìn)行適應(yīng)度函數(shù)計(jì)算,本文適應(yīng)度函數(shù)為測試集數(shù)據(jù)誤差平方和的倒數(shù):
式中,^ti為測試集的預(yù)測值,tn為測試集的真實(shí)值,n為測試集的樣本數(shù)目。
然后,進(jìn)行選擇、交叉和變異循環(huán)操作,經(jīng)過一次次的迭代進(jìn)化,當(dāng)滿足迭代終止條件時(shí),輸出末代種群對應(yīng)的問題最優(yōu)解,即篩選出最具近優(yōu)解的懲罰參數(shù)和徑向基函數(shù)的核函數(shù)參數(shù)。
3.1 加工番茄早疫病的光譜特征分析
當(dāng)綠色植物生長旺盛時(shí),葉綠素含量高,紅邊會向紅外方向偏移,稱之為紅移;當(dāng)植物感染病蟲害或重金屬污染時(shí),紅邊會向藍(lán)光方向移動,稱之為藍(lán)移[20]。加工番茄早疫病病葉共179個樣本,分別求平均值。如圖2所示,在可見光近紅外短波紅外區(qū)域中,光譜反射率能反映加工番茄早疫病不同病害程度的變化特征。在可見光區(qū)域350nm~760nm,隨著早疫病病害嚴(yán)重度升高,光譜反射率也升高,主要是因?yàn)榧庸し咽茉缫卟∶{迫,使得加工番茄葉片中的葉綠素含量降低,造成葉綠素在藍(lán)紅波段的吸收減少,反射增強(qiáng)。在近紅外的反射平臺(761nm~1169nm),加工番茄早疫病不同嚴(yán)重度病葉的光譜特征反映比較顯著,隨著病害的加重,光譜反射率降低。在1170nm~2500nm,光譜反射率隨著加工番茄早疫病的加重,光譜反射率增高。這種現(xiàn)象主要是因?yàn)榧庸し咽茉缫卟∶{迫,使得葉片的細(xì)胞結(jié)構(gòu)以及間隙發(fā)生變化,并不斷失去水分,細(xì)胞含水量降低。加工番茄早疫病病葉不同嚴(yán)重度的光譜特征差異比較明顯,利用光譜的手段對早疫病嚴(yán)重度進(jìn)行識別具有可行性。
圖2 加工番茄早疫病病葉光譜特征
3.2 加工番茄早疫病病害嚴(yán)重度等級與光譜反射率的相關(guān)分析
對加工番茄早疫病病葉病害嚴(yán)重度等級和光譜反射率進(jìn)行相關(guān)分析,如圖3所示,350nm~711nm和1154nm~2500nm呈正相關(guān),582nm~698nm病害嚴(yán)重度與光譜反射率呈顯著相關(guān)水平,其中691nm的相關(guān)系數(shù)最大,為0.909。712nm~1153nm呈負(fù)相關(guān),764nm病害嚴(yán)重度與光譜反射率的相關(guān)系數(shù)最小,為-0.769。選取628nm~643nm和689nm~692nm為加工番茄早疫病嚴(yán)重度的敏感波段。
圖3 加工番茄早疫病病害嚴(yán)重度等級與光譜反射率相關(guān)曲線
3.3 基于GA-SVM的加工番茄早疫病病害嚴(yán)重度識別
3.3.1 輸入向量的選擇與GA-SVM訓(xùn)練參數(shù)的設(shè)定
選用于加工番茄果實(shí)膨大期2013年8月12日和8月20日兩期早疫病病葉光譜數(shù)據(jù),其中8月12日,91個樣本作為訓(xùn)練樣本。8月20日,88個樣本作為測試樣本。
原始光譜波段范圍為350nm~2500nm,波段數(shù)若全部作為輸入向量,計(jì)算量過大,導(dǎo)致訓(xùn)練時(shí)間增加,預(yù)測結(jié)果也不穩(wěn)定,通過相關(guān)分析選取敏感波段如表1所示,選取相關(guān)性較強(qiáng)的628nm~643nm和689nm~692nm波段作為敏感波段,輸入SVM模型進(jìn)行訓(xùn)練。在Matlab R2009a中,通過GA優(yōu)化SVM參數(shù)懲罰參數(shù)c和核函數(shù)參數(shù)g[21-22]。其中GA的參數(shù)中最大的進(jìn)化代數(shù)為200,種群最大的數(shù)量為20,參數(shù)c的變化范圍為(0,100],參數(shù)g的變化范圍為(0,1000],得出最佳參數(shù)c為0.1289,參數(shù)g為3.479。
3.3.2 GA和SVM的分類結(jié)果
調(diào)用svmtrain和svmpredict函數(shù),代入c和g,分別采用多項(xiàng)式核、徑向基核函數(shù)、Sigmoid核,得到訓(xùn)練樣本的準(zhǔn)確率和測試樣本的準(zhǔn)確率。如表1所示,其中徑向基核函數(shù)的GA-SVM分類準(zhǔn)確率最高,在實(shí)際分類和預(yù)測分類圖中,總樣本88個,正確率為80.68%。
表1 GA-SVM分類結(jié)果
選取相關(guān)性較強(qiáng)的628nm~643nm和689nm~692nm波段作為敏感波段,輸入SVM模型進(jìn)行訓(xùn)練,其中參數(shù)c默認(rèn)為2,參數(shù)g默認(rèn)為1,如表2所示,其中徑向基核函數(shù)的SVM模型訓(xùn)練準(zhǔn)確率和預(yù)測準(zhǔn)確率最高,分別為83.798%和79.625%。說明通過GA優(yōu)化SVM模型的參數(shù)c和參數(shù)g,可以提高加工番茄早疫病病害嚴(yán)重度高光譜遙感的識別精度。
表2 SVM分類結(jié)果
基于高光譜遙感數(shù)據(jù)和田間早疫病調(diào)查數(shù)據(jù),利用GA優(yōu)化SVM懲罰參數(shù)c和核函數(shù)參數(shù)g,對加工番茄早疫病病害嚴(yán)重度進(jìn)行識別。得出以下結(jié)論:
(1)加工番茄早疫病光譜響應(yīng)特征為:在可見光波段(350nm~760nm)隨著病害的加重,光譜反射率升高;在近紅外的反射平臺(761nm~1169nm),不同病害嚴(yán)重度早疫病的光譜反射率隨著病害的加重而降低;在(1170nm~2500nm)不同病害嚴(yán)重度的加工番茄早疫病的光譜反射率隨著病害的加重而升高。
(2)加工番茄早疫病的敏感波段為628nm~643nm和689nm~692nm。
(3)遺傳優(yōu)化算法得出支持向量機(jī)最佳懲罰參數(shù)c為0.129,核函數(shù)參數(shù)g為3.479;
(4)利用多項(xiàng)式核、徑向基核函數(shù)、Sigmoid核進(jìn)行分類訓(xùn)練和測試,最佳分類模型為徑向基核函數(shù)模型,訓(xùn)練準(zhǔn)確率為84.615%,預(yù)測準(zhǔn)確率為80.681%,高于默認(rèn)參數(shù)c和g的支持向量機(jī)模型,GA優(yōu)化SVM參數(shù)提高了病害識別的精度。同時(shí),SVM在輸入向量上融合更多的波段信息。本文為多波段協(xié)同病害識別提供了新的思路。
參考文獻(xiàn):
[1] 喻樹龍,王健,楊曉光,等.新疆加工番茄適生種植氣候區(qū)劃[J].中國農(nóng)業(yè)氣象,2005,26(4):268-271.
[2] NASH A F,GARDNER R G.Tomato early blight resistance in a breeding line derived from Lycopersicon hirsutum PI 126445[J].Plant Disease,1988,(72):206-209.
[3] 趙思峰,廖依學(xué),王昌,等.新疆加工番茄病蟲草害發(fā)生概況及綜合防治技術(shù)[J].新疆農(nóng)業(yè)科學(xué),2004,41(5):274-276.
[4] 趙英時(shí).遙感應(yīng)用分析原理與方法[M].北京:科學(xué)出版社,2005.
[5] KOBAYASHI T,KANADA E,KITADA K,et al.Detection of rice panicle blast with multispectral radiometer and the potential of using airborne multispectral scanners[J].Phytopathology,2001,91(3):316-323.
[6] WANG D,DOWELL F E,LAN Y,et al.Determing pecky rice kernels using visible and near-infrared spectroscopy[J].International Journal of Food Properties,2002,5(3):629-639.
[7] 李波,劉占宇,黃敬峰,等.基于PCA和PNN的水稻病蟲害高光譜識別[J].農(nóng)業(yè)工程學(xué),2009,25(9):143-148.
[8] 劉占宇,孫化生,黃敬峰.基于學(xué)習(xí)矢量化神經(jīng)網(wǎng)絡(luò)的水稻白穗和正常穗的高光譜識別[J].中國水稻科學(xué),2007,21(6):664-668.
[9] 楊昊諭,于海業(yè),劉煦,等.葉綠素?zé)晒釶CA-SVM分析的黃瓜病蟲害診斷研究[J].光譜學(xué)與光譜分析,2010,30(11):3018-3021.
[10] 劉良云,黃木易,黃文江,等.利用多時(shí)相的高光譜航空圖像監(jiān)測冬小麥條繡病[J].遙感學(xué)報(bào),2004,8(3):275-282.
[11] 黃木易,黃文江,劉良云,等.冬小麥條繡病單葉光譜特性及嚴(yán)重度反演[J].農(nóng)業(yè)工程學(xué)報(bào),2004,20(1):176-181.
[12] 梁棟,管青松,黃文江,等.基于支持向量機(jī)回歸的冬小麥葉面積指數(shù)遙感反演[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(7):117-123.
[13] 林卉,梁亮,張連蓬,等.基于支持向量機(jī)回歸算法的小麥葉面積指數(shù)高光譜遙感反演[J].農(nóng)業(yè)工程學(xué)報(bào),2013,29(11):139-146.
[14] 董金臬.農(nóng)業(yè)植物病理學(xué).北方本[M].北京:中國農(nóng)業(yè)出版社,2001.
[15] 羅澤舉.支持向量機(jī)學(xué)習(xí)算法及應(yīng)用研究中的若干問題[D].中山大學(xué),2006.
[16] 范昕煒.支持向量機(jī)算法的研究及其應(yīng)用[D].浙江大學(xué),2003.
[17] 張睿,馬建文.改進(jìn)的P-SVM支持向量機(jī)與遙感數(shù)據(jù)分類[J].遙感學(xué)報(bào),2009,13(3):445-453.
[18] 宮鵬.遙感科學(xué)與技術(shù)中的一些前沿問題[J].遙感學(xué)報(bào),2009,13(1):13-24.
[19] 雷英杰,張善文,李續(xù)武,等.MATLAB遺傳算法工具箱及應(yīng)用[M].西安:西安電子科技大學(xué)出版社,2005.
[20] 黃木易,王記華,黃文江,等.冬小麥條繡病的光譜特征及遙感監(jiān)測[J].農(nóng)業(yè)工程學(xué)報(bào),2003,19(6):154-158.
[21] CHANG C C,LIN C J.LIBSVM:A library for support vector machines[EB/OL].http://www.csie.ntu.edu.tw/~cjlin/libsvm,2001.
[22] YANG L.LIBSVM-faruto ultimate version a toolbox with implements for support vector machines based on libsvm[EB/OL].http://www.ilovematlab.cn,2009.
Hyperspectral Remote Sensing Identification of Processing Tomato Early Blight Based on GA and SVM
YIN Xiao-jun,NING Chuan,ZHANG Yong-cai
(The Institute of Information Science and Technology,Shihezi 832000)
The yield and quality of processing tomato are seriously affected by early blight.Our study area is the main growing area of the north of Tianshan in Xinjiang.Based on the data of hyperspectral remote sensing and the data of survey in the field of early blight,we analyzed the spectral characterization in order to look for the sensitive wave bands and recognized the different disease severity with the genetic algorithm and support vector machine model.The result show that:①Sensitive bands of different disease severity levels of processing tomato early blight is 628nm~643nm and 689nm~692nm.②Using genetic algorithm optimize parameters of support vector machine,we get that the best penalty parameters is 0.129and kernel function parameters is 3.479.③We make classification training and testing by polynomial nuclear,radial basis function nuclear,and sigmoid nuclear,where the best classification model is the radial basis function nuclear of SVM.Training accuracy is 84.615% and testing accuracy is 80.681%.Those are higher than SVM with default parameters.So the method of support vector machine optimized by genetic algorithm has higher accuracy and support vector machine are offered a new idea of combined band to identify disease severity.
genetic algorithm;support vector machine;processing tomato;early blight;blight recognition
10.3969/j.issn.1000-3177.2015.02.017
TP79
A
1000-3177(2015)138-0094-05
2013-12-20
2014-04-24
中國科學(xué)院數(shù)字地球重點(diǎn)實(shí)驗(yàn)室開放基金項(xiàng)目(2012LDE011);國家科技支撐計(jì)劃項(xiàng)目(2012BAH27B02);國家自然科學(xué)基金項(xiàng)目(31260291);石河子大學(xué)高層次人才基金項(xiàng)目(RCZX201226)。
尹小君(1977~),女,博士,副教授,主要從事資源環(huán)境遙感研究。
E-mail:penseyinxj@163.com