路 陽 ,郭 丹 ,沈 賀 ,李 欣 ,韓正君
(1黑龍江八一農(nóng)墾大學(xué)電氣與信息學(xué)院 黑龍江 大慶 163319)
(2內(nèi)蒙古自治區(qū)額爾古納市公安局 內(nèi)蒙古 額爾古納 022250)
(3中國移動北京公司 北京 100007)
水稻是我國主要糧食作物之一,北方寒地水稻種植過程中,常常發(fā)生多種病害,其中稻瘟病、紋枯病對水稻產(chǎn)量影響最為嚴重,其次為惡苗病、葉鞘腐敗病和立枯病。這些病害造成了水稻品質(zhì)下降和嚴重的經(jīng)濟損失?,F(xiàn)階段水稻病害的識別主要是通過人工觀察的方法,但此方法效率低,容易出現(xiàn)誤診并延誤最佳診斷時間,影響了水稻病害防治的準確性和時效性[1]。
隨著圖像處理技術(shù)和人工智能技術(shù)的發(fā)展,國外從60年代起開始研究系統(tǒng)控制理論在害蟲治理中的應(yīng)用問題。Girshick等[2]使用基于HIS的顏色共生矩陣和Canny邊緣檢測算子獲取紋理特征,并使用廣義二乘矩判別式分類器進行柑桔病害的識別。Hitimana[3]采用圖像處理技術(shù)從形狀特性角度建立了識別參數(shù)對咖啡葉子病害進行了自動判斷與識別。為了提高作物病害診斷效果,許多學(xué)者研究了基于機器學(xué)習(xí)方法的作物病害自動診斷與識別。如黃雙萍等[4]基于深度卷積神經(jīng)網(wǎng)絡(luò)GoogleNet模型對水稻穗瘟病檢測,預(yù)測準確率達到92%。李長纓等[5]利用計算機視覺技術(shù)實現(xiàn)對溫室植物生長的無損監(jiān)測。這些模式識別技術(shù)提高了病害診斷的自動化水平,但在特征提取及泛化能力方面還存在一定的局限。
2006 年,Hinton等人首次提出深度信念網(wǎng)絡(luò)的概念,標識著深度學(xué)習(xí)的誕生,引起機器學(xué)習(xí)研究的第二次浪潮。在目標識別中,深度學(xué)習(xí)方法已經(jīng)獲得了比傳統(tǒng)分類算法更好的性能。如深度神經(jīng)網(wǎng)絡(luò)(DNNs)已經(jīng)被應(yīng)用到精神分裂癥的全腦靜態(tài)FC的分類中。Sidong Liu等應(yīng)用深度學(xué)習(xí)理論對老年癡呆癥進行早期診斷。為了提高分類性能,Ren等提出了一種新的最大邊緣多模式深度神經(jīng)網(wǎng)絡(luò)(3mDNN),以利用圖像的多個局部描述符。與標準算法相比,這種方法考慮到多個描述符的信息,在學(xué)習(xí)多層非線性特征中表現(xiàn)出區(qū)別能力。文獻中,Szegedy指出,由于DNNs具有捕獲目標位置等幾何信息的強大能力,DNNs已經(jīng)被廣泛用于檢測,并表現(xiàn)出卓越的性能。深度信念網(wǎng)絡(luò)(DBN)已經(jīng)廣泛用于目標檢測任務(wù)中。例如,我們可以用圖像檢測找出醫(yī)學(xué)圖像中可能異常的組織或細胞。Abdel-Zaher等使用基于DBN計算機輔助診斷(CAD)系統(tǒng)對乳腺癌早期檢測,取得非常好的效果。
深度學(xué)習(xí)方法通過組合多個非線性處理層對原始數(shù)據(jù)特征進行淺層到深層的逐層抽象用于診斷識別。具有以下優(yōu)點:1)“深層”模型結(jié)構(gòu):與其他淺層模型相比,深度學(xué)習(xí)模型的多層結(jié)構(gòu)與大腦的視覺處理系統(tǒng)非常相似,深度學(xué)習(xí)模型擁有更多的隱層,更多的非線性變換,這使得深度學(xué)習(xí)擬合復(fù)雜模型的能力大大增強。2)多層數(shù)據(jù)特征表示:深度學(xué)習(xí)模型可以直接輸入圖像,之后將當前層的輸出作為下一層的輸入,逐層堆疊,由此得到更高級的特征,更清晰刻畫原始輸入的復(fù)雜數(shù)據(jù)結(jié)構(gòu)。
本文將利用深度學(xué)習(xí)模型對無標簽的水稻病害圖像數(shù)據(jù)進行訓(xùn)練,提高稻瘟病、紋枯病、惡苗病、葉鞘腐敗病及立枯病等水稻病害診斷的智能化和自動化水平。
部分水稻病害圖像在田間自然光照條件下,使用佳能EOS 5D Mark Ⅲ (EF24–70mm F2.8L Ⅱ USM)數(shù)碼相機獲取。針對北方寒地水稻生長中期葉部分別采集稻瘟病、紋枯病、惡苗病、葉鞘腐敗病及紋枯病等病害圖像。部分水稻病害圖像從《水稻病蟲害防治圖解》、《北方水稻病蟲害防治彩色圖譜》等圖書中掃描獲取。每種病害采集200幅圖像,共采集2000幅圖像,每幅圖像采用JPG格式存儲并歸一化處理為64╳64大小。采集的原始水稻病害圖像預(yù)處理后如圖1所示:
由于采集的水稻病害原始圖像數(shù)據(jù)量非常大,不利于計算機處理,因此采用PCA(Principal component analysis)主成分分析方法對水稻病害圖像數(shù)據(jù)進行降維。在降維之前,首先對水稻病害圖像進行均值化處理,即對水稻病害圖像每個特征維,通過除以每維的最大值,得到該維的平均值,再減去該維的平均值,從而將不同維的數(shù)據(jù)范圍歸一化到同一范圍。
然后根據(jù)下述公式求出降維后的各個向量的方向和原先的樣本在新的方向上投影后的值。其中表示原始圖像,為圖像像素總數(shù),為在方向上的投影。
這種預(yù)處理后,利用PCA使得每個圖像由64*64*3=12288維降低到400維,保留了97%的主要成分,同時大大加快了訓(xùn)練速度。
本文設(shè)計的深度網(wǎng)絡(luò)結(jié)構(gòu),主要包括4個卷積層、3個Pooling層和1個全連接層、線性修正單元層以及標志所屬類別的輸出層。網(wǎng)絡(luò)最后一個全連接層的輸出需要設(shè)置為類別數(shù),輸入水稻病害圖像尺寸為96╳96╳3。輸出屬于每種病害的概率值。選擇網(wǎng)絡(luò)結(jié)構(gòu)中的全連接層作為要提取的病斑特征層,使用的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖1 水稻葉部主要病害圖像Fig.1 Image of main leaf disease in Rice
圖2 深度網(wǎng)絡(luò)模型結(jié)構(gòu)Fig.2 Deep network model structure
本文卷積神經(jīng)網(wǎng)絡(luò)搭建在深度學(xué)習(xí)框架Caffe上,Ubuntu14.04操作系統(tǒng),模型的訓(xùn)練以及整體測試過程在Matlab 平臺上進行。
Caffe深度學(xué)習(xí)框架中,train_val.prototxt文件定義了深度網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練集和驗證集,Solver.prototxt文件定義了訓(xùn)練網(wǎng)絡(luò)所需的網(wǎng)絡(luò)參數(shù),deploy.prototxt用于提取病斑特征。通過反復(fù)試驗,深度網(wǎng)絡(luò)模型中最優(yōu)各項參數(shù)為:
使用上述參數(shù)構(gòu)建深度網(wǎng)絡(luò),然后從建立的水稻病害圖像數(shù)據(jù)庫中隨機選取60%樣本來訓(xùn)練,40%用于測試,采用10重交叉驗證方法,水稻葉部主要病害識別結(jié)果如表1所示。從表中可以看出深度網(wǎng)絡(luò)結(jié)構(gòu)對水稻葉部病害平均識別率達到96.9%,而SVM方法與BP方法的識別率分別為86.4%和89.3%,在訓(xùn)練時間上,深度網(wǎng)絡(luò)所需的時間為78ms,低于SVM方法的81ms和BP方法的85ms,結(jié)果表明深度網(wǎng)絡(luò)結(jié)構(gòu)方法針對水稻葉部病害的識別準確率比較高。
表1 水稻病害識別結(jié)果Table 1 Rice disease recognition results
本文針對寒地水稻稻瘟病、紋枯病、惡苗病、葉鞘腐敗病及立枯病等主要病害,建立水稻病害圖像數(shù)據(jù)庫并使用PCA方法降維,基于深度學(xué)習(xí)方法研究了水稻病害的識別技術(shù),通過10重交叉驗證,平均識別率達到96.9%,優(yōu)于常見的SVM模型和BP模型。