張云龍, 張會敏, 謝澤奇, 張晴晴, 齊國紅
(鄭州大學西亞斯國際學院,河南鄭州 451150)
近年來,由于自然災害、水土流失、化肥和農(nóng)藥的不合理使用以及城市化過度開發(fā)、環(huán)境污染等因素,導致農(nóng)作物病害發(fā)生頻繁,危害極大,這些病害嚴重影響了作物的產(chǎn)量和品質(zhì)。傳統(tǒng)的作物病害識別結(jié)果往往受到人為因素的影響,導致病害類型診斷不準確。隨著計算機視覺技術(shù)和模式識別技術(shù)發(fā)展以及智能攝像手段的普及,為農(nóng)作物病害智能診斷和準確識別提供了可能。作物病害葉片圖像分割和病害類型識別一直是一個重要而具有挑戰(zhàn)性的研究課題[1-3]。病害葉片圖像分割是作物病害識別方法的關(guān)鍵技術(shù)[4-6]。任守綱等針對復雜背景下黃瓜葉部病害圖片分割精度不高的問題,提出了一種基于顯著性檢測的黃瓜葉部病害圖像分割算法[7]。胡敏等提出了一種自然環(huán)境中的黃瓜病害葉片圖像在不同顏色空間中的分割及顏色、紋理特征提取算法[8]。張芳提出了一種基于超像素和形狀上下文的復雜背景下的黃瓜葉片的圖像分割算法[9]。復雜圖像的顯著性是相對于它的鄰域在不同尺度上的圖像區(qū)域的局部對比度,它表示圖像子區(qū)域像素的平均特征向量與其鄰域像素的平均特征向量之間的距離。在一個特定尺度上,可以通過采用各個像素特征向量,而不是結(jié)合為各個特征的尺度值得到的單獨顯著圖域,獲取一個組合的特征映射。對于同一幅黃瓜病害葉片圖像,不同的目的可能選擇不同的區(qū)域作為感興趣區(qū)域。近年來,顯著性分割技術(shù)已被應(yīng)用于病害葉片圖像分割中,取得了較好的分割效果[10-12]。由于黃瓜病害葉片圖像的復雜性,很多學者從病害葉片圖像中提取了各種各樣的分類特征,用于黃瓜病害識別方法。王獻鋒等提出一種基于葉片圖像和環(huán)境信息的黃瓜病害識別方法,該方法充分利用了作物病害的環(huán)境信息和作物病害葉片圖像的顏色、形狀、紋理等統(tǒng)計特征進行病害識別[13]。謝澤奇等提出了一種基于病害葉片圖像的顏色特征和屬性約簡算法的黃瓜病害葉片分割與識別方法,該方法首先利用最大類間方差閾值法對黃瓜病害葉片圖像進行病斑分割,然后提取了病斑圖像的36個分類特征進行病害識別[14]。張芳等針對復雜背景下作物病害葉片圖像特征提取和識別難題,通過局部二值模式(local binary patterns,簡稱LBP)、區(qū)域平均方差、區(qū)域平均熵值等方法分別提取病害葉片圖像的顏色、形狀、紋理等11個典型特征識別病害類型[15]。Kouakou等提出了一種基于人工神經(jīng)網(wǎng)絡(luò)的黃瓜病害檢測方法,該方法能夠檢測出黃瓜的早期病害[16]。馬浚誠等構(gòu)建了一種基于圖像處理的溫室黃瓜霜霉病診斷系統(tǒng),該系統(tǒng)基于條件隨機場分割病斑圖像,利用決策樹模型提取病斑,最后基于徑向基核函數(shù)的支持向量機(support vector machine,簡稱SVM)分類器進行黃瓜霜霉病識別與診斷[17]。由于實際病害葉片圖像包含正常綠色、病斑和復雜背景,病葉圖像中的病斑顏色成分多樣、不均勻,病斑的紋理和形狀多種多樣,病斑灰度值存在重疊,而且正常像素與病斑像素邊界具有模糊性和不確定性。因此,很難利用固定閾值和確定的準則將病斑圖像準確分割。K-均值算法是一種被廣泛使用的彩色圖像分割算法,但該算法的分割結(jié)果在很大程度上依賴于初始聚類中心和聚類數(shù),隨機選取的聚類中心和聚類數(shù)容易造成分割時間長、分割誤差大,也可能陷入局部最小值。方向梯度直方圖(histogram of oriented gradient,簡稱HOG)特征是一種在計算機視覺和圖像處理中用來進行物體檢測的特征描述子,它通過計算和統(tǒng)計圖像局部區(qū)域的梯度方向直方圖來構(gòu)成特征[18],其實現(xiàn)方法是先將圖像分成小的方格單元連通區(qū)域,然后采集方格單元中各像素點的梯度方向或邊緣方向直方圖,再把這些直方圖組合起來就可以構(gòu)成特征描述子。本研究在顯著性區(qū)域和HOG特征提取方法基礎(chǔ)上,提出一種黃瓜葉部病害識別方法。首先,利用亮度和顏色的低階特征,結(jié)合多尺度分析確定原始彩色圖像的顯著圖;然后利用K-均值算法分割顯著圖,得到病斑圖像;再提取病斑圖像方向梯度直方圖特征;最后利用支持向量機分類器分類病斑圖像,并通過4種黃瓜病害進行測試。
本研究中所使用的黃瓜葉部病害樣本圖像均是在陜西省楊凌現(xiàn)代農(nóng)業(yè)示范園采集,黃瓜品種為中農(nóng)26號。在自然光源條件下進行病害葉片圖像采集,采集時間主要從病害初期至病害后期(主要是在3—6月),在每天8:00、12:00、16:00拍攝3次病害葉片圖像。利用數(shù)碼相機采集4種黃瓜病害(角斑病、霜霉病、炭疽病、白粉病)葉片病斑圖像各60幅 (共240幅)作為研究對象。圖像采集系統(tǒng)硬件主要包括數(shù)碼相機和方正電腦。數(shù)碼相機為佳能A640,圖像分辨率為 1 200×1 600。為了試驗方便,把每幅葉片圖像剪裁成480×320,并以JPG格式存儲到圖像數(shù)據(jù)庫中。
1.2.1 作物病害葉片圖像分割 與RGB顏色空間相比,顏色空間是一種生理特征與設(shè)備無關(guān)的顏色系統(tǒng),是用數(shù)字化方法描述人的視覺感應(yīng)。其中,L表示像素亮度,a表示從紅色到綠色的范圍,b表示從黃色到藍色的范圍。病害葉片圖像的顯著區(qū)域是葉片圖像中的病斑部分,最能表現(xiàn)作物病害內(nèi)容的區(qū)域。因此,本研究提出一種作物病害葉片顯著區(qū)域提取方法。該方法結(jié)合通過改變各個濾波器的尺度大小的多尺度分析方法,然后生成顯著區(qū)域[12]。
給定一個病害葉片圖像,設(shè)(i,j)為圖像上任一像素點,在一個給定的尺度下定義該像素點處的顯著值為該點處的內(nèi)部區(qū)域R1和外部區(qū)域R2中平均像素值之間的距離D(i,j):
D(i,j)=‖A1-A2‖。
(1)
區(qū)域R1通常被選擇為一個像素點。為了克服圖像中噪聲的影響,本研究方法中選擇一個3×3的小像素區(qū)域作為區(qū)域R1。對于R1與R2之間對應(yīng)的區(qū)域是寬度為w個像素、高度為h個像素的圖像,則區(qū)域R2的寬度變化范圍wB為
(2)
則圖像顯著區(qū)域定義為尺度S上的顯著值之和:
(3)
式中:mi,j是在尺度S上通過逐點求和顯著值而獲得的組合顯著區(qū)域M的一個元素,Ci,j為圖像在像素點(i,j)處的灰度值。
得到各個像素點的顯著性值后,利用K-均值算法分割顯著區(qū)域。K個種子由爬山算法在三維Lab圖像直方圖上自動確定[19]。爬山算法是一個搜索窗口運行在特征空間維數(shù)為d的直方圖空間上在該窗口中尋找最大的盒子。因為Lab顏色空間的像素為三維向量,則顏色直方圖中每個盒子有3d-1=26個鄰居,因此可以獲得具有K個波峰的盒子,盒子值即為初始種子。本研究采用一種8-鄰域連通分量算法連接各聚類中的像素點。當找到分割區(qū)域rk(k=1,2,…,K)時,將對應(yīng)分割圖像中像素最終顯著區(qū)域M上的值相加,計算每個分割區(qū)域的平均顯著值:
(4)
式中:|rk|為用像素表示的分割區(qū)域的大小。
給定一個閾值T,將大于閾值的平均顯著值的區(qū)域保留下來,將剩余的丟棄,就得到只包含顯著對象的區(qū)域,即病害葉片病斑圖像。
1.2.2 病斑圖像特征提取 方向梯度直方圖特征能夠利用梯度或邊緣的方向密度分布很好地描述一幅病害葉片圖像中病斑的表象和形狀。其實現(xiàn)過程為將原始圖像劃分為一些子圖像,計算局部直方圖,然后對比度歸一化局部直方圖在圖像更大的區(qū)域(block)。此過程先計算各直方圖在該block的密度,然后根據(jù)此密度值對區(qū)間的各個方格單元歸一化。歸一化能對光照變化和陰影獲得更好的穩(wěn)定性。
HOG特征提取過程中的主要步驟為
步驟1:遍歷圖像每個像素點,以其為中心取8×8像素領(lǐng)域為block。
步驟2:將圖像按照空間位置均勻劃分多個子圖像,將block區(qū)域平均分成4個大小相等的細胞單元(cell),每個cell的大小為4×4個像素。
步驟3:計算cell中每個像素的梯度方向和它的梯度幅值,梯度算子使用中心算子[1,0,-1]:
(5)
式中:α(x,y)和m(x,y)分別為像素點(x,y)處的梯度方向及它的梯度幅值,H(x,y)和V(x,y)分別為像素點(x,y)的水平方向的梯度大小、垂直方向的梯度大小。
步驟4:將梯度方向限定在(0,180°)內(nèi),平均分成8個區(qū)間,利用符號表示8個方向。根據(jù)橢圓圈的高斯加權(quán)范圍將cell上所有相同梯度方向像素點的梯度幅值加權(quán)累加,組成該單元的8維梯度方向直方圖。
步驟5:計算得到cell的8維梯度方向直方圖,將1個block區(qū)域中4個cell的梯度直方圖連接起來,得到1個block的4×8=32維的梯度直方圖特征。連接所有block的直方圖特征,并采用L2-模歸一化,得到HOG特征。
1.2.3 基于顯著性區(qū)域和方向梯度直方圖的作物病害識別方法 設(shè)1幅大小為128×128的圖像,可以分成16×16=256個無重疊網(wǎng)格區(qū)域,則HOG特征向量的長度為256×32=8 192。與其他的特征描述方法相比,HOG能夠得到圖像的局部特征,該特征對圖像幾何的和光學的形變具有不變性。
空間金字塔HOG(pyramid histogram of oriented gradients,簡稱PHOG)特征能夠?qū)D像的全局結(jié)構(gòu)特征進行編碼,因此,本研究選用PHOG作為病害識別的基礎(chǔ)特征提取算子[18],首先在不同的層次將圖像劃分成不同數(shù)量的塊,每一層將上一層的各塊比例按寬和高等分成更小分塊,提取各個分塊輪廓點梯度方向直方圖,然后按權(quán)值將各層中的各塊的特征向量串聯(lián)合并,就形成一個大金字塔梯度方向直方圖作為圖像的形狀特征。本研究基于顯著性區(qū)域和方向梯度直方圖,提出一種作物病害識別方法,該方法的步驟為步驟1:選擇一定數(shù)量的作物RGB彩色病害葉片圖像;步驟2:對于每幅RGB圖像的每個分量圖像,利用加權(quán)平均法進行增強處理,再進行3×3模板的中值濾波,以減少噪聲的影響,然后進行直方圖均衡化的增強處理,以改善圖像效果;步驟3:將預處理后的RGB圖像轉(zhuǎn)換為Lab圖像,利用顯著性方法分割病斑圖像;步驟4:提取每個病斑圖像的PHOG特征;步驟5:利用SVM分類器識別病斑類別。
本研究算法是在Matlab 7.0中進行測試。分割窗口是在一個16×16×16盒子Lab直方圖上爬山搜索出的一個3×3×3的小窗。用于選擇區(qū)段平均顯著性的閾值T設(shè)置為25(一般取歸一化最終顯著圖域中最大可能平均顯著性值的10%),PHOG中的級數(shù)為4。
支持向量機由于參數(shù)較少、魯棒性好、計算效率高,并且具有良好的抗干擾和噪聲能力,已被廣泛應(yīng)用于作物病害識別中。構(gòu)建SVM分類器關(guān)鍵在于選擇合適的核函數(shù),以及核函數(shù)參數(shù)g和懲罰因子c。本研究選擇基于徑向基核函數(shù)的SVM分類器,然后將L=3時的PHOG特征向量作為SVM分類器輸入,采用4折交叉驗證法進行作物病害識別,即將所有預處理后的4種黃瓜病斑圖像隨機劃分成4份,每次將其中3份共180幅圖像作為訓練樣本建立模型,用于訓練SVM分類器;剩余1份共60幅圖像作為測試樣本,用于測試算法的有效性。SVM中的2個參數(shù)由2次完整的交叉驗證試驗中最高識別率對應(yīng)的參數(shù)值決定,經(jīng)過參數(shù)優(yōu)化計算后,設(shè)置核函數(shù)參數(shù)g和懲罰因子c均為0.25。共執(zhí)行4次性能測試,得到4個識別結(jié)果,計算4個最佳結(jié)果的平均值作為本次試驗的識別結(jié)果。由于分成4份,因此,本研究進行4次重復交叉驗證法試驗,因此,每類病害共測試15×4=60幅樣本,計算4次重復試驗的識別結(jié)果如表1所示,共測試240幅樣本,正確識別225幅,平均識別率為93.75%;可以看出,霜霉病的識別率最低,白粉病的識別率最高。
表1 本研究方法對4種黃瓜病害的識別結(jié)果
為了驗證本研究病害識別方法的有效性,本研究與4種常用的作物病害識別方法進行比較,即基于顏色和紋理特征的黃瓜病害識別算法[8]、基于彩色圖像顏色統(tǒng)計特征的識別方法[20]、基于病斑形狀和神經(jīng)網(wǎng)絡(luò)的黃瓜病害識別方法[21]、基于K-均值分割和神經(jīng)網(wǎng)絡(luò)的葉片病害識別方法[22]。其中,前3種方法都是先提取病斑圖像的分類特征,然后采用遺傳算法進行特征選擇,再利用神經(jīng)網(wǎng)絡(luò)分類器或逐步判別分析法進行病害分類;第4種方法屬于維數(shù)約簡方法,該方法利用主成分分析對提取的特征進行維數(shù)約簡,再進行病害識別。這4種方法及本研究提出的方法都是在相同的黃瓜病害葉片圖像數(shù)據(jù)集上進行試驗,而且葉片圖像的預處理以及訓練子集和測試子集劃分相同,但各個方法提取和選擇的特征數(shù)目不同。
由表2可知,本研究方法的識別率最高,主要原因是本研究利用顯著性得到了準確病斑圖像,而且從病斑圖像中提取的PHOG特征能夠反映病斑圖像的顏色和紋理特征,相對于傳統(tǒng)的HOG和其他特征PHOG可以檢測到不同尺度特征,表達能力更強。其他4種方法都是利用常規(guī)的病害葉片圖像分割方法,而且提取的特征維數(shù)較少,不能有效反映病斑的特征。本研究方法利用顯著圖分割病斑圖像,省略先分割背景,降低算法的復雜性和難度,再提取病斑圖像中提取PHOG特征,可有效反映病斑的局部和全局特征,試驗結(jié)果驗證算法有效性。由此可見,本研究提出的基于顯著區(qū)域和PHOG的病害識別方法是行之有效的。在目前絕大多數(shù)植物病害類型識別中,不同方法的建模方式不同,得到的分類特征不完全相同,再進行特征選擇或維數(shù)約簡得到低維特征也不相同。從試驗結(jié)果上來看,本研究方法對4種主要的黃瓜病害識別精度較好,可以用于實際黃瓜病害識別中,同時可為田間開放環(huán)境下實現(xiàn)其他作物病害的快速自動識別提供依據(jù)。
表2 5種方法對黃瓜病害的識別率
由于病害葉片圖像及其病斑的復雜、多變性,須要提取很多分類特征,但利用現(xiàn)有的特征選擇方法不容易從眾多的特征中選擇出對病害識別算法貢獻較大的少數(shù)幾個分類特征。本研究針對現(xiàn)有基于病害葉片圖像的黃瓜病害識別方法中的病斑分割和特征提取難題,提出了一種基于顯著性和PHOG的作物病害識別方法,該算法利用葉片圖像的亮度和顏色低階特征,結(jié)合多尺度分析確定原始采用病害葉片圖像的顯著圖;再提取病斑圖像的方向梯度直方圖特征;最后利用支持向量機進行病害識別。結(jié)果表明,該方法易于實現(xiàn),識別率較高。在試驗驗證過程中,可直接提取到病斑區(qū)域,省略了先分割背景的步驟,減小了試驗的復雜性和難度,從分割的病斑圖像中提取的PHOG特征能夠反映病斑的局部和全局特征,有效實現(xiàn)了復雜背景下黃瓜葉片病害分割與病害識別。由于得到的PHOG維數(shù)較大,須要進一步進行維數(shù)約簡,這也是下一步研究的重點。