茅正沖, 孫雅慧
(江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,江蘇 無錫 214122)
通過準確地觀測玉米發(fā)育期信息,可以科學(xué)地指導(dǎo)農(nóng)民合理地進行去雄,進而有效地提高產(chǎn)量[1]。長期以來農(nóng)業(yè)氣象觀測以及傳統(tǒng)的農(nóng)作物農(nóng)情信息的提取存在耗費人力、實時性不足等問題,對現(xiàn)代農(nóng)業(yè)以及數(shù)字農(nóng)情的建設(shè)不利。圖像識別技術(shù)作為計算機視覺技術(shù)領(lǐng)域的重要課題之一,在自動化農(nóng)業(yè)領(lǐng)域受到廣泛關(guān)注。
本文利用計算機視覺技術(shù)對復(fù)雜環(huán)境下的玉米雄穗進行識別研究。針對在復(fù)雜的自然光照條件下,田間玉米分布十分密集、玉米雄穗與葉片之間顏色在三原色(red green blue,RGB)彩色空間下差異不明顯,且會對樣本圖像有遮擋導(dǎo)致識別率低下的問題,本文首先將圖像從RGB彩色空間轉(zhuǎn)換到HSI色彩空間[2]并分別提取H,S,I分量圖,發(fā)現(xiàn)H分量圖中,玉米雄穗能夠明顯地區(qū)分于葉片。對H分量圖進行二值化處理、中值濾波、連通域面積去噪、形態(tài)學(xué)處理、生成矩形框框出連通域后,能夠?qū)τ衩仔鬯肽繕诉M行識別。本文在上述識別算法之后加入再確認步驟,將識別出的候選玉米雄穗進行顏色、形態(tài)特征提取,并將上述特征輸入學(xué)習(xí)矢量量化(learning vector quantization,LVQ)神經(jīng)網(wǎng)絡(luò)進一步確認,與前一步目標識別效果相比較,得到的結(jié)果有效地提高了玉米雄穗識別的準確性,大幅降低了誤檢率。
本文圖像由江蘇省無線電研究所有限公司提供,通過安裝在田間的裝置獲取。試驗田分別位于中國山東省的泰安市(北緯36.11°,東經(jīng)117.08°)和河南省的鄭州市(北緯34.46°,東經(jīng)113.40°)。所使用的CCD相機為奧林巴斯(Olympus)E450,最高分辨率達3 648像素×2 736像素,采用定焦方式對試驗田進行拍攝,焦距設(shè)置為16 mm。相機離地面的高度約5 m,拍攝方向為前下視,光軸與地面的夾角約60°。
圖像試驗環(huán)境:軟件平臺MATLAB R2012b,硬件配置為處理器為Intel(R)Pentium(R)CPU P6200(2.13 GHz),內(nèi)存為2 GB。
為了克服RGB空間的不均勻和不直觀性,本文中采用了在接近人眼對景物的認知方面優(yōu)于RGB顏色模型、更符合人類視覺特性的色度、飽和度、亮度(hue saturation intensity,HSI)顏色空間[3],RGB空間到HSI空間的轉(zhuǎn)換關(guān)系為
(1)
(2)
(3)
H分量圖中可以觀察到玉米雄穗較明顯地區(qū)分于葉片。
2.2.1 中值濾波
中值濾波[4]是一種非線性空間濾波,可以有效地消除一定類型的隨機噪聲,同時又能較好地保護圖像中關(guān)鍵的細節(jié)信息,使圖像較為清晰。在大小為m×n的窗口A下進行中值濾波可表示為
(4)
式中m和n均為奇數(shù),i=1,2,…,m,j=1,2,…,n。
2.2.2 連通域面積去噪
中值濾波后的二值圖像仍存在著將背景誤認為雄穗的噪聲干擾,鑒于這部分誤差在二值圖中的面積較玉米雄穗面積要小得多,因此,采用連通域面積去噪的方法。根據(jù)采集圖片分辨率大小設(shè)定一個閾值T,二值圖像中面積小于T的連通域像素值均置為0;大于T的連通域保留。
由于復(fù)雜的田間環(huán)境,玉米葉片與雄穗之間相互遮擋時常發(fā)生,會導(dǎo)致得到的雄穗目標部分斷裂。為了解決上述問題,在圖像去噪后通過形態(tài)學(xué)膨脹操作[5]使斷裂的區(qū)域重新連接,該過程如圖1所示。然后提取圖像中的連通域,生成矩形框框出玉米雄穗候選圖像。
圖1 形態(tài)學(xué)膨脹操作
由于復(fù)雜的田間環(huán)境,玉米雄穗和葉片生長的姿態(tài)多變,以及圖像采集時拍攝角度不一,易出現(xiàn)葉片遮擋雄穗、雄穗間相互重疊等現(xiàn)象,對目標物的精準識別造成干擾,出現(xiàn)誤檢。為了得到更精確的識別率,在閾值分割算法后加入“再確認”算法,即將分割后的圖像特征再輸入到LVQ神經(jīng)網(wǎng)絡(luò)中進行分類,保留玉米雄穗?yún)^(qū)域,剔除誤檢區(qū)域。
1)顏色特征提取
考慮到復(fù)雜背景下光照對圖像的影響,提取目標物的H,S,I分量特征作為顏色特征[6]。
2)形狀特征提取
玉米雄穗具有發(fā)散形狀,與玉米葉片形狀不同,且差異較為明顯,依據(jù)玉米雄穗圖像的特點,本文選取Hu不變矩[7,8]提取目標物形狀特征,Hu不變矩包含7 個特征向量。
1)輸入層神經(jīng)元數(shù)目
本文選取玉米雄穗的顏色特征:H,S,I3個分量特征和7個Hu不變矩特征,因此,輸入層神經(jīng)元數(shù)目為10個。
2)輸出層神經(jīng)元數(shù)目
LVQ神經(jīng)網(wǎng)絡(luò)的輸出層神經(jīng)元數(shù)目主要依據(jù)待識別物體的類別數(shù)來決定,本文將候選玉米雄穗圖像主要分為2種,即雄穗圖像和非雄穗圖像,因此,輸出層神經(jīng)元的數(shù)目為2個。
3)競爭層神經(jīng)元數(shù)目
在LVQ神經(jīng)網(wǎng)絡(luò)[9~11]中,競爭層神經(jīng)元的數(shù)目即為子類的數(shù)目,一般子類的數(shù)目都要大于類別數(shù),因此,競爭層的神經(jīng)元數(shù)目要大于輸出層的神經(jīng)元數(shù)目。本文設(shè)計的LVQ神經(jīng)網(wǎng)絡(luò)為每個類別分配了3個子類,因此,競爭層的神經(jīng)元數(shù)目為6個。
4)學(xué)習(xí)速率選取
學(xué)習(xí)速率η通常都是在0~1之間取值,其大小決定了競爭層神經(jīng)元權(quán)值的學(xué)習(xí)速度[12]。當η的值接近1時,可以使權(quán)值快速修正,以較快的速度到達一個類,但權(quán)值可能會發(fā)生振蕩,導(dǎo)致分類網(wǎng)絡(luò)穩(wěn)定性不夠;當η值接近0時,權(quán)值修正比較穩(wěn)定,但學(xué)習(xí)速度比較慢,訓(xùn)練時間比較長。因此η的值可以分段選擇,即學(xué)習(xí)前期進行粗調(diào)節(jié),可以選取較大值,隨著學(xué)習(xí)次數(shù)的增加,權(quán)值修正要更加精細,η的取值要較小。本文選取的學(xué)習(xí)速率為
(5)
式中η(0)為初始學(xué)習(xí)速率,取值為0.5;t為當前學(xué)習(xí)次數(shù);T為設(shè)定的總次數(shù)。學(xué)習(xí)速率會隨著學(xué)習(xí)次數(shù)的增加而變小,符合上述要求。
1)將玉米田間圖片從RGB顏色空間轉(zhuǎn)換到HSI顏色空間,得到圖片的H分量圖。
2)對H分量圖進行中值濾波、連通域面積去噪、形態(tài)學(xué)處理和連通域提取操作,使得能夠粗略地分割出玉米雄穗候選區(qū)域。
3)提取20組已知是玉米雄穗目標和非玉米雄穗目標的H,S,I顏色分量和Hu不變矩分量作為訓(xùn)練樣本輸入LVQ神經(jīng)網(wǎng)絡(luò)中訓(xùn)練。
4)對步驟(2)中得到的玉米雄穗候選區(qū)域進行H,S,I顏色分量和Hu不變矩特征提取,并輸入到已訓(xùn)練好的LVQ神經(jīng)網(wǎng)絡(luò)中分類,得到最終識別的玉米雄穗目標。
3.2.1 閾值分割
分割過程如圖2(a)~圖2(d)所示。
圖2 玉米雄穗閾值分割過程
3.2.2 LVQ神經(jīng)網(wǎng)絡(luò)再分類
觀察圖2(d)可發(fā)現(xiàn),有一些非玉米雄穗的雜物被分割出來,于是在閾值分割算法后加入“再確認”步驟,利用LVQ神經(jīng)網(wǎng)絡(luò)將玉米雄穗和非玉米雄穗進行分類,最終去除非玉米雄穗部分,識別到精確的玉米雄穗目標。為了評價分割效果,本文選取相同玉米田間圖像在HSI空間下將本文方法與K-means聚類算法[13]進行比較,仿真后的分割效果對比如圖3所示。
圖3 分割效果對比
利用本文試驗樣本結(jié)果計算出算法的檢出率和誤檢率分別為96.91 %和1.63 %(閾值分割算法分別為75.53 %和23.54 %),本文提出的算法噪聲較小、更直觀地降低了誤檢率,算法結(jié)果更精確。
本文在HSI顏色空間下首先采用中值濾波、連通域面積去噪、形態(tài)學(xué)處理和連通域提取的閾值分割算法將候選玉米雄穗目標分割,再通過利用真實的玉米雄穗和非雄穗的顏色特征、形狀特征訓(xùn)練好的LVQ神經(jīng)網(wǎng)絡(luò)進行“再確認”分類。本文算法能夠有效地降低誤檢率、提高分割準確率,分割準確率達到96.9 %。