戴 寧
(倫敦大學(xué)國(guó)王學(xué)院,倫敦 WC2R 2LS)
據(jù)相關(guān)資料顯示,全世界每年通過(guò)使用農(nóng)藥可以挽回農(nóng)產(chǎn)品20%-25%的產(chǎn)量損失。[1]但大量的農(nóng)藥噴灑容易造成嚴(yán)重的生態(tài)環(huán)境污染,農(nóng)產(chǎn)品的產(chǎn)量也受到很大影響,因此精準(zhǔn)施藥勢(shì)在必行。精準(zhǔn)施藥即利用圖像識(shí)別技術(shù)對(duì)農(nóng)作物病蟲(chóng)草害的圖像進(jìn)行處理,通過(guò)提取特征參數(shù),有針對(duì)性地對(duì)病蟲(chóng)的種類和位置合理噴藥。[2]
基于圖像的病蟲(chóng)識(shí)別技術(shù)結(jié)合了模式識(shí)別技術(shù)和圖像處理技術(shù),雖然研究時(shí)間并不長(zhǎng),但卻得到快速的發(fā)展。[3]國(guó)外方面,Keagy最早利用圖像對(duì)甲蟲(chóng)進(jìn)行病蟲(chóng)識(shí)別研究。C.Karunakaran 通過(guò)提取面粉甲蟲(chóng)的特征對(duì)其進(jìn)行識(shí)別分析。美國(guó)科學(xué)家利用人臉識(shí)別的原理對(duì)幾個(gè)屬于姬蜂科種類的昆蟲(chóng)進(jìn)行識(shí)別,以及通過(guò)人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)對(duì)某幾種病蟲(chóng)進(jìn)行識(shí)別,都獲得了不錯(cuò)的效果。[4]國(guó)內(nèi)方面,徐昉等[5]通過(guò)提取玉米象的周長(zhǎng)、面積、復(fù)雜度三個(gè)特征,對(duì)這兩種昆蟲(chóng)進(jìn)行分類識(shí)別。趙汗青等[6]通過(guò)分析昆蟲(chóng)的形態(tài)特征,將面積、形狀參數(shù)、偏心率等幾個(gè)特征按照其重要性進(jìn)行排序,作為分類的依據(jù)。張洪濤等[7]對(duì)病蟲(chóng)原始圖像進(jìn)行預(yù)處理,得到閾值分割的圖像后再提取出球形性等幾個(gè)特征進(jìn)行分類。
基于以上學(xué)者研究,本文以玉米作物蟲(chóng)害玉米象為研究對(duì)象,利用基于K-means硬聚類算法的圖像分割技術(shù),通過(guò)提取玉米象的周長(zhǎng)、面積、復(fù)雜度三個(gè)特征,對(duì)玉米象進(jìn)行識(shí)別,對(duì)蟲(chóng)害圖像預(yù)處理,提取蟲(chóng)害的形狀特征,使用模糊識(shí)別來(lái)區(qū)分蟲(chóng)害,為智能化噴霧與精準(zhǔn)施藥的研究奠定基礎(chǔ)。
正常條件下,在北京市郊區(qū)玉米田進(jìn)行了圖像采集,相機(jī)固定在距離地面1.5m處的三腳架上,要求相機(jī)鏡頭距離葉面1m,平行拍攝玉米葉面圖像,將得到的圖像以24位 BMP格式寫(xiě)入計(jì)算機(jī)中,以獲得實(shí)驗(yàn)的原始圖像。首先我們將獲得的原始圖像進(jìn)行了灰度化處理,通過(guò)采用三原色R、G、B來(lái)對(duì)圖像的灰度值進(jìn)行描述,其中R為像素的紅色分量值,B為像素的藍(lán)色分量值,G為像素的綠色分量值。由于均值G在背景中所占比重較大,便于進(jìn)行玉米象與背景的分割。在實(shí)驗(yàn)中,通過(guò)比較G、G-R、G-B、2G-R-B和 2G-R-B的 轉(zhuǎn) 換 效 果 圖,我們發(fā)現(xiàn)采用超G絕對(duì)值法時(shí),可以得到效果最好的以綠色背景為主的進(jìn)行灰度化處理的圖像。
由于采集的圖像僅包括玉米象與玉米,可采用灰度直方圖的方法。害蟲(chóng)的顏色相對(duì)于農(nóng)作物顏色較深,即害蟲(chóng)的灰度比作物深,因此其直方圖是雙峰。為了將目標(biāo)與背景更好地區(qū)分開(kāi)來(lái),我們選取兩個(gè)峰之間的灰度值T作為閾值,這個(gè)閾值采用灰度直方圖統(tǒng)計(jì)的方法計(jì)算出來(lái)。由于玉米象目標(biāo)較小,采用簡(jiǎn)單統(tǒng)計(jì)法求閾值。
圖像進(jìn)行分割以后, 得到簡(jiǎn)單統(tǒng)計(jì)
進(jìn)行分割以后, 得到簡(jiǎn)單統(tǒng)計(jì)法的閾值t 的計(jì)算公式如式(1)所示。
得到二值化圖像之后,通過(guò)采用5×5的單位矩陣,對(duì)二值圖像進(jìn)行開(kāi)、閉運(yùn)算的方式,把圖像中的雜點(diǎn)去除,修復(fù)圖像中的斷點(diǎn),實(shí)現(xiàn)對(duì)目標(biāo)的識(shí)別。
我們所得到的圖像是由農(nóng)作物和空塊區(qū)域組成的,因此為了進(jìn)行有效特征的提取,我們需要將空塊區(qū)域從所得圖像中提取出來(lái)。
傳統(tǒng)的邊緣檢測(cè)算法有Roberts、Sobel、Prewitt和Laplacian算子等。其中,Roberts邊緣檢測(cè)算子是使用局部差分算法來(lái)實(shí)現(xiàn)的,它通過(guò)對(duì)模板的利用來(lái)計(jì)算Roberts梯度幅度G,進(jìn)而獲得合適的閾值T,當(dāng)G〉T時(shí),該點(diǎn)即為階躍邊緣點(diǎn),從而可獲取邊緣圖像。Sobel算子和Prewitt算子具有類似的特點(diǎn),都是通過(guò)考察各個(gè)像素的鄰域加權(quán)差,加權(quán)差值最大的點(diǎn)就是邊緣點(diǎn)。對(duì)于Laplacian邊緣檢測(cè)算子則是通過(guò)在邊緣處產(chǎn)生陡峭的零交叉來(lái)達(dá)到邊緣檢測(cè)的目的。
但是,傳統(tǒng)的邊緣檢測(cè)算子提取的邊緣很粗,無(wú)法得到精確的邊緣像素。因此,我們通過(guò)分層K-means硬聚類算法來(lái)實(shí)現(xiàn)對(duì)所得圖像的分割。經(jīng)典的K-means 算法基本思想是,以空間中k個(gè)點(diǎn)為中心進(jìn)行聚類,對(duì)最靠近他們的對(duì)象歸類,并通過(guò)迭代的方法,逐次更新各聚類中心的值,直至得到最好的聚類結(jié)果。其實(shí)現(xiàn)步驟為:
(1)確定像素大小為n 的樣本空間數(shù)據(jù)集,使迭代次數(shù)為R,依據(jù)指定的聚類數(shù)k, 隨機(jī)選取k個(gè)像素作為初始聚類中心Cj(r),其中:j=1,2,3,…,k;r=1,2,3,…,R;
(2)計(jì)算樣本空間中每個(gè)數(shù)據(jù)對(duì)象與初始聚類中心的相似度距離 D(Xi, Cj(r));其中,i=1,2,3,…,n,形成簇Wj,如果滿足式(2)。
式(2)中,Xi∈Wj,Xi 記為w,ε為任意給定的正數(shù);
(3)計(jì)算k個(gè)新的聚類中心,其表達(dá)式如式(3)所示:
依據(jù)式(4)可計(jì)算聚類準(zhǔn)則函數(shù)值,其表達(dá)式如下所示:
依據(jù)式(5)判斷聚類是否合理,其表達(dá)式如下所示:
若合理則迭代終止;若不合理則返回(2)(3)步繼續(xù)迭代。
我們從得到的圖像中選取一幅圖進(jìn)行分割。從分割結(jié)果來(lái)看,K-means聚類算法可以較為準(zhǔn)確的將空塊區(qū)域從圖像當(dāng)中分離出來(lái),且效果比較理想,分割的精度也較高,因而得到的分割圖像可以更加方便的用于后續(xù)圖像的特征提取。
在圖像分析的過(guò)程中,由于區(qū)域描述子特征具有很強(qiáng)的實(shí)用效果,于是作為糧蟲(chóng)識(shí)別模型的輸入特征,我們采用糧蟲(chóng)圖像的八種區(qū)域描述子特征,分別如下所示:
(1)面積A:圖像中需識(shí)別對(duì)象面積的像素點(diǎn)個(gè)數(shù)總和,其表達(dá)式如(6)所示:
(2)周長(zhǎng)P:除識(shí)別對(duì)象的周長(zhǎng)如式(7)所示:
公式中SUM(in)是4鄰域內(nèi)像素均為需識(shí)別對(duì)象的像素個(gè)數(shù)總和。
(3)相對(duì)面積RA:待識(shí)別對(duì)象面積占圖像總體比例,其表達(dá)式如(8)所示:
(4)延伸率S:待識(shí)別害蟲(chóng)玉米象圖像的最小外接矩形的寬度與長(zhǎng)度值之比,其表達(dá)式如(9)所示:
(5)復(fù)雜度C:待識(shí)別對(duì)象緊湊性,其表達(dá)式如(10)所示:
(6)占空比B:反應(yīng)待識(shí)別對(duì)象的復(fù)雜程度,其表達(dá)式如(11)所示:
(7)等效面積圓半徑R,如式(12)所示:
(8)偏心率E:待識(shí)別對(duì)象的長(zhǎng)軸與短軸長(zhǎng)度之比,表明了待識(shí)別對(duì)象的緊湊性,利用Tenebaum近似計(jì)算公式求解偏心率E:
平均向量求解:
j+k階中心矩求解:
方向角求解:
偏心率E近似求解:
我們選取了常見(jiàn)的糧蟲(chóng)—玉米象作為研究對(duì)象,并通過(guò) K-means的方法對(duì)其進(jìn)行了邊緣檢測(cè),同時(shí)提取其圖像的面積 A、周長(zhǎng)P、相對(duì)面積RA、延伸率 S、復(fù)雜度 C、占空比B、等效面積圓半徑 R和偏心率 E這八個(gè)特征用于對(duì)玉米害蟲(chóng)的識(shí)別, 具體特征值如下表。
表1 面積周長(zhǎng)等特征對(duì)玉米蟲(chóng)害的識(shí)別
我們選取了十幅圖像,并分別用含有2個(gè)、3個(gè)、4個(gè)、5個(gè)聚類中心時(shí)可K-means算法識(shí)別這十幅圖像,得到的識(shí)別率和誤判率如下表。
表2 識(shí)別率和誤判率表
由上述表格可以看出,含2個(gè)聚類中心的K-means聚類法對(duì)有的圖像的目標(biāo)識(shí)別率較低,對(duì)有的圖像誤判率較高,對(duì)10幅圖像中糧蟲(chóng)的平均識(shí)別率為40.0%;平均誤判率為485%,識(shí)別率一般且誤判率較高。含3個(gè)聚類中心的K-means聚類法能夠正確識(shí)別大部分圖中的目標(biāo),但分類數(shù)量較少導(dǎo)致算法難以徹底消除背景雜點(diǎn)的影響,對(duì)少數(shù)幾幅圖像誤判率仍較高。含4個(gè)聚類中心的K-means聚類法對(duì)其中五幅圖片的識(shí)別率可達(dá)到100%,對(duì)所有圖像誤判率均為0%。含5個(gè)聚類中心的K-means聚類法對(duì)其中七幅圖片的識(shí)別率均可達(dá)到100%,并且誤判率為0%。由上述數(shù)據(jù)我們可以看出,K-means聚類算法對(duì)于圖像的識(shí)別能力較高,且所包含的聚類中心越多,識(shí)別率越高,且誤判率也越低。
本文將計(jì)算機(jī)圖像識(shí)別處理技術(shù)應(yīng)用于農(nóng)業(yè)生產(chǎn)研究,試驗(yàn)一種基于圖像識(shí)別處理的玉米害蟲(chóng)檢測(cè)方法,選取常見(jiàn)的玉米象作為研究對(duì)象,對(duì)其進(jìn)行圖像識(shí)別。
(1)采用基于 K-means硬聚類算法的圖像分割技術(shù),成功地對(duì)所獲得圖像進(jìn)行空塊區(qū)域分割,獲得了空塊區(qū)域的二值分割圖像和彩色分割圖像,比較準(zhǔn)確的將空塊區(qū)域從圖像中分割了出來(lái),分割精度較高,效果達(dá)到了預(yù)期目的。
(2)提取了所得圖像的周長(zhǎng)、面積、相對(duì)面積、復(fù)雜度、延伸率、占空比、偏心率和等效面積圓半徑這八個(gè)特征用于對(duì)玉米害蟲(chóng)的識(shí)別。
(3)通過(guò)使用K-means的算法并改變聚類中心的個(gè)數(shù),我們發(fā)現(xiàn)聚類中心較多時(shí)識(shí)別率高且誤判率低,在含有5個(gè)聚類中心時(shí),識(shí)別率可達(dá)到95.7%,且誤判率為0%。
(4)將來(lái)我們擬在此方法的基礎(chǔ)上,進(jìn)一步開(kāi)發(fā)利用該圖像識(shí)別技術(shù)系統(tǒng),使這種技術(shù)不僅能夠檢測(cè)到糧蟲(chóng),還能檢測(cè)出糧蟲(chóng)的密度信息和種類歸屬;隨著進(jìn)一步的深入研究, 我們還可以利用該系統(tǒng)拓展檢測(cè)范圍和對(duì)象,比如該系統(tǒng)將具有測(cè)量溫度、測(cè)量濕度、測(cè)量水分等綜合功能,把該系統(tǒng)建設(shè)成為一個(gè)具有智能綜合控制的專家系統(tǒng)。