張紅濤,劉迦南,譚 聯(lián),朱 洋
華北水利水電大學(xué)電力學(xué)院,鄭州市金水區(qū)北環(huán)路36 號(hào) 450011
煙青蟲(chóng)和棉鈴蟲(chóng)屬于同目同科同屬害蟲(chóng),且兩種昆蟲(chóng)雜交可育,生物習(xí)性、形態(tài)等特征極為相似,對(duì)其進(jìn)行檢測(cè)分類一直是生產(chǎn)實(shí)踐中研究的熱點(diǎn)問(wèn)題之一[1-2]。目前國(guó)內(nèi)外對(duì)昆蟲(chóng)的檢測(cè)分類主要采用人工識(shí)別法[3-7]、生物標(biāo)記法[8-10]、紅外光譜法[11-12]、圖像識(shí)別法等[13-16]。方紅等[6]首次對(duì)我國(guó)4 種麗金龜蛹進(jìn)行了形態(tài)描述,主要鑒別特征依據(jù)為上唇、發(fā)音器、尾部形狀等,從而編制了我國(guó)麗金龜蛹的分種檢索表;梁培生等[13]利用機(jī)器視覺(jué)技術(shù)對(duì)雌雄蠶蛹分別進(jìn)行了圖像獲取,并結(jié)合PCA 及BP 人工神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行了分析識(shí)別,準(zhǔn)確率達(dá)98%;周昊等[10]通過(guò)對(duì)棕尾別麻蠅蛹3 個(gè)發(fā)育時(shí)期基因轉(zhuǎn)錄組的差異分析,發(fā)現(xiàn)蛹在不同發(fā)育時(shí)期基因表達(dá)量存在顯著差異;郭婷婷等[7]利用體視顯微鏡實(shí)現(xiàn)對(duì)雙委夜蛾蛹和成蟲(chóng)雌雄性的快速鑒別,正確率達(dá)100%;代芬等[12]利用近紅外漫透射光譜對(duì)家蠶蠶蛹的雌雄性實(shí)現(xiàn)快速、無(wú)損鑒別,建立了PLSDA、BPNN 和SVM 3 種判別模型,并選出效果最優(yōu)的PLSDA 模型,準(zhǔn)確率達(dá)94.57%。但以上方法中,人工識(shí)別耗時(shí)耗力且容易出錯(cuò),生物標(biāo)記工作周期長(zhǎng),紅外設(shè)備造價(jià)昂貴且建模難度大,而圖像識(shí)別方法則方便、高效,且目前對(duì)煙草主要害蟲(chóng)雌雄蛹的分類判別研究鮮見(jiàn)報(bào)道。為此,采用機(jī)器視覺(jué)技術(shù)對(duì)煙草主要害蟲(chóng)煙青蟲(chóng)和棉鈴蟲(chóng)的雌雄蛹進(jìn)行自動(dòng)識(shí)別分類,旨在為害蟲(chóng)的有效監(jiān)測(cè)與防治提供支持。
供試蟲(chóng)源由河南農(nóng)業(yè)大學(xué)植物保護(hù)學(xué)院實(shí)驗(yàn)室提供,為化蛹2~5 d 的煙青蟲(chóng)和棉鈴蟲(chóng)。圖像采集設(shè)備為SLR 相機(jī)(型號(hào)Canon EOS 5D Mark IV 配百微鏡頭,日本Canon 公司),軟件運(yùn)行環(huán)境為Windows7,處理器為Intel Core i7 @3.60GHz,軟件應(yīng)用工具選擇matlab2014a。
使用SLR 相機(jī)對(duì)固定后的活體蟲(chóng)蛹樣本進(jìn)行拍照,由于兩種害蟲(chóng)雌雄蛹的明顯判別特征位于腹部末節(jié)處,故將相機(jī)聚焦于此位置。對(duì)采集到的原始圖像進(jìn)行腹部末節(jié)有效區(qū)域提取后可以獲得表征害蟲(chóng)蛹的局部特征圖像,共計(jì)2 類4 種圖像,見(jiàn)圖1。由采集到的圖像可以觀察到2 種害蟲(chóng)蛹的形狀大小幾乎無(wú)差異,但雌雄蛹在腹部末節(jié)處存在差異,雄蛹表現(xiàn)為末端凸起且呈暗黑色,雌蛹表現(xiàn)為凹陷狀且質(zhì)地均勻無(wú)明顯顏色變化,且上述特征在人眼狀態(tài)下不易觀察到。
圖1 兩類害蟲(chóng)雌雄蛹腹部末節(jié)的采集圖像Fig.1 Images of abdominal end segment of male and female pupae for two types of pests
對(duì)上述圖像進(jìn)行多種顏色空間變換,經(jīng)觀察比較發(fā)現(xiàn)RGB 顏色空間下的蟲(chóng)蛹圖像具有較高的對(duì)比度和清晰度,便于后續(xù)特征提取與分類判別。將采集到的原始圖像分別提取其R、G、B 三通道灰度圖像,試驗(yàn)發(fā)現(xiàn)R 通道下的蟲(chóng)蛹圖像特征表現(xiàn)最為顯著, 故最終選擇R 通道的蟲(chóng)蛹圖像作為特征提取的輸入圖像,見(jiàn)圖2。
對(duì)上述4 種蟲(chóng)蛹的R 通道灰度圖片分別提取其基于灰度共生矩陣的紋理特征構(gòu)建原始特征空間,包括對(duì)比度、角二階矩、相關(guān)性、同質(zhì)性4 個(gè)特征指標(biāo)(均選取0°、45°、60°、90°4 個(gè)方向的數(shù)據(jù)),共形成16 維原始特征數(shù)據(jù)[17]。
圖2 兩種害蟲(chóng)蛹的R 通道圖像Fig.2 R channel images of pupae for two types of pests
①對(duì)比度CON:反映了圖像的清晰度和紋理溝紋深淺的程度,對(duì)比度值越大,表明紋理溝紋越深,圖像整體視覺(jué)效果就越清晰;相反,對(duì)比度值小,則紋理溝紋淺,圖像也就越模糊[18]。計(jì)算公式:
式中:P(i, j)表示彩色圖像第j 個(gè)像素的第i 個(gè)顏色分量。
②相關(guān)性COR:描述了像素矩陣在行或列方向的線性關(guān)系程度,相關(guān)度大,則圖像像素在行或列方向的相似度高,矩陣元素均勻相等,紋理模糊;反之,紋理會(huì)越明顯[18]。計(jì)算公式:
③角二階矩ASM:又稱能量,描述了圖像灰度分布的均勻性和紋理的粗細(xì)程度,能量值越大,目標(biāo)的灰度分布越均勻,紋理越清晰;反之亦然[18]。計(jì)算公式:
④同質(zhì)性Homogeneity(Hom):也稱為逆差距,描述了目標(biāo)圖像局部所具有的信息量和紋理復(fù)雜程度,同質(zhì)度越大,則圖像局部包含的信息量越多,紋理越復(fù)雜;反之,若圖像沒(méi)有紋理,則逆差距值接近于零[18]。計(jì)算公式:
支持向量機(jī)(SVM)作為一種創(chuàng)新的監(jiān)督式機(jī)器學(xué)習(xí)方法,其原理是依據(jù)Vapnik 創(chuàng)立的統(tǒng)計(jì)學(xué)習(xí)理論中的風(fēng)險(xiǎn)經(jīng)驗(yàn)最小化準(zhǔn)則(SRM), 將樣本點(diǎn)誤差以及結(jié)構(gòu)風(fēng)險(xiǎn)水平降到最低,對(duì)樣本數(shù)量范圍沒(méi)有過(guò)多要求,較大地提高了模型的推廣度[19]。本試驗(yàn)中為線性不可分情況,通過(guò)非線性變換將樣本集的原始特征空間轉(zhuǎn)換成高維空間中的一個(gè)線性的問(wèn)題,從而在變換的空間中求出最優(yōu)分類并實(shí)現(xiàn)目標(biāo)判別,這一過(guò)程需要核函數(shù)的參與,因此選擇徑向基核函數(shù)。
設(shè)訓(xùn)練樣本集為(xi,yi),其中xi∈Rd(i=1, 2, …, n)。對(duì)于研究對(duì)象的分類問(wèn)題,如二分類,yi∈(-1,1)。該分類可歸結(jié)為二次規(guī)劃問(wèn)題。
式中:(ω, ω)、(ω, xi)為兩向量之間的內(nèi)積;ξi為訓(xùn)練樣本不可分時(shí)引入的一個(gè)松弛變量;c>0 表示一個(gè)整數(shù),是用來(lái)控制對(duì)錯(cuò)誤判斷樣本懲罰力度的懲罰因子,將錯(cuò)分樣本數(shù)量盡量降到最低;ω和b 為線性判決函數(shù)f(x)=(ω, x)+b 中的權(quán)向量和分類閾值。
對(duì)于害蟲(chóng)雌雄蟲(chóng)蛹的SVM 分類問(wèn)題,選用c-SVC 分類和徑向基核函數(shù)(RBF),K(x, xi)=exp(-g||xi-x||2),其中g(shù)>0。懲罰因子c(0,+∞)和RBF核函數(shù)參數(shù)g(方差)是影響SVM 分類器識(shí)別率的重要參數(shù),因此利用參數(shù)組合尋優(yōu)的方法對(duì)其進(jìn)行優(yōu)化選擇[20]。
在SVM 分類器的參數(shù)尋優(yōu)中,將交叉驗(yàn)證訓(xùn)練模型識(shí)別率作為最終判別標(biāo)準(zhǔn), cg(m, n)=svmtrain(train_pest_labels, train_pest_features,’-c cm
-g gm -k 5’)。其中,train_pest_labels 為兩類害蟲(chóng)雌雄蛹訓(xùn)練樣本的種類標(biāo)簽;train_pest_features 為兩類害蟲(chóng)雌雄蛹訓(xùn)練樣本的紋理特征數(shù)據(jù);cm 和gm 分別表示第m 次循環(huán)的c 和g;參數(shù)k 表示交叉驗(yàn)證的折數(shù)(選取k=5),根據(jù)交叉驗(yàn)證的識(shí)別率作為判斷best-c 和best-g 的標(biāo)準(zhǔn)[21-22]。
按照1.2 節(jié)方法對(duì)兩類害蟲(chóng)蛹的圖像進(jìn)行特征提取,共提取32 個(gè)蛹圖像的紋理特征,其中煙青蟲(chóng)雌雄蛹紋理特征見(jiàn)表1,棉鈴蟲(chóng)雌雄蛹紋理特征見(jiàn)表2。表中結(jié)果顯示,煙青蟲(chóng)蛹的紋理特征中雄蛹的對(duì)比度、相關(guān)性、角二階矩特征指標(biāo)均明顯大于雌蛹,而同質(zhì)性指標(biāo)雌蛹大于雄蛹;棉鈴蟲(chóng)雌雄蛹紋理特征指標(biāo)變化趨勢(shì)與煙青蟲(chóng)一致。表明兩類害蟲(chóng)的雄蛹紋理特征指標(biāo)優(yōu)于雌蛹,圖像上表現(xiàn)為其蟲(chóng)翅表面的輪廓、斑紋等更清晰、對(duì)比度較高。由于兩類害蟲(chóng)間雌雄蛹特征指標(biāo)差異不大且規(guī)律不明顯,因此未對(duì)煙青蟲(chóng)和棉鈴蟲(chóng)的混合雌雄蛹進(jìn)行識(shí)別,僅對(duì)單一害蟲(chóng)的雌雄蛹進(jìn)行有效識(shí)別。
對(duì)煙青蟲(chóng)和棉鈴蟲(chóng)蛹的采集圖片分別提取70張作為樣本集,其中每類別均將50 張用于訓(xùn)練,20 張用于測(cè)試,共計(jì)280 張,以此形成訓(xùn)練樣本特征空間200×16 維,測(cè)試樣本特征空間80×16 維,最終形成280×16 維原始特征數(shù)據(jù)作為支持向量機(jī)的輸入。由于兩類昆蟲(chóng)間蛹的圖像極為相似,試驗(yàn)中只對(duì)其種類內(nèi)蟲(chóng)蛹進(jìn)行分類識(shí)別。
表1 煙青蟲(chóng)蛹的紋理特征Tab.1 Texture features of Helicoverpa assulta pupae
表2 棉鈴蟲(chóng)蛹的紋理特征Tab.2 Texture features of Helicoverpa armigera pupae
首先使用支持向量機(jī)對(duì)害蟲(chóng)特征數(shù)據(jù)進(jìn)行分類,即對(duì)害蟲(chóng)種類內(nèi)雌雄性的識(shí)別,在分類器中4類害蟲(chóng)分別用“1,-1,2,-2”4 類標(biāo)簽來(lái)表示,其中“1”表示棉鈴蟲(chóng)雄蛹,“-1”表示棉鈴蟲(chóng)雌蛹,“2”表示煙青蟲(chóng)雄蛹,“-2”表示煙青蟲(chóng)雌蛹。
選擇煙青蟲(chóng)蛹的圖像測(cè)試樣本共40 張,其中雌雄各20 張,分類結(jié)果如圖3 所示。圖3 結(jié)果表明,雌蛹有5 個(gè)被錯(cuò)判,雄蛹全部識(shí)別正確,識(shí)別正確個(gè)數(shù)35 個(gè),總體識(shí)別率達(dá)到87.5%。
圖3 煙青蟲(chóng)雌雄蛹的分類Fig.3 Classification of male and female pupae of Helicoverpa assulta
選擇棉鈴蟲(chóng)蛹的圖像測(cè)試樣本共40 張,其中雌雄各20 張,分類結(jié)果如圖4 所示。圖4 結(jié)果表明,雌蛹有7 個(gè)被錯(cuò)判,雄蛹全部識(shí)別正確,識(shí)別正確蛹個(gè)數(shù)33 個(gè),總體識(shí)別率達(dá)到82.5%。
分類結(jié)果表明,存在識(shí)別精度較低的原因可能是由于兩種害蟲(chóng)蛹的特征差異微小且僅體現(xiàn)在腹部末端局部位置;同時(shí)由于飼養(yǎng)環(huán)境、食物等因素的影響,生長(zhǎng)過(guò)程中蟲(chóng)蛹的局部特征表現(xiàn)均存在差異;另外煙青蟲(chóng)對(duì)飼養(yǎng)條件要求較高,其存活率低導(dǎo)致樣本采集量較少。因此,在昆蟲(chóng)飼養(yǎng)實(shí)驗(yàn)及圖像處理等方面還有待于進(jìn)一步研究。
圖4 棉鈴蟲(chóng)雌雄蛹的分類Fig.4 Classification of male and female pupae of Helicoverpa armigera
利用SLR 相機(jī)對(duì)煙青蟲(chóng)和棉鈴蟲(chóng)的雌雄蛹進(jìn)行圖像采集并進(jìn)行有效區(qū)域提取,同時(shí)提取其RGB 顏色空間的R 通道灰度圖像作為紋理特征提取的特征圖像。提取基于灰度共生矩陣的對(duì)比度、角二階矩等16 維特征指標(biāo)作為原始特征數(shù)據(jù)。將280×16 維的原始特征空間送入SVM 分類器進(jìn)行自動(dòng)識(shí)別分類,煙青蟲(chóng)雌雄蛹的識(shí)別率達(dá)到87.5%,棉鈴蟲(chóng)雌雄蛹識(shí)別率達(dá)到82.5%,表明該方法具有可行性。