• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于多尺度殘差空間注意力輕量化U-Net的農(nóng)業(yè)害蟲檢測(cè)方法

      2023-03-17 04:04:40師曉麗張善文
      江蘇農(nóng)業(yè)科學(xué) 2023年3期
      關(guān)鍵詞:殘差害蟲尺度

      李 萍,劉 裕,師曉麗,張善文

      (1.鄭州西亞斯學(xué)院,河南鄭州 451150;2.西京學(xué)院信息工程學(xué)院,陜西西安 710123)

      作物蟲害嚴(yán)重降低了作物的產(chǎn)量和質(zhì)量,是造成世界各地作物損失的主要原因[1]。盡管各種殺蟲劑等化學(xué)農(nóng)藥能夠快速有效地防治蟲害,但對(duì)生態(tài)環(huán)境和人類健康造成了極大危害[2]。蟲害精準(zhǔn)檢測(cè)是蟲害防治的前提,有助于減少農(nóng)藥使用量,進(jìn)而減少環(huán)境污染。傳統(tǒng)的害蟲檢測(cè)依賴專家或技術(shù)人員肉眼觀察,該方式的主觀性強(qiáng)、勞動(dòng)強(qiáng)度大、成本高,很難應(yīng)用于大規(guī)模大田害蟲檢測(cè),不能滿足數(shù)字化作物害蟲管理的需要[3]。

      1 研究現(xiàn)狀

      隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,出現(xiàn)了大量基于計(jì)算機(jī)視覺技術(shù)的田間作物病蟲害檢測(cè)方法。汪京京等從圖像分割、特征提取和分類識(shí)別3個(gè)方面,分別闡述了計(jì)算機(jī)視覺技術(shù)應(yīng)用于農(nóng)作物病蟲害識(shí)別的研究現(xiàn)狀[4]??碉w龍等對(duì)國(guó)內(nèi)外基于計(jì)算機(jī)視覺技術(shù)的作物病蟲害檢測(cè)方法進(jìn)行了大量研究,并提出一種基于生成對(duì)抗網(wǎng)絡(luò)(GAN)的害蟲檢測(cè)方法,并嘗試將基于深度學(xué)習(xí)的害蟲檢測(cè)方法應(yīng)用于移動(dòng)端APP上,為快速準(zhǔn)確的作物病蟲害識(shí)別提供了技術(shù)支持[5]。針對(duì)不同害蟲具有不同的顏色、形狀、紋理的特點(diǎn),胡永強(qiáng)等提出了一種將多特征與稀疏表示相融合的害蟲識(shí)別方法[6]。該方法首先提取害蟲紋理、形狀與顏色特征,然后構(gòu)建訓(xùn)練樣本矩陣,最后通過求矩陣最優(yōu)稀疏系數(shù)以實(shí)現(xiàn)害蟲圖像識(shí)別。謝成軍等提出了一種稀疏編碼與空間金字塔模型相融合的害蟲檢測(cè)方法[7]。該方法首先基于圖像構(gòu)建非完備字典,然后利用構(gòu)建的字典進(jìn)行稀疏表示以達(dá)到檢測(cè)的目的。由于作物害蟲圖像的復(fù)雜多樣性和多變性,使得利用以上傳統(tǒng)方法很難提取魯棒性的檢測(cè)特征,限制了這些方法的泛化能力。

      近年來,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,它在農(nóng)業(yè)信息處理領(lǐng)域得到了廣泛應(yīng)用,包括作物害蟲檢測(cè)。傅隆生等歸納、梳理和分析深度學(xué)習(xí)在農(nóng)業(yè)信息處理領(lǐng)域的應(yīng)用現(xiàn)狀,并討論深度學(xué)習(xí)在農(nóng)業(yè)信息處理領(lǐng)域的優(yōu)缺點(diǎn),同時(shí)對(duì)后續(xù)研究進(jìn)行了展望[8]。Thenmozhi 等提出了一種高效的深度CNN模型,在3個(gè)公開的昆蟲數(shù)據(jù)集上對(duì)昆蟲物種進(jìn)行了分類驗(yàn)證,并與深度學(xué)習(xí)模型AlexNet、ResNet、GoogleNet和VGGNet進(jìn)行了比較[9]。結(jié)果表明,所提出的CNN模型比預(yù)訓(xùn)練模型更能有效地對(duì)大田作物中各類昆蟲進(jìn)行分類,可用于農(nóng)業(yè)領(lǐng)域的作物保護(hù)。為了緩解害蟲姿勢(shì)與尺度的變化對(duì)模型性能的影響,張博等提出了一種將空間金字塔池化與CNN相結(jié)合的作物害蟲識(shí)別方法,可實(shí)現(xiàn)較小作物害蟲的高效檢測(cè)[10]。Liu等提出了一種基于改進(jìn)的CNN的害蟲檢測(cè)方法。該方法由模塊通道-空間注意、區(qū)域建議網(wǎng)絡(luò)和位置敏感評(píng)分圖組成,取得了較好的檢測(cè)性能[11]。Wang等建立了1個(gè)大規(guī)模標(biāo)準(zhǔn)化農(nóng)業(yè)害蟲數(shù)據(jù)集Pest24,該數(shù)據(jù)集包含378幅野外害蟲標(biāo)注圖像,并采用多種深度學(xué)習(xí)模型對(duì)提出的害蟲數(shù)據(jù)集進(jìn)行試驗(yàn)[12]。Rahman等提出了一種VGG16和InceptionV3相融合的水稻病蟲害檢測(cè)方法,并與CNN的改進(jìn)模型MobileNet、NasNet mobile和SqueezeNet進(jìn)行了比較[13]。結(jié)果表明,該模型在顯著減小模型尺寸情況下能達(dá)到預(yù)期的93.3%的精度。錢蓉等構(gòu)建了一種基于VGG-16的水稻害蟲檢測(cè)方法[14]。該模型針對(duì)水稻害蟲的特點(diǎn),調(diào)整VGG-16網(wǎng)絡(luò)的局部結(jié)構(gòu),并對(duì)模型參數(shù)進(jìn)行優(yōu)化,能對(duì)水稻害蟲進(jìn)行智能識(shí)別。針對(duì)較多方法大多數(shù)存在對(duì)像素之間的關(guān)系提取不充分、模型參數(shù)量大、推理速度慢的缺點(diǎn),樂毅等提出了一種分段模型與多層注意力機(jī)制相結(jié)合特征關(guān)系提取方法[15]。該方法通過引入注意力機(jī)制以有效降低噪聲,從而提高模型性能。Ayan等利用遷移學(xué)習(xí)對(duì)公開D0數(shù)據(jù)集上的7個(gè)不同的預(yù)訓(xùn)練CNN模型進(jìn)行了重新訓(xùn)練,然后通過對(duì)分類性能較好的模型進(jìn)行最大概率求和策略進(jìn)行集成,最后利用遺傳算法得到最終權(quán)重,在D0數(shù)據(jù)集上的分類準(zhǔn)確率達(dá)到了98.81%[2]。

      CNN及其改進(jìn)模型在圖像處理方面取得了顯著效果。試驗(yàn)表明,CNN模型的層次越深得到特征的表達(dá)能力越強(qiáng),但更深的CNN模型同時(shí)具有較多參數(shù),在模型訓(xùn)練中易導(dǎo)致過擬合和梯度爆炸等問題,而簡(jiǎn)單、較淺層的CNN模型不能完全學(xué)習(xí)到有效的特征。由于深層CNN的結(jié)構(gòu)更加復(fù)雜,梯度下降算法得到的最優(yōu)解可能是局部最優(yōu)解,所以不能單純地通過加深網(wǎng)絡(luò)提高網(wǎng)絡(luò)的性能[16]。為了克服這些問題,He等提出了一種殘差網(wǎng)絡(luò)(ResNet)架構(gòu)。ResNet解決了增加深度帶來的退化等問題,更容易優(yōu)化,能夠通過增加網(wǎng)絡(luò)深度來提高網(wǎng)絡(luò)性能[17]。

      近年來,注意力機(jī)制在基于深度神經(jīng)網(wǎng)絡(luò)的多項(xiàng)視覺任務(wù)中取得了廣泛應(yīng)用[18-19]。在CNN中引入注意力機(jī)制,能夠得到更重要的特征,抑制不重要的特征[20-21]。Zhang等提出了一種注意引導(dǎo)網(wǎng)絡(luò)。該網(wǎng)絡(luò)注意引導(dǎo)濾波器,以更好地保留圖像的結(jié)構(gòu)信息[22]。一般而言,CNN中大卷積核適用于大尺度目標(biāo)檢測(cè),小卷積核適用于小尺度目標(biāo)檢測(cè),所以多尺度CNN(MSCNN)模型為多尺度目標(biāo)檢測(cè)提供了最佳解決方案[20,23]。張善文等提出了一種基于多尺度注意力卷積網(wǎng)絡(luò)(MSCNA)的作物害蟲檢測(cè)方法[24]。該方法將多尺度結(jié)構(gòu)和注意力機(jī)制引入到卷積神經(jīng)網(wǎng)絡(luò)(CNN),用于提取多尺度害蟲檢測(cè)特征,增強(qiáng)對(duì)形態(tài)較小型害蟲的檢測(cè)能力,并在訓(xùn)練過程中引入二階項(xiàng)殘差模塊,減少了網(wǎng)絡(luò)損失和加速網(wǎng)絡(luò)訓(xùn)練。

      U-Net模型簡(jiǎn)單,易于訓(xùn)練,更適合小數(shù)據(jù)集,目前廣泛應(yīng)用于醫(yī)療圖像分割等領(lǐng)域[25]。Xu等在U-Net中引入了注意機(jī)制,有效地提高了網(wǎng)絡(luò)的預(yù)測(cè)性能[26]。注意模塊以上采樣的上一級(jí)特征圖和下采樣過程的特征圖作為輸入。Zhao等通過融合U-Net與空間注意力機(jī)制,提出了一種輕量級(jí)模型,并應(yīng)用于gland分割[27]。Ali等提出了一種快速、全自動(dòng)的深度學(xué)習(xí)框架用于左心室分割[28]。該模型結(jié)合ResNet和U-Net的優(yōu)點(diǎn),提供了可靠的分割結(jié)果。盡管這些U-Net變體性能良好,但它們不可避免地會(huì)使網(wǎng)絡(luò)變得更加復(fù)雜和難以解釋。

      由于大田中的害蟲多種多樣,害蟲的大小、形狀、姿態(tài)、位置和顏色差異較大,而且存在復(fù)雜的環(huán)境和背景,害蟲與背景的對(duì)比度降低,一般拍攝的圖像中的害蟲尺寸比較小,所以害蟲檢測(cè)方法研究一直是一個(gè)重要、且具有挑戰(zhàn)性的研究課題。U-Net 是一種典型的、結(jié)構(gòu)簡(jiǎn)單、易于訓(xùn)練的分割。本研究在殘差網(wǎng)絡(luò)、注意力機(jī)制和U-Net的基礎(chǔ)上,提出一種多尺度殘差空間注意力輕量化U-Net模型(MSRSALU-Net),并應(yīng)用于作物害蟲檢測(cè)。與經(jīng)典的U-Net相比,該網(wǎng)絡(luò)刪除了U-Net的一些塊,在性能和精度提高的同時(shí)極大減少網(wǎng)絡(luò)參數(shù),由此加快網(wǎng)絡(luò)訓(xùn)練。由于MSRSALU-Net 中的卷積塊包含Inception結(jié)構(gòu),Inception中有3個(gè)卷積核(1×1、3×3、5×5)對(duì)特征圖進(jìn)行多卷積核特征提取,可以提取圖像的多尺度信息;另外Inception中的3個(gè)卷積核構(gòu)成的局部稀疏矩陣能夠大幅增強(qiáng)模型的運(yùn)算能力,所以加速了模型的收斂。在構(gòu)建的5種常見作物的10種害蟲數(shù)據(jù)集上進(jìn)行試驗(yàn)驗(yàn)證。試驗(yàn)結(jié)果表明,該方法有效可行。

      2 材料與方法

      2.1 害蟲圖像及其擴(kuò)展圖像

      IP102 是一個(gè)大型作物害蟲識(shí)別數(shù)據(jù)集[29],包含102種害蟲的超過7.5萬(wàn)幅圖像,其中水稻 14種、玉米13種、小麥9種、甜菜8種、苜蓿13種、葡萄16種、柑橘19種、芒果10種,其中有常見農(nóng)作物害蟲的30多萬(wàn)幅害蟲圖像。在IP102具有等級(jí)分類,將主要影響某一特定農(nóng)產(chǎn)品的害蟲被歸為同一上層分類,如圖1-A所示(圖像來源于參考文獻(xiàn)[29-30]),其中FC和EC分別為大田作物和經(jīng)濟(jì)作物。在子類級(jí)別上,只顯示了35個(gè)類,每個(gè)子類的完整列表可以在發(fā)布的IP102數(shù)據(jù)集中找到。每種害蟲都是某個(gè)超類的一個(gè)下級(jí)類,比如稻稈蛆害蟲屬于水稻作物害蟲類,所以在IP102的分類系統(tǒng)中,稻稈蛆亞類具有水稻和大田作物的超類。數(shù)據(jù)集的構(gòu)建過程為利用常見的圖像搜索引擎在害蟲的整個(gè)生命周期內(nèi)收集每一幅圖像,通過查詢進(jìn)行弱標(biāo)記,然后由志愿者進(jìn)行檢查,以確定與害蟲的相關(guān)性,然后農(nóng)業(yè)專家進(jìn)一步檢查和標(biāo)注蟲害圖像的類別標(biāo)簽或邊界框。在該數(shù)據(jù)集中,屬于同一類別的害蟲圖像可能捕捉到同一類型害蟲的不同生長(zhǎng)形態(tài)。一些圖像示例如圖1-B所示。

      IP102數(shù)據(jù)集的一個(gè)特性是圖像種類分布不均勻,例如水稻的亞洲大米蟲和薊馬害蟲的圖像數(shù)分別為1 053、173幅。為了避免模型過擬合,增強(qiáng)泛化和最終識(shí)別結(jié)果,對(duì)害蟲種類中少于600幅的害蟲圖像集進(jìn)行圖像旋轉(zhuǎn)、縮放、裁剪和雙線性插值等數(shù)據(jù)增強(qiáng)操作,增加圖像數(shù)。圖1-C為該圖中第一幅圖像的20幅擴(kuò)展圖像。為了減少網(wǎng)絡(luò)的訓(xùn)練計(jì)算量,首先刪除了1/3的重復(fù)或損壞的圖像;然后將每幅圖像的大小統(tǒng)一調(diào)整為512×512×3像素,保存為JPEG格式;最后,為每幅圖像生成包含邊界框和每種害蟲類別的注釋文件。考慮到本研究圖像用于害蟲檢測(cè)任務(wù),所以僅利用IP102數(shù)據(jù)集中的14種水稻害蟲圖像8 415幅和9種小麥害蟲圖像1 532幅圖像進(jìn)行試驗(yàn),對(duì)于圖像數(shù)小于500幅的害蟲圖像數(shù),利用擴(kuò)展算法擴(kuò)展為500幅,共得到12 040幅圖像組成一個(gè)數(shù)據(jù)集記為IP23,表示23種害蟲圖像集。

      2.2 方法

      2.2.1 U-Net模型 U-Net是一個(gè)對(duì)稱的U形網(wǎng)絡(luò),其架構(gòu)如圖2所示,左側(cè)為收縮網(wǎng)絡(luò)即編碼網(wǎng)絡(luò),用于從圖像中提取空間特征;右側(cè)為擴(kuò)展網(wǎng)絡(luò)即解碼網(wǎng)絡(luò),用于構(gòu)造分段映射編碼的特性;中間為跳過連接,用于連接底層和高層特征圖譜通過編碼和解碼的過程。U-Net中的卷積層采用標(biāo)準(zhǔn)卷積計(jì)算,可分為2部分:首先對(duì)輸入特征圖進(jìn)行卷積濾波,然后將卷積濾波后的結(jié)果組合成輸出特征圖。

      收縮網(wǎng)絡(luò)由5個(gè)卷積模塊組成,每個(gè)模塊2個(gè)卷積、1個(gè)ReLU激活和1個(gè)最大池化操作組成,最大池化層對(duì)輸入進(jìn)行2倍采樣。在擴(kuò)展網(wǎng)絡(luò)中,每個(gè)塊從1個(gè)轉(zhuǎn)換卷積層開始,每個(gè)特征圖的高度和寬度加倍,但特征圖的數(shù)量減少2倍。在每個(gè)轉(zhuǎn)換卷積層之后,應(yīng)用2個(gè)卷積層來減少特征圖的數(shù)量。最后1層是卷積層,卷積核大小為1×1、個(gè)數(shù)為2,適用于圖像的像素級(jí)2類分割情況[31]。

      2.2.2 多尺度殘差空間注意力輕量化U-Net模型 U-Net是一種被廣泛應(yīng)用于圖像分割與檢測(cè)的深度學(xué)習(xí)架構(gòu),在訓(xùn)練樣本數(shù)量有限的情況下,基于U-Net的圖像分割方法表現(xiàn)出了良好的性能。但該方法不適用于作物害蟲檢測(cè),因?yàn)閁-Net不能有效檢測(cè)變化多樣的、大小不一的多尺度害蟲,而且U-Net需要訓(xùn)練的參數(shù)較多,因此訓(xùn)練速度比其他分割網(wǎng)絡(luò)模型較慢。經(jīng)典U-Net的網(wǎng)絡(luò)參數(shù)有3 100多萬(wàn)個(gè),對(duì)于基于梯度下降法的網(wǎng)絡(luò)訓(xùn)練來說,對(duì)如此多的參數(shù)進(jìn)行訓(xùn)練微調(diào)比較耗時(shí)。本節(jié)將結(jié)合Inception多尺度特征提取、殘差網(wǎng)絡(luò)、注意力機(jī)制和U-Net的優(yōu)點(diǎn),考慮到輕量化的需求,在U-Net的架構(gòu)上構(gòu)建一種多尺度殘差空間注意力輕量化U-Net模型(MSRSALU-Net),用于作物害蟲檢測(cè)。其架構(gòu)如圖3-A所示:每個(gè)黑色的右箭頭表示與大小為3×3的卷積核的卷積,每個(gè)藍(lán)色框旁邊和上面的數(shù)字分別表示特征圖的大小(高、寬)和數(shù)量,向下紅色箭頭是最大池化層,大小為2×2、步長(zhǎng)為2×2,特征圖的大小減半。MSRSALU-Net的網(wǎng)絡(luò)參數(shù)有約2 300萬(wàn)個(gè),與 U-Net 相比減少了25.81%。

      在經(jīng)典的U-Net及其一些改進(jìn)的模型中,只是簡(jiǎn)單地對(duì)圖像的卷積層進(jìn)行疊加,在底層采用較小的卷積核而在高層采用較大的卷積核,增加網(wǎng)絡(luò)深度,由此不僅増大了計(jì)算量,而且容易導(dǎo)致梯度消失的問題。在MSRSALU-Net中,在卷積模塊中使用多尺度卷積Inception結(jié)構(gòu)(圖3-B),對(duì)于不同的支路采用不同尺度的卷積核,各支路中不同的感受野提取具有多尺度的圖像特征,由此增加網(wǎng)絡(luò)的寬度和網(wǎng)絡(luò)對(duì)多尺度目標(biāo)的適應(yīng)性。為了加速網(wǎng)絡(luò)收斂,在卷積模塊中利用殘差網(wǎng)絡(luò)(ResNet)的跳躍連接方式,使深度網(wǎng)絡(luò)能夠提取包含更多圖像信息的特征。DropBlock是dropout的一種結(jié)構(gòu)化變體,將DropBlock引入卷積塊,能夠有效防止網(wǎng)絡(luò)過擬合問題。根據(jù)分析,設(shè)計(jì)MSRSALU-Net中的卷積模塊結(jié)構(gòu)(圖3-C)。與經(jīng)典的U-Net中擴(kuò)展網(wǎng)絡(luò)的轉(zhuǎn)換卷積塊類似,設(shè)計(jì)MSRSALU-Net中的轉(zhuǎn)換卷積塊(圖3-D)。

      ResNet由一些堆疊的殘差塊組成,每個(gè)殘差塊的一般表示為:

      yi=F(xi,wi)+h(xi)
      xi+1=σ(yi)

      。

      (1)

      式中:xi和xi+1表示當(dāng)前殘差塊的輸入和輸出;σ(yi)為激活函數(shù);F(·)為殘差函數(shù);h(xi)為恒等映射函數(shù),通常為h(xi)=xi。

      Ibtehaz等在MultiresuNet中用于減小收縮路徑特征層與擴(kuò)張路徑特征層之間存在的語(yǔ)義間隔[32],每個(gè)Respath由若干個(gè)殘差卷積塊組成(圖3-E)。在MSRSALU-Net中利用Respath連接收縮路徑特征層與擴(kuò)張路徑特征層,收縮路徑的特征層經(jīng)過Respath后與對(duì)應(yīng)擴(kuò)張路徑的特征層進(jìn)行級(jí)聯(lián),經(jīng)過Respath后的特征層的空間尺寸和通道數(shù)保持不變。若輸入輸出通道數(shù)不同,可以采用1×1卷積來壓縮或擴(kuò)大通道數(shù)。

      (2)

      式中:f1×1表示卷積核為1×1的卷積操作;σ(·)為Sigmoid激活函數(shù)。

      3 結(jié)果與分析

      為了驗(yàn)證所提出的MSRSALU-Net的有效性,在構(gòu)建的作物害蟲圖像數(shù)據(jù)庫(kù)上進(jìn)行試驗(yàn),并與4種結(jié)構(gòu)相似的模型進(jìn)行比較:U-Net[25]、注意力 U-Net(AU-Net)[26]、MultiResUNet[32],都是由編碼器模型和解碼器模型組成的體系結(jié)構(gòu)。其中AU-Net、MultiResUNet為2種比較突出的U-Net改進(jìn)模型:AU-Net將注意力機(jī)制應(yīng)用于U-Net分割模型中,關(guān)注顯著性區(qū)域,抑制無(wú)關(guān)背景區(qū)域;MultiResUNet將U-Net的2個(gè)3×3的卷積替換為3×3和7×7卷積與5×5卷積并行合并,使用了多分辨率思路替換傳統(tǒng)卷積層,再利用Respath替換了U-Net中的簡(jiǎn)單跳過連接。

      3.1 試驗(yàn)設(shè)置

      工作站試驗(yàn)系統(tǒng)環(huán)境為Ubuntu,其配備為 Xeon? CPU E5-2650 v4 @ 2.20 GHz,顯卡型號(hào)為NVIDIA Tesla P100。NVIDIA Tesla P100擁有3 584個(gè)CUDA核、HBM2內(nèi)存16 GB、核心頻率 1 328 MHz,浮點(diǎn)性能為10.6 TFLOPS?;赨-Net的改進(jìn)模型在Caffe深度學(xué)習(xí)框架中實(shí)現(xiàn)。試驗(yàn)時(shí),每幅輸入圖像大小被固定為512×512,優(yōu)化器使用Adam,初始學(xué)習(xí)率為0.001,權(quán)重衰減為1×10-4,動(dòng)量為0.9,迭代次數(shù)為3 000,迭代時(shí)如果模型在驗(yàn)證集上的損失上升,則學(xué)習(xí)率改為原來的50%。

      將IP23圖像集中的所有12 040幅圖像按照 6∶4 的比例隨機(jī)分成2個(gè)子集,進(jìn)行作物害蟲檢測(cè)試驗(yàn),其中7 224幅圖像用于訓(xùn)練模型,剩余的 4 816 幅圖像用于測(cè)試模型。在試驗(yàn)中,分多批進(jìn)行模型訓(xùn)練,每批使用50幅圖像。通過對(duì)重疊patch上得到的類別標(biāo)簽的多數(shù)投票來決定害蟲圖像像素的類別。采用精確率(Pre)、召回率(Rec)、F1-Score(F1)作為模型的評(píng)價(jià)指標(biāo),分別計(jì)算如下:

      (3)

      式中:TP表示真陽(yáng)性數(shù);FP表示假陽(yáng)性數(shù);FN表示假陰性數(shù)。Pre為檢測(cè)為正的樣本且標(biāo)簽為正樣本的比例,Rec為正樣本中被檢測(cè)結(jié)果為正樣本的比例,F(xiàn)1則為Rec與Pre的權(quán)重調(diào)和值。

      3.2 試驗(yàn)結(jié)果

      一個(gè)害蟲圖像在MSRSALU-Net的收縮模型中3個(gè)不同卷積層的部分卷積特征如圖4所示。

      卷積特征(圖4)表明,MSRSALU-Net能夠捕獲害蟲的細(xì)節(jié)信息,低級(jí)卷積特征圖包含了害蟲的基本輪廓特征,而高級(jí)卷積特征包含了害蟲的細(xì)節(jié)特征,卷積模型的不同卷積核能夠?qū)W習(xí)圖像的不同特征,關(guān)注圖像的不同部分,能夠充分提取各自關(guān)注部分圖像的顯著區(qū)域。從圖4-B和圖4-C看出,卷積特征圖沒有明顯的銳化邊緣,這是因?yàn)樵贛SRSALU-Net中引入了ReLU+DropBlock,能使模型更關(guān)注害蟲區(qū)域且抑制其他特征的影響。從圖4-D可以看出,特征圖中害蟲區(qū)域比較集中,第3卷積模塊能夠提取圖像的深層次特征。

      為了觀察MSRSALU-Net的收斂性能,在構(gòu)建的數(shù)據(jù)集上進(jìn)行了大量試驗(yàn),并將其與U-Net[25]、注意力U-Net(AU-Net)[26]、MultiResUNet[32]進(jìn)行比較。4種模型的損失值隨迭代次數(shù)的變化情況見圖5。

      從圖5可以看出,4種模型的損失值在第1 000次迭代前都迅速下降,在第1 500次迭代后趨于平穩(wěn),經(jīng)過2 000次迭代后MSRSALU-Net就達(dá)到了收斂效果。此時(shí),MSRSALU-Net的內(nèi)存為 2.47 GB,訓(xùn)練時(shí)間為4.35 h,測(cè)試時(shí)間為1.64 s??偟膩碚f,MSRSALU-Net的性能優(yōu)于其他3個(gè)模型,因?yàn)榭赡苁窃贛SRSALU-Net中引入了多尺度Inception卷積、Respath連接和注意力機(jī)制,加快了MSRSALU-Net的訓(xùn)練速度,提高了MSRSALU-Net的收斂性能和檢測(cè)精確率;MultiResUNet優(yōu)于AUNet,因?yàn)樗昧薘espath而不是跳過U-Net的連接;AU-Net優(yōu)于U-Net,因?yàn)樗鼘?duì)收縮模型每個(gè)通道的特征經(jīng)過注意力,能夠提取與學(xué)習(xí)任務(wù)有關(guān)的特征。

      為了公平比較4個(gè)模型的性能,將迭代次數(shù)為3 000次時(shí)的模型作為訓(xùn)練好的模型,重復(fù)訓(xùn)練樣本與測(cè)試樣本的6∶4試驗(yàn)100次,得到穩(wěn)定可靠的平均檢測(cè)結(jié)果(表1)。

      表1 基于4種模型的作物害蟲檢測(cè)方法的檢測(cè)結(jié)果

      為了評(píng)估MSRSALU-Net的整體性能,在構(gòu)建的數(shù)據(jù)集上給出基于4種模型的作物害蟲檢測(cè)結(jié)果。所選擇的訓(xùn)練好的模型也是迭代次數(shù)為3 000次時(shí)的模型,檢測(cè)到的害蟲圖像見圖6。5個(gè)訓(xùn)練模型的一些具有代表性的RSIs及其對(duì)應(yīng)的檢測(cè)性能見圖6,涉及多尺度、小型害蟲、簡(jiǎn)單背景和復(fù)雜背景。

      從圖6可以看到,U-Net可以檢測(cè)害蟲,但卻錯(cuò)過一些小型害蟲,不能有效地檢測(cè)復(fù)雜背景下的小型害蟲,也出現(xiàn)明顯的誤分割現(xiàn)象;AU-Net的檢測(cè)效果比U-Net好,能夠檢測(cè)出害蟲的位置,但對(duì)細(xì)小型害蟲部分的分割效果較差;MultiResUNet的檢測(cè)效果比U-Net、AU-Net好,但該模型對(duì)于復(fù)雜背景下分割的害蟲完整性較差,出現(xiàn)一些噪聲像素點(diǎn);MSRSALU-Net不僅在害蟲和背景檢測(cè)方面優(yōu)于其他比較模型,能夠完整分割出害蟲圖像中的害蟲區(qū)域,而且分割后的害蟲形狀比較完整,對(duì)較小型害蟲的分割效果較好。原因是該模型在卷積模塊中引入了多尺度卷積和空間注意力機(jī)制,并采用了修改的Respath連接。

      從圖5、圖6、表1可以看出,除了MSRSALU-Net外,其他3種模型都存在誤檢小型害蟲情況,其中U-Net比較嚴(yán)重,AU-Net由于注意機(jī)制優(yōu)于 U-Net,而MultiResUNet對(duì)小型害蟲的誤檢現(xiàn)象較小。MSRSALU-Net優(yōu)于其他方法,主要原因是該模型引入了Respath、多尺度卷積和空間注意力機(jī)制以及DropBlock的卷積層正則化。在特征提取階段,利用卷積后的加權(quán)特征代替?zhèn)鹘y(tǒng)特征進(jìn)行殘差融合,在訓(xùn)練過程中利用空間注意機(jī)制減少信息丟失,且加快了模型訓(xùn)練收斂速度。

      4 結(jié)論

      及時(shí)準(zhǔn)確檢測(cè)農(nóng)業(yè)害蟲是作物蟲害精確防治的前提。由于田間害蟲種類多,相同害蟲的大小和形態(tài)的多樣性以及復(fù)雜的田間背景,使得田間作物害蟲智能檢測(cè)是一個(gè)具有挑戰(zhàn)性的課題。在U-Net架構(gòu)基礎(chǔ)上,將多尺度卷積、空間注意力機(jī)制和殘差模塊相結(jié)合,提出了一種多尺度殘差空間注意力輕量化U-Net模型,并應(yīng)用于多尺度作物害蟲檢測(cè)。在害蟲圖像數(shù)據(jù)集上進(jìn)行試驗(yàn),結(jié)果表明,該模型能實(shí)現(xiàn)作物害蟲精準(zhǔn)檢測(cè),其檢測(cè)精度達(dá)到95%以上?;谠撃P偷淖魑锖οx檢測(cè)方法可應(yīng)用于作物害蟲的自動(dòng)檢測(cè)系統(tǒng)中。

      在作物害蟲防治過程中,需要確定害蟲的類別。下一步的研究重點(diǎn)是利用形態(tài)學(xué)優(yōu)化層對(duì)檢測(cè)后的害蟲圖像進(jìn)行優(yōu)化,再結(jié)合害蟲類別識(shí)別方法,研究有效可行的大田作物害蟲檢測(cè)與識(shí)別系統(tǒng)。

      猜你喜歡
      殘差害蟲尺度
      基于雙向GRU與殘差擬合的車輛跟馳建模
      蝸牛一覺能睡多久?
      冬季果樹常見蛀干害蟲的防治
      基于殘差學(xué)習(xí)的自適應(yīng)無(wú)人機(jī)目標(biāo)跟蹤算法
      財(cái)產(chǎn)的五大尺度和五重應(yīng)對(duì)
      基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
      棗樹害蟲的無(wú)公害防治
      宇宙的尺度
      太空探索(2016年5期)2016-07-12 15:17:55
      農(nóng)業(yè)害蟲的冬季防治
      平穩(wěn)自相關(guān)過程的殘差累積和控制圖
      河南科技(2015年8期)2015-03-11 16:23:52
      洛川县| 龙海市| 安远县| 繁昌县| 安泽县| 石台县| 翁牛特旗| 辽源市| 台湾省| 墨江| 衡东县| 开阳县| 汉川市| 焦作市| 德格县| 土默特右旗| 洛宁县| 菏泽市| 土默特右旗| 荥阳市| 芒康县| 蒲城县| 西峡县| 双桥区| 安福县| 南涧| 来凤县| 湖北省| 灯塔市| 竹溪县| 那曲县| 萝北县| 衡阳市| 东源县| 于田县| 翁牛特旗| 湖州市| 襄樊市| 兴山县| 阿拉善左旗| 丰县|