• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    改進Faster RCNN在糧蟲目標(biāo)檢測中的應(yīng)用研究

    2022-06-22 10:23:44許德剛郭奕欣邢奎杰
    中國糧油學(xué)報 2022年4期
    關(guān)鍵詞:儲糧背景樣本

    許德剛, 王 露, 李 凡, 郭奕欣, 邢奎杰

    (河南工業(yè)大學(xué)糧食信息處理與控制教育部重點實驗室1,鄭州 450001)(河南工業(yè)大學(xué)信息科學(xué)與工程學(xué)院2,鄭州 450001)

    長期以來,糧食作為人類社會生存的基本需求,對維持社會穩(wěn)定、保障民生和社會發(fā)展都具有重要作用。我國每年由于糧蟲侵虐造成的損失達數(shù)百萬t,給國家造成了巨大的損失[1]。儲糧害蟲不僅會造成糧食品質(zhì)和數(shù)量下降,而且蟲害的排泄物和尸體還會造成疾病傳播[2]。因此,糧蟲檢測與識別是儲糧安全的重要一部分,在糧食儲糧過程中定期檢測糧食谷物是否有儲糧害蟲存在至關(guān)重要。隨著技術(shù)的進步,糧蟲檢測方法從傳統(tǒng)的直觀檢測法、取樣法、誘捕法、逐步發(fā)展到聲測法[3]、圖像識別法、近紅外光譜法[4]、X-ray射線法[5]、生物光子法和深度學(xué)習(xí)目標(biāo)檢測法等。傳統(tǒng)的圖像識別法通過提取糧蟲的邊緣、形狀、紋理等圖像特征,再將這些特征拼接為特征向量,最后利用機器學(xué)習(xí)算法對特征向量進行分類,識別糧蟲種類?;谏疃葘W(xué)習(xí)的目標(biāo)檢測方法避免了手工設(shè)計糧蟲特征的煩瑣步驟,可以自動學(xué)習(xí)和泛化大量圖像數(shù)據(jù)的特征,對糧蟲的特征向量進行分類,快速識別不同糧蟲種類。

    近年來,目標(biāo)檢測技術(shù)在科學(xué)研究和計算機視覺領(lǐng)域都受到了廣泛的關(guān)注。經(jīng)典的目標(biāo)檢測算法有基于候選區(qū)域的雙階段算法和基于回歸的單階段算法。具體來說,雙階段算法在第一階段主要生成區(qū)域建議;第二階段主要用于分類和回歸區(qū)域建議以獲得更準(zhǔn)確的目標(biāo)位置,以Faster-RCNN[6]和R-FCN[7]為代表,特點是識別精度高、速度較慢、訓(xùn)練過程困難。單階段算法將目標(biāo)檢測視為一個回歸或分類問題,采用統(tǒng)一的框架直接實現(xiàn)分類和定位,以SSD[8](Single Shot Multibox Detector)和YOLO(You Only Look Once)[9]為代表,特點是檢測速度快,但精度相對較差。本研究將糧蟲檢測作為目標(biāo)檢測的背景,要準(zhǔn)確識別糧蟲的種類,并對糧蟲進行定位。

    為了提升糧蟲檢測效果,基于經(jīng)典的雙階段Faster RCNN算法,針對糧倉內(nèi)赤擬谷盜、銹赤扁谷盜、米象、煙草甲和鋸谷盜5種最主要的甲蟲類儲糧害蟲分別制作了白板背景和實際儲糧背景兩個糧蟲數(shù)據(jù)集,在特征圖后引入一個金字塔池化模塊以融合全局特征信息,采用改進的Focal Loss損失函數(shù)代替交叉熵損失函數(shù),以解決糧蟲分類過程中樣本不平衡問題,實現(xiàn)糧蟲檢測效果的有效提升。

    1 經(jīng)典Faster RCNN算法

    Faster RCNN算法在2015年提出,在RCNN[10]和Fast RCNN[11]基礎(chǔ)上擴展而來,引入了區(qū)域建議網(wǎng)絡(luò)(Region Proposal Network,RPN)取代選擇性搜索算法,RPN將區(qū)域建議提取集成到深度卷積神經(jīng)網(wǎng)絡(luò),在每個位置同時預(yù)測目標(biāo)邊界框和類別置信度分?jǐn)?shù),加快了網(wǎng)絡(luò)的計算速度。Faster R-CNN采用VGG-16作為骨干網(wǎng)絡(luò),由卷積層、RPN網(wǎng)絡(luò)、RoI Pooling層[12]、分類和回歸層等4部分組成。

    Faster RCNN方法的檢測流程分為兩個階段:生成候選區(qū)域,詳細地搜索圖像中所有可能是目標(biāo)的位置,并為可能是目標(biāo)的位置產(chǎn)生大量的邊界框,帶有邊界框的感興趣區(qū)域稱為區(qū)域建議;對候選區(qū)域進行分類和回歸,得到區(qū)域建議后,通過一些技術(shù)來判斷它是屬于目標(biāo)類還是背景類。區(qū)域建議網(wǎng)絡(luò)用于選出并刪除目標(biāo)存在概率非常小的區(qū)域,從而加快了整個目標(biāo)檢測系統(tǒng)的速度。

    2 算法優(yōu)化

    根據(jù)Faster RCNN算法的原理,針對糧蟲目標(biāo)體積小、姿態(tài)多變、糧蟲與糧粒相互遮擋且容易混淆等特點,通過引入金字塔池化模塊(Pyramid Pooling Module,PPM)[13]來融合全局信息,采用Focal Loss損失函數(shù)作為分類損失解決數(shù)據(jù)不平衡問題,以提升糧蟲目標(biāo)的檢測效果。

    2.1 增加上下文的金字塔池化模塊

    在目標(biāo)檢測領(lǐng)域,上下文信息起著重要作用。在檢測特征不足的目標(biāo)時,上下文信息可以了解目標(biāo)及其周圍環(huán)境之間的關(guān)聯(lián),提高檢測器了解場景的能力,有效地幫助提高檢測性能。糧蟲目標(biāo)檢測中的上下文信息是糧蟲目標(biāo)的語義信息,主要分為局部上下文和全局上下文。全局上下文信息可以提供圖像級別或者場景級別的上下文信息,局部上下文信息可以提升目標(biāo)被檢測的可能性。

    深度卷積神經(jīng)網(wǎng)絡(luò)為了獲得較大感受野的特征表達,需要進行多次下采樣,在最后一個卷積層的特征圖可以獲得目標(biāo)類別和豐富的語義信息。但是多次下采樣會導(dǎo)致信息丟失,本文提出采用PSPNet[14]的金字塔池化模塊(PPM)來解決此問題,該模塊通過將最終特征圖和4個不同金字塔比例尺的特征進行級聯(lián)來獲得更加豐富的多尺度上下文信息。金字塔池化模塊如圖1所示,通過融合不同區(qū)域的上下文信息在不同尺度下保留全局信息,有效地獲取全局語境信息。

    本研究采用在特征圖后增加一個金字塔池化模塊PPM來解決卷積神經(jīng)網(wǎng)絡(luò)在多次下采樣時造成得信息丟失,以有效融合全局上下文信息,以提升檢測性能。金字塔池化結(jié)構(gòu)如圖1中的c部分。PPM通過不同金字塔尺寸的自適應(yīng)平均池化(GAP)處理卷積神經(jīng)網(wǎng)絡(luò)得到特征圖,如圖1中b部分,PPM包含1個直接連接和4個分支,每個分支分別由1個池化層,1個卷積層和1個反卷積層組成。不同分支在池化層和卷積層中具有不同大小的內(nèi)核,同時生成不同大小的感受野。PPM融合了4種不同金字塔尺度下的特征,4個分支的內(nèi)核大小分別設(shè)置為1、2、4、6,POOL表示采用1×1、2×2、4×4和6×6 4種不同尺寸的池化操作得到多個尺寸的特征圖,其中較大內(nèi)核的分支可以獲得更多的全局特征,反之,內(nèi)核較小的分支獲取更多的局部特征,并對這些尺寸的特征圖再次進行“1×1的Conv”來減少通道路。金字塔池化模塊的輸入和所有分支的輸入通過級聯(lián)輸入到下一層,使用雙線性插值[15]填充上采樣得到原來的尺寸,將不同級別的特征圖拼接得到最終的金字塔池化全局特征。因此,全局和局部特征的融合可以生成準(zhǔn)確的像素級預(yù)測。同時,不同的內(nèi)核大小能夠提升模型檢測不同尺度目標(biāo)的能力。

    圖1 金字塔池化模塊結(jié)構(gòu)圖

    2.2 損失函數(shù)優(yōu)化

    Faster RCNN算法的損失函數(shù)設(shè)計過程中沒有考慮到訓(xùn)練數(shù)據(jù)集樣本不均衡的問題,可能導(dǎo)致算法對不同類別糧蟲的檢測效果相差較大,為了提高算法的檢測準(zhǔn)確率,從樣本分布均衡的角度出發(fā),基于Focal loss損失函數(shù)的思想對算法進行改進,以提升算法對困難樣本和類別較少的樣本的檢測準(zhǔn)確率。

    本研究使用Focal Loss解決糧蟲檢測的數(shù)據(jù)不平衡問題。Focal Loss以通過重塑標(biāo)準(zhǔn)交叉熵損失來解決目標(biāo)檢測任務(wù)中的不平衡問題,其不僅實現(xiàn)降低簡單樣本的影響,更多地關(guān)注困難樣本,而且基于分類誤差考慮每個樣本對損失的影響。除了以上原因,前景和背景的極度不平衡也是影響目標(biāo)檢測算法的一個重要原因,F(xiàn)ocal Loss還考慮到前景和背景類之間1∶1 000比例的不平衡比例的高訓(xùn)練精度[16],在計算機視覺、目標(biāo)檢測領(lǐng)域都獲得了優(yōu)越性能。

    2.2.1 Focal Loss損失函數(shù)

    由于糧蟲形狀相似,一般情況下,RPN中屬于負樣本的區(qū)域建議較多。為了解決訓(xùn)練過程中前景和背景類別不平衡的問題(如:1∶1 000),并更好地進行分類,用Focal Loss代替RPN中的標(biāo)準(zhǔn)交叉熵(Cross-entropy,Ce)分類損失。

    傳統(tǒng)的分類交叉熵損失函數(shù)如公式所示:

    (1)

    式中:p是網(wǎng)絡(luò)模型預(yù)測該樣本為正樣本的概率值,p∈[0,1]。其中y∈{±1}是真值類,表示樣本標(biāo)簽,當(dāng)y=+1時表示正樣本,y=-1時表示負樣本。當(dāng)樣本標(biāo)簽為1時,p越接近1,損失越小。

    通過對交叉驗證建立的可調(diào)參數(shù)改進,為便于表示,將p標(biāo)記為pt,目標(biāo)類的概率pt定義為:

    (2)

    此時,二分類交叉熵損失函數(shù)Ce可以簡寫為:

    Ce(p,y)=Ce(pt)=-log(pt)

    (3)

    此外為了解決樣本不平衡中的正負樣本不均衡問題,添加了一個加權(quán)項α來處理正類和負類(1-α)的類別不平衡,α的取值范圍為0~1,如下所示:

    (4)

    在α平衡形式中,調(diào)整后的二分類交叉熵損失函數(shù)Ce可以寫成:

    Ce(pt)=-αtlog(pt)

    (5)

    這個公式被認(rèn)為是Ce的一個簡單擴展,其中,α是類概率的倒數(shù),或作為交叉驗證修復(fù)的超參數(shù),與正負樣本數(shù)量呈反比,以減少正負樣本不均衡對性能的影響。

    由公式可以看出,所有樣本的權(quán)值在標(biāo)準(zhǔn)交叉熵中是一樣的。如果在訓(xùn)練過程中存在前景和背景的類別不平衡,大量的負樣本的將主導(dǎo)梯度,小量的困難樣本和正樣本將會被覆蓋,也就難以發(fā)揮作用,使準(zhǔn)確率降低。

    用Focal Loss函數(shù)代替交叉熵來解決類不平衡問題,相當(dāng)于為Ce損失函數(shù)的擴展。而對于難易樣本不均衡的問題,為了增加小目標(biāo)的權(quán)重,類似于權(quán)重因子α,通過增加高斯權(quán)重(Gaussian weight)來改進Focal Loss。某一類中的樣本數(shù)越少,高斯權(quán)重就越大,模型就越會引起注意。 Focal Loss為帶有參數(shù)的交叉熵損失增加了一個調(diào)節(jié)因子(1-pt)y。其中y≥0,改進的損失函數(shù)表示為:

    Lfl(pt)=-αt(1-pt)ylog(pt)

    (6)

    式(6)既可以調(diào)整正負樣本不均衡,也可以調(diào)整困難樣本和簡單樣本的不均衡。其中,(1-pt)γ用來調(diào)整困難樣本和簡單樣本的權(quán)重,(1-pt)γ取值范圍為0~1,如果pt值越大,為簡單樣本,則(1-pt)γ值越小,故對損失函數(shù)的影響更??;如果pt值較小,則為困難樣本,則對應(yīng)的(1-pt)γ值更大,對損失函數(shù)影響較大。

    (7)

    其中αt權(quán)重為了改善正負樣本不平衡,αt是加權(quán)因子,α和γ是2個可調(diào)參數(shù),ct是每個類別的數(shù)量。當(dāng)γ=0時,focalloss等于交叉熵,并且隨著γ增加,α不斷減小。在0~1的范圍內(nèi),α越小,負樣本(具有較大數(shù)量的類別)的權(quán)重越小。通過增加較少數(shù)量類的權(quán)重,通過高斯部分對αt進行了改進。

    當(dāng)一個邊界框被錯誤分類時,pt很小,并且(1-pt)γ接近于1,對分類損失幾乎沒有影響。同樣,當(dāng)分類預(yù)測結(jié)果很好時,即pt接近于1,(1-pt)γ接近于0,這相當(dāng)于減少了簡單樣本的損失。在Lin等[17]的研究中,當(dāng)γ=2和α=0.25時,模型效果最好。在此研究基礎(chǔ)上,應(yīng)用相同的參數(shù)設(shè)置。參數(shù)β和σ控制著每個類別損失的權(quán)重,確保αt∈[0,1]。

    2.2.2 Faster RCNN模型的損失函數(shù)設(shè)計

    Faster RCNN的總損失函數(shù)由分類損失和回歸損失組成。該方法對一幅圖像的具體損失函數(shù)定義為如式(8)所示。

    (8)

    其中,回歸損失函數(shù)Lreg的具體表達式如式(9)所示。

    (9)

    式(9)中,平滑函數(shù)(smooth function)的定義如式(10)所示。

    (10)

    式中:x為邊界框的預(yù)測誤差,參數(shù)σ用來控制平滑區(qū)域。對于邊界框回歸采用式(11)中的4個參數(shù)坐標(biāo)表達。

    tw=log(w/wa)th=log(h/ha)

    (11)

    式中:x、y、w和h為方框的中心坐標(biāo)及其寬、高。變量x為預(yù)測框、xa為錨框、x*為真值框,這可以看作從錨框到真值框的邊界框回歸。

    2.2.3 改進后Faster RCNN模型架構(gòu)

    Faster RCNN檢測模型由4個部分組成:使用VGG-16提取糧蟲圖像特征,得到特征圖;將特征圖輸入RPN得到區(qū)域建議生成;將特征圖和Proposals輸入到RoI Pooling層得到綜合的Proposals特征;根據(jù)Proposals特征預(yù)測目標(biāo)的邊界框和位置,即分類和邊界框回歸。改進后Faster RCNN模型架構(gòu)如圖2所示。

    圖2 改進的Faster RCNN網(wǎng)絡(luò)架構(gòu)圖

    基于改進的Faster RCNN儲糧害蟲目標(biāo)檢測模型流程包括特征提取、金字塔池化、區(qū)域建議網(wǎng)絡(luò)和全連接網(wǎng)絡(luò)。

    2.3 改進后Faster RCNN模型架構(gòu)

    2.3.1 特征提取

    該模塊利用VGG-16作為特征提取網(wǎng)絡(luò),提取原始圖像的特征圖并與Faster RCNN的RPN共享所有的卷積操作。

    2.3.2 金字塔池化模塊PPM

    特征圖經(jīng)過PPM模塊得到融合了整體信息的特征,然后,采用雙線性插值對低維特征圖上采樣,使其與原始特征圖尺度相同。最后,拼接不同層級的特征圖得到金字塔池化全局特征。

    2.3.3 RPN網(wǎng)絡(luò)

    RPN通過比較各個區(qū)域建議的置信度得分和執(zhí)行二值分類任務(wù),判斷每個建議屬于前景還是背景,并利用錨框回歸得到糧蟲的邊界框。

    2.3.4 全連接網(wǎng)絡(luò)

    通過RoI池化層獲得特征發(fā)送到全連接網(wǎng)絡(luò)進行分類和邊界框回歸計算。在訓(xùn)練階段,需要計算預(yù)測值與真實值之間的所有損失,并進行反向梯度傳播優(yōu)化。本文模型通過對給定圖像進行輸入,網(wǎng)絡(luò)轉(zhuǎn)發(fā),得到圖像的分類和回歸預(yù)測框。

    3 數(shù)據(jù)集與評價標(biāo)準(zhǔn)

    糧蟲數(shù)據(jù)集是目標(biāo)檢測研究的基礎(chǔ),在目標(biāo)檢測任務(wù)中扮演著十分重要的角色。在進行糧蟲目標(biāo)檢測任務(wù)時,需要適用性強的數(shù)據(jù)集來有效測試和評估本文算法的性能。由于該領(lǐng)域目前沒有公開的糧蟲數(shù)據(jù)集,所以本文采用人工采集的方法來制作數(shù)據(jù)集。

    3.1 數(shù)據(jù)集的制作

    儲糧害蟲分為昆蟲和螨類兩類,昆蟲類又分為甲蟲類和蛾類兩種,其中甲蟲類對糧食谷物的破壞性最強,所以本文以甲蟲類儲糧害蟲為研究對象,選取了赤擬谷盜、銹赤扁谷盜、米象、煙草甲和鋸谷盜5 種最主要的甲蟲類儲糧害蟲。拍攝白板背景下圖像時,用鑷子將昆蟲夾出放置實驗平臺的白紙上,將手機固定,垂直平臺進行拍攝,選取了赤擬谷盜、銹赤扁谷盜、米象、煙草甲和鋸谷盜5 類害蟲,數(shù)據(jù)集名稱為WBGP,如圖3所示;拍攝實際儲糧背景的糧蟲圖像時以小麥和大米為背景鋪滿實驗平臺,固定手機,垂直平臺進行拍攝,選取了赤擬谷盜、米象和鋸谷盜3類害蟲,數(shù)據(jù)集名稱為RBGP,如圖4所示。每張圖像的糧蟲數(shù)量為4~10只,白板背景下原始圖像樣本共計2 601張,實際背景下原始圖像共計1317張,昆蟲圖像統(tǒng)一 resize 成了640×480大小。

    圖3 白板背景數(shù)據(jù)集WBGP的糧蟲圖像

    圖4 實際儲糧背景數(shù)據(jù)集RBGP的糧蟲圖像

    3.2 數(shù)據(jù)增強

    在深度學(xué)習(xí)中,為了增強模型的穩(wěn)定性,提取圖像特征,防止模型過擬合,需要大量的數(shù)據(jù)進行訓(xùn)練以提高模型的魯棒性。本文對圖像進行幾何變換、調(diào)節(jié)亮度、添加高斯噪聲等一系列增強操作來豐富糧蟲數(shù)據(jù),幾何變換包括圖像翻轉(zhuǎn)和旋轉(zhuǎn)兩種方法,采用了90°、180°和270°對圖像進行旋轉(zhuǎn)。白板背景下原始圖像數(shù)據(jù)2 601張增強至3 734張,白板背景下數(shù)據(jù)增強前后糧蟲圖像數(shù)量如表1所示,儲糧背景下原始圖像數(shù)據(jù)1 317張增強至2 074張,儲糧背景數(shù)據(jù)增強前后糧蟲圖像數(shù)量如表2所示,平均每種糧蟲圖像700張,每幅圖像上糧蟲4~10只。最后,按照7∶1∶2的比例[18]構(gòu)建訓(xùn)練集、驗證集和測試集。

    表1 白板背景數(shù)據(jù)集WBGP的糧蟲圖像數(shù)量

    表2 實際儲糧背景數(shù)據(jù)集RBGP的糧蟲圖像數(shù)量

    3.3 性能評價指標(biāo)

    本研究采用精確度(P)、召回率(R)、平均精確度(AP)和平均精確度均值(mAP)[19]和來評估目標(biāo)檢測模型的性能。目標(biāo)檢測模型的分類和定位能力是其最主要的性能體現(xiàn),而mAP值是其最直觀的表達方式,mAP值越大,表明該模型的精度越高。其中, mAP的計算公式為,Q代表目標(biāo)類別數(shù):

    (12)

    4 結(jié)果與分析

    4.1 實驗環(huán)境

    本實驗根據(jù)PyTorch的運行環(huán)境要求在計算機進行環(huán)境的搭建,參數(shù)如表3所示。

    表3 實驗環(huán)境配置參數(shù)

    選用的GPU最大分辨率為7 680×4 320,能夠處理大量圖像數(shù)據(jù),加快網(wǎng)絡(luò)模型的訓(xùn)練速度,從而提高圖像處理速度和模型訓(xùn)練效率。

    4.2 定性分析

    算法實驗過程中用糧蟲相對應(yīng)的拼音縮寫表示糧蟲的種類,其中“chini”表示赤擬谷盜,“mixing”表示米象,“jugudao”表示鋸谷盜,“yancojia”表示煙草甲,“xiuchi”表示銹赤扁谷盜。

    Faster RCNN算法在白板背景數(shù)據(jù)集的檢測結(jié)果對比如圖5所示,圖5a是Faster RCNN算法的檢測效果,圖5b是Faster RCNN算法改進后的檢測效果。

    圖5 白板背景數(shù)據(jù)集Faster RCNN算法改進前后檢測效果對比圖

    圖6是實際儲糧背景數(shù)據(jù)集中Faster RCNN算法改進前后對3種糧蟲的檢測結(jié)果對比,其中圖6a是Faster RCNN算法的檢測效果圖,圖6b是Faster RCNN算法改進后的檢測效果圖。對比Faster RCNN算法改進前后的檢測結(jié)果可以發(fā)現(xiàn),圖像中每只糧蟲被檢測的概率值都有了明顯的提升,改進后Faster RCNN算法的精度有了一定提高,同時避免了一些漏檢。

    圖6 儲糧背景數(shù)據(jù)集的Faster RCNN算法改進前后檢測效果對比圖

    4.3 定量分析

    SSD作為深度學(xué)習(xí)中的典型單階段目標(biāo)檢測算法,具有精度高、速度快的特點。本實驗針對2.1和2.2中的優(yōu)化方案,對比SSD算法與改進前后Faster RCNN算法在白板背景數(shù)據(jù)集的糧蟲檢測實驗結(jié)果,如表4所示,在實際儲糧背景數(shù)據(jù)集的糧蟲檢測對比實驗結(jié)果如表5所示。

    白板背景數(shù)據(jù)集一共有五類糧蟲目標(biāo),分別是銹赤扁谷盜、米象、鋸谷盜、煙草甲、銹赤扁谷盜。從表4可以看出,不同種類糧蟲的檢測效果存在差異,在白板背景下SSD算法對糧蟲小目標(biāo)的檢測效果不佳,每類糧蟲的mAP值都低于改進前后的Faster RCNN算法,使用改進的Faster RCNN算法后整個數(shù)據(jù)集的mAP從88.52%提升到了89.42%,上升了0.90%,其中赤擬谷盜的mAP從87.46%提升到了89.73%,上升了2.27%,提升效果最好,該算法對糧蟲小目標(biāo)的檢測能力有一定的改善。通過對Faster RCNN模型進行改進,每類糧蟲的mAP都有提升,檢測效果都比原始算法的更好,說明了該改進算法對糧蟲小目標(biāo)具有提升效果。

    實際儲糧背景數(shù)據(jù)集中一共有三類糧蟲,分別是赤擬谷盜、米象和鋸谷盜。從表5中可以看出,在儲糧背景下SSD算法對每類糧蟲的檢測mAP值都低于Faster RCNN算法,整個數(shù)據(jù)集的mAP值為76.60%,對比Faster RCNN算法的87.66%,低了11.06%,驗證了本文選擇Faster RCNN算法的正確性;使用改進Faster RCNN算法后,每種糧蟲的檢測精度都有提升,且各不相同,整個數(shù)據(jù)集的mAP從87.66%提升到了90.12%,上升了2.46%,其中赤擬谷盜的mAP從84.51%提升到了89.98%,上升了5.47%,也是提升效果最好的種類。說明了該改進算法對實際儲糧背景下糧蟲數(shù)據(jù)集的檢測性能也有一定的改善,證明了本章改進方法對糧蟲目標(biāo)檢測的有效性。

    對比表4和表5,發(fā)現(xiàn)使用原始Faster RCNN算法時,在儲糧背景下整個數(shù)據(jù)集的mAP比白板背景數(shù)據(jù)集糧蟲的mAP值低,但在改進后的Faster RCNN算法中結(jié)果正好相反,改進后的Faster RCNN算法在儲糧背景數(shù)據(jù)集的mAP比白板背景數(shù)據(jù)集的mAP高,說明本改進方法在實際儲糧環(huán)境的糧蟲檢測提升效果更明顯,更具實用價值。另一方面,在2個數(shù)據(jù)集中,由于赤擬谷盜的體積的體積形態(tài)都是最大的,在糧蟲圖像中所占的像素更多,而且提升效果也是最明顯的,說明目標(biāo)的尺度越大,特征就越明顯,檢測效果也會更好。

    表4 白板背景糧蟲數(shù)據(jù)集下改進Faster RCNN算法的實驗對比

    表5 實際儲糧背景糧蟲數(shù)據(jù)集下改進Faster RCNN算法的實驗對比

    5 結(jié)論

    儲糧安全關(guān)系社會穩(wěn)定發(fā)展,高效的糧蟲檢測方法有助于構(gòu)建綠色倉儲環(huán)境。本研究針對糧蟲目標(biāo)體積小、檢測難度大的問題以及原始Faster RCNN模型在檢測糧蟲目標(biāo)時精度和檢測效率兩方面的不足,提出了一種改進的Faster RCNN糧蟲檢測模型。通過引用金字塔池化模塊融合全局上下信息,優(yōu)化分類損失來解決分類過程的樣本不平衡問題,解決了糧蟲相似度高,產(chǎn)生較多陰性樣本的問題。實驗表明本文采用的改進Faster RCNN算法對白板背景和實際儲糧背景糧蟲目標(biāo)檢測的有效性。后續(xù)工作將構(gòu)建種類更全的糧蟲數(shù)據(jù)集,增加算法對不同種類糧蟲的泛化性。

    猜你喜歡
    儲糧背景樣本
    “新四化”背景下汽車NVH的發(fā)展趨勢
    用樣本估計總體復(fù)習(xí)點撥
    《論持久戰(zhàn)》的寫作背景
    渭南農(nóng)戶儲糧的調(diào)查與分析
    推動醫(yī)改的“直銷樣本”
    中儲糧企業(yè)全面預(yù)算管理之我見
    國內(nèi)首座球形糧倉儲糧效果及特性
    隨機微分方程的樣本Lyapunov二次型估計
    晚清外語翻譯人才培養(yǎng)的背景
    村企共贏的樣本
    泌阳县| 庄河市| 凤城市| 麻栗坡县| 华坪县| 大厂| 卢湾区| 天等县| 崇阳县| 长宁区| 华亭县| 伊通| 琼结县| 米林县| 八宿县| 六枝特区| 兴山县| 衢州市| 兴城市| 闻喜县| 房产| 阆中市| 南乐县| 稻城县| 庆元县| 福海县| 咸丰县| 苏尼特右旗| 霞浦县| 探索| 蓝山县| 明星| 佳木斯市| 白玉县| 绥阳县| 康定县| 四子王旗| 武功县| 新田县| 西峡县| 邮箱|