• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      YOLOv5目標(biāo)檢測(cè)的輕量化研究

      2023-01-13 11:57:16田軍委
      關(guān)鍵詞:輕量化特征提取卷積

      何 雨,田軍委,張 震,王 沁,趙 鵬

      西安工業(yè)大學(xué) 機(jī)電工程學(xué)院,西安 710021

      室內(nèi)目標(biāo)檢測(cè)技術(shù)是當(dāng)前極具實(shí)用價(jià)值與廣闊前景的熱點(diǎn)研究,其在智能家居、服務(wù)機(jī)器人、安防監(jiān)控等領(lǐng)域都有著廣闊的應(yīng)用前景[1-2]。目標(biāo)檢測(cè)技術(shù)的研究是開(kāi)展室內(nèi)視覺(jué)任務(wù)的基礎(chǔ),對(duì)于提高場(chǎng)景理解的感知力度有著重要意義。傳統(tǒng)的目標(biāo)檢測(cè)算法基于手工提取特征[3],形成了以級(jí)聯(lián)檢測(cè)器(VJ-Det),梯度方向直方圖檢測(cè)器(HOG-Det)和可變形組件檢測(cè)器(deformable part model,DPM)為代表的傳統(tǒng)目標(biāo)檢測(cè)算法,廣泛應(yīng)用于動(dòng)態(tài)視頻中的行人檢測(cè),以及靜態(tài)圖像中的車(chē)輛和常見(jiàn)動(dòng)物檢測(cè)[4]。深度學(xué)習(xí)技術(shù)突破了傳統(tǒng)目標(biāo)檢測(cè)算法在特征提取上的技術(shù)瓶頸問(wèn)題[5-7],成為當(dāng)前目標(biāo)檢測(cè)的主流算法。基于檢測(cè)原理的差異,深度學(xué)習(xí)型目標(biāo)檢測(cè)可分為兩類(lèi):two-stage和one-stage,代表算法分別為RCNN[8-10]系列和YOLO[11]、SSD[12]系列,其中SSD是基于前兩者的改進(jìn)。雖然現(xiàn)有目標(biāo)檢測(cè)方法眾多,但大多數(shù)研究致力于精度提升,使得網(wǎng)絡(luò)結(jié)構(gòu)愈加復(fù)雜,對(duì)硬件成本要求也更大。而實(shí)際室內(nèi)場(chǎng)景中機(jī)器人作業(yè)平臺(tái)硬件平臺(tái)有限,難以達(dá)到其要求,因此研究輕量化的目標(biāo)檢測(cè)顯得尤其重要。YOLO系列算法作為經(jīng)典的one-stage目標(biāo)檢測(cè)算法,因其出色的檢測(cè)性能得到廣泛應(yīng)用,文獻(xiàn)[13-15]采用MobileNetV2主干網(wǎng)絡(luò)替換和注意力機(jī)制結(jié)合的方式來(lái)實(shí)現(xiàn)YOLO系列的輕量化的研究,在模型復(fù)雜度上有了改進(jìn),但對(duì)于精度卻沒(méi)有很好地兼顧。文獻(xiàn)[16-17]提出基于網(wǎng)絡(luò)通道的剪枝模型壓縮方法來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)輕量化,在MobileNetV2的基礎(chǔ)上再次進(jìn)行剪枝來(lái)減少模型參數(shù)量,效果顯著,但其精度損失嚴(yán)重,難以保障檢測(cè)準(zhǔn)確率,且在不同數(shù)據(jù)集的檢測(cè)效果難以維持穩(wěn)定。文獻(xiàn)[18]采用空心卷積和超輕量子空間注意機(jī)制對(duì)特征圖像進(jìn)行重采樣,極大地提高了目標(biāo)檢測(cè)精度。

      以上研究針對(duì)單一精度或輕量化的改進(jìn)難以滿足室內(nèi)機(jī)器人作業(yè)中對(duì)實(shí)時(shí)性和準(zhǔn)確率的要求。因此,本文擬通過(guò)改進(jìn)YOLOV5s目標(biāo)檢測(cè)算法對(duì)精度和輕量化進(jìn)行研究,加強(qiáng)室內(nèi)機(jī)器人的環(huán)境感知能力,有效解決室內(nèi)目標(biāo)檢測(cè)實(shí)時(shí)性與準(zhǔn)確率難以平衡的問(wèn)題。

      1 改進(jìn)輕量化YOLOv5s算法

      YOLOv5與YOLO系列的網(wǎng)絡(luò)結(jié)構(gòu)類(lèi)似,主要由Input、Backbone、Neck和Head等四部分組成,YOLOv5s是YOLOv5里最小的一個(gè)模型,廣泛應(yīng)用于輕量化研究。如圖1為YOLOV5s網(wǎng)絡(luò)結(jié)構(gòu),由Input、Backbone、Neck和Head四部分組成構(gòu)成,右側(cè)為SPP和Foucs組件結(jié)構(gòu)。其中,輸入Input為三通道的RGB圖像,特征大小為640×640×3,采用Mosaic數(shù)據(jù)增強(qiáng)的方式,豐富了檢測(cè)目標(biāo)圖像背景,減少了模型對(duì)batch size的依賴(lài)。主干網(wǎng)絡(luò)階段Backbone使用Foucs網(wǎng)絡(luò)結(jié)構(gòu)對(duì)特征進(jìn)行切片操作,更好地進(jìn)行深度特征提取,使得通道數(shù)擴(kuò)充了4倍,特征尺寸減半,提升了運(yùn)算速度。特征融合層Neck采用路徑聚合網(wǎng)絡(luò)(path aggregation network,PANet),對(duì)Backbone輸出的有效的特征圖進(jìn)行融合,實(shí)現(xiàn)不同特征層的信息交融。PANet更好地融合了淺層與深層的特征信息,使得網(wǎng)絡(luò)充分提取到網(wǎng)絡(luò)中各個(gè)層次的特征,從而加強(qiáng)特征提取,得到更為豐富的特征信息(強(qiáng)語(yǔ)義信息和邊緣、紋理等信息)。輸出部分Head有3個(gè)YOLO Head檢測(cè)器,分別輸出不同尺度特征圖進(jìn)行目標(biāo)預(yù)測(cè)。

      圖1 YOLOv5s網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 YOLOv5s network structure

      YOLOv5雖已取得很好的成就,但仍存在一定的不足,對(duì)于硬件成本要求較高,難以部署在小型的嵌入式設(shè)備或者移動(dòng)端設(shè)備。因此,為解決這個(gè)該問(wèn)題,從算法模型復(fù)雜度和檢測(cè)精度出發(fā),對(duì)YOLOv5進(jìn)行改進(jìn)。

      改進(jìn)的YOLOv5s主要從輕量化特征提取、特征融合和損失函數(shù)三方面進(jìn)行改進(jìn)。首先,利用ShuffleNet v2輕量網(wǎng)絡(luò)替代CSPDarknet(cross stage partial darknet)主干網(wǎng)絡(luò)進(jìn)行特征提取,大幅減少參數(shù),實(shí)現(xiàn)YOLOv5s算法的整體輕量化;其次,使用引入了上下文信息和權(quán)重信息的加權(quán)雙向特征金字塔(bidirectional feature pyramid network,BiFPN)進(jìn)行特征加強(qiáng)提取,獲取更為豐富的特征信息,進(jìn)一步提高檢測(cè)性能;最后,采用位置回歸EIOU損失,從重疊、中心距離、寬高三部分損失描述目標(biāo)框的回歸,加快模型收,提升檢測(cè)性能。下面將對(duì)輕量化特征提取、特征融合和損失函數(shù)的相關(guān)基礎(chǔ)理論和改進(jìn)方法進(jìn)行詳細(xì)介紹。

      1.1 卷積計(jì)算

      模型參數(shù)量和計(jì)算量是衡量網(wǎng)絡(luò)輕量化的標(biāo)準(zhǔn),通過(guò)對(duì)其計(jì)算獲取網(wǎng)絡(luò)的實(shí)際參數(shù)量和模型復(fù)雜度。

      標(biāo)準(zhǔn)卷積由三部分組成:包括卷積層、批量歸一化和激活函數(shù)。在標(biāo)準(zhǔn)卷積中,特征圖的卷積核kernel通道數(shù)與輸入保持一致,各通道單獨(dú)做卷積運(yùn)算后再相加。假設(shè)輸入特征圖shape為Cin×H×W,輸出通道數(shù)為Cout,那么,會(huì)有Cout個(gè)卷積核,卷積核尺寸為Cin×K×K,由此可以計(jì)算其參數(shù)量(parameters)和計(jì)算量(FLOPS)大小。

      參數(shù)量:

      式中,H為特征圖高度,W為寬度,K為卷積核的寬高尺寸。

      計(jì)算量:

      深度可分離卷積(depthwise separable convolution,DW)通過(guò)輸入通道數(shù)與多個(gè)單通道卷積核的逐層運(yùn)算,得到多個(gè)特征圖,再利用逐點(diǎn)卷積在深度方向進(jìn)行加權(quán)混合,實(shí)現(xiàn)不同通道間的信息融合。同理,可以計(jì)算DW卷積的參數(shù)量和計(jì)算量。

      參數(shù)量:

      計(jì)算量:

      由上式可得:

      根據(jù)式(5)可得,深度可分離卷積參數(shù)量和計(jì)算量明顯小于標(biāo)準(zhǔn)卷積,因此,采用DW卷積替換標(biāo)準(zhǔn)卷積能極大減少計(jì)算量,減輕模型體積,實(shí)現(xiàn)輕量化,為最終模型部署在小型嵌入式設(shè)備提供了可行的依據(jù)。

      分組卷積(group convolution,GC)把輸入特征通道數(shù)Cin和卷積核劃分為G組,每個(gè)卷積核的通道數(shù)為CinG,分組進(jìn)行卷積后,G組輸出拼接得到通道數(shù)為Cout的特征圖,其參數(shù)量大小為:

      由上式可知,標(biāo)準(zhǔn)卷積參數(shù)量是幾種不同卷積中參數(shù)量最大的,而分組卷積和深度可分離卷積的參數(shù)量都有一定程度的降低。其中,分組卷積的參數(shù)里是標(biāo)準(zhǔn)卷積的1G,同理,計(jì)算量也是標(biāo)準(zhǔn)卷積的1G。

      1.2 輕量化特征提取

      YOLOV5初始模型在特征提取階段易丟失小目標(biāo)特征信息,對(duì)小目標(biāo)的檢測(cè)效果有所降低,并且其網(wǎng)絡(luò)模型體積較大、參數(shù)量多、對(duì)硬件要求較高,對(duì)部署造成一定的困難。針對(duì)以上情況,本文在初始YOLOV5s網(wǎng)絡(luò)基礎(chǔ)上用輕量化的ShuffleNet v2[19]代替主干網(wǎng)絡(luò),減少參數(shù),實(shí)現(xiàn)網(wǎng)絡(luò)輕量化。

      ShuffleNet v2提出了通道混洗(channel shuffle,CS)的操作。通過(guò)將分組卷積得到輸出特征的不同通道信息均勻打亂,在不增長(zhǎng)計(jì)算量的情況下,保證分組卷積之后不同組的特征圖之間實(shí)現(xiàn)特征通信,增強(qiáng)特征提取效果。如圖2所示為ShuffleNet v2基本模塊。單元1中將輸入特征通道數(shù)分為兩組,左側(cè)分支不作處理,右側(cè)進(jìn)行卷積操作和批量歸一化等處理,再將左分支的通道劃分特征與右分支卷積輸出特征進(jìn)行融合并進(jìn)行通道混洗,從而加強(qiáng)對(duì)兩分通道圖信息的融合。單元2左右分支均為降采樣操作,特征圖大小減半,維度加倍,由兩個(gè)單元共同組成ShuffleNet v2網(wǎng)絡(luò)結(jié)構(gòu),實(shí)現(xiàn)輕量化特征提取。

      圖2 ShuffleNet v2基本模塊Fig.2 Basic module of Shufflenet v2

      表1展示了改進(jìn)后的主干網(wǎng)絡(luò)提取特征的每個(gè)階段,采用計(jì)算量更小的DW卷積代替原先的最大池化卷積,可獲取更為豐富的特征圖。其中,Stage代表ShuffleNetv2基礎(chǔ)模塊,連續(xù)使用3個(gè)ShuffleNetv2模塊在不增加計(jì)算量的同時(shí)使得特征提取能力加強(qiáng),再使用1×1卷積擴(kuò)充通道數(shù),獲取大感受野下的目標(biāo)特征信息;最后,使用全局池化替代全連接層進(jìn)行融合空間信息,同時(shí)也可防止過(guò)擬合,提高泛化能力。

      表1 改進(jìn)后的主干網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)Table 1 Structure parameters of improved backbone network

      1.3 特征融合網(wǎng)絡(luò)

      YOLOv5采用PANet進(jìn)行特征融合,采用自頂向下和自底向上構(gòu)建不同shape的特征層的方式進(jìn)行融合。通過(guò)淺層與深層的特征融合,使得網(wǎng)絡(luò)充分提取到網(wǎng)絡(luò)中各個(gè)層次的特征,從而加強(qiáng)特征提取,得到更為豐富的特征信息(強(qiáng)語(yǔ)義信息和邊緣、紋理等細(xì)節(jié)信息)。因此,為進(jìn)一步研究高效的多尺度特征融合方式,達(dá)到更好的目標(biāo)檢測(cè)效果,本文改進(jìn)特征融合層的連接方式,使用BiFPN進(jìn)行特征融合。BiFPN在PANet基礎(chǔ)上引入了上下文信息和權(quán)重信息平衡不同尺度,通過(guò)添加一條額外的邊,在不增加cost的同時(shí)可融合更多的特征,實(shí)現(xiàn)簡(jiǎn)單快速的多尺度特征融合,獲取更大的感受野和清晰的目標(biāo)位置和豐富的語(yǔ)義信息。Neck層網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。

      圖3 Neck層網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Network structure of Neck layer

      1.4 損失函數(shù)改進(jìn)

      YOLOV5的損失函數(shù)由三部分組成,包括位置、置信度和類(lèi)別損失。其中,使用GIOU損失函數(shù)預(yù)測(cè)目標(biāo)框的位置回歸損失,BCE損失函數(shù)預(yù)測(cè)類(lèi)別和置信度損失:

      其中,LIOU=b?bgt b?bgt,b為真實(shí)框,bgt為預(yù)測(cè)框,C為包含b和bgt檢測(cè)框的最小矩形框。

      對(duì)于針對(duì)邊界框回歸任務(wù)位置損失,GIOU采取先擴(kuò)大并集面積再實(shí)施優(yōu)化IOU的方式,并以閉包的面積減去并集的面積作為懲罰項(xiàng),不能反映真實(shí)框與預(yù)測(cè)框距離(重合度)和loss為0時(shí)梯度無(wú)法回傳的情況。而CIOU存在寬和高不能同時(shí)增大或者減小的問(wèn)題。

      本文采用EIOU[20]損失函數(shù),考慮了中心點(diǎn)距離、長(zhǎng)寬邊長(zhǎng)真實(shí)差的問(wèn)題,解決了GIoU存在的不足和CIOU縱橫比的模糊的情況(將CIOU縱橫比的影響因子拆開(kāi)分別計(jì)算目標(biāo)框和錨框的長(zhǎng)和寬)。EIOU直接對(duì)w和h的預(yù)測(cè)結(jié)果進(jìn)行懲罰,如式(9),由三部分組成,包括重疊、中心距離、寬高三種情況的損失。重疊和中心距離部分沒(méi)做改動(dòng),繼續(xù)使用沿用CIOU的方法,加入寬高損失解決了CIOU寬和高不能同時(shí)增大或者減小的問(wèn)題,使目標(biāo)框和預(yù)測(cè)框之間的寬高之差最小。引入的EIOU損失函數(shù)收斂更快,回歸精度更高。

      其中,cw、ch、ρ分別是覆蓋兩個(gè)box的最小外接框的寬度、高度和b和bgt之間的歐式距離,w,h,wgt,hgt分別為預(yù)測(cè)框的和真實(shí)框的寬高。

      2 實(shí)驗(yàn)與結(jié)果分析

      2.1 數(shù)據(jù)集準(zhǔn)備

      本文以COCO數(shù)據(jù)集為研究對(duì)象,提取5類(lèi)常見(jiàn)室內(nèi)目標(biāo)樣本:vase、apple、tv、laptop、refrigerator,總共13 441張,隨機(jī)選取80%做訓(xùn)練集。訓(xùn)練前對(duì)所有數(shù)據(jù)進(jìn)行Mosaic數(shù)據(jù)增強(qiáng)、初始化、歸一化等處理。如圖4所示為目標(biāo)樣本及其標(biāo)簽分布情況。

      圖4 數(shù)據(jù)標(biāo)簽分布Fig.4 Data label distribution

      2.2 實(shí)驗(yàn)環(huán)境及配置

      選用Ubuntu20.04為主要操作系統(tǒng),利用Pytorch搭建神經(jīng)網(wǎng)絡(luò)模型,硬件平臺(tái)NVIDIA GeForce RTX 2080Ti,運(yùn)行內(nèi)存為11 GB。采用COCO數(shù)據(jù)集預(yù)訓(xùn)練權(quán)重和余弦退火、預(yù)熱學(xué)習(xí)率的方式來(lái)進(jìn)一步收斂損失函數(shù)。如表2為訓(xùn)練的初始化參數(shù)。

      表2 初始化參數(shù)Table 2 Initialization parameters

      2.3 評(píng)價(jià)指標(biāo)

      深度學(xué)習(xí)目標(biāo)檢測(cè)算法的性能主要通過(guò)精確率(precision)、召回率(recall)、均值平均精度(mean average precision,mAP)等評(píng)價(jià)指標(biāo)來(lái)體現(xiàn)。

      精確率(precision)又稱(chēng)為查準(zhǔn)率,被正確預(yù)測(cè)的正樣本TP占所有檢出(預(yù)測(cè)為正)樣本的百分比例,是針對(duì)預(yù)測(cè)結(jié)果。

      其中,TP是正確預(yù)測(cè)為正樣本的樣本,F(xiàn)P為錯(cuò)誤地預(yù)測(cè)為正樣本的樣本。

      召回率(recall),又稱(chēng)為查全率,被正確預(yù)測(cè)的正樣本TP占所有正樣本(ground truth)的比例,是針對(duì)原樣本。

      其中,F(xiàn)N是錯(cuò)誤預(yù)測(cè)為負(fù)樣本的樣本。

      如圖5所示為precision-recall曲線,用于評(píng)估模型性能,橫坐標(biāo)為查全率recall,縱坐標(biāo)為查準(zhǔn)率precision,曲線與坐標(biāo)軸的面積代表該類(lèi)別的平均精度AP。曲線上各個(gè)點(diǎn)代表當(dāng)前的精度值,曲線之上的點(diǎn)為正樣本,反之為負(fù)樣本。隨著precision降低,recall不斷增大,更多的樣本判為正樣本。由曲線可看出,曲線A檢測(cè)性能優(yōu)于曲線B,曲線B優(yōu)于曲線C,可得到曲線越往右上角凸檢測(cè)性能越好。

      圖5 Precision-recall曲線Fig.5 Curve of precision-recall

      2.4 算法對(duì)比

      為進(jìn)一步驗(yàn)證本文YOLOv5s算法的優(yōu)勢(shì),通過(guò)與YOLOv4算法對(duì)比發(fā)現(xiàn),YOLOv5s算法雖在精度上比YOLOv4有略微降低,但是其參數(shù)量和計(jì)算量大小卻有大幅度的降低,表明其模型復(fù)雜度和參數(shù)量的下降,能滿足輕量化的要求。表3為YOLOV5s與YOLOv4算法的對(duì)比,如圖6顯示了YOLOV4算法在不同類(lèi)別上的AP及mAP。YOLOv5s初始算法mAP為60.1%,F(xiàn)LOPS為15.9×109,Params為7.03×106。

      表3 不同算法對(duì)比Table 3 Comparison of different algorithms

      圖6 YOLOv4目標(biāo)檢測(cè)結(jié)果Fig.6 YOLOv4 target detection results

      2.5 輕量化實(shí)驗(yàn)對(duì)比

      為證明本文研究?jī)?nèi)容的可靠性,本文采取多組對(duì)比實(shí)驗(yàn)來(lái)確認(rèn)本方法相比其他輕量化方法的存在的優(yōu)勢(shì)。表4顯示了不同主干網(wǎng)絡(luò)下目標(biāo)檢測(cè)算法的檢測(cè)性能。可發(fā)現(xiàn)Mobilenet v3輕量化主干網(wǎng)絡(luò)相比于ShuffleNet v2模型復(fù)雜度更低,mAP值相對(duì)下降偏高,難以保障檢測(cè)性能。本文研究目的需在輕量化的同時(shí)也需保障整體檢測(cè)性能,因此,本文選用ShuffleNet v2作為主干特征提取網(wǎng)絡(luò),實(shí)現(xiàn)模型輕量化。

      表4 輕量化網(wǎng)絡(luò)對(duì)比Table 4 Lightweight network comparison

      2.6 消融實(shí)驗(yàn)

      選用ShuffleNet、ECA、BiFPN、EIOU方法分別作為獨(dú)立的變量模塊,采取控制變量的方法研究各個(gè)方法在YOLOv5s網(wǎng)絡(luò)上的改進(jìn)效果。表5為消融實(shí)驗(yàn)[21]結(jié)果,顯示了各個(gè)方法改進(jìn)的效果和融合效果,實(shí)驗(yàn)結(jié)果得出了適用于本文研究的室內(nèi)輕量化目標(biāo)檢測(cè)方法。

      表5 消融實(shí)驗(yàn)結(jié)果Table 5 Ablation experiment results

      由表5可知,ShuffleNet v2、BiFPN、EIOU單個(gè)模塊均能達(dá)到預(yù)期的效果,BiFPN、EIOU在mAP上有大幅改善,而ShuffleNet v2雖在精度上有所降低,但其參數(shù)量和模型復(fù)雜度均下降,滿足輕量化需求。ECA注意力機(jī)制在本實(shí)驗(yàn)中并未達(dá)到理想的效果,因此不采用。故本文最終選用ShuffleNet v2、BiFPN、EIOU方法對(duì)YOLOV5進(jìn)行改進(jìn),實(shí)現(xiàn)輕量化和精度的提升。

      如表6是基于消融實(shí)驗(yàn)的各類(lèi)別的平均精度AP,其中tv的AP值較高,而apple的AP值最低。結(jié)合實(shí)驗(yàn)結(jié)果和樣本數(shù)據(jù)標(biāo)簽分布情況可以發(fā)現(xiàn),大目標(biāo)樣本的整體檢測(cè)性能高于小目標(biāo)樣本,而訓(xùn)練數(shù)據(jù)樣本數(shù)量越多,檢測(cè)結(jié)果越好。改進(jìn)后的YOLOv5s算法在檢測(cè)精度上有明顯改善,可極大地提升室內(nèi)目標(biāo)檢效果。

      表6 不同方法檢測(cè)下的APTable 6 AP under different methods to detect單位:%

      圖8 改進(jìn)后YOLOv5s的P-R曲線Fig.8 P-R curve of improved YOLOv5s

      2.7 目標(biāo)檢測(cè)實(shí)驗(yàn)分析

      使用相同的數(shù)據(jù)集和參數(shù)對(duì)原始YOLOv5s模型和改進(jìn)YOLOv5s模型進(jìn)行訓(xùn)練和測(cè)試,取IOU閾值為0.5時(shí),得到如圖7、8的P-R曲線圖。對(duì)應(yīng)曲線與橫縱坐標(biāo)圍成的面積為該類(lèi)別的AP,曲線越靠近右上角,則AP越大,效果越好其中,5條細(xì)曲線由左下到右上分別代表apple、vase、refrigerator、laptop、tv,藍(lán)實(shí)線代表5類(lèi)的均值平均精度mAP,圖例處顯示為每類(lèi)目標(biāo)的AP。通過(guò)對(duì)比發(fā)現(xiàn)每類(lèi)AP值均有所上漲,檢測(cè)效果有大幅提升。

      圖7 YOLOv5s的P-R曲線Fig.7 P-R curve of YOLOv5s

      如圖9和圖10為改進(jìn)前后mAP對(duì)比,分別為取IOU閾值為0.5和0.5∶0.95(步長(zhǎng)0.05)時(shí)所有類(lèi)別的平均精確度。其中,藍(lán)線為改進(jìn)后的YOLOV5s曲線,紅線為YOLOv5s,由曲線可發(fā)現(xiàn),mAP閾值在兩個(gè)取值范圍內(nèi),改進(jìn)后的均值平均精度mAP皆有5個(gè)百分點(diǎn)的提升。由圖可以看出,本文改進(jìn)的算法在檢測(cè)性能整體均有提升。

      圖9 IOU閾值取0.5的mAPFig.9 IOU threshold is 0.5 mAP

      圖10 IOU閾值?。?.5∶0.95)的MAPFig.10 IOU threshold is(0.5∶0.95)mAP

      由實(shí)驗(yàn)得到表7數(shù)據(jù),改進(jìn)后的計(jì)算量減小到9.2×109,參數(shù)量減少到4.01×106,mAP提升到63.9%,改進(jìn)的YOLOv5算法讓檢測(cè)性能得到進(jìn)一步的提升,實(shí)現(xiàn)了輕量化和精度的平衡,解決了現(xiàn)有模型檢測(cè)速度與精度無(wú)法平衡的問(wèn)題。

      表7 改進(jìn)前后實(shí)驗(yàn)結(jié)果對(duì)比Table 7 Comparison of experimental results before and after improvement

      如圖11和圖12分別是兩個(gè)不同場(chǎng)景下的目標(biāo)檢測(cè)情況。其中,圖(a)代表改進(jìn)前的檢測(cè)結(jié)果,圖(b)代表改進(jìn)后的檢測(cè)結(jié)果。由圖可以看出,改進(jìn)后的漏檢率明顯少于前者,且預(yù)測(cè)置信度也高于改進(jìn)前,改后的檢測(cè)效果明顯提升,驗(yàn)證了改進(jìn)后模型的有效性。

      進(jìn)一步驗(yàn)證本文改進(jìn)算法的可移植性和通用性,在VOC2012數(shù)據(jù)集上進(jìn)行驗(yàn)證,包含室內(nèi)外不同場(chǎng)景下的20類(lèi)目標(biāo),其類(lèi)別及對(duì)應(yīng)標(biāo)簽分布如圖13,檢測(cè)結(jié)果如表8。

      圖13 類(lèi)別標(biāo)簽分布Fig.13 Category label distribution

      通過(guò)對(duì)比表8的數(shù)據(jù)可發(fā)現(xiàn),在VOC2012數(shù)據(jù)集上本文研究的改進(jìn)算法也能有效提升檢測(cè)性能。相比于改進(jìn)前mAP降低了一點(diǎn),但模型復(fù)雜度和參數(shù)量有了極大的減少,保障了輕量化的實(shí)現(xiàn)。進(jìn)一步驗(yàn)證本文改進(jìn)算法的通用性,不僅對(duì)于室內(nèi)目標(biāo),對(duì)于室外等其他場(chǎng)景下的目標(biāo)檢測(cè)均能實(shí)現(xiàn)輕量化的需求,且能保障其精度不受太大影響。

      表8 VOC2012數(shù)據(jù)集下檢測(cè)結(jié)果Table 8 Test results under VOC2012 dataset

      3 總結(jié)

      本文提出了一種基于YOLOv5的輕量化目標(biāo)檢測(cè)算法,改進(jìn)了主干網(wǎng)絡(luò)、特征融合及損失函數(shù),提高了模型的檢測(cè)性能,使得該模型在輕量化和準(zhǔn)確率上有顯著提升。該算法在實(shí)驗(yàn)中檢測(cè)效果較好,檢測(cè)精度和實(shí)時(shí)性達(dá)到了很好的平衡。其中,目標(biāo)檢測(cè)平均準(zhǔn)確率mAP達(dá)到了63.9%,提高了3.8個(gè)百分點(diǎn),參數(shù)量為4.01×106,減少了42.9%,模型復(fù)雜度減少了42.1%,極大地縮減了檢測(cè)時(shí)間,提升了檢測(cè)精度。該模型可以滿足實(shí)際部署中輕量化和檢測(cè)的實(shí)時(shí)性等需求。但室內(nèi)環(huán)境復(fù)雜,目標(biāo)檢測(cè)算法難以獲取其三維目標(biāo)位置信息。在后續(xù)研究中,將重點(diǎn)對(duì)目標(biāo)物在室內(nèi)空間中三維信息的獲取進(jìn)行深入探究,以提升模型在實(shí)際場(chǎng)景中的應(yīng)用價(jià)值。

      猜你喜歡
      輕量化特征提取卷積
      汽車(chē)輕量化集成制造專(zhuān)題主編
      基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
      從濾波器理解卷積
      電子制作(2019年11期)2019-07-04 00:34:38
      一種輕量化自卸半掛車(chē)結(jié)構(gòu)設(shè)計(jì)
      基于Daubechies(dbN)的飛行器音頻特征提取
      電子制作(2018年19期)2018-11-14 02:37:08
      基于傅里葉域卷積表示的目標(biāo)跟蹤算法
      Bagging RCSP腦電特征提取算法
      瞄準(zhǔn)掛車(chē)輕量化 鑼響掛車(chē)正式掛牌成立
      用戶:輕量化掛車(chē)的使用體驗(yàn)
      基于MED和循環(huán)域解調(diào)的多故障特征提取
      铁岭县| 洛川县| 嵊泗县| 巢湖市| 洛川县| 崇信县| 青川县| 濉溪县| 叙永县| 阳西县| 宁远县| 库尔勒市| 涟水县| 义乌市| 洛阳市| 屏边| 资源县| 清流县| 南木林县| 长丰县| 芦溪县| 万山特区| 孙吴县| 酒泉市| 桑植县| 永川市| 安宁市| 娄底市| 安平县| 澎湖县| 宁武县| 靖边县| 南昌县| 阿尔山市| 呼图壁县| 陆良县| 日喀则市| 长垣县| 竹溪县| 屏山县| 衡水市|