王燕妮,劉 祥,劉 江
(1.西安建筑科技大學(xué)信息與控制工程學(xué)院,陜西 西安 710055;2.西安現(xiàn)代控制技術(shù)研究所,陜西 西安 710065)
目標(biāo)檢測(cè)作為計(jì)算機(jī)視覺領(lǐng)域中重要的研究方向和研究熱點(diǎn)[1],其任務(wù)可以分為“識(shí)別”和“定位”兩部分。它是進(jìn)行場(chǎng)景內(nèi)容理解等高級(jí)視覺任務(wù)的前提[2],并廣泛應(yīng)用于紅外探測(cè)技術(shù)、智能視頻監(jiān)控、遙感影像目標(biāo)檢測(cè)和醫(yī)療診斷等任務(wù)中[3-6]。目標(biāo)檢測(cè)算法可以分為傳統(tǒng)目標(biāo)檢測(cè)算法和基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法。
傳統(tǒng)目標(biāo)檢測(cè)算法有尺度不變特征變換算法[7](scale invariant feature transform)和傳統(tǒng)人臉檢測(cè)算法等[8](Viola-Jones),但該類方法時(shí)間復(fù)雜度高且魯棒性較差。
基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法,可分為兩階段目標(biāo)檢測(cè)算法和單階段目標(biāo)檢測(cè)算法。前者具有代表性的算法有R-CNN[9]算法、Fast R-CNN[10]算法和Faster R-CNN[11]算法。R-CNN利用選擇性搜索算法提取候選區(qū)域,通過卷積神經(jīng)網(wǎng)絡(luò)提取區(qū)域特征,最后通過支持向量機(jī)(SVM)[12]進(jìn)行分類;Fast R-CNN在R-CNN的基礎(chǔ)上,加入了感興趣區(qū)域,通過多任務(wù)損失函數(shù),實(shí)現(xiàn)端到端的訓(xùn)練;Faster R-CNN采用候選區(qū)域生成網(wǎng)絡(luò)(regional proposal networks,RPN)代替了選擇性搜索算法,提高了算法的速度和準(zhǔn)確率。單階段目標(biāo)檢測(cè)算法通過回歸直接在輸入圖像上輸出目標(biāo)的類別及邊框,典型的單階段目標(biāo)檢測(cè)算法有快速目標(biāo)檢測(cè)算法(you only look once,YOLO)[13]和單階段多框目標(biāo)檢測(cè)算法(single shot multibox detector,SSD)[14],YOLO采用全圖信息進(jìn)行預(yù)測(cè),極大地提高了檢測(cè)速率;SSD采用多尺度特征圖進(jìn)行檢測(cè),在提高檢測(cè)速度的同時(shí)也提高了檢測(cè)精度。
現(xiàn)階段目標(biāo)檢測(cè)算法中普遍存在檢測(cè)精度不夠高,誤檢和漏檢等問題。本文針對(duì)此問題,提出一種基于單階段網(wǎng)絡(luò)模型的目標(biāo)檢測(cè)改進(jìn)算法。
原始SSD目標(biāo)檢測(cè)算法采用VGG-16[15]作為基礎(chǔ)網(wǎng)絡(luò),并在其基礎(chǔ)上有進(jìn)一步的改進(jìn),網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。將VGG16的全連接層fc6和fc7轉(zhuǎn)換成conv6和conv7兩個(gè)卷積層;移除原本的dropout層和分類層;同時(shí)新增了4組卷積層來獲取更多的特征圖以用于檢測(cè);SSD目標(biāo)檢測(cè)算法采用卷積對(duì)不同尺度的特征圖進(jìn)行檢測(cè),分別對(duì)輸入圖像中目標(biāo)邊界框的位置和類別的置信度進(jìn)行預(yù)測(cè);最后通過非極大值抑制(non-maximum suppression,NMS)算法[16],得到最終的檢測(cè)結(jié)果。SSD采用多尺度的特征圖用于檢測(cè),大尺度特征圖用于小目標(biāo)檢測(cè),小尺度特征圖用于大目標(biāo)檢測(cè),通過這種策略,提高了對(duì)物體尺度變化的泛化能力。
SSD目標(biāo)檢測(cè)算法采用多尺度特征圖進(jìn)行檢測(cè),分別為conv4_3,conv7,conv8_2,conv9_2,conv10_2,conv11_2共6個(gè)特征圖,其大小分別是(38,38),(19,19),(10,10),(5,5),(3,3),(1,1);同時(shí)SSD借鑒了Faster R-CNN中錨點(diǎn)框的概念,通過在各個(gè)特征圖上設(shè)置不同尺度和長寬比的候選框,來簡化訓(xùn)練的過程。對(duì)于候選框的尺度,按如下公式進(jìn)行計(jì)算:
(1)
式(1)中,m代表特征圖的個(gè)數(shù),sk表示候選框與圖片的比例,smax和smin代表比例的最大值和最小值,分別取值為0.9和0.2。利用式(1)可以得到各個(gè)候選框的尺度。
圖1 SSD網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 SSD network structure diagram
(2)
(3)
SSD目標(biāo)檢測(cè)算法中損失函數(shù)定義為位置損失(localization loss,loc)和置信度損失(confidence loss,conf)的加權(quán)和,計(jì)算公式如下:
(4)
式(4)中,N為匹配的候選框的數(shù)量;x∈{1,0}表示候選框是否與真實(shí)框匹配,若匹配,則x=1,反之x=0;c為類別置信度預(yù)測(cè)值;g為真實(shí)框的位置參數(shù);l為預(yù)測(cè)框的位置預(yù)測(cè)值;α權(quán)重系數(shù)一般設(shè)置為1。
對(duì)于SSD中的位置損失函數(shù),采用smooth L1 loss[17]損失函數(shù),對(duì)候選框的中心(cx,cy)及寬度(w)、高度(h)的偏移量進(jìn)行回歸。公式如下:
(5)
(6)
(7)
對(duì)于SSD中的置信度損失函數(shù),使用的是典型的softmax loss,其公式為:
(8)
為了對(duì)SSD算法的不足進(jìn)行改進(jìn),本文借鑒了深度殘差網(wǎng)絡(luò)[18]、特征融合[19]以及反卷積[20]的思想,對(duì)原始SSD算法進(jìn)行了修改,提出了改進(jìn)后的SSD算法。算法首先對(duì)原始SSD算法中的基礎(chǔ)網(wǎng)絡(luò)進(jìn)行修改,采用深度殘差網(wǎng)絡(luò)Resnet-50對(duì)原始算法中的VGG-16網(wǎng)絡(luò)進(jìn)行替換,并且新增了一個(gè)用于檢測(cè)的卷積層;結(jié)合反卷積與特征融合的思想,對(duì)修改后網(wǎng)絡(luò)所提取出的不同尺度的特征圖進(jìn)行融合;同時(shí)利用了在網(wǎng)絡(luò)中每個(gè)卷積層之后添加批規(guī)范化操作(batch normalization,BN)[21]的網(wǎng)絡(luò)搭建策略,以達(dá)到提高檢測(cè)能力的效果。
深度殘差網(wǎng)絡(luò)(resnet)克服了隨著網(wǎng)絡(luò)層數(shù)加深而出現(xiàn)的退化問題,極快地加深了深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,模型的準(zhǔn)確率也有了非常大的提升。
相比傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò),深度殘差網(wǎng)絡(luò)新增了殘差學(xué)習(xí)單元以解決退化問題,殘差學(xué)習(xí)單元與傳統(tǒng)單元的對(duì)比如圖2所示。
圖2 傳統(tǒng)單元和殘差學(xué)習(xí)單元對(duì)比Fig.2 Comparison between traditional units and residual learning units
圖2中,殘差學(xué)習(xí)單元在傳統(tǒng)單元的基礎(chǔ)上新疊加了y=x的恒等映射層,改變了網(wǎng)絡(luò)的學(xué)習(xí)目標(biāo),將原始所需要學(xué)習(xí)的函數(shù)H(x)轉(zhuǎn)換為殘差F(x)=H(x)-x。曲線表示短路連接(shortcut connection),繞過了權(quán)重層,即使當(dāng)殘差F(x)=0時(shí),網(wǎng)絡(luò)也只是做了恒等映射,網(wǎng)絡(luò)的性能并不會(huì)下降,且在實(shí)際中殘差并不會(huì)為0,網(wǎng)絡(luò)在輸入特征的基礎(chǔ)上仍能學(xué)習(xí)到新的特征,從而擁有更好的性能;同時(shí)殘差學(xué)習(xí)單元中的疊加算法并不會(huì)給網(wǎng)絡(luò)增加額外的參數(shù)和計(jì)算量,且可以增加網(wǎng)絡(luò)的訓(xùn)練速度,提高網(wǎng)絡(luò)的訓(xùn)練效果。
在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上重復(fù)使用殘差學(xué)習(xí)單元,即可構(gòu)成深度殘差網(wǎng)絡(luò)。圖3為Resnet-50的網(wǎng)絡(luò)結(jié)構(gòu)圖,網(wǎng)絡(luò)大致由5個(gè)階段構(gòu)成,其中階段2、3、4、5中每個(gè)殘差學(xué)習(xí)單元都由三次卷積操作和短路連接構(gòu)成。
圖3 Resnet-50網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.3 Resnet-50 network structure diagram
反卷積,也稱為轉(zhuǎn)置卷積,是卷積操作的逆運(yùn)算,用于還原特征圖的尺寸大小,解決經(jīng)過一系列卷積運(yùn)算后特征圖分辨率變小的問題,擴(kuò)大感受野,卷積與反卷積的過程如圖4所示。
圖4 卷積和反卷積操作示意圖Fig.4 Convolution and Deconvolution operation diagram
圖4左側(cè)表示卷積過程,表示4×4的特征圖在3×3的卷積核作用下,得到的2×2特征圖;圖4右側(cè)表示反卷積過程,輸入特征圖大小為2×2,經(jīng)過填充補(bǔ)零操作,與大小為3×3的卷積核執(zhí)行反卷積操作,得到大小為4×4的特征圖。反卷積操作公式如下:
d=s(i-1)+k-2p
(9)
式(9)中,d為反卷積輸出特征圖,s為步長,i為輸入特征圖,k為卷積核尺寸,p為填充。通過反卷積操作,可以將高層特征圖中豐富的語音信息映射到底層特征圖中,使底層特征圖在擁有大量細(xì)節(jié)信息同時(shí)擁有足夠的語義信息,增強(qiáng)了網(wǎng)絡(luò)的辨識(shí)度。
在SSD算法中,采用VGG-16作為算法的基礎(chǔ)網(wǎng)絡(luò),結(jié)合新增的卷積層用于獲得輸入圖像的特征圖。前端基礎(chǔ)網(wǎng)絡(luò)所提取出的不同尺度的特征圖,其底層特征對(duì)應(yīng)細(xì)節(jié)信息,高層特征對(duì)應(yīng)抽象的語義信息[22]。若保存在底層特征圖上的目標(biāo)較小,那么底層特征圖在經(jīng)過一系列復(fù)雜的卷積操作后,得到的高層特征圖上保留的該目標(biāo)信息將會(huì)變得更少,對(duì)其的檢測(cè)也更加不敏感[23];因此,在SSD算法中,底層特征圖用于對(duì)小目標(biāo)進(jìn)行檢測(cè),高層特征圖用于對(duì)中、大型目標(biāo)進(jìn)行檢測(cè)。
如2.1節(jié)中所述,SSD算法分別采用conv4_3,conv7,conv8_2,conv9_2,conv10_2,conv11_2共6個(gè)特征圖對(duì)目標(biāo)進(jìn)行檢測(cè),但其中用于檢測(cè)小目標(biāo)的底層特征圖只有conv4_3一個(gè),所包含的細(xì)節(jié)信息不足,并且沒有充分利用高層語義信息;雖然還有5個(gè)高層特征圖輔助檢測(cè),但對(duì)小目標(biāo)特征的提取仍不夠充分,故導(dǎo)致對(duì)中、大型目標(biāo)的檢測(cè)效果比對(duì)小目標(biāo)檢測(cè)效果更好。
基礎(chǔ)網(wǎng)絡(luò)部分提取出的特征圖好壞,對(duì)整個(gè)算法有至關(guān)重要的作用,基礎(chǔ)網(wǎng)絡(luò)應(yīng)提取出更優(yōu)秀的特征,且要具有足夠高的分辨率;同時(shí)網(wǎng)絡(luò)要有足夠的深度,網(wǎng)絡(luò)的深度足夠深,網(wǎng)絡(luò)容量更大,非線性表達(dá)能力也越強(qiáng)。因此,采用深度殘差網(wǎng)絡(luò)Resnet-50來代替原本的VGG-16網(wǎng)絡(luò)。修改后的網(wǎng)絡(luò)輸入圖像尺寸為224×224,同時(shí)移除了Resnet-50的全連接層,在其基礎(chǔ)上新增一系列卷積層以獲得更多的特征圖用于進(jìn)行檢測(cè);其中在基礎(chǔ)網(wǎng)絡(luò)Resnet-50結(jié)構(gòu)中選取4個(gè)卷積層conv1_x,conv2_x,conv3_x,conv4_x,新增卷積層中選取3個(gè)卷積層conv5_x,conv6_x,conv7_x,共提取7個(gè)特征圖用于檢測(cè);相比原始SSD算法中的6個(gè)特征圖,本算法新增了一個(gè)底層特征圖,用于增強(qiáng)對(duì)圖像中小目標(biāo)物體檢測(cè)的能力。
同時(shí),結(jié)合反卷積與特征融合的思想,首先對(duì)Resnet-50基礎(chǔ)網(wǎng)絡(luò)部分提取出的尺寸為7×7的conv4_x特征圖進(jìn)行反卷積操作,再利用卷積操作進(jìn)行特征提取,與尺寸為56×56的conv1_x特征圖進(jìn)行融合,通過對(duì)具有豐富語義信息的高層特征圖與具有豐富細(xì)節(jié)信息的底層特征圖的融合操作,使形成的新特征圖同時(shí)具備原本兩個(gè)特征層的優(yōu)點(diǎn),并與其他特征圖一起用于檢測(cè)。本文使用的特征融合方式為element sum融合方式,直接對(duì)兩個(gè)的特征圖相加,沒有改變特征圖的通道數(shù),融合后的新特征圖在同一維度下的信息量增多;由于基礎(chǔ)網(wǎng)絡(luò)的替換以及特征融合操作本身就引入了大量額外參數(shù)和計(jì)算量,為了盡量減少計(jì)算量,選取該融合方式進(jìn)行融合。融合操作示意圖如圖5所示。
圖5 element sum融合示意圖Fig.5 element sum fusion diagram
網(wǎng)絡(luò)還利用了在每個(gè)卷積層后添加批規(guī)范化操作的網(wǎng)絡(luò)搭建策略,加快了模型訓(xùn)練的收斂速度;通過對(duì)網(wǎng)絡(luò)輸入的均值和方差進(jìn)行縮放,使其調(diào)整到一個(gè)合適的范圍,防止產(chǎn)生梯度爆炸和梯度消失;在一定程度上防止了過擬合的現(xiàn)象。
在得到特征圖之后,參照本文1.2節(jié)中候選框的生成規(guī)則,提取出的7個(gè)特征圖中每個(gè)單元分別設(shè)置4、4、6、6、6、4、4個(gè)不同的候選框,其中設(shè)置個(gè)數(shù)為4的候選框長寬比選{1,1,2,1/2},個(gè)數(shù)為6的候選框長寬比選{1,1,2,1/2,3,1/3},共17 340個(gè)框用于進(jìn)行檢測(cè),在增加用于檢測(cè)的特征層的基礎(chǔ)上,設(shè)置更多、更密集的檢測(cè)框以增強(qiáng)算法的檢測(cè)能力;分別通過使用3×3的卷積核對(duì)特征圖進(jìn)行卷積操作,得到檢測(cè)類別置信度和檢測(cè)框的位置。算法修改后的網(wǎng)絡(luò)各參數(shù)表和網(wǎng)絡(luò)結(jié)構(gòu)圖分別如表1和圖6所示。
表1 修改后網(wǎng)絡(luò)各參數(shù)值Tab.1 Modified basic network parameter values
圖6 改進(jìn)算法網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.6 Improved algorithm network structure diagram
本文的實(shí)驗(yàn)平臺(tái)為i7-8700處理器,NVIDIA GeForce TX1070Ti顯卡,基于深度學(xué)習(xí)框架Tensorflow實(shí)現(xiàn)。實(shí)驗(yàn)所用的數(shù)據(jù)集為PASCAL VOC數(shù)據(jù)集,是一套用于圖像識(shí)別和分類的標(biāo)準(zhǔn)化的數(shù)據(jù)集,該數(shù)據(jù)集中包含20個(gè)類別,分別為人、鳥、貓、牛、狗、馬、羊、飛機(jī)、自行車、船、巴士、汽車、摩托車、火車、瓶子、椅子、餐桌、盆栽植物、沙發(fā)、電視。其中VOC2007包含9 963張標(biāo)注過的圖片,共有標(biāo)注出的物體24 640個(gè);VOC2012包含11 540張標(biāo)注過的圖片,共有標(biāo)注出的物體27 450個(gè)。本文使用VOC2007和VOC2012數(shù)據(jù)集進(jìn)行訓(xùn)練,使用VOC2007進(jìn)行測(cè)試。訓(xùn)練時(shí)采用隨機(jī)梯度下降法(SGD),批量batchsize設(shè)置為32,初始學(xué)習(xí)率設(shè)置為0.001,動(dòng)量參數(shù)monmentum設(shè)置為0.9,學(xué)習(xí)率在迭代次數(shù)為180 000和230 000時(shí)調(diào)小90%,共訓(xùn)練280 000次。
目標(biāo)檢測(cè)算法中,通常使用mAP(mean average precision)來作為評(píng)價(jià)指標(biāo),mAP由查準(zhǔn)率和查全率構(gòu)成,公式如下:
Pprecision=TP/TP+FP
(5)
Precall=TP/TP+FN
(6)
式(5)、式(6)中,TP代表正樣本被正確識(shí)別的樣本,F(xiàn)P代表負(fù)樣本被錯(cuò)誤識(shí)別為正樣本的樣本,F(xiàn)N代表正樣本被錯(cuò)誤識(shí)別為負(fù)樣本的樣本。
目標(biāo)檢測(cè)算法中,檢測(cè)的每一個(gè)類別都會(huì)得到由查準(zhǔn)率和查全率構(gòu)成的曲線(P-R曲線),曲線下的面積就是平均精度值(AP值),即衡量模型在單獨(dú)一個(gè)類別上的評(píng)價(jià)指標(biāo)。對(duì)檢測(cè)的所有類別的AP值再求平均,即可得到mAP值,用以衡量模型在所有類別上的好壞,mAP值計(jì)算公式如下所示:
(5)
式(5)中,Q代表檢測(cè)中總類別數(shù)目,AP(q)代表檢測(cè)中第q類的AP值。
文中以VOC2007和VOC2012為訓(xùn)練集進(jìn)行訓(xùn)練,并在VOC2007上進(jìn)行測(cè)試,實(shí)驗(yàn)結(jié)果與其他主流模型對(duì)比如表2所示。
通過對(duì)表中數(shù)據(jù)分析,改進(jìn)后的算法在VOC2007數(shù)據(jù)集上的檢測(cè)精度達(dá)到78.5%,相較原始SSD算法提升了1.3%;但在檢測(cè)速度上,由于基礎(chǔ)網(wǎng)絡(luò)部分更加復(fù)雜,采用了更多更密集的檢測(cè)框,且引入了其他額外計(jì)算量,導(dǎo)致算法在檢測(cè)速度方面相較原始SSD算法有所下降,實(shí)時(shí)性較差。與其他模型對(duì)比,檢測(cè)精度均有較大提升,檢測(cè)精度相較基礎(chǔ)網(wǎng)絡(luò)為更復(fù)雜的Resnet-101的DSSD算法下降了0.1%,但檢測(cè)速度卻比DSSD算法更快。
為了更直觀地感受改進(jìn)后算法檢測(cè)精度的提升,在VOC2007測(cè)試集中選取圖片分別使用SSD算法和改進(jìn)后的算法進(jìn)行檢測(cè),限于篇幅限制,本節(jié)選取了6張測(cè)試集圖片進(jìn)行檢測(cè)精度的對(duì)比,對(duì)比圖如圖7—圖12所示。
圖7—圖12為原始SSD算法和改進(jìn)后算法檢測(cè)結(jié)果對(duì)比圖,圖中左側(cè)圖(a)均代表原始SSD算法檢測(cè)結(jié)果,圖中右側(cè)圖(b)代表改進(jìn)后算法的檢測(cè)結(jié)果。對(duì)比圖7可以看到在兩種算法均可以檢測(cè)出圖中目標(biāo)時(shí),改進(jìn)后的算法中檢測(cè)框的位置更加準(zhǔn)確,檢測(cè)出目標(biāo)的置信度值更高,檢測(cè)結(jié)果相比原始SSD算法更加準(zhǔn)確;對(duì)比圖8和圖9,改進(jìn)后的算法相較原始SSD算法可以檢測(cè)出更多目標(biāo),檢測(cè)效果更加準(zhǔn)確,有效改善了漏檢的現(xiàn)象;對(duì)比圖10,改進(jìn)后算法在可以檢測(cè)出更加微小目標(biāo)的情況下,對(duì)待檢測(cè)目標(biāo)的分類也更加準(zhǔn)確,改善了誤檢的現(xiàn)象;對(duì)比圖11,在待檢測(cè)目標(biāo)出現(xiàn)重疊覆蓋等現(xiàn)象時(shí),改進(jìn)后算法仍可以檢測(cè)出更多的目標(biāo);對(duì)比圖12,當(dāng)檢測(cè)圖片背景復(fù)雜度較高時(shí),原始SSD算法中待檢測(cè)目標(biāo)與背景很難分離,導(dǎo)致出現(xiàn)難以檢測(cè)到目標(biāo)的情況,改進(jìn)后的算法雖然仍存在一定漏檢現(xiàn)象,但還是可以檢測(cè)出圖中的目標(biāo)物體,較原始算法檢測(cè)能力上有了一定程度的提升。
表2 VOC2007測(cè)試集結(jié)果對(duì)比Tab.2 Comparison of VOC2007
圖7 兩種算法檢測(cè)結(jié)果對(duì)比圖1Fig.7 Comparison of the detection results of the two algorithms 1
圖8 兩種算法檢測(cè)結(jié)果對(duì)比圖2Fig.8 Comparison of the detection results of the two algorithms 2
圖9 兩種算法檢測(cè)結(jié)果對(duì)比圖3Fig.9 Comparison of the detection results of the two algorithms 3
圖10 兩種算法檢測(cè)結(jié)果對(duì)比圖4Fig.10 Comparison of the detection results of the two algorithms 4
圖11 兩種算法檢測(cè)結(jié)果對(duì)比圖5Fig.11 Comparison of the detection results of the two algorithms 5
圖12 兩種算法檢測(cè)結(jié)果對(duì)比圖6Fig.12 Comparison of the detection results of the two algorithms 6
本文提出一種基于單階段網(wǎng)絡(luò)模型的目標(biāo)檢測(cè)改進(jìn)算法。該算法首先采用Resnet-50網(wǎng)絡(luò)代替了原始基礎(chǔ)網(wǎng)絡(luò)VGG-16網(wǎng)絡(luò),增加一層用于檢測(cè)小目標(biāo)的底層特征圖;然后對(duì)高層特征圖和底層特征圖進(jìn)行特征融合,在同一特征圖中引入了豐富的上下文信息;設(shè)置更密集的檢測(cè)框,網(wǎng)絡(luò)搭建策略上,在每層卷積層后添加批規(guī)范化操作,使算法訓(xùn)練時(shí)收斂更快,防止產(chǎn)生過擬合。仿真實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的算法相較原始算法在檢測(cè)精度提升了1.3%,并且改善了原始算法中存在的漏檢、誤檢等問題;但由于改進(jìn)后的算法網(wǎng)絡(luò)復(fù)雜度較高,且引入了其他額外計(jì)算量,導(dǎo)致算法在檢測(cè)速度上有所下降。針對(duì)該問題,在后期研究中,擬采用更加優(yōu)秀,更加輕量化的網(wǎng)絡(luò)進(jìn)行改進(jìn),同時(shí)擬引入注意力機(jī)制,在提升檢測(cè)能力時(shí)優(yōu)化提高檢測(cè)速度。