• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    注意力機制改進輕量SSD模型的海面小目標檢測

    2022-04-24 09:53:44賈可心馬正華朱蓉李永剛
    中國圖象圖形學報 2022年4期
    關鍵詞:輕量化卷積特征

    賈可心,馬正華,朱蓉,李永剛

    1.常州大學計算機與人工智能學院,阿里云大數(shù)據(jù)學院,常州 213000;2.嘉興學院數(shù)理與信息工程學院,嘉興 314001

    0 引 言

    中國擁有廣闊的水域面積和大量海洋資源,隨著對海洋開發(fā)需求的不斷增長,無論對海洋資源勘探、無人艇避障還是目標攻擊等應用,海面目標檢測都是重要的研究課題(Zhao等,2014)。然而,海面復雜多變的環(huán)境和種類繁多的目標,對精確檢測海面目標提出了更高要求,特別是海面小目標檢測。進入21世紀以來,以大數(shù)據(jù)、人工智能為代表的新一代信息技術(shù)快速發(fā)展,為推動海洋事業(yè)發(fā)展做出了重要貢獻。深度學習模型強大的特征提取能力,使其在目標檢測技術(shù)中得到廣泛應用,使用深度學習模型進行海面目標檢測,可為海洋搜救、無人艇業(yè)務和智能船舶等提供技術(shù)支持。

    目標檢測技術(shù)主要包括基于圖像處理并結(jié)合機器學習算法的傳統(tǒng)目標檢測方法和基于深度學習的目標檢測方法,如圖1所示。

    圖1 目標檢測技術(shù)的主要研究方向Fig.1 Main research directions of object detection technology

    傳統(tǒng)的目標檢測方法主要有特征匹配法、背景差分法、幀差法和光流法。背景差分法、幀差法和光流法多用于運動目標檢測,特征匹配法適用于圖像目標檢測,主要分為區(qū)域選擇、特征提取和圖像分類3部分。雖然有一些檢測效果較好的傳統(tǒng)目標檢測方法,但面臨檢測精度低和檢測速度慢等問題。相比傳統(tǒng)目標檢測方法,基于深度學習的目標檢測方法在速度和準確率方面均有明顯優(yōu)勢。基于深度學習的目標檢測方法大致分為兩個研究方向:基于目標候選框檢測與卷積神經(jīng)網(wǎng)絡結(jié)合的two-stage目標檢測系列和基于回歸的一體化卷積網(wǎng)絡one-stage目標檢測系列。在two-stage系列中,以區(qū)域卷積神經(jīng)網(wǎng)絡(region convolutional neural network,R-CNN)的系列算法為代表算法,逐步實現(xiàn)端到端的目標檢測,檢測精度得到大幅提升,但網(wǎng)絡參數(shù)龐大,檢測速度較慢(Ren等,2017)。以單次檢測器YOLO(you only look once)(Redmon等,2016)和單網(wǎng)多尺度檢測器SSD(single shot multiBox detector)(Liu等,2016)為代表算法的one-stage系列算法,相比two-stage檢測器,檢測速度得到一定幅度提升,但定位精度有所下降,且仍有模型參數(shù)過大問題。

    基于深度學習的目標檢測方法通常是針對通用目標數(shù)據(jù)集設計的檢測模型,對于圖像中的小目標來說,檢測效果并不是很理想。定義小目標一般有根據(jù)絕對尺寸進行定義和根據(jù)相對尺寸進行定義兩種方式。根據(jù)絕對尺寸進行定義時,以COCO(common objects in context)數(shù)據(jù)集為例,尺寸小于32 × 32像素的目標即為小目標;根據(jù)相對尺寸進行定義時,國際光學工程學會(International Society of Photo-Optical Instrumentation Engineers,SPIE)將小目標定義為在256 × 256像素的圖像中目標面積小于80像素的目標,即目標面積小于圖像面積的0.12%。針對圖像中的小目標檢測,部分研究在現(xiàn)有檢測模型基礎上提出了一些改進方法。特征金字塔網(wǎng)絡(feature pyramid network,F(xiàn)PN)(Lin等,2017)采用多尺度特征融合方式,通過融合高層語義信息和低層位置信息后的結(jié)果來檢測目標,該方法是針對通用目標的檢測方法,在小目標檢測中起到了關鍵作用,但結(jié)果不可控。Bell等人(2016)提出利用上下文信息和多尺度特征改善小目標檢測效果。Yang等人(2016)提出根據(jù)候選區(qū)域尺寸大小提取不同卷積層特征,并使用級聯(lián)分類器快速提取不含目標的候選區(qū)域,提高了小目標的檢測精度和速度。檢測小目標可以通過使用高層特征圖來加強低層特征圖的語義信息(Cao等,2018)、增加圖像分辨率或融合高分辨率特征與低分辨率圖像的高維特征來解決(Menikdiwela等,2017),然而使用較高分辨率的圖像會增加計算開銷,對設備要求較高。Singh等人(2018)提出一種新的訓練思路,利用類似滑動窗口的碎片chips,先粗略定位正負樣本的所在區(qū)域,然后將該區(qū)域作為卷積網(wǎng)絡的輸入,進行精確檢測。該方法擺脫了模型訓練時對較高分辨率圖像的依賴,對小目標的檢測效果也有所提升,但實現(xiàn)過程相對復雜。感知生成對抗網(wǎng)絡(perceptual generative adversarial network,PGAN)(Li等,2017)使用生成對抗網(wǎng)絡(generative adversarial network,GAN)在卷積網(wǎng)絡中構(gòu)建特征,其中生成器生成小目標的超分表達,判別器能從生成的超分圖形中的檢測獲益量來計算損失值,然后交替執(zhí)行生成器和判別器網(wǎng)絡對抗訓練過程,利用大小目標的結(jié)構(gòu)相關性來增強小目標的表達,使其與對應大目標的表達相似,從而提高小目標檢測性能,但網(wǎng)絡構(gòu)建的特征在交通標志和行人檢測上下文中難以區(qū)分大小目標。Chen等人(2016)改進候選區(qū)域生成網(wǎng)絡,并結(jié)合上下文信息采用上采樣策略用于小目標檢測。Cheng等人(2018)和Ren等人(2018)通過添加上下文信息提高小目標檢測的檢測效果。Hu和Ramanan(2017)提出一種無約束條件下的低分辨率人臉檢測方法,通過在不同大小的模板上分別尋找對應大小的目標,采用超分辨率和細化網(wǎng)絡生成真實清晰的高分辨率圖像,并引入判別網(wǎng)絡對人臉與非人臉進行分類,從而增強人臉檢測算法的魯棒性,但對其他小目標的檢測效果有待驗證。另外,Kisantal等人(2019)通過對數(shù)據(jù)集進行預處理,利用過采樣和增強的方法提高小目標的檢測性能,但大目標的檢測效果會受到影響。

    目前,基于深度學習的目標檢測方法的研究更多集中于構(gòu)建更深的網(wǎng)絡,以達到提高檢測精度的目的,網(wǎng)絡模型一般存在參數(shù)量過于龐大,從而導致檢測速度過慢等問題,且大部分檢測效果優(yōu)秀的網(wǎng)絡僅能在高性能的圖形處理器(graphics processing unit,GPU)上運行,對設備計算能力要求較高,而壓縮模型又會影響模型的檢測精度。同時,海面圖像中目標復雜多樣,其中小目標相對較多,通用目標檢測模型和一些特定的小目標檢測模型對海面目標的檢測效果還有待驗證。因此,本文在標準的SSD目標檢測模型基礎上,結(jié)合Xception深度可分卷積神經(jīng)網(wǎng)絡結(jié)構(gòu),在保證一定檢測精度的情況下,提出了輕量化的SSD海面目標檢測模型。同時,基于提出的輕量化SSD海面目標檢測模型,引入輕量級注意力機制模塊,在壓縮模型的同時保證了目標檢測精度,并可有效實現(xiàn)對海面小目標的檢測,降低了小目標漏檢率。

    1 理論基礎

    1.1 標準的SSD目標檢測算法

    SSD目標檢測算法是Liu等人(2016)提出的一種one-stage深度學習目標檢測算法。標準的SSD目標檢測算法基于VGG-16(Visual Geometry Group network-16)網(wǎng)絡模型,刪除末端全連接層,添加輔助卷積層和池化層,提取特征的同時減小特征圖的尺寸,并在6個不同尺寸的特征圖上進行預測。標準的SSD目標檢測算法架構(gòu)細節(jié)如圖2所示。

    圖2 標準的SSD目標檢測算法架構(gòu)細節(jié)Fig.2 Architecture details of the standard SSD object detection algorithm

    SSD目標檢測算法結(jié)合了YOLO算法檢測速度快和區(qū)域候選網(wǎng)絡(region proposal network,RPN)定位精準的優(yōu)點,采用RPN中的多參考窗口技術(shù),進一步提出在多個分辨率的特征圖上進行檢測,訓練過程中融入難分樣本挖掘操作,對圖像中難分樣本進行聚焦,針對具有多種尺度的目標檢測效果較好,但對小目標的檢測通常效果不佳。

    1.2 Xception網(wǎng)絡結(jié)構(gòu)

    Xception(Chollet,2017)是谷歌公司繼inception后提出的inceptionV3的一種改進模型,采用深度可分卷積替換inceptionV3中的多尺寸卷積核。簡化的inception模塊如圖3所示。

    圖3 簡化版inception模塊Fig.3 Simplified inception module

    深度可分卷積是輕量化網(wǎng)絡的主要結(jié)構(gòu),由3 × 3和1 × 1卷積核組成,將標準卷積分為深度卷積和逐點卷積,即在輸入的每個通道獨立執(zhí)行空間卷積,再進行逐點卷積,將深度卷積的通道輸出映射到新的通道空間,簡化結(jié)構(gòu)如圖4所示,其主要作用是減少網(wǎng)絡參數(shù),加快網(wǎng)絡運行速度。

    圖4 簡化版Xception模塊Fig.4 Simplified Xception module

    Xception網(wǎng)絡是帶有殘差連接的深度可分卷積層的線性堆疊?;谏疃瓤煞志矸e,搭配線性殘差卷積網(wǎng)絡實現(xiàn)內(nèi)部結(jié)構(gòu)的每個塊,使得該結(jié)構(gòu)非常容易定義和修改,主要塊結(jié)構(gòu)有兩種,如圖5所示。

    圖5 Xception內(nèi)部塊結(jié)構(gòu)Fig.5 Internal block structure of Xception ((a)internal block A;(b)internal block B)

    1.3 注意力機制

    深度學習中的注意力機制借鑒了人類的視覺注意力機制,在快速掃描全局圖像的同時,獲得需要重點關注的目標區(qū)域,并對此區(qū)域投入更多的注意力資源,以獲取關注目標的細節(jié)信息,從而抑制其他無用信息。在計算能力有限的情況下,注意力機制是解決信息超載問題的一種分配方案,可將計算資源更多地分配給表征中較有價值的部分。

    近年來,在計算機視覺領域中注意力機制的應用逐漸增加,Wang等人(2017)提出使用一種基于注意力的可堆疊的殘差學習網(wǎng)絡結(jié)構(gòu),在前向過程中提取模型的注意力,使模型訓練更加簡單,且易優(yōu)化和學習,具有較好的性能。Hu等人(2018)通過顯式地建立通道間的依賴關系,使網(wǎng)絡能夠執(zhí)行動態(tài)通道特征,重新自適應地校準通道式的特征響應,提高了網(wǎng)絡的表征能力。受此啟發(fā),結(jié)合SSD目標檢測算法的特點,本文引入了輕量級注意力機制模塊進行進一步研究。

    2 本文模型

    本文在標準的SSD目標檢測模型基礎上,結(jié)合Xception深度可分卷積,提出了輕量SSD模型用于海面目標檢測,減少了網(wǎng)絡模型的參數(shù),使網(wǎng)絡模型輕量化得到體現(xiàn)。同時,為保證檢測精度,引入輕量級注意力機制模塊,降低了小目標的漏檢率,可有效檢測出圖像中的小目標。模型總體網(wǎng)絡結(jié)構(gòu)如圖6所示,架構(gòu)細節(jié)如圖7所示。

    圖6 本文模型總體網(wǎng)絡結(jié)構(gòu)Fig.6 The network structure of this model

    圖7 本文模型網(wǎng)絡架構(gòu)細節(jié)Fig.7 Network architecture details of this model

    2.1 基于Xception網(wǎng)絡的深度可分卷積特征提取網(wǎng)絡

    標準的SSD目標檢測模型采用VGG-16作為特征提取網(wǎng)絡,其中使用標準的卷積方式進行密集鏈接,參數(shù)量相對較大。而Xception網(wǎng)絡采用深度可分卷積,對過參數(shù)化的標準卷積進行壓縮,使網(wǎng)絡輕量化得到體現(xiàn)?;赬ception網(wǎng)絡的深度可分卷積特征提取網(wǎng)絡分為入口流(entry flow)、中間流(middle flow)和出口流(exit flow)3部分,共13個塊,其中entry flow有4個,exit flow有1個,主要由Xception內(nèi)部塊結(jié)構(gòu)A組成;middle flow有8個,主要由Xception內(nèi)部塊結(jié)構(gòu)B組成,結(jié)構(gòu)如圖8所示。

    圖8 特征提取網(wǎng)絡結(jié)構(gòu)Fig.8 Structure of the feature extraction network ((a)entry flow;(b)middle flow;(c)exit flow)

    本文模型使用深度可分卷積層替代標準卷積層,其中Xception網(wǎng)絡的entry flow替代VGG-16中的前4個塊,middle flow和exit flow替代VGG-16中的第5個塊,后接4個標準卷積層,作為整體特征提取網(wǎng)絡。同時,將其中6個卷積層生成的特征圖輸入到檢測模塊中進行回歸和分類,包括middle flow生成的特征圖、exit flow生成的特征圖以及后4個標準卷積層生成的特征圖。

    2.2 輕量級注意力機制模塊

    使用深度可分卷積可以減少參數(shù)量,但由于失去了大部分可調(diào)參數(shù),在一定程度上犧牲了檢測精度。為保證輕量化后的SSD目標檢測模型的檢測精度,本文引入輕量級注意力機制模塊(lightweight attention modules,LAM)來提升目標的檢測效果。

    輕量級注意力機制模塊對輸入的特征層進行全局平均池化,再分別采用線性整流函數(shù)ReLU(rectified linear unit)和hard-swish激活函數(shù)進行兩次全連接,通過調(diào)整通道的權(quán)重,達到選擇更具有價值的特征信息的目的。LAM結(jié)構(gòu)中使用的激活函數(shù)ReLU和hard-swish為

    relu(x)=min(max(x,0),6)∈[0,6]

    (1)

    (2)

    式中,變量x為輸入圖像,relu表示激活函數(shù)ReLU,h-swish表示激活函數(shù)hard-swish,該函數(shù)類似于sigmoid激活函數(shù),可以減少運算量,提高性能。LAM結(jié)構(gòu)如圖9所示。

    圖9 輕量級注意力機制模塊結(jié)構(gòu)Fig.9 Structure of lightweight attention mechanism module

    3 實驗與分析

    3.1 實驗平臺

    在Windows10 64位操作系統(tǒng)上搭建深度學習開發(fā)環(huán)境,選用PyCharm作為集成開發(fā)環(huán)境,實驗框架基于Python語言實現(xiàn)。主要配置為16.0 GB內(nèi)存,Intel Core i7-9750H @ 2.60 GHz CPU,顯卡(GPU)型號為NVIDIA GeForce RTX 2060,顯存6 GB,顯卡計算能力為7.5。深度學習開發(fā)環(huán)境為JetBrains PyCharm Community Edition 2017.2.4 x64,Python 3.6.5,CUDA 9.0,cuDNN7.6.4.38,tensorflow-GPU 1.9.0和Keras 2.2.0。

    3.2 實驗數(shù)據(jù)

    實驗原始數(shù)據(jù)來源于海洋障礙檢測數(shù)據(jù)集MODD 2(marine obstacle detection dataset 2)(Bovcon等,2018)。該數(shù)據(jù)集圖像由船(boat)和浮標(buoy)等海面物體組成,原始圖像大小為1 278 × 958像素,本文實驗采用其中5 050幅圖像,檢測目標設定為船(boat)和浮標(buoy)兩類,并將圖像直接縮小到300 × 300像素,如圖10所示,其中包含目標的圖像共3 823幅,包含船的圖像2 571幅,包含浮標的圖像2 041幅,隨機選取2 140幅圖像用于訓練,1 147幅圖像用于測試,通過標注軟件(LabelImg)對船和浮標進行標定,按照VOC2007(visual object class 2007)數(shù)據(jù)集格式進行處理,包含目標總數(shù)為5 019,其中標簽boat的數(shù)量為2 840,標簽buoy的數(shù)量為2 179,構(gòu)建海面目標檢測數(shù)據(jù)集,并定義本數(shù)據(jù)集中所占像素面積小于32 × 32像素的目標為小目標。據(jù)實驗統(tǒng)計,本數(shù)據(jù)集標簽boat的小目標數(shù)量為1 150,標簽buoy的小目標數(shù)量為1 408。

    圖10 原始數(shù)據(jù)集Fig.10 Original dataset

    由于本文選取的海面目標檢測的數(shù)據(jù)集樣本量不大,若直接使用該數(shù)據(jù)集從零開始進行訓練會導致網(wǎng)絡收斂速度慢,檢測效果也會受到一定影響。因此,采用遷移學習的方法,利用預訓練的模型,對本文數(shù)據(jù)集進行微調(diào)訓練。同時,在對海面圖像采集設備不做高要求的基礎上,一般采集到的海面圖像分辨率相對較低,為使本文模型在此情況下也有較好的檢測效果,在訓練模型前,將圖像直接縮小至300 × 300像素。圖像縮小后對原始圖像中的小目標的分辨率會有一定的影響,后續(xù)工作中將考慮直接使用原始圖像進行實驗,并將圖像縮小后的實驗結(jié)果與直接使用原始圖像的實驗結(jié)果進行對比,為得到檢測效果更好的網(wǎng)絡模型做準備。

    3.3 實驗分析

    訓練過程中,對輸入圖像進行歸一化處理,縮小為300 × 300像素的RGB圖像,基于Xception在COCO數(shù)據(jù)集上預訓練的模型進行訓練,使用模型參數(shù)量(model parameters,params)、浮點計算量(floating-point operations per second,F(xiàn)LOPs)、每秒內(nèi)可處理的圖像數(shù)量(frames per second,F(xiàn)PS)、檢測精度(precision rate)和漏檢率(miss rate)對模型進行評估,并采用平均精度均值(mean average precision,mAP)評估模型在本文數(shù)據(jù)集上的各類別的性能。檢測精度和漏檢率的計算公式為

    (3)

    (4)

    式中,fprce表示檢測精度,fmiss表示漏檢率,TP(true positives)為真正例,即同一真實標簽只計算一次情況下,交并比 (intersection-over-union,IoU)>0.5的檢測框數(shù)量;FP(false positives)為假正例,即IoU≤ 0.5的檢測框或檢測到同一真實標簽的多余檢測框數(shù)量;FN(false negatives)為假負例,即未檢測到的真實標簽數(shù)量。

    3.3.1 實驗1

    實驗使用基于Xception網(wǎng)絡的深度可分卷積特征提取網(wǎng)絡替換VGG-16骨干網(wǎng)絡,并通過控制變量,對比不同網(wǎng)絡模型的檢測效果,包括基于VGG-16的SSD網(wǎng)絡(SSD + VGG-16模型)、基于Mobilenet的SSD網(wǎng)絡(SSD + Mobilenet模型)以及基于Xception的SSD網(wǎng)絡(SSD + Xception模型)。

    4種模型的浮點運算量如表1所示,標準的SSD目標檢測模型的浮點運算集中于乘(Mul)和加(Add)運算,計算量較大,內(nèi)存訪問成本較高;其他模型則通過減少Mul和Add運算,提高內(nèi)存的讀寫速度,從而達到網(wǎng)絡輕量化的效果。

    表1 4種模型的浮點運算量Table 1 Floating-point operations of four models

    4種模型的輕量化評價指標的實驗結(jié)果如表2所示。對比第1行和第2行結(jié)果可以看出,Mul和Add運算的大量減少使得以Mobilenet為特征提取網(wǎng)絡的目標檢測模型的參數(shù)量和浮點運算量均有所降低,同時每秒內(nèi)可處理圖像的數(shù)量有所增加,但檢測模型的輕量化導致其特征表達能力降低,從而影響了檢測精度,mAP降低了2.28%。對比第1行和第3行結(jié)果可以看出,以Xception為特征提取網(wǎng)絡的SSD + Xception目標檢測模型轉(zhuǎn)化一定量的Mul和Add運算,使其參數(shù)量降低了19.01%,浮點運算量降低了18.40%,保證了模型的特征表達能力,在減少參數(shù)量和浮點運算量的同時,保持每秒內(nèi)處理圖像數(shù)量基本不變,檢測精度降低較少,達到了在保證一定的檢測精度情況下,對網(wǎng)絡輕量化的效果。

    表2 4種模型的輕量化評價指標的實驗結(jié)果Table 2 Experimental results of lightweight evaluation indexes of four models

    3.3.2 實驗2

    實驗以基于Xception特征提取網(wǎng)絡的SSD+ Xception目標檢測模型為輕量化SSD模型,分別在不同輸出層引入輕量級注意力機制模塊來提高模型的檢測精度,并進行檢測效果對比,實驗結(jié)果如表3所示。

    表3 不同輸出層引入輕量化注意力機制對實驗結(jié)果的影響Table 3 Effects of different output layers on experimental results by introducing lightweight attention mechanism /%

    雖然網(wǎng)絡高層的特征語義信息比較豐富,但隨著網(wǎng)絡逐層升高,圖像中的小目標的特征語義信息逐漸淡化,使得檢測過程中小目標易漏檢。網(wǎng)絡低層的特征語義信息較少,但小目標的特征語義信息明確,且目標位置準確,在低層引入注意力機制模塊可以將注意力集中在部分顯著或感興趣的信息上,對小目標的特征語義信息表達起到一定積極作用。

    從表3可以看出,在不同輸出層引入LAM得到的mAP也不同。在6個特征層均引入LAM的情況下,mAP反而有所下降,隨著LAM在特征層的引入逐漸趨于低層化,mAP逐漸增加,在中間流、出口流和卷積層1分別引入LAM時,mAP達到局部最大值。單獨在出口流引入LAM時,與未引入LAM的輕量化SSD模型相比,mAP提高了0.11%。在出口流和卷積層1分別引入LAM時,檢測效果最好,與未引入LAM的輕量化SSD模型相比,mAP提高了1.22%。

    本文模型為在出口流和卷積層1分別引入LAM的輕量化SSD目標檢測模型,與其他改進SSD模型的目標檢測效果評價指標進行對比,實驗結(jié)果如表4和圖11—圖15所示。綜合表2的實驗結(jié)果,對比本文模型和其他3種模型的目標檢測效果,與SSD+Mobilenet和SSD + Xception兩種模型相比,雖然本文模型的參數(shù)量和浮點計算量有所增加,但檢測效果也有所增強,甚至部分指標超過了標準SSD目標檢測模型;與標準SSD目標檢測模型相比,本文模型每秒處理圖像的數(shù)量基本不變,并且在參數(shù)量降低16.26%、浮點運算量降低15.65%的情況下,buoy的平均精度提高了1.1%,漏檢率減小了3%,mAP提高了0.51%,同時保證了boat的平均檢測精度,提高了檢測準確率。

    表4 4種模型的目標檢測效果評價指標的實驗結(jié)果Table 4 Experimental results of object detection effect evaluation indexes of four models /%

    圖11 mAP及兩類目標AP的實驗結(jié)果Fig.11 Experiment results of mAP and two kinds of objects AP

    圖12 boat類精確率—召回率曲線Fig.12 Precision-recoll(P-R)curves of boat class

    圖13 buoy類精確率—召回率曲線Fig.13 Precision-recoll(P-R)curves of buoy class

    圖14 FP與TP檢測結(jié)果Fig.14 Detection results of FP and TP

    圖15 漏檢率實驗結(jié)果Fig.15 Experimental results of missing rate

    使用本文模型和其他模型分別對圖像中的小目標和非小目標進行測試,效果如圖16和圖17所示。可以看出,對圖像中的小目標測試時,本文模型優(yōu)于其他模型,但是對圖像中非小目標測試時。同時,由圖17可以看出,在對圖像中的重疊目標測試時,本文模型的檢測效果并不明顯。對此,本文從構(gòu)建的數(shù)據(jù)集中選取457幅含重疊目標的圖像作為測試集對重疊目標進行檢測實驗,結(jié)果如表5所示,本文模型在對重疊目標進行檢測時,mAP值均高于其他3種模型,但是浮標漏檢率略高于標準的SSD模型。

    表5 4種模型對重疊目標的檢測效果評價指標的實驗結(jié)果Table 5 Experimental results of overlapping object detection effect evaluation indexes of four models /%

    圖16 小目標測試效果Fig.16 Test effect of small objects ((a)SSD + VGG-16;(b)SSD + Mobilenet;(c)SSD + Xception;(d)ours)

    圖17 非小目標測試效果Fig.17 Test effect of non small objects ((a)SSD+VGG-16;(b)SSD + Mobilenet;(c)SSD + Xception;(d)ours)

    由此可見,由于較低層的特征圖蘊含更多小目標的信息,本文模型在較低的特征層中引入輕量級注意力機制,能有效提升小目標檢測性能,同時能有效提升重疊目標的檢測效果。

    使用本文模型與其他目前流行的輕量化目標檢測模型進行對比實驗,選擇在PASCAL VOC2007(pattern analysis,statistical modeling and computational learning visual object classes 2007)數(shù)據(jù)集上對模型進行訓練,并在VOC2007測試集上進行測試。實驗結(jié)果如表6所示,雖然Tiny SSD模型最小,但其檢測精度相對較低;本文模型比Tiny YOLOv2、Tiny YOLOv3和PeleeNet更輕量化,但在檢測精度上優(yōu)于以上模型。權(quán)衡兩個檢測標準,本文模型取得了較好的檢測效果。

    表6 本文模型與其他輕量化目標檢測模型的對比實驗結(jié)果Table 6 The comparison experimental results between the proposed model and other popular lightweight object detection models

    4 結(jié) 論

    本文提出一種注意力機制改進的輕量SSD模型用于海面小目標檢測,針對標準的SSD目標檢測模型參數(shù)量較大、對設備計算能力要求較高等特點,在保證一定的檢測精度的情況下,以Xception網(wǎng)絡作為特征提取模塊對其進行輕量化操作,基于輕量化的SSD目標檢測網(wǎng)絡,引入輕量級注意力機制模塊,對輕量化后的網(wǎng)絡進行優(yōu)化,彌補由于參數(shù)量降低帶來的檢測精度損失,同時提高了對小目標的檢測效果。

    目前,本文實驗只針對船和浮標兩類海面目標進行檢測,后續(xù)考慮增加檢測目標種類,統(tǒng)計數(shù)據(jù)集中的大小目標檢測情況,對在不同層引入注意力機制時大小目標的檢測精度進行量化對比分析。本文模型將注意力集中于較低特征層,使得高層的特征語義信息相對忽略,從而對圖像中部分重疊目標的檢測效果有一定的影響,后續(xù)考慮利用高層語義特征增加經(jīng)驗知識,繼續(xù)對網(wǎng)絡進行優(yōu)化,并對海面目標與岸邊目標重疊的檢測情況進行實驗對比分析,以尋求效果更好的網(wǎng)絡模型用于海面目標檢測。

    猜你喜歡
    輕量化卷積特征
    汽車輕量化集成制造專題主編
    基于3D-Winograd的快速卷積算法設計及FPGA實現(xiàn)
    如何表達“特征”
    從濾波器理解卷積
    電子制作(2019年11期)2019-07-04 00:34:38
    不忠誠的四個特征
    當代陜西(2019年10期)2019-06-03 10:12:04
    一種輕量化自卸半掛車結(jié)構(gòu)設計
    智富時代(2019年2期)2019-04-18 07:44:42
    基于傅里葉域卷積表示的目標跟蹤算法
    抓住特征巧觀察
    瞄準掛車輕量化 鑼響掛車正式掛牌成立
    專用汽車(2016年1期)2016-03-01 04:13:19
    用戶:輕量化掛車的使用體驗
    專用汽車(2015年4期)2015-03-01 04:09:07
    奎屯市| 新津县| 双峰县| 长治县| 买车| 华亭县| 神木县| 大田县| 怀安县| 越西县| 雅安市| 岳西县| 抚松县| 沾益县| 鄂州市| 海原县| 永顺县| 桃源县| 周宁县| 大方县| 沙洋县| 榆林市| 固镇县| 化州市| 南昌市| 新沂市| 英吉沙县| 满城县| 德格县| 岳池县| 宣化县| 略阳县| 方山县| 河津市| 富源县| 重庆市| 满洲里市| 巴彦淖尔市| 龙岩市| 武宁县| 和顺县|