李洋,梁瀟,賈海薩
?目標(biāo)特性與探測(cè)跟蹤技術(shù)?
基于知識(shí)蒸餾的SAR圖像艦船目標(biāo)檢測(cè)*
李洋,梁瀟,賈海薩
(中國(guó)人民解放軍92941部隊(duì),遼寧 葫蘆島 125000)
隨著深度學(xué)習(xí)的快速發(fā)展,目標(biāo)檢測(cè)網(wǎng)絡(luò)模型在SAR圖像艦船檢測(cè)取得了很大的成功。為了取得更好的效果,往往采取規(guī)模很大的檢測(cè)網(wǎng)絡(luò),這需要更多的計(jì)算資源并且推理更慢。知識(shí)蒸餾能夠有效地壓縮網(wǎng)絡(luò),但當(dāng)前的知識(shí)蒸餾大都是對(duì)于圖像分類問(wèn)題。在分析SAR圖像中艦船與背景差異的基礎(chǔ)上,提出局部與全局蒸餾的艦船目標(biāo)檢測(cè)方法??紤]到艦船在SAR圖像中的散射特性,對(duì)艦船樣本數(shù)據(jù)進(jìn)行幅值方向的切片預(yù)處理,作為具有更顯著散射特性的單獨(dú)數(shù)據(jù)通道,提升了網(wǎng)絡(luò)輸入數(shù)據(jù)的質(zhì)量。利用SSDD(SAR ship detection dataset)艦船數(shù)據(jù)集開(kāi)展目標(biāo)檢測(cè)實(shí)驗(yàn)和評(píng)估。實(shí)驗(yàn)結(jié)果表明,所提出的方法能夠在輕量化網(wǎng)絡(luò)下,提升艦船檢測(cè)性能,mAP能達(dá)到90.7%。
合成孔徑雷達(dá);目標(biāo)檢測(cè);艦船;深度學(xué)習(xí);知識(shí)蒸餾
合成孔徑雷達(dá)(synthetic aperture radar,SAR)具有全天候、全時(shí)的成像特性。因此,它受到世界各國(guó)的廣泛重視,已成為人們觀察地球的重要工具之一。因此,SAR圖像廣泛應(yīng)用于地球觀測(cè)任務(wù),尤其是海洋目標(biāo)監(jiān)測(cè)、海上救援和港口安全。由于SAR圖像的特殊性,利用SAR圖像進(jìn)行艦船目標(biāo)檢測(cè)具有明顯的優(yōu)勢(shì),使大范圍全天候艦船監(jiān)視任務(wù)成為可能。
在過(guò)去的幾十年里,人們?cè)赟AR圖像中提出了許多艦船目標(biāo)檢測(cè)方法。在所有傳統(tǒng)的檢測(cè)方法中,基于恒虛警率(constant false alarm rate,CFAR)的方法應(yīng)用最為廣泛。WANG Chonglei等[1]提出了一種強(qiáng)度空間域恒虛警檢測(cè)器,它利用數(shù)據(jù)相關(guān)性來(lái)檢測(cè)目標(biāo)像素和尾跡像素。LENG Xiangguang等[2]提出了一種具有雙邊結(jié)構(gòu)的恒虛警檢測(cè)器,該檢測(cè)器通過(guò)同時(shí)考慮強(qiáng)度信息和位置信息來(lái)減少斑點(diǎn)噪聲和海雜波的干擾。PAPPAS O等[3]提出了一種超像素級(jí)恒虛警檢測(cè)器,它通過(guò)利用超像素技術(shù)獲得感興趣的區(qū)域,在減少虛警方面提供了優(yōu)越的性能。這些方法在場(chǎng)景相對(duì)簡(jiǎn)單的情況下,通過(guò)分析SAR圖像的特征,取得了具有良好的效果。然而,當(dāng)目標(biāo)區(qū)域被幾個(gè)像素占據(jù)時(shí),基于CFAR的方法很難提取有效的目標(biāo)信息,導(dǎo)致性能有限,漏報(bào)率高。
近年來(lái),隨著深度學(xué)習(xí)理論的蓬勃發(fā)展,基于深度網(wǎng)絡(luò)的目標(biāo)檢測(cè)取得了巨大進(jìn)展?;诰矸e神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)的高性能檢測(cè)網(wǎng)絡(luò)分為兩階段網(wǎng)絡(luò)如Faster R-CNN[4],Cascade R-CNN[5]等,基于錨框的單階段如RetinaNet[6],Single-Shot-multibox-Detector(SSD)[7]等和無(wú)錨框的單階段檢測(cè)器如CenterNet[8],F(xiàn)COS[9]。一級(jí)檢測(cè)器直接在特征圖上獲取目標(biāo)的分類和回歸框。相比之下,兩級(jí)探測(cè)器利用RPN和R-CNN獲得更好的結(jié)果,但花費(fèi)更多的時(shí)間。之前的錨框提供了一個(gè)階段模型,提出了檢測(cè)目標(biāo)的建議。然而,錨框的數(shù)量遠(yuǎn)遠(yuǎn)超過(guò)目標(biāo),這會(huì)帶來(lái)額外的計(jì)算量。而無(wú)錨檢測(cè)器則提供了一種直接預(yù)測(cè)目標(biāo)關(guān)鍵點(diǎn)和位置的方法。
為了提高檢測(cè)精度以及效率,許多研究提出了不同的基于深度網(wǎng)絡(luò)的SAR圖像艦船目標(biāo)檢測(cè)方法,在各方面取得良好的效果。JIAO Jiao等[10]設(shè)計(jì)了一個(gè)具有密集連接結(jié)構(gòu)的網(wǎng)絡(luò),其目的是通過(guò)將上層的高分辨率特征地圖與下層提取的特征地圖合并來(lái)解決多尺度問(wèn)題。FU Jiamei等[11]提出了一種特征平衡和細(xì)化網(wǎng)絡(luò),該網(wǎng)絡(luò)通過(guò)細(xì)化目標(biāo)特征和加強(qiáng)語(yǔ)義信息,極大地提高了檢測(cè)性能。CUI Zongyong等[12]提出了一種通過(guò)CenterNet在大尺寸SAR圖像中進(jìn)行艦船檢測(cè)的方法,該方法應(yīng)用了一個(gè)帶有組卷積的注意模塊,以增強(qiáng)所學(xué)習(xí)的特征,并排除海岸對(duì)艦船目標(biāo)檢測(cè)的干擾。
為了獲得更好的性能,通常使用更大的主干網(wǎng),這意味著需要更多的計(jì)算資源和更慢的推理。為了克服這個(gè)問(wèn)題,有人提出了知識(shí)蒸餾[13]。知識(shí)蒸餾是一種將大型教師網(wǎng)絡(luò)中的信息繼承到一個(gè)緊湊的學(xué)生網(wǎng)絡(luò)中,并在推理過(guò)程中不增加額外成本而獲得強(qiáng)大性能的方法。Hinton等首先提出了該方法,該方法使用輸出作為軟標(biāo)簽,將從大型教師網(wǎng)絡(luò)轉(zhuǎn)移到小型學(xué)生網(wǎng)絡(luò),用于分類任務(wù)。最近,一些工作已經(jīng)成功地將知識(shí)蒸餾應(yīng)用于目標(biāo)檢測(cè)。CHEN Guobin等[14]首先通過(guò)提取頸部特征、分類頭和回歸頭的知識(shí),將知識(shí)提取應(yīng)用于檢測(cè)。然而,由于前景和背景之間的不平衡,提取整個(gè)特征可能會(huì)引入很多噪聲。LI Quanquan等[15]選擇從區(qū)域生成網(wǎng)絡(luò)(region proposal network,RPN)中采樣的特征來(lái)計(jì)算蒸餾損失?;谔卣鞯闹R(shí)蒸餾(feature-based knowledge distillation,F(xiàn)BKD)[16]分別使用注意力掩膜和非局部模塊來(lái)引導(dǎo)學(xué)生并提取教師與學(xué)生之間的關(guān)系,它同時(shí)提取前景和背景。焦點(diǎn)和全局知識(shí)蒸餾(focal and global knowledge distillation,F(xiàn)GKD)[17]使用局部分離目標(biāo)與背景,使用全局蒸餾彌補(bǔ)局部蒸餾損失的全局信息。
然而,對(duì)SAR圖像艦船檢測(cè),因?yàn)榕灤c背景存在不同的散射信息,因此蒸餾的關(guān)鍵問(wèn)題是選擇有價(jià)值的蒸餾區(qū)域,即艦船區(qū)域。之前的提取方法對(duì)所有像素和通道進(jìn)行同等處理,或同時(shí)提取所有區(qū)域。大多數(shù)方法缺乏對(duì)全局上下文信息的提煉。在本文中,使用真實(shí)標(biāo)注來(lái)分離圖像,然后使用教師的注意掩膜來(lái)選擇關(guān)鍵部分進(jìn)行蒸餾。此外,捕獲不同像素之間的全局關(guān)系,并將其提取給學(xué)生。
因?yàn)镾AR圖像艦船檢測(cè)的一個(gè)主要難點(diǎn)是背景雜波的影響,為了抑制SAR圖像的雜波散射信息,引入二維切片來(lái)抑制雜波干擾,從而增強(qiáng)SAR圖像艦船散射強(qiáng)度信息。
考慮當(dāng)前SAR圖像艦船檢測(cè)面臨的復(fù)雜背景雜波的干擾問(wèn)題,以及模型部署對(duì)于壓縮網(wǎng)絡(luò)模型的需求,本文提出通過(guò)輸入數(shù)據(jù)預(yù)處理來(lái)增強(qiáng)目標(biāo)散射信息以及抑制雜波背景,并通過(guò)知識(shí)蒸餾方法來(lái)壓縮網(wǎng)絡(luò)模型。
由于SAR特殊的電磁散射成像機(jī)理,導(dǎo)致SAR圖像特性不同于常見(jiàn)的光學(xué)圖像,這也是SAR圖像解譯的一個(gè)難點(diǎn)。SAR圖像艦船檢測(cè)中,背景通常是海面或者是近岸港口。影響SAR艦船檢測(cè)性能的一個(gè)重要因素就是近岸復(fù)雜背景雜波的干擾,這些干擾常常造成虛警。相比于散射特性起伏較大且變化雜亂的背景雜波,SAR圖像中的艦船目標(biāo)往往具有顯著的散射點(diǎn)或區(qū)域,并且呈現(xiàn)出較規(guī)則的特性。但,由于艦船為大型金屬目標(biāo),并具有復(fù)雜的人造結(jié)構(gòu),因此往往其強(qiáng)散射點(diǎn)帶來(lái)的旁瓣也較強(qiáng),這會(huì)影響深度神經(jīng)網(wǎng)絡(luò)的高層語(yǔ)義特征提取。
針對(duì)上述問(wèn)題,本文考慮一種簡(jiǎn)要的預(yù)處理方法,即在幅值方向上進(jìn)行量化得到二維切片圖像,以不同切片后的圖像表示不同的散射信息。
具體來(lái)說(shuō):將SAR圖像中()處像素值與設(shè)定的閾值進(jìn)行比較,如果()處像素值大于或等于設(shè)定的閾值,就保留該處的像素,否則置零。最后得到的二維切片圖像只保留想要的散射信息,這樣強(qiáng)散射中心導(dǎo)致的旁瓣得到有效抑制。閾值設(shè)定得越大,保留的散射信息對(duì)應(yīng)原始圖像中散射越強(qiáng)的部分。通過(guò)設(shè)定多個(gè)閾值,可以得到不同的切片圖像。
顯然,低閾值對(duì)應(yīng)底層的切片,其保留了原始圖中絕大部分的信息。而高閾值對(duì)應(yīng)的切片只保留較強(qiáng)的散射中心。由于艦船的散射往往呈現(xiàn)為強(qiáng)散射特征,因此,高閾值層切片也能保留大部分艦船目標(biāo)的信息。
圖1是對(duì)歸一化幅值按照等間隔取8個(gè)閾值并切片得到的圖像,其中a)~h)分別表示閾值從小到大的第1層到第8層切片。從圖中清晰可見(jiàn),低層切片圖像保留了絕大部分的信息,而隨著閾值越大,濾除的強(qiáng)散射中心旁瓣和低值雜波越多。根據(jù)圖1h)可以看出,其中的背景雜波被明顯抑制,而對(duì)于艦船目標(biāo)信息卻能幾乎全部保留,而且目標(biāo)整體結(jié)構(gòu)更加清晰。
根據(jù)上述分析,又因?yàn)镾AR圖像是單通道圖像,將選取中間和最高層的2片切片作為2個(gè)通道,和原SAR圖像一起作為三通道圖像送進(jìn)檢測(cè)網(wǎng)絡(luò)模型進(jìn)行學(xué)習(xí)。
選取Faster R-CNN作為基準(zhǔn)檢測(cè)網(wǎng)絡(luò)驗(yàn)證本文提出的通過(guò)切片抑制雜波散射信息, Faster R-CNN在Fast R-CNN的基礎(chǔ)上進(jìn)一步優(yōu)化,用CNN網(wǎng)絡(luò)代替Fast R-CNN中使用傳統(tǒng)Selective Search方法的Region Proposal模塊,從而實(shí)現(xiàn)了全神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè),在召回率和速度上都超過(guò)了傳統(tǒng)的Selective Search。
1.2.1局部知識(shí)蒸餾
對(duì)于前景和背景的不平衡,提出了局部蒸餾來(lái)分離圖像,并引導(dǎo)學(xué)生聚焦關(guān)鍵像素和通道。首先,設(shè)置一個(gè)二值掩碼來(lái)分離背景和前景。
式中:為真實(shí)標(biāo)注;,分別為特征圖的水平和垂直坐標(biāo)。如果(,)在真實(shí)標(biāo)簽內(nèi),那么(i,j)=1,否則為0。
尺度較大的目標(biāo)由于像素較多,損失較大,影響了小目標(biāo)的提取。在不同的圖像中,前景與背景的比例有很大的差異。因此,為了平等地對(duì)待不同的目標(biāo),平衡前景和背景的損失,所以應(yīng)用縮放掩模:
式中:H和W表示真實(shí)標(biāo)簽的高度和寬度。如果一個(gè)像素屬于不同的目標(biāo),選擇最小的框來(lái)計(jì)算。在本文中,應(yīng)用文獻(xiàn)[17]的方法來(lái)選擇焦點(diǎn)像素和通道,然后得到相應(yīng)的注意掩膜。
局部蒸餾損失函數(shù)如下:
1.2.2全局知識(shí)蒸餾
不同像素之間的關(guān)系具有寶貴的知識(shí),可用于提高檢測(cè)任務(wù)的性能。因此提出了全局蒸餾,其目的是從特征圖中獲取不同像素之間的全局關(guān)系,并將其從教師網(wǎng)絡(luò)蒸餾到學(xué)生網(wǎng)絡(luò)。
利用GcBlock[18]在單個(gè)圖像中捕獲全局關(guān)系信息,并強(qiáng)制學(xué)生網(wǎng)絡(luò)從教師網(wǎng)絡(luò)那里學(xué)習(xí)全局關(guān)系。全局蒸餾損失函數(shù)如下:
式中:W,W1和W2表示卷積層;表示層標(biāo)準(zhǔn)化;N表示特征中的像素?cái)?shù);表示平衡損失的超參數(shù)。
綜上所述,對(duì)學(xué)生網(wǎng)絡(luò)的總損失為
式中:original表示檢測(cè)器原始的損失。在本文中使用Faster R-CNN的損失函數(shù)。教師網(wǎng)絡(luò)和學(xué)生網(wǎng)絡(luò)分別使用不同的骨干網(wǎng)絡(luò),具體細(xì)節(jié)將在實(shí)驗(yàn)部分介紹。
為了評(píng)價(jià)所提出方法的性能,采用公開(kāi)發(fā)布的SAR圖像艦船檢測(cè)數(shù)據(jù)集SSDD作為實(shí)驗(yàn)數(shù)據(jù)。SSDD數(shù)據(jù)集中的SAR圖像是通過(guò)RadarSat-2, TerraSAR-X, and Sentinel-1獲取的,共有1 160幅SAR圖像和2 456艘艦船。每張圖片的平均船只數(shù)量為2.12艘。SSDD中的SAR圖像包括HH,HV,VV和VH極化模式。場(chǎng)景包含近岸以及遠(yuǎn)海。圖像分辨率1~15 m。選取后綴索引為1和9的作為測(cè)試集(共232張圖像),其余作為訓(xùn)練集(共928張圖像)。圖2給出了該數(shù)據(jù)集中的部分樣本。
本文采用選擇準(zhǔn)確率(precision,P),召回率(recall,R),F(xiàn)1值(F1-score,F(xiàn)1)以及平均精度(mean average precision,mAP)作為指標(biāo)來(lái)評(píng)估本文方法性能。
2.2.1消融實(shí)驗(yàn)
本文選取Faster R-CNN作為基線網(wǎng)絡(luò),為了說(shuō)明本文提出的通過(guò)切片抑制雜波散射信息,以及學(xué)生網(wǎng)絡(luò)通過(guò)對(duì)教師網(wǎng)絡(luò)的局部和全局的蒸餾能夠提升網(wǎng)絡(luò)性能,以Faster R-CNN為基線模型,其中骨干網(wǎng)絡(luò)為ResNet50,并在SSDD數(shù)據(jù)集上進(jìn)行消融實(shí)驗(yàn)。
從表1可以看出,切片預(yù)處理和局部與全局的蒸餾,這2種技術(shù)對(duì)檢測(cè)網(wǎng)絡(luò)的性能均有影響。可以看出預(yù)處理與蒸餾都能提升檢測(cè)精度,mAP分別提升0.6%,1.0%。同時(shí)使用2種技術(shù)的平均精度達(dá)到最高??梢钥闯?,利用切片抑制雜波散射信息,以及局部蒸餾和全局蒸餾能夠有效地在壓縮模型規(guī)模的同時(shí),一定程度地提升艦船檢測(cè)性能。
圖2 SSDD數(shù)據(jù)集中部分SAR圖像
表1 消融實(shí)驗(yàn)結(jié)果
2.2.2蒸餾的影響
為了驗(yàn)證蒸餾對(duì)網(wǎng)絡(luò)模型能夠進(jìn)行有效壓縮,以及分析不同蒸餾方式對(duì)實(shí)驗(yàn)結(jié)果的影響,選擇教師網(wǎng)絡(luò)的骨干網(wǎng)絡(luò)為ResNet101,學(xué)生網(wǎng)絡(luò)的骨干網(wǎng)絡(luò)為ResNet50,從表2可以看出經(jīng)過(guò)蒸餾后得到的學(xué)生網(wǎng)絡(luò)比未經(jīng)過(guò)蒸餾的學(xué)生網(wǎng)絡(luò)模型,mAP達(dá)到了90.1%,并且與教師網(wǎng)絡(luò)的性能接近。說(shuō)明通過(guò)局部和全局蒸餾,有效地將教師網(wǎng)絡(luò)模型的參數(shù)傳遞到了學(xué)生網(wǎng)絡(luò)模型中。
表2 教師網(wǎng)絡(luò)與學(xué)生網(wǎng)絡(luò)對(duì)比
表3給出了局部蒸餾以及全局蒸餾對(duì)學(xué)生網(wǎng)絡(luò)性能的影響??梢钥闯觯植空麴s以及全局蒸餾對(duì)于檢測(cè)性能mAP都有一定的提升。而兩者結(jié)合時(shí),效果最好。
表3 不同蒸餾的實(shí)驗(yàn)結(jié)果
2.2.3不同預(yù)處理方法的比較
為了說(shuō)明本文方法的有效性,同時(shí)采用了其他的預(yù)處理方法進(jìn)行比較實(shí)驗(yàn)??紤]通過(guò)提取SAR圖像的傳統(tǒng)圖像特征作為預(yù)處理方法,來(lái)增強(qiáng)圖像的特征信息。本文選擇2種傳統(tǒng)圖像特征,方向梯度直方圖(histogram of oriented gridients,HOG),以及局部二值模式(local binary pattern,LBP)紋理,進(jìn)行實(shí)驗(yàn)并比較。表4給出了不同預(yù)處理方法的結(jié)果。
由表4可知,HOG特征或LBP特征,作為預(yù)處理在一定程度上提升了船舶檢測(cè)的性能。相對(duì)來(lái)說(shuō),HOG比LBP的效果更好,這是因?yàn)榇拜喞畔⒏用黠@。但兩者均不如切片預(yù)處理方法對(duì)SAR圖像艦船檢測(cè)精度有更好的性能提升。
表4 不同預(yù)處理方法實(shí)驗(yàn)結(jié)果
2.2.4與其他CNN檢測(cè)網(wǎng)絡(luò)比較
為了進(jìn)一步說(shuō)明本文方法的性能,實(shí)驗(yàn)中還與現(xiàn)有的單階段檢測(cè)網(wǎng)絡(luò)RetinaNet和無(wú)錨框檢測(cè)網(wǎng)絡(luò)FCOS進(jìn)行了性能比較。這些檢測(cè)網(wǎng)絡(luò)在SSDD數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如表5所示。從結(jié)果可以看出,本文所提出的方法獲得了最佳的檢測(cè)性能,優(yōu)于其他算法。
圖3給出了不同檢測(cè)方法的PR曲線??梢钥闯霰疚姆椒ǖ钠骄日w優(yōu)于單階段檢測(cè)網(wǎng)絡(luò)RetinaNet和無(wú)錨框檢測(cè)網(wǎng)絡(luò)FCOS。
圖3 不同方法的檢測(cè)結(jié)果
為了驗(yàn)證本文算法的實(shí)驗(yàn)性能,選取了SSDD測(cè)試集中的4副測(cè)試圖像,這些圖像分別包含了港口,島礁等復(fù)雜情況。如圖4所示。
圖4 不同方法的檢測(cè)結(jié)果比較
其中,第1行表示真實(shí)標(biāo)注框,第2行至第5行分別表示,基線(Faster R-CNN),RetinaNet,F(xiàn)COS以及本文方法。對(duì)于第1個(gè)場(chǎng)景和第2場(chǎng)景,由于近岸雜波以及海上雜波的干擾,F(xiàn)aster R-CNN,RetinaNet產(chǎn)生了虛警,而FCOS產(chǎn)生了漏檢,本文的方法能夠較好地檢測(cè)出正確結(jié)果。對(duì)于第3個(gè)場(chǎng)景以及第4個(gè)場(chǎng)景,由于周圍島礁,小雜波的干擾,F(xiàn)aster R-CNN,RetinaNet以及FCOS都產(chǎn)生了虛警,而本文的方法能夠很大程度降低虛警的產(chǎn)生。總的來(lái)說(shuō),通過(guò)對(duì)比真實(shí)標(biāo)注框與檢測(cè)結(jié)果,艦船檢測(cè)因?yàn)殡s波以及小目標(biāo)的干擾,造成的虛警,通過(guò)本文實(shí)現(xiàn)的切片預(yù)處理以及局部與全局蒸餾能夠較好地識(shí)別出目標(biāo),具有較好的性能。
針對(duì)SAR圖像艦船檢測(cè)存在的困難,以及對(duì)于深度學(xué)習(xí)模型部署資源有限的需求,本文提出了一種結(jié)合切片預(yù)處理的知識(shí)蒸餾檢測(cè)算法。首先,通過(guò)對(duì)SAR圖像在幅值方向進(jìn)行二維切片處理,選取中高層切片來(lái)抑制雜波,并與原圖相組合送入目標(biāo)檢測(cè)網(wǎng)絡(luò)模型。然后,通過(guò)教師網(wǎng)絡(luò)模型進(jìn)行全局信息蒸餾,與局部的空間、通道蒸餾結(jié)合引導(dǎo)學(xué)生檢測(cè)網(wǎng)絡(luò)模型,從而達(dá)到壓縮網(wǎng)絡(luò)模型的目的。通過(guò)在SSDD數(shù)據(jù)集上的實(shí)驗(yàn)表明,本文提出的算法相比傳統(tǒng)的Faster R-CNN模型,既能降低模型網(wǎng)絡(luò)規(guī)模和參數(shù)規(guī)模,又提升了檢測(cè)性能。
[1] WANG Chonglei, BI Fukun, ZHANG Weiping, et al. An Intensity-Space Domain CFAR Method for Ship Detection in HR SAR Images [J]. IEEE Geoscience and Remote Sensing Letters, 2017, 14(4): 529-533.
[2] LENG Xiangguang, JI Kefeng, YANG Kai, et al. A Bilateral CFAR Algorithm for Ship Detection in SAR Images[J]. IEEE Geoscience and Remote Sensing Letters, 2015, 12(7): 1536-1540.
[3] PAPPAS O, ACHIM A, BULL D. Superpixel-Level CFAR Detectors for Ship Detection in SAR Imagery[J]. IEEE Geoscience and Remote Sensing Letters, 2018, 15(9): 1397-1401.
[4] REN Shaoqing, HE Kaiming, GIRSHICK R, et al. Faster R-Cnn: Towards Real-Time Object Detection with Region Proposal Networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2017, 39(6):1137-1149.
[5] CAI Zhaowei, VASCONCELOS N. Cascade R-Cnn: Delving into High Quality Object Detection[C]∥Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 6154-6162.
[6] LIN Sungyi, GOYAL P, GIRSHICK R, et al. Focal Loss for Dense Object Detection[C]∥Proceedings of the IEEE International Conference on Computer Vision. 2017: 2980-2988
[7] LIU Wei, ANGUELOV D, ERHAN D, et al. Ssd: Single Shot Multibox Detector[C]∥European Conference on Computer Vision. Springer, Cham, 2016: 21-37.
[8] ZHOU Xingyi, WANG Dequan, Kr?henbühl P. Objects as Points[J]. arXiv preprint arXiv:1904.07850, 2019:2103-2112.
[9] TIAN Zhi, SHEN Chunhua, CHEN Hao, et al. Fcos: Fully Convolutional One-Stage Object Detection[C]∥Proceedings of the IEEE/CVF International Conference on Computer Vision, 2019: 9627-9636.
[10] JIAO Jiao, ZHANG Yue, SUN Hao, et al. A Densely Connected End-to-End Neural Network for Multiscale and Multiscene SAR Ship Detection[J]. IEEE Access, 2018, 6: 20881-20892.
[11] FU Jiamei, SUN Xian, WANG Zhirui, et al. An Anchor-Free Method Based on Feature Balancing and Refinement Network for Multiscale Ship Detection in SAR Images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2020, 59(2): 1331-1344.
[12] CUI Zongyong, WANG Xiaoya, LIU Nengyuan, et al. Ship Detection in Large-Scale SAR Images Via Spatial Shuffle-Group Enhance Attention[J]. IEEE Transactions on Geoscience and Remote Sensing, 2020, 59(1): 379-391.
[13] HINTON G, VINYALS O, DEAN J. Distilling the Knowledge in a Neural Network[J]. arXiv Preprint arXiv:1503.02531, 2015, 2(7):21-29.
[14] CHEN Guobin, CHOI Wongun, YU Xiang, et al. Learning Efficient Object Detection Models with Knowledge Distillation[J]. Advances in Neural Information Processing Systems, 2017, 30(2):742-751.
[15] LI Quanquan, JIN Shengying, YAN Junjie. Mimicking Very Efficient Network for Object Detection[C]∥Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2017: 6356-6364.
[16] ZHANG Linfeng, MA Kaisheng. Improve Object Detection with Feature-Based Knowledge Distillation: Towards Accurate and Efficient Detectors[C]∥International Conference on Learning Representations, 2020:3327-3336.
[17] YANG Zhendong, LI Zhe, JIANG Xiaohu, et al. Focal and Global Knowledge Distillation for Detectors[C]∥Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, 2022: 4643-4652.
[18] CAO Yue, XU Jiarui, LIN Stephen, et al. Gcnet: Non-Local Networks Meet Squeeze-Excitation Networks and Beyond[C]∥Proceedings of the IEEE/CVF International Conference on Computer Vision Workshops, 2019:1971-1980.
Ship Detection in SAR Images Based on Knowledge Distillation
LIYang,LIANGXiao,JIAHaisa
(PLA 92941 Troops,Huludao 125000,China)
With the rapid development of deep learning, the object detection network model hsa achieved great success in ship detection from synthetic aperture radar (SAR) images. In order to achieve better results, a large detection network is usually adopted, which requires more computing resources and slower inference. Knowledge distillation can effectively compress the network, but most of them are for image classification. Considering the difference between ships and background in SAR images, this paper proposes a combining local and global distillation method for ship detection. Considering the scattering characteristics of ships in SAR images, slice preprocessing in the amplitude direction is performed on the ship sample data constructing a separate data channel with more significant scattering characteristics, which improves the quality of input data fed to the network. Experimental results based on SAR ship detection dataset (SSDD) show that the proposed approach can effectively reduce the price of the network model and improve the detection performance, achieving 90.7% mAP.
synthetic aperture radar(SAR);object detection;ship;deep learning;knowledge distillation
10.3969/j.issn.1009-086x.2023.04.010
TN957.52;E925.6;TJ0
A
1009-086X(2023)-04-0078-08
李洋, 梁瀟, 賈海薩.基于知識(shí)蒸餾的SAR圖像艦船目標(biāo)檢測(cè)[J].現(xiàn)代防御技術(shù),2023,51(4):78-85.
LI Yang,LIANG Xiao,JIA Haisa.Ship Detection in SAR Images Based on Knowledge Distillation[J].Modern Defence Technology,2023,51(4):78-85.
2022 -09 -26 ;
2022 -11 -10
李洋(1982-),男,遼寧葫蘆島人。工程師,學(xué)士,研究方向?yàn)樗姘袠?biāo)、目標(biāo)特性。
125001 遼寧省葫蘆島市龍港區(qū)怡心苑小區(qū) E-mail:42208848@qq.com