薛 錦,田增嫻,師慶科,文占婷
(1.四川大學(xué) 華西醫(yī)院信息中心,成都 610041;2.成都信息工程大學(xué) 應(yīng)用數(shù)學(xué)學(xué)院,成都 610225;3.中電科網(wǎng)絡(luò)安全科技股份有限公司,成都 610041)
弱小目標(biāo)檢測在導(dǎo)航、偵察、精確打擊、打擊效果評估中起著重要的作用[1-2],一直是計算機視覺領(lǐng)域的研究熱點,廣泛應(yīng)用于許多領(lǐng)域[3],如行人檢測、智能監(jiān)控、自動駕駛以及壓縮測量領(lǐng)域的目標(biāo)檢測和分類等[4]。在圖像處理中,目標(biāo)檢測非常具有挑戰(zhàn)性,需要對目標(biāo)分類并定位[5-6]。出于安全性考慮,戰(zhàn)斗機必須從遠距離處攻擊地面目標(biāo),目標(biāo)在圖像中占的像素比很低,目標(biāo)檢測的難度很大[7]。
鑒于目標(biāo)和背景雜波的極端復(fù)雜性及紅外圖像的低分辨性,使得紅外視頻中小型目標(biāo)艦船自動檢測成為現(xiàn)代軍事應(yīng)用中的一項瓶頸技術(shù)。海天區(qū)域即海天線附近的圖像區(qū)域,海天線為海與天之間的邊界線。在基于圖像的目標(biāo)檢測時,小型艦船經(jīng)常出現(xiàn)在海天線附近。受海天線干擾,使目標(biāo)檢測非常困難。本文重點關(guān)注海天場景下目標(biāo)檢測問題,尤其是海天線附近的弱小目標(biāo)檢測。
艦船目標(biāo)在一般情況下,在紅外圖像中呈現(xiàn)的圖像特征為強度弱、信噪比低、形狀特征不明顯,目標(biāo)檢測和識別非常困難。兼之紅外背景復(fù)雜、混亂,對比度不夠。雜波背景的復(fù)雜性是由于傳感器噪聲、背景紋理、成像環(huán)境。且雜波背景均勻性較差,產(chǎn)生高對比度物體的可能性增加,從而會導(dǎo)致虛警增加。隨著外部大氣和熱力學(xué)因素的變化,紅外圖像中目標(biāo)及背景雜波外觀會發(fā)生較大變化。另外,在視頻中的目標(biāo)成像會在時空域上發(fā)生變化,會導(dǎo)致目標(biāo)輪廓檢測及準(zhǔn)確提取困難。在很多場景下,目標(biāo)與噪聲、雜波非常類似,無法將真實目標(biāo)與背景、噪聲分開,檢測性能并不理想。
一般將檢測小目標(biāo)的模式分為兩種,跟蹤前檢測及檢測前跟蹤。對于前者,很多學(xué)者提出了檢測方法。比如形態(tài)學(xué)方法,基于小波變換方法,基于模板匹配的方法等。這些方法的好處為計算檢測,實時性好。在海天紅外輻射背景下,小目標(biāo)在海天線附近成像形式為明暗光斑,天氣條件對目標(biāo)的紅外輻射特征會產(chǎn)生重要影響,在晴朗天氣,背景變暗,運動目標(biāo)在圖像上顯示為點源輻射。但在惡劣天氣下,成像受海浪及云層污染,目標(biāo)湮滅在雜波中,跟蹤前檢測算法精度較低甚至?xí)?。但在海天線指引下,可提出一些有效的算法,抑制雜波,增強目標(biāo)。海天線檢測直接影響目標(biāo)檢測性能。但在某些情況下,海天線并不明顯,會受到海浪及云層干擾,將嚴(yán)重干擾目標(biāo)穩(wěn)定檢測。一些學(xué)者提出了許多新穎、巧妙的方法對海天線進行自動檢測,但未能適配各種條件下的自動海天線檢測定位。
在傳統(tǒng)方法中,使用尺度不變特征的變換、局部二值模式等方法。然而,這些特征很難適應(yīng)某些特定的任務(wù),效果很難令人滿意[7-8]。隨著GPU 的發(fā)展,一些學(xué)者在目標(biāo)檢測模型中嵌入卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型(簡稱CNN)處理圖像,目標(biāo)檢測精度逐漸提高[9]。區(qū)域CNN 算法使用區(qū)域分塊方法在輸入圖像中產(chǎn)生大量區(qū)域塊,并將區(qū)域調(diào)整為相同大?。?0]。然后,在這些區(qū)域上進行CNN 處理以提取特征。利用支持向量機對輸入的特征進行分類,線性回歸用于調(diào)整邊界的位置和尺度。由于支持向量機和線性回歸必須分別訓(xùn)練,并且大量區(qū)域塊之間存在重疊[10],因此區(qū)域CNN 算法效率很低。快速區(qū)域CNN 算法通過多線程方法將分類和識別結(jié)合,使用末端卷積層的九個不同框以替代大量候選區(qū)域[11-12],該算法在處理效率上雖有提高,但依然未能讓人滿意,針對特征多的對象容易形成數(shù)據(jù)災(zāi)難,同時當(dāng)數(shù)據(jù)量不足時極有可能訓(xùn)練不足,導(dǎo)致預(yù)測精度下降。YOLO 算法將該問題簡化,成為端到端的網(wǎng)絡(luò),同時支持預(yù)測和分類,檢測速度有了很大提高,但檢測精度低于快速區(qū)域CNN 算法。
在快速區(qū)域CNN 中的機制下[13-14],使用SSD算法也可快速提高檢測精度。這種算分創(chuàng)造出一系列默認的區(qū)域塊[15-17],并對多層框中對象實例進行計算。通過對SSD(single shot multibox detector)算法的不同預(yù)測,及默認策略覆蓋輸入對象的尺寸和形狀。默認的框制約因素有:比例及縱橫比,為不同的圖層的框提供基本比例及默認框的大小及數(shù)量[18]。由于弱小目標(biāo)本身在最頂層可能沒有任何信息,于是SSD算法對于小目標(biāo)檢測性能會很差[19]。更深刻的原因是,原始默認參數(shù)僅用于檢測合適尺度的目標(biāo),而非針對小目標(biāo)檢測[20]。若增加默認框的數(shù)量,可能會降低SSD算法的收斂性。
此篇文章提出一種基于新學(xué)習(xí)策略的弱小目標(biāo)檢測方法,自適應(yīng)尺度信息,按照多層定義策略,可更快、更準(zhǔn)確檢測小目標(biāo)。
基于DCNN 的目標(biāo)檢測器可以分為兩類。一種是兩級目標(biāo)檢測器,如R-CNN、Fast R-CNN、Faster R-CNN 和Mask R-CNN 等。R-CNN 首先通過選擇性搜索生成大量候選方案。然后,利用檢測網(wǎng)絡(luò)進一步預(yù)測目標(biāo)的類別和位置。Fast R-CNN 引入了興趣區(qū)域池(ROI池)來融合來自特征地圖每個區(qū)域的特征。為了提高檢測器的效率,更快的R-CNN 通過引入?yún)^(qū)域建議網(wǎng)絡(luò)(RPN)來減少低級建議。Mask R-CNN 將任務(wù)從檢測擴展到分割。另一種是單級目標(biāo)檢測器,如SSD、YLO、YLO 9000、YLO V3、CenterNet和CornerNet等。它們是端到端目標(biāo)檢測算法,因為它們可以直接預(yù)測目標(biāo)的位置和類別。SSD 使用特征金字塔結(jié)構(gòu)來檢測不同大小的目標(biāo),并提出一種生成錨盒的策略。YOLO、YOLO 9000和YOLO V3將圖像劃分為多個網(wǎng)格,并預(yù)測每個網(wǎng)格中的目標(biāo)。YOLO V3采用特征金字塔網(wǎng)絡(luò)的思想,對目標(biāo)進行多尺度檢測。CenterNet和CornerNet提出了無錨策略來檢測目標(biāo)的關(guān)鍵點。
傳統(tǒng)的SSD 方法不適合針對小目標(biāo)的檢測,制定新策略用于特定場景的檢測,包括自適應(yīng)的尺度及縱橫比。新尺度中,核與卷積層的尺度比用于替代固定的增量。在新縱橫比中,每層縱橫比數(shù)量將減少。與較低層的縱橫比數(shù)對比,增加了高層的縱橫比數(shù)量。于是,可從頂層獲取更多有用信息。
原始的范圍用于覆蓋目標(biāo)的所有尺度。在較低層次,算法中使用小比例增量以確保較小的縱橫比,也可很好捕獲小目標(biāo)的細節(jié)信息。在更高的層次上,使用大尺度增量來捕獲輪廓信息。對于小型目標(biāo),其比例一定不會像頂層中正常目標(biāo)尺度一樣。于是,頂層的設(shè)置比例要小于原始比例。新比例增量的值在較低層較小,在較高層較大。
尺度公式如下:
其中:τc-1表示c-1層的長度,κc-1表示c-1卷積層內(nèi)核的長度。
設(shè)計的網(wǎng)絡(luò)能夠通過多尺度訓(xùn)練,在多樣化尺度的圖像上運行,有效提高檢測性能。在弱小目標(biāo)檢測中,輸入圖像中大部分區(qū)域都是背景,為在大范圍內(nèi)檢測目標(biāo),需對圖像進行感興趣區(qū)域劃分,對冗余的區(qū)域進行識別。首先,根據(jù)真實場景搜索包含小目標(biāo)的最小區(qū)域。去除圖像中多余的背景后,大部分背景不參與訓(xùn)練,虛警率會增加。為緩解問題,將感興趣區(qū)域與原始圖像一同作為訓(xùn)練數(shù)據(jù)集。在訓(xùn)練階段,所有的圖像均調(diào)整為相同大小。與原始訓(xùn)練集相比,給出的訓(xùn)練集中的小目標(biāo)可在更大范圍內(nèi)訓(xùn)練而不會增加記憶。
另外,根據(jù)不同分層在圖像上應(yīng)該具有相同密度的原則,以確保不同比例的目標(biāo)可獲得大致匹配的指標(biāo)。不同層應(yīng)該以2的冪進行降階匹配。因此,在每個尺度上密度的變化都非常小,為選擇合適的密度范圍,對視頻數(shù)據(jù)集進行了大量的分析。結(jié)論為低分辨率的特征包含了顆粒度信息,有助于目標(biāo)定位。高分辨率特征包含了更多有意義的理解信息,有助于對目標(biāo)進行分類。若密度低,小目標(biāo)會淹沒在大目標(biāo)中,若密度高,大目標(biāo)將會被分割成很多小份,分割非常不合理。小目標(biāo)周邊上下文信息對小目標(biāo)檢測非常有用。延拓卷積可在不丟失分辨率或覆蓋率的條件下擴展接受域,將有助于獲取更多的上下文信息。于是,以擴展卷積為基本單元,構(gòu)建自適應(yīng)融合模塊。
由于紅外海天背景圖像中小目標(biāo)經(jīng)常出現(xiàn)在海天線附近,因此識別海天線是目標(biāo)檢測的重要線索。海天線的檢測是海天背景下小目標(biāo)檢測的首要步驟,可以很大程度消除虛警,提高目標(biāo)檢測概率。
為有效區(qū)分海天不同區(qū)域的差異,設(shè)計一種新的特征描述子,對該描述子的需求為:在海天區(qū)域中心處達到峰值,在其他區(qū)域響應(yīng)值較小。采用橫向搜索方式,檢測海天線段:
其中:SSSD為檢測描述子,h為待檢測圖像的列寬,σ為檢測寬度,W為待檢測圖像的行寬,通過積分手段將不同區(qū)域的差異進行積分,I為圖像函數(shù),x,y分別為圖像像素坐標(biāo)。由于SSSD代表圖像的復(fù)雜性,其反映了圖像中海天候選區(qū)域的數(shù)量。在低雜波場景下,海區(qū)和天空區(qū)有輕微的海雜波和明亮的云,海天線非常清晰。因此,很容易分離天空區(qū)域和海洋區(qū)域。在此情況下,應(yīng)用高斯低通濾波器去除異常高斯白噪聲并增強獲得的紅外圖像質(zhì)量。分割后,紅外圖像的天空區(qū)域和海洋區(qū)域分別被分割成具有垂直空間分布特征的塊區(qū)域,并通過提取的特征對其進行驗證。然后將概率最大的區(qū)域作為海天區(qū)域。最后,提取特征并驗證潛在的海天線是否準(zhǔn)確。
在低雜波場景下,海區(qū)和天空區(qū)有輕微的海雜波和明亮的云,海天線非常清晰。因此,在天空區(qū)域和海洋區(qū)域相互分離后,可以很容易地從背景中提取海洋天空線。在這種情況下,使用高斯低通濾波器去除異常高斯白噪聲并增強獲得的紅外圖像的圖像質(zhì)量,然后,使用經(jīng)典的Otsu方法進行區(qū)域分割。分割后,紅外圖像的天空區(qū)域和海洋區(qū)域分別被分割成具有垂直空間分布特征的水平塊。因此,重要的一步是從這些塊中提取潛在的海天區(qū)域,并通過提取的特征對其進行驗證。然后將概率最大的區(qū)域作為海天區(qū)域??梢蕴崛〔Ⅱ炞C潛在的海天線是否真實。首先,特征提取和獲取區(qū)域?qū)傩?。?jīng)過圖像預(yù)處理和分割后,各塊在分割后的結(jié)果圖像中呈現(xiàn)垂直空間分布,每個潛在海天區(qū)域假設(shè)位于高度為h的鄰域塊的中間。然后,從所有潛在海天區(qū)域提取特征。同時,獲取由寬度、高度、質(zhì)心和面積組成的區(qū)域?qū)傩?。然后,海天區(qū)域驗證。在獲得特征和屬性后,利用特征對每個潛在海天區(qū)域進行驗證,然后將概率最大的區(qū)域作為海天區(qū)域。之后,完成潛在海天線提取和驗證。接著,進行海天線定位。驗證海天區(qū)域的質(zhì)心和飛機的橫滾分別被視為海天線的頂點和角度。最后,在紅外圖像中檢測并定位了海天線。
在高雜波場景中,海天背景也受到云雜波和波雜波的強烈污染。在這種情況下,海天區(qū)域的直線成為重要信息,有助于找到潛在的海天線。在圖像預(yù)處理后,采用基于Canny算子的經(jīng)典直線提取方法,提取增強圖像的模糊和清晰邊緣,長度大于閾值的直線均被視為潛在海天線。然后,使用提取的特征在附近區(qū)域驗證這些潛在的海天線。最后,將概率最大的潛在海天線視為真實海天線。
目標(biāo)增強和背景抑制算法直接影響檢測性能。在小目標(biāo)增強領(lǐng)域已提出很多方法,如Top-Hat方法、Max-Median、Max-Mean。以目標(biāo)比背景亮的假設(shè)作為基礎(chǔ)的多級濾波器,效果明顯。上述方法認為在低頻中背景占主導(dǎo)地位,目標(biāo)由中頻構(gòu)成,高頻中以噪聲為主。利用頻率差抑制雜波背景,增強目標(biāo)。此篇文章提出一種基于二值決策的目標(biāo)分割算法。定義決策準(zhǔn)則:
其中:T為紅外目標(biāo)空間函數(shù)分布,B為背景空間函數(shù)分布,N為噪聲空間分布函數(shù),P0為無目標(biāo)圖像函數(shù)分布,P1為有目標(biāo)時圖像函數(shù)分布。
由上述決策公式可獲得原始圖像的預(yù)處理方法:在采集的圖像上減去預(yù)測的背景圖像完成背景抑制,處理完成后,重寫決策準(zhǔn)則公式為:
其中:C為背景抑制殘差,該函數(shù)與設(shè)計的濾波器緊密相關(guān),按照高斯低通濾波器設(shè)計,表示為C=Filter(Ω),Ω為截止頻率,值與濾波效果呈負相關(guān)。
定義閾值為λ,通過該值進行圖像分割,在概率空間表示為:
當(dāng)存在目標(biāo)時,設(shè)定終極函數(shù)G(Filter(Ω)+N+T>λ,當(dāng)函數(shù)值達到最大時,濾波效果最好,可獲得最佳濾波值λmax、Ωmax。
在實測中,用于估計參數(shù)值時,需目標(biāo)的預(yù)估信噪比,背景的分布函數(shù)以及預(yù)期的檢測概率,通過優(yōu)化算法,獲得最佳參數(shù)。
在抑制背景后,目標(biāo)局部對比度得到明顯增強。之后進行全局Otsu二值分割,得到疑似目標(biāo)的寬度、高度、質(zhì)心和面積等屬性。然后在疑似目標(biāo)區(qū)域范圍內(nèi)再運行局部Otsu二值分割算法,并對目標(biāo)進行分類。直至無新的目標(biāo)產(chǎn)生,算法結(jié)束。通過運算,虛警成為干擾目標(biāo)提取的重要因素。利用海天線檢測的結(jié)果對虛警進行抑制。
提出算法的流程如圖1~2所示。
圖1 算法預(yù)處理流程圖
圖2 算法流程圖
1)預(yù)處理流程:首先對輸入的紅外序列圖像進行預(yù)處理,判別雜波性能,分兩種情況對圖像進行處理。在低雜波條件下,對圖像進行分割,歸類并獲取區(qū)域信息,得到海天線;在高雜波條件下,對圖像直線進行檢測,獲取疑似海天線信息,并進行校驗。在不同的情況下,利用特征及平臺輸出的先驗信息對海天線進行校驗。然后,輸出海天線位置,對其進行多級濾波器濾波,進行迭代二值分割,并統(tǒng)計目標(biāo)特征,最后輸出目標(biāo)的位置信息。
2)算法流程:對輸入的圖像根據(jù)目標(biāo)尺度生成覆蓋目標(biāo)的全部尺度卷積層,保證設(shè)計的網(wǎng)絡(luò)可覆蓋多樣化尺度圖像,可有效提高目標(biāo)檢測性能。使用自適應(yīng)特征交叉融合模型,輸出目標(biāo)的分類、定位、置信度量。
為有效評估算法的性能,在采集的數(shù)據(jù)集及存在小目標(biāo)的數(shù)據(jù)集上進行對比實驗。用于對航拍圖像進行小目標(biāo)檢測。目標(biāo)在圖像上占有的面積在5×5~10×10(像素)之間。
訓(xùn)練在高端顯卡配置下的服務(wù)器上進行訓(xùn)練,實驗編程語言為Python。在訓(xùn)練和測試階段,輸入圖像的大小均調(diào)整為1 024×1 024。
利用露點控制和氣候補償技術(shù),該系統(tǒng)還實現(xiàn)了利用地板輻射制冷的功能。通過溫濕度傳感器采集當(dāng)前室內(nèi)的溫度和濕度,中央控制器計算出當(dāng)前的露點溫度,通過調(diào)節(jié)混水閥控制地暖的供水溫度使水溫一直在露點溫度以上,保證室內(nèi)不會結(jié)露,通過風(fēng)盤除濕來保證室內(nèi)濕度恒定。
通過融合,背景訓(xùn)練使用率有了明顯提高,增強了目標(biāo)識別的能力。在保持高檢測速度的同時,檢測指標(biāo)的提高也很顯著。通過權(quán)重共享,使得模型健壯性更強。通過感興趣區(qū)域的提取,在不影響檢測速度的同時,背景利用率提高了8.2%??杀WC在更大范圍內(nèi)對目標(biāo)進行訓(xùn)練,有助于提高小目標(biāo)的檢測性能。
為定性評估算法性能,在4組圖像中進行試驗,測試結(jié)果如圖3所示,由圖中處理的結(jié)果可見,經(jīng)過海天線檢測,分段處理不同區(qū)域的圖像,再經(jīng)過基于新學(xué)習(xí)策略的算法處理后,艦船目標(biāo)被清晰分割了出來。試驗結(jié)果表明,提出的算法對海天背景下小目標(biāo)的檢測十分有效。
圖3 提出算法檢測結(jié)果
為進一步驗證提出算法的性能,進行對比實驗,采用的對比算法有CNN、RCNN、Faster RCNN、YOLO 以及提出的算法,選取mAP 指標(biāo)(mean average precision,即所有類別AP的平均值),指標(biāo)mAP 的測試對比表如表1。由mAP指標(biāo)的性質(zhì)可知,作為一個相對較好的度量指標(biāo)mAP可有效衡量比較出不同目標(biāo)檢測算法的優(yōu)劣。由表中可知,提出算法的mAP值較高,代表其可在這類場景中效果超過其它算法。本文提出的算法mAP值計算結(jié)果針對圖1~6 分別為39.412、19.572、29.190、28.491、22.651、9.117 3,其它算法中效果最好的YOLO 算法為:39.298、18.003、28.315、29.340、21.387、8.474 1,可見,YOLO 效果雖然較好,但依然不如本文提出的算法。
表1 小目標(biāo)數(shù)據(jù)集的檢測結(jié)果
表2為算法檢測時間對比表,根據(jù)測量單幀處理時間信息,按照CNN、RCNN、Faster RCNN、YOLO 以及提出的算法的順序,處理的平均時間分別為0.416 1、0.788 0、0.634 6、1.281 9、0.579 8,可見,提出的算法計算效率為中等,但綜合檢測效能和計算消耗,性價比最高。結(jié)論:本文提出的算法計算耗時與Faster RCNN 相當(dāng),可滿足絕大多數(shù)應(yīng)用需求。
表2 小目標(biāo)數(shù)據(jù)集的檢測時間表
定義局部信雜比增益SCRG 用于提出算法的性能測試:
SCRout為算法輸出圖像的目標(biāo)信雜比,SCRin為算法輸入圖像的目標(biāo)信雜比。
表3 多種算法處理后序列圖像首幀SCRG 指標(biāo)
定義背景抑制因子BSF用于提出算法的性能測試:
σout為算法輸出圖像的局部噪聲標(biāo)準(zhǔn)差。σin為算法輸入圖像的局部噪聲標(biāo)準(zhǔn)差。
測試完畢后,如表4所示。CNN、RCNN、Faster RCNN、YOLO 以及提出的算法的平均BSF 值分別為1.91、3.24、144.56、215.70、2 217.73。可見,提出算法在處理完畢圖像后,背景抑制因子最高,即對背景的抑制效果最好。
表4 多種算法處理后序列圖像各幀BSF指標(biāo)
綜上所述,通過海天線檢測、尺度匹配策略、融合算法及圖像感興趣區(qū)域選定方法,提出的算法在小目標(biāo)檢測的精度和效率方面都優(yōu)于其他檢測器。
另外,為進一步評估提出方法的目標(biāo)檢測性能,采用受試者工作特性曲線(ROC),實驗結(jié)果如圖4 所示,可見,在相同的虛警率下,本文提出算法的檢測率最高,證明了在ROC曲線下的提出算法性能優(yōu)勢。
圖4 ROC曲線對比圖
針對傳統(tǒng)策略無法準(zhǔn)確檢測小目標(biāo)的問題,設(shè)計一種新的策略,通過多層尺度與縱橫比,更好反映特征層之間準(zhǔn)確的關(guān)系,并捕獲小目標(biāo)?;谛略O(shè)計的尺度,新縱橫比極大減少了框數(shù),提高了算法檢測速度。另外,還引入了自適應(yīng)融合模塊,通過融合特征以及不同的接收域來增加小目標(biāo)周圍的上下文信息。通過海天線處理,按照感興趣區(qū)域的方法,在圖像中去除了冗余背景,在更大范圍內(nèi)對算法進行訓(xùn)練。實驗結(jié)果表明,與其他檢測方法相比,提出的方法在檢測速度和檢測精度方面表現(xiàn)良好。