雷文太 毛凌青 龐澤邦* 任 強 王成浩 隋 浩 辛常樂
①(中南大學計算機學院 長沙 410083)
②(中國電波傳播研究所 青島 266107)
探地雷達(Ground Penetrating Radar,GPR)是一種利用高頻電磁波在地下異常體界面上的散射來探測目標體的無損探測技術,已成為地球物理領域一種重要的探測手段[1–4],廣泛應用于市政工程、交通、軍事等領域。GPR沿地表測線掃描,發(fā)射天線在不同的位置處向地下發(fā)射高頻電磁波,接收天線在每一個位置都會接收到一道A-scan數(shù)據(jù),所有位置的A-scan數(shù)據(jù)按順序組合在一起便形成了一幅B-scan回波數(shù)據(jù)。通過分析該B-scan回波數(shù)據(jù),可以得到地下被測目標的形狀尺寸、介電特性、空間位置信息等參數(shù)。然而由于發(fā)射天線和接收天線之間的耦合、地面反射、地下隨機媒質(zhì)的復雜性等因素,導致GPR B-scan數(shù)據(jù)中存在雜波。雜波和真實目標的回波信號在時域和空域上難以分離,對目標信號造成了嚴重的干擾,增大了地下目標檢測和特征提取的難度。在GPR目標檢測和特征提取之前,必須進行雜波抑制處理。
GPR B-scan回波數(shù)據(jù)是2維數(shù)字矩陣,通常用一幅灰度圖像來表示。GPR B-scan圖像雜波抑制一直是GPR信號處理中一個活躍的研究方向。最簡單的方法是均值減法(M ean Subtraction,MS),即GPR B-scan圖像的每一行減去這一行的均值。這種方法十分方便,但會弱化真實目標的散射回波[5],對于不均勻雜波的抑制效果較差?;谧涌臻g技術的雜波抑制算法有奇異值分解(Singu lar Value Decom position,SVD)[6]、主成分分析(Principal Com ponent Analysis,PCA)[7]、獨立成分分析(Independent Com ponent Analysis,ICA)[8]、非負矩陣分解(Nonnegative M atrix Factorization,NMF)[9]等。這類方法將GPR B-scan圖像分解為多個分量,各分量分別對應于雜波、目標和噪聲。然而在實際處理過程中,目標信息包含在多個分量中,無法很好地加以分離?;谛螒B(tài)成分分析(M orphological Com position Analysis,MCA)[10]的雜波抑制算法將GPR B-scan圖像分解為目標形態(tài)分量和雜波形態(tài)分量,每個分量用相應的字典稀疏地表示。這種方法的復雜度很高,它的性能在很大程度上取決于人工設置的字典。字典選取的不合適,雜波抑制效果變差,大大限制了其適用性?;诘椭认∈璞硎痉ǖ碾s波抑制算法有魯棒非負矩陣分解(Robust Nonnegative M atrix Factorization,RNMF)[11]、魯棒主成分分析(Robust Principal Component Analysis,RPCA)[12]、魯棒自編碼器(Robust Autoencoder,RAE)[13]等。該類方法將GPR B-scan圖像分解為低秩矩陣和稀疏矩陣,目標部分可以用稀疏矩陣表示,雜波部分可以用低秩矩陣表示,對于簡單雜波的抑制效果較好,但對于復雜不均勻雜波的抑制效果有限。
基于深度學習的GPR雜波抑制方法,對GPR數(shù)據(jù)集的構建、深度學習網(wǎng)絡的設計提出了挑戰(zhàn)。文獻[14]提出了一種雙網(wǎng)絡結構與偽標簽結合的自監(jiān)督學習雜波抑制算法。訓練后的網(wǎng)絡具有與RNM F相似的性能,提升了處理速度,但對于不均勻雜波的抑制效果有限。文獻[15]提出了一種基于長短期記憶(Long Short Term M emory,LSTM)網(wǎng)絡的GPR雜波抑制算法,通過LSTM網(wǎng)絡來預測GPR數(shù)據(jù)的雜波信號,網(wǎng)絡的訓練需要輸入相似的A-scan準周期信號。對于不均勻雜波,每道A-scan的雜波信號并不相同,會造成雜波抑制效果下降。Tem lioglu等人[16]提出了一種基于卷積自編碼器的GPR雜波抑制算法,Ni等人[17]設計了一種條件生成對抗網(wǎng)絡來消除GPR雜波。上述兩種深度學習方法都是有監(jiān)督學習,必須要有成對的匹配數(shù)據(jù),但是在實際應用中,獲得有雜波GPR數(shù)據(jù)和與之對應的無雜波GPR數(shù)據(jù)是不現(xiàn)實的。
本文提出了一種用于GPR B-scan雜波抑制的解糾纏表示生成對抗網(wǎng)絡(Disentanglement Represen ts Generative Adversarial Networks,DRGAN),該網(wǎng)絡是一種無監(jiān)督學習網(wǎng)絡,不需要成對的匹配數(shù)據(jù)。解糾纏表示的基本思想是將圖像解構到不同的域中[18],解糾纏表示的思想已成功應用于圖像處理領域,如圖像去噪[18]、風格轉(zhuǎn)換[19]、圖像分類[20]等。本文利用解糾纏表示的思想將含雜波GPR圖像解構到目標域和雜波域中,用于提取GPR圖像的目標特征和雜波特征,同時設計了生成器來生成雜波抑制圖像和含雜波圖像,設計了判別器提供對抗損失來實現(xiàn)網(wǎng)絡的無監(jiān)督訓練,最終實現(xiàn)GPR B-scan圖像的雜波抑制。
本文的其余部分組織為第2節(jié)介紹了所提出的DR-GAN網(wǎng)絡的具體實現(xiàn)方式,包括網(wǎng)絡框架和損失函數(shù)的設計,第3節(jié)給出了實驗結果和相應的分析討論,第4節(jié)對本文進行了總結。
DR-GAN包含2個編碼器、2個生成器,以及3個判別器,DR-GAN的網(wǎng)絡框架如圖1所示。
圖1 DR-GAN的網(wǎng)絡框架
DR-GAN網(wǎng)絡的輸入為含雜波GPR圖像x、無雜波GPR圖像y、雜波背景圖像z,綜合考慮GPR圖像質(zhì)量與網(wǎng)絡訓練時間,輸入圖像的大小設置為256×256×1,其中z僅用于雜波背景判別器DBN的
DR-GAN訓練好后,在測試時,只需要用到ET和GC這兩個模塊。含雜波GPR圖像經(jīng)過ET得到目標特征,目標特征經(jīng)過 GC得到雜波抑制后的GPR圖像,GPR圖像的雜波抑制流程如圖2所示。
圖2 GPR圖像的雜波抑制流程
其中,λ1,λ2,λ3,λ4為總損失函數(shù)的超參數(shù),這4個部分將在下面詳細介紹。
(1)對抗損失
對抗損失使用判別器 DC和判別器DN,DC是為了使生成的xcle與y相似,DN是為了使生成的ynoi和x相似,對抗損失使生成器實現(xiàn)雜波域圖像與干凈域圖像的轉(zhuǎn)換,對抗損失定義為
(2)重建損失
為了使 GC和GN能夠生成雜波抑制圖像和含雜波圖像,使用 GC和GN重建yrec和xrec,并且使xrec與x相同,yrec與y相同,重建損失定義為
其中,‖·‖1為L1范數(shù)。
(3)循環(huán)一致?lián)p失
為了使 GC和GN不是隨機生成雜波抑制圖像和含雜波圖像,而是能夠得到對應x的雜波抑制圖像xcle以及對應y的含雜波圖像ynoi,引入循環(huán)一致?lián)p失來使xcyc與x相同,ycyc與y相同。循環(huán)一致?lián)p失定義為
(4)雜波背景損失
為了使生成的雜波背景圖像與原始雜波背景圖像z相似,以輔助GC和GN更 好地生成xcle和ynoi,雜波背景損失使用判別器DBN對生成的雜波背景圖像(x-xcle)和 (ynoi-y)進行判別,雜波背景損失定義為
2.3.1生成器網(wǎng)絡的結構
DR-GAN網(wǎng)絡的編碼器和生成器結構如圖3所示,編碼器ET和 編碼器EC的結構是相同的,由4層卷積層和3層最大池化層組成,卷積層的卷積核大小均為3×3,步長均為1×1,最大池化層的池化核大小均為2×2,通過卷積層提取GPR圖像的目標特征或者雜波特征。生成器 GC由若干卷積層、上采樣層、跳躍連接、特征融合層、注意力機制模塊組成。生成器 GC的輸入為目標特征FT4,FT3,FT2,FT1,特征FT3,FT2,FT1通過注意力機制模塊后參與跳躍連接,注意力機制使生成器 GC更好地生成雜波抑制圖像。生成器 GN的主體結構與生成器GC一樣,但生成器 GN的輸入是目標特征FT4,FT3,FT2,FT1和雜波特征FC4,FC3,FC2,FC1,特征融合模塊用于融合對應的目標特征和雜波特征得到融合特征FTC4,FTC3,FTC2,FTC1,特征FTC4輸入至上采樣層,特征FTC3,FTC2,FTC1通過注意力機制模塊后參與跳躍連接,注意力機制使生成器 GN更好地生成雜波重建圖像。
圖3 DR-GAN的編碼器與生成器的網(wǎng)絡結構
特征融合模塊如圖3(d)所示,特征融合模塊的輸入是目標特征圖和雜波特征圖,目標特征圖和雜波特征圖經(jīng)過特征融合層進行特征融合,再經(jīng)過卷積核為3×3的卷積層得到最終的輸出。
注意力機制模塊如圖3(e)所示,InputA表示編碼器的壓縮特征,InputB表示生成器的解碼特征,InputA和InputB經(jīng)過卷積層后進行特征相加,再經(jīng)過卷積層和激活函數(shù)得到權重信息。將獲得的權重信息與編碼器的壓縮特征進行相乘,此時編碼器壓縮的特征會被賦予不同的權重,有助于網(wǎng)絡更加關注所需要的特征。
2.3.2判別器網(wǎng)絡的結構
3個判別器的結構是相同的,如圖4所示,采用PatchGAN[21]結構的判別器,在最后一層添加了1個全局平均池化層。判別器由5個卷積層和1個全局平均池化層組成,前4層卷積層的卷積核大小為4×4,步長為2×2。最后一層卷積層的卷積核大小為3×3,步長為1×1,判別器采用L2距離損失。
圖4 DR-GAN的判別器網(wǎng)絡結構
對仿真數(shù)據(jù),采用峰值信噪比(Peak Signal to Noise Ratio,PSNR)和結構相似性(Structu ral SIM ilarity,SSIM)指標進行雜波抑制前后的GPR B-scan定量分析。由于實測的含雜波數(shù)據(jù)沒有對應的無雜波標簽,就無法采用和仿真實驗相同的評價指標。對實測數(shù)據(jù),采用改善系數(shù)(Im p rovem ent Factor,IF)指標[13]進行定量分析,以衡量雜波抑制后的信雜比(Signal to Clutter Ratio,SCR)的改善程度。IF的公式為
其中,SCRbe與S CRaf分別是GPR圖像雜波抑制前后的SCR ,NC和NS分別表示所選雜波區(qū)域RC和信號區(qū)域RS的像素數(shù),I(p)是 GPR圖像中的第p個像素值。
3.2.1仿真模型
GPR仿真數(shù)據(jù)集是使用gp rM ax仿真軟件[22]計算得到的,仿真場景如圖5所示,仿真場景設置為隨機混合土壤,發(fā)射天線和接收天線采用合成孔徑的方式在起伏地表上從左到右掃描探測。地下目標為一個圓柱體或方柱體,目標材料為空氣、金屬或聚氯乙烯(PolyVinyl Chloride,PVC),目標半徑、邊長、埋深和水平位置在一定范圍內(nèi)隨機變化。
圖5 仿真場景模型
一共進行150次A-scan得到B-scan,將B-scan圖像的大小轉(zhuǎn)換為256×256×1用于制作網(wǎng)絡的訓練數(shù)據(jù)集。仿真場景參數(shù)如表1所示。
仿真模型一共有6種不同的地下目標,通過gprM ax在每一種地下目標場景下采集250張含雜波圖像和250張無雜波圖像,一共組成1 500張含雜波圖像和1 500張無雜波圖像。混合介質(zhì)場景下地下無目標的GPR圖像作為雜波背景圖像,通過gprMax采集1 500張雜波背景圖像。DR-GAN的訓練數(shù)據(jù)集由1 500張含雜波圖像、1 500張無雜波圖像、1 500張雜波背景圖像組成。
3.2.2網(wǎng)絡訓練
DR-GAN的超參數(shù)λ1設置為1,λ2設置為5,λ3設置為5,λ4設置為1,使用Adam優(yōu)化器,學習率和一階動量衰減率設置為0.000 2和0.5,使用1 500組數(shù)據(jù)用于訓練,訓練的批大小設置為1,訓練40個周期后結束訓練。網(wǎng)絡在Tensorflow框架上實現(xiàn),在NV ID IA GeForce RTX 2080 SUPER GPU上進行訓練。
3.2.3仿真實驗結果
在測試集上對DR-GAN網(wǎng)絡進行預測,在圖6中展示了3組GPR圖像雜波抑制效果,圖6(a)是含雜波GPR圖像,圖6(b)是含雜波GPR圖像經(jīng)過DRGAN處理后的雜波抑制GPR圖像,圖6(c)是對應的無雜波GPR圖像標簽??梢钥闯鯠R-GAN能夠較好地去除雜波,并且保留了大部分目標雙曲線信息。
圖6 DR-GAN在仿真數(shù)據(jù)上的雜波抑制效果
圖7(a)顯示了仿真的含雜波GPR B-scan圖像,圖7(b)—圖7(h)顯示了MS, SVD, NMF, RPCA, RNMF,RAE,DR-GAN的雜波抑制效果,MS對于不均勻雜波抑制效果較差,幾乎沒有太多作用,SVD和NMF幾乎能保留所有的目標雙曲線信息,對不均勻雜波也具有一定的抑制效果,但還是保留了大部分的雜波分量,RPCA,RNMF,RAE能夠去除大部分雜波,但仍然還是有一些雜波存在,并且丟失了部分目標雙曲線信息,DR-GAN幾乎能去除所有的不均勻雜波,而且保留了目標的主要雙曲線信息。
圖7 不同方法對仿真數(shù)據(jù)的雜波抑制效果
在PSNR,SSIM和時間指標上比較各種算法的雜波抑制性能,分別在6種不同地下目標的測試集上進行測試,每個測試集有30張含雜波圖像,各種雜波抑制算法的平均PSNR(d B)和平均SSIM如表2所示。
由于非金屬目標的回波較弱,因此在去除雜波的同時部分目標信號也被去除了,所以非金屬目標的雜波抑制效果會差于金屬目標。由表2可以看出MS效果較差,NMF與SVD效果類似,但仍然保留了許多雜波成分,所以效果差于RPCA,RNM F,RAE。由于RPCA,RNMF,RAE還是有少量雜波成分,以及在去除雜波的同時丟失了部分目標信息,因此它們的SSIM都較低。DR-GAN的PSNR,SSIM指標均最高,表明DR-GAN能夠較好地抑制雜波,并且保留大部分目標信息。表3列出了不同方法的用時比較,算法的運行平臺和3.2.2節(jié)中的平臺相同,其中RNM F用時最長,其次是RAE,MS用時最短,DR-GAN的運行時間僅為0.103 s,表明DR-GAN能夠近似實時地進行GPR圖像的雜波抑制。
表3 各種雜波抑制方法的平均用時(s)
3.3.1實測數(shù)據(jù)集制作
為了驗證DR-GAN的實測效果,使用制作的沙箱作為實測測試場地,如圖8所示。沙箱中放入石英砂作為背景介質(zhì),放入空心塑料瓶、鋼筋、空心PVC管(外徑25 mm,壁厚3 mm)作為目標,使用中心頻率為2 GHz的GSSISIR4000商用探地雷達采集數(shù)據(jù)。
圖8 實測場景
由于用仿真訓練的權重直接預測實測數(shù)據(jù)效果較差,因此DR-GAN需要在實測數(shù)據(jù)集上訓練才能得到較好的雜波抑制性能。由于網(wǎng)絡的訓練需要無雜波圖像作為B域,但在實測中難以得到無雜波GPR圖像,因此本文參考了文獻[17]中的方法,來制作一種仿真-實測數(shù)據(jù)集,如圖9所示,將仿真的無雜波數(shù)據(jù)添加到實測的無目標背景圖像中來得到A域含雜波圖像,仿真的無雜波數(shù)據(jù)作為B域無雜波圖像,實測的無目標背景圖像作為雜波背景圖像。制作260組數(shù)據(jù)用于DR-GAN網(wǎng)絡的訓練。
圖9 實測雜波數(shù)據(jù)的制作
3.3.2實測數(shù)據(jù)結果
圖10展示了DR-GAN處理實測數(shù)據(jù)的效果,圖10(a)是實測的GPR圖像,圖10(b)是經(jīng)過DR-GAN處理后的雜波抑制圖像??梢钥闯鯠R-GAN能夠較好地抑制雜波,并且保留大部分目標雙曲線信息。
圖11(a)是實測的GPR圖像,由于實測環(huán)境的不均勻性,實測GPR圖像的部分雜波是不均勻的,圖11(b)—圖11(h)是MS, SVD,NMF,RPCA,RNMF,RAE,DR-GAN的雜波抑制結果,由于雜波的不均勻,MS只能去除部分均勻的雜波,SVD與NMF效果類似,能夠去除部分雜波,但還是保留了較多雜波成分,RPCA與RNMF能夠去除較多的雜波,但仍然還是有少量雜波剩余,由于目標較弱,RAE在去除雜波的同時把目標也去除了,DR-GAN幾乎能把所有雜波去除,并且將主要的雙曲線信息都保留下來了。
圖11 不同方法對實測數(shù)據(jù)的雜波抑制效果
各種算法對實測數(shù)據(jù)進行雜波抑制的IF指標如表4所示,每個測試集有10張含雜波圖像,從表4可以看出在不同測試集上DR-GAN的IF指標均最高,進一步驗證了DR-GAN的雜波抑制性能。從鋼筋目標的處理結果看,其IF指標較RNM F方法提高了17.85 dB。
表4 實測數(shù)據(jù)雜波抑制的平均IF(dB)
本文設計了一種無監(jiān)督學習網(wǎng)絡DR-GAN用于抑制GPR圖像的雜波。與有監(jiān)督學習網(wǎng)絡不同,DRGAN的訓練不需要成對的匹配數(shù)據(jù),擴大了該方法的適用性。DR-GAN通過目標特征編碼器和雜波特征編碼器分別提取GPR圖像中的目標特征和雜波特征,雜波抑制生成器和雜波重建生成器分別利用目標特征和目標特征及雜波特征得到雜波抑制后的GPR圖像和具有雜波的GPR圖像,實現(xiàn)含雜波GPR圖像和無雜波GPR圖像的解糾纏表示學習,通過判別器提供對抗損失使生成器生成相應圖像,不斷降低生成器和判別器的損失誤差以完成訓練,訓練好的DR-GAN通過目標特征編碼器和雜波抑制生成器實現(xiàn)GPR圖像的雜波抑制。
采用仿真軟件,生成了在混合土壤場景下的1 500組GPR B-scan數(shù)據(jù)用于DR-GAN的訓練,DR-GAN與常用的雜波抑制算法相比(如SVD,RPCA,RNMF等),在PSNR和SSIM指標上均取得了更好的結果。同時也采用實測數(shù)據(jù)進行了處理驗證,制作了仿真-實測數(shù)據(jù)集用于網(wǎng)絡的訓練,并在實測數(shù)據(jù)上驗證了此方法的性能。實測數(shù)據(jù)的處理結果表明,DR-GAN具有更好的不均勻雜波抑制效果。