徐高貴,殷紅成,袁莉,董純柱
(1.中國傳媒大學 理工學部,北京 100024;2.電磁散射重點實驗室,北京 100854)
窄帶雷達目標回波所攜帶的目標特征信息有限,僅僅依據窄帶特征無法滿足空間目標精確識別的要求。而寬帶信息具有較高的距離分辨率,能夠反映目標的結構、尺寸等細節(jié)信息,有利于目標的識別[1]。與基于二維SAR圖像或ISAR圖像識別技術不同的是,一維距離像(高分辨距離像,High-resolution Range Profile,HRRP)避免了復雜的運動補償、對目標運動的特殊要求等問題,反映了目標尺寸和結構的特征,每個峰值位置與目標局部散射中心位置相對應,從而有利于目標的識別[2-4]。
傳統(tǒng)的基于HRRP的目標識別主要是提取平移、尺度不變性等特征,然后將這些特征組合為特征矢量,通過設計適當的分類器完成目標識別。常見的分類器包括模板匹配法[5-6]、支持向量機[7-8]、聚類[9]、BP神經網絡[10]等。這些方法均需要人工進行特征的設計與提取,例如功率譜特征、目標強散射中心特征和熵值特征等,受噪聲影響較大。如何提取性能更好、更穩(wěn)定的特征成為HRRP目標識別的研究難點。近年來,深度學習理論在模式識別領域掀起了一股浪潮,其在圖像分類、目標檢測、自然語言處理、文本翻譯等領域取得了巨大的成功[11]。許多學者開始用深度學習理論解決HRRP目標識別問題,文獻[12]提出了基于注意循環(huán)神經網絡的雷達高分辨距離像目標識別,取得了較好的識別結果。但是它需要對HRRP提取時域特征,同時為了克服平移敏感性等問題,需要進行一定的預處理操作。與循環(huán)神經網絡不同的是,卷積神經網絡(Convolutional Neural Network,CNN)以其權值共享、平移不變性等特點在圖像識別領域有著較多成功的應用。文獻[13-14]均將卷積神經網絡應用到HRRP目標識別中,但使用的都是一維的距離像,忽略了雷達觀測前后相鄰時刻距離像之間的相關性,不利于目標識別。
為了解決前面提出的問題,本文提出了一種基于卷積神經網絡的HRRP序列圖的空間目標識別模型。該模型是一種端到端的分類模型,避免了特征選擇、特征提取等工作。它通過自動提取空間目標的寬帶信息,不僅考慮了目標尺寸和結構的特征,也考慮了相鄰時刻目標運動所反饋的運動特性,更符合空間目標識別的實際情況。通過從雷達部署點、飛行軌跡以及兩者的混合影響等三個方面分別與傳統(tǒng)的空間目標識別算法進行對比分析,結果表明,本方法具有較好的分類識別率,同時泛化能力強。
本文所使用的卷積神經網絡模型結構如圖1所示,輸入為目標距離像序列圖,經過兩次卷積操作后進行下采樣,然后重復這一過程。圖中方塊表示經過卷積、池化后特征圖的維度,可以看出,隨著網絡層次的加深,卷積核的數量在增加,特征圖的尺寸在急劇減小。
圖1 卷積神經網絡模型結構
假設輸入圖像為X0,第i層的特征圖Xi可表示為:
Xi=f(Wi?Xi-1+bi)
(1)
其中i=1,2,…,nc,nc表示網絡中卷積層的數目,這里nc=5。Wi表示網絡第i層與第i-1層連接的卷積核的權重,bi表示偏置項,符號?表示卷積運算。在該運算中,對輸入特征圖不做邊界填充等處理,故而卷積后的特征圖尺寸將有所減小。
CNN網絡中,卷積核就是圖像處理中的濾波器,卷積運算主要是提取圖像中的特征,是一個線性運算。如果在網絡中不加以非線性變換,網絡將只能學習到輸入圖像的線性特征,從而導致網絡無法處理非線性問題,應用場景受限。為了避免這種情況,公式中的函數f表示一類非線性函數,通常也稱為激勵函數。常見的激勵函數有Sigmoid函數、tanh函數等,本文使用的是修正線性單元(The Rectified Linear Unit,ReLU),函數表達式為:
(2)
池化層通常夾在連續(xù)的卷積層中間,依據一定的規(guī)則對特征圖進行下采樣。本文采用的是窗口大小為2×2,步長為2的最大池化,即在2×2的方陣中,使用最大值替代該方陣,故而特征圖將縮小一倍。池化層可實現對特征圖的壓縮,極大地減少了網絡參數,防止過擬合,同時具有一定的特征尺度不變性。
經過多個重復的卷積和池化后,特征圖的尺寸將越來越小,網絡學習的特征也將越抽象。最后全連接層與輸出層構成目標的分類器,ReLU激勵函數的輸出是實數域,而分類問題中的類別標簽是有限的離散值,故而ReLU函數不適合作為輸出層的激勵函數??紤]到Softmax函數將實數域變換到 (0,1)之間,可表示屬于某類的概率,函數表達式為:
(3)
其中,L表示目標類別總數。
因此,在輸出層,激勵函數可采用Softmax函數,目標類別由概率最高的神經元決定。CNN的訓練可分為前向傳播和后向傳播兩個過程,在前向傳播中,根據輸入的圖像通過權值計算網絡的輸出;在后向傳播中,通過網絡預測與真實值之間的差異自動更新權值參數。損失函數L(W,b)就是衡量網絡預測值與真實值差異的指標,在多分類問題中,損失函數可取為:
2.無癥狀期:可從急性期進入此期,或無明顯的急性期癥狀而直接進入此期。此期持續(xù)時間一般為6~8年。其時間長短與感染病毒的數量和型別、感染途徑、機體免疫狀況的個體差異、營養(yǎng)條件及生活習慣等因素有關。在無癥狀期,由于HIV在感染者體內不斷復制,免疫系統(tǒng)受損,CD4+T淋巴細胞計數逐漸下降??沙霈F淋巴結腫大等癥狀或體征,但一般不易引起重視。
(4)
其中yi表示真實的分類結果,ai表示屬于第i類的概率,可表示為:
ai=σ(Wk(…W2(σ(W1x+b1))+b2)+…bk)
(5)
式中,σ(x)表示激勵函數。
損失函數表征的是單個樣本網絡預測值與真實值之間的差異,衡量的是算法在單個樣本上的性能。代價函數表示算法在整個訓練樣本上的性能,網絡模型訓練的時候,本質上就是尋找合適的參數集W,b,使得代價函數最小。為了避免過擬合,最終的代價函數會增加L2范數,以控制權值參數W,可表示為
(6)
其中,m表示訓練樣本的個數。
計算出代價函數后,即可通過梯度下降法對網絡參數進行自動更新。具體是通過從后往前,即從輸出層到輸入層依據鏈式法則逐層傳遞殘差,從而更新網絡參數W和b,如式所示。
(7)
其中,η表示學習率,控制參數更新的快慢。
CNN在訓練過程中,根據公式和公式更新網絡參數W和b,使得總的代價函數最小。網絡收斂后,針對新的未知數據,CNN通過將輸入圖像逐層向前傳導,上一層的特征圖作為下一層的輸入,依據公式(5)給出最終的識別概率。
為了研究飛行軌跡、雷達部署點等因素對空間目標識別的影響,針對四種類型的空間目標,分別設定2種飛行軌跡和2個雷達部署點,共仿真生成了4組目標散射特性數據。其中四種類型的空間目標分別為鈍頭圓錐、圓柱、尖錐和球,幾何模型如圖2所示;雷達、飛行軌跡等相關信息如表1所示。
圖2 空間目標的幾何模型
表1 空間目標4組場景參數
表1中,4組目標場景數據共有2種飛行軌跡,分別為A(高軌)、B(低軌),飛行高度如圖3所示。每種軌跡共有2個雷達部署點,每個部署點的經緯度均不相同。故而,可從雷達部署點、飛行軌跡以及兩者的混合影響等三個方面分別進行基于卷積神經網絡的空間目標識別研究。
圖3 飛行軌跡的高度
在4組目標特性數據中,為了考慮不同雷達部署點對識別性能的影響,每次實驗的訓練集和測試集應在同一飛行軌跡下。故而共設計兩組實驗,其一為A01軌跡作為訓練集,A02作為測試集;其二為B01軌跡作為訓練集,B02作為測試集,如表2所示。
表2 測試雷達部署點對識別性能影響的實驗方案
訓練集與測試集中雷達部署點經緯度大概相差1°,位置上相距100 km左右。依據表2的實驗方案,構建如圖1所示的卷積神經網絡,對空間目標的距離像序列圖分別進行訓練和測試,兩種方案的識別結果匯總如表3所示。
表3 不同部署點的識別率
從表3可以看出,當兩雷達相距100km左右時,不同的雷達部署點主要對鈍頭圓錐識別性能影響較大,識別準確率為84.96%,其他目標的識別率均在98%以上。為了與傳統(tǒng)方法做對比,采用功率譜特征、目標強散射中心特征、徑向長度和熵值特征等特征結合支持向量機(SVM)進行目標識別實驗,識別準確率為78.62%。該結果表明,基于CNN的距離像序列圖的識別準確率提高了16%左右。
飛行軌跡的高低不僅會影響到目標的落腳點,對同一位置的雷達而言,其與目標的視線角不同,將對目標識別準確率產生影響。為了獲得不同軌跡對識別性能的影響,每次實驗的訓練集和測試集雷達部署點應在同一位置。故而共設計兩組實驗,每組實驗方案的訓練集與測試集劃分明細如表4所示。
表4 測試軌跡對識別性能影響的實驗方案
表5給出了雷達部署點相同時,不同飛行軌跡下兩種方案總的識別結果。實驗結果表明,只有少量球類樣本被識別為尖錐,鈍頭圓錐、圓柱以及尖錐的識別率均為100%,平均識別率接近100%。與雷達部署點對識別性能的影響相比,飛行軌跡對識別性能的影響較小?;赟VM傳統(tǒng)的目標識別算法平均識別準確率為83.4%,這表明對于傳統(tǒng)算法而言,飛行軌跡對識別性能的影響比較小,與本算法的結論不謀而合。
表5 不同飛行軌跡的識別率
為了觀測不同地方發(fā)射的空間目標,雷達部署點往往也不同。用已知場景的目標散射特性數據進行網絡模型的訓練,然后使用訓練好的模型進行未知場景空間目標的識別將更具有實際意義。在該4組數據中,為了考慮雷達部署點、飛行軌跡對識別性能的混合影響,假設已知高軌場景中各目標的類型,需要預測低軌不同雷達觀測數據的目標類型,可使用A01和A02所有數據作為訓練集,B01和B02的所有數據組成測試集,識別結果如表6所示。
從表6可看出,雖然飛行軌跡和部署點均存在差異,但是由于加大了訓練樣本,網絡觀測到的數據也更多,獲得了更高的識別準確率。而傳統(tǒng)SVM目標識別算法的準確率僅為80.3%,這表明當樣本足夠多時,再增加樣本對傳統(tǒng)算法的性能幾乎沒有幫助。
表6 不同部署點和不同飛行軌跡的識別率
本文提出了一種基于卷積神經網絡的高分辨距離像序列空間目標識別方法,與傳統(tǒng)方法不同的是,該方法避免了人工特征選擇、特征提取等工作。高分辨距離像序列不僅反映了目標的尺寸、結構等信息,而且包含目標一定的運動信息。通過構建適當的網絡模型,從雷達部署點、目標飛行軌跡以及兩者的混合影響等三個方面對該方法進行了驗證。實驗結果表明,CNN能夠有效地從距離像序列圖中提取到穩(wěn)定、有效的特征,平均識別準確率在95%以上,相對于傳統(tǒng)的基于SVM識別算法,平均識別準確率提升了16%以上。