龔承君 蒲宇清
(武漢市交管局科技管理處 武漢 430000)
目標識別[1]問題是數據融合中的基本問題之一,將系統(tǒng)中多個數據源提供的目標身份信息綜合處理,產生比系統(tǒng)中單一信源更有效、更精確的身份估計和分類判決。物理模型法主要有卡爾曼濾波[2~3]、最大似然估計、最小二乘法[4];基于特征的推理技術主要有貝葉斯推理[5]、D-S證據理論[6];基于知識表示技術[7]的方法主要有專家系統(tǒng)、模糊集合論[8]和邏輯模板[9]。在實際檢測中,傳感器數量大且種類繁多,返回量測數據各式各樣,傳統(tǒng)目標識別方法計算較復雜且魯棒性較低。本文提出一種基于卷積神經網絡[10]的智能識別技術,利用卷積神經網絡直接從大量復雜傳感器數據中提取特征進行推理的能力,構造固定大小的目標識別決策矩陣,輸入卷積神經網絡進行身份判別。
目標信息綜合了運動特征信息和輻射源特征信息,其中運動特征信息包括目標高度、速度、加速度、最大爬升率,輻射源特征信息包括目標載頻、重復頻率、脈沖寬度、天線掃描周期,共8 種可識別屬性,將其記為ai(i=1,2,…,8)。目標待識別種類有防爆運兵車、機要指揮車、通信指揮車、裝備輸送車、布障車、運犬車、攀登突擊車以及防爆水炮車共8 類,記為bj(j=1,2,..,8)。目標待識別的種類和屬性按上述順序排列,依次計算各個特征信息與身份向量的歐氏距離dxi,yj,根據匹配度計算公式計算匹配度:得到目標識別決策矩陣i=1,...,8,j=1,...,8。
根據2.1 節(jié)建立的目標識別問題模型,算法綜合不同類別的傳感器上傳的運動特征信息和輻射源信息,計算每種數據與每個待識別目標的匹配度,形成目標識別決策矩陣輸入卷積神經網絡,由卷積神經網絡判別后輸出身份識別結果。算法流程如圖1所示。
圖1 基于卷積神經網絡的目標識別方法流程
算法將系統(tǒng)接收到的同一運動特征信息與目標身份的匹配度以及輻射源特征信息與目標身份的匹配度合并為一個目標識別決策矩陣。通過各個卷積核對目標識別決策矩陣進行特征提取,使用池化層對提取的特征圖進行壓縮,使用全連接層將卷積核學到的特征映射到樣本標記空間,然后交給Softmax 分類器獲得分類輸出?;诰矸e神經網絡的目標識別算法分為訓練和推理兩部分:1)訓練階段:設計卷積神經網絡,調整網絡結構,以建立模型復雜度與識別問題復雜度匹配的網絡模型,引入Dropout策略[11]防止網絡出現過擬合,保存模型;2)推理階段:將待識別的傳感器數據輸入保存的網絡模型,輸出身份識別判決結果。
1)標準化處理:數據的標準化處理是將數據按比例縮放,將其轉化為無量綱的純數值,使得不同量級或單位的數據具有可比性。本文采用最大最小值標準化對仿真生成的數據進行預處理,使其分布在區(qū)間[0,1]之間,其公式如下:
xi為待歸一化數據,yi為歸一化后的輸出。
2)One-hot 編碼:基于卷積神經網絡的目標識別算法將識別問題轉化為分類問題,標簽的類別(8類車輛)為離散型字符變量,在計算損失函數即神經網絡輸出和真實標簽值的相似度時,需要通過one-hot 編碼將標簽轉化為數值型變量,將離散特征的取值擴展到歐氏空間。
本文使用的卷積神經網絡結構如圖所示,對于本文構造的目標識別決策矩陣,每一列數據代表某一類待識別目標的運動征和輻射源特征,這些數據本身存在一定的關聯(lián)性,因此目標識別決策矩陣的基本特征比較少,所以我們選取網絡層數相對較少的Alexnet[12],參數量更少,網絡訓練速度更快。
圖2 本文使用的CNN網絡結構
網絡的輸入為8×8 大小的目標身份決策矩陣。第一層卷積層采用2×2 卷積核進行特征提取,輸出特征數為8 個。使用Relu 激活函數[13]對輸出值引入非線性,強化特征表示能力。每一層卷積層后對輸出的特征圖進行周邊補0(padding模式),使特征圖始終保持8×8 大小。通過多層卷積層進行特征提取,最后輸出特征圖[14]數量為64。在第4層和第8 層,我們嘗試使用不同的池化方式來減少網絡參數,加快訓練速度。最后將提取的特征圖交由全連接層映射至樣本的標記空間,最后由Softmax分類器輸出分類結果。再調整網絡的參數包括卷積核參數,根據網絡在測試集上的識別準確率對以上參數進行優(yōu)化。
數據集由劇情仿真生成。對于運動特征信息,待識別目標對應的目標高度、速度、加速度、最大爬升率如表1所示。
對于輻射源特征信息,假設存在4 種型號的雷達,分別為雷達1、雷達2、雷達3、雷達4,其對應的目標載頻、重復頻率、脈沖寬度和天線掃描周期范圍如表2所示。
假設防爆運兵車、攀登突擊車和防爆水炮車裝備輻射源為雷達1,布障車裝備輻射源為雷達2,裝備輸送車和運犬車裝備輻射源為雷達3,通信指揮車裝備輻射源為雷達4。輻射源探測系統(tǒng)對目標載頻的量測精度隨目標載頻大小變化,取目標載頻的量測精度一般值為5MHz,即載頻量測誤差的值由均值為0,標準差為5的正態(tài)分布隨機產生;對于目標重復頻率,其量測誤差的值由正態(tài)分布產生,其中均值為0,標準差計算公式如下:
其中,PRF 為目標重復頻率的值,σPRF為目標重復頻率誤差的標準差。
對于目標脈沖寬度,其量測誤差值由正態(tài)分布產生,其中均值為0,標準差計算公式如下:
其中,PW 為目標脈沖寬度的值,σPW為目標脈沖寬度誤差的標準差。
假設其誤差分布滿足區(qū)間[-0.1T,0.1T]上的均勻分布,其中T 為天線掃描周期的真實值。仿真時每次生成一個目標的運動特征與輻射源特征的量測信息,運動特征信息中最大高度在20m~10000m,最大速度在0~3000km/h,最大加速度在0~90m/s2,最大爬升率在0~500m/s 內隨機生成,隨機分布模型采用均勻分布。輻射源特征信息中,載頻、重復頻率、脈沖寬度和天線掃描周期由表中的真實值和誤差相加而成。計算所有特征信息的值與各待識別目標的特征真實值的匹配度pij,其中i=1,2,…,8,j=1,2,…,8,獲得一個目標識別決策矩陣。通過以上仿真劇情產生樣本集,并劃分訓練集和測試集,其中訓練集數據與測試集數據比例為4∶1,訓練集數據共16w 組,測試集數據共4w組,每一類待識別目標各占樣本總數的1/8。
在卷積神經網絡中,池化層[15]的作用主要是通過降低特征圖的大小以減少計算量,同時保留主要的特征來防止過擬合。以下主要討論兩種池化方法以及不使用池化對算法性能的影響。圖3 為在使用dropout 比例為0.5 時,分別使用平均池化、最大池化以及不使用池化采樣時測試集準確率變化趨勢對比。
圖3 平均池化、最大池化以及無池化采樣時的測試集準確率對比
采用平均池化還是最大池化采樣表現較不采用池化時均有下降。表3 為性能對比。由于使用2×2 池化降低需要訓練的參數量,平均單步訓練時間較無池化采樣時低,池化丟失了部分特征使得網絡收斂速度以及最終的測試集表現都較無池化采樣低,故使用網絡模型在原有基礎上去掉池化層。
表3 無池化、平均池化以及最大池化性能對比
Dropout 可以起到防止過擬合的作用,本節(jié)主要討論選擇不同比例p 時對網絡表現的影響,以選擇較優(yōu)的p 值。圖4 為p 值分別為0.1、0.3、0.5、0.8和1(p=1 表示不使用dropout)時,測試集準確率變化趨勢對比。
圖4 p值分別為0.1、0.3、0.5、0.8以及1時的測試集平均準確率變化趨勢對比
表4 為使用不同dropout 比例時的測試集平均準確率對比,對于使用的神經網絡而言,當p=0.1即每次僅使用10%的全連接層節(jié)點用于參數更新時,網絡難以充分訓練,使得模型在訓練集和測試集上的表現較差。p=0.5 時,網絡在測試集上的表現最佳。最終的模型參數選取隨機失活比例為0.5,其識別準確率可達86.71%。
表4 使用不同dropout比例時的測試集最大準確率對比
本文對目標識別問題進行建模分析,提出一種基于卷積神經網絡的目標識別方法。通過計算特征信息與目標身份向量的匹配度構造固定大小的目標身份決策矩陣,作為卷積神經網絡輸入,并針對該矩陣的特性修改了網絡結構。仿真產生目標識別算法的樣本集,在樣本集上設計仿真對比試驗優(yōu)化了池化方式以及隨機失活比例等參數。當傳感器量測誤差在一定范圍內隨機變化時,基于卷積神經網絡的目標識別算法在該數據集的識別準確率達到86.71%,證明了算法的有效性。