李雅朦,武艷偉,裴曉帥,宋 揚(yáng)
(中國(guó)電子科技集團(tuán)公司信息科學(xué)研究院,北京100086)
隨著電子戰(zhàn)信號(hào)環(huán)境的復(fù)雜化及雷達(dá)信號(hào)形式的多樣化,依靠傳統(tǒng)的五大參數(shù)法(脈寬、載頻、到達(dá)角、幅度和到達(dá)時(shí)間)進(jìn)行信號(hào)分選時(shí)不可避免地會(huì)產(chǎn)生參數(shù)模糊,影響信號(hào)分選的效果[1]。如果能對(duì)分選出的每個(gè)雷達(dá)脈沖序列的PRI調(diào)制特性進(jìn)行分析,一方面有助于解決參數(shù)模糊問題,提高信號(hào)分選的可靠性[2];另一方面,PRI調(diào)制形式反映了雷達(dá)信號(hào)的某些特性,對(duì)PRI調(diào)制類型的正確識(shí)別將有助于推定雷達(dá)的用途與性能,實(shí)現(xiàn)輻射源識(shí)別。因此,對(duì)復(fù)雜體制的PRI調(diào)制方式進(jìn)行識(shí)別是ESM中的重要任務(wù)之一。
一般而言,復(fù)雜體制PRI調(diào)制識(shí)別算法應(yīng)可以解決如下3個(gè)問題:
1)脈沖樣本數(shù)量少時(shí),可對(duì)PRI調(diào)制方式進(jìn)行有效識(shí)別[3]。例如,對(duì)于搜索雷達(dá),其旋轉(zhuǎn)一周,電子偵察接收機(jī)只能接收到近100個(gè)脈沖。
2)存在TOA測(cè)量誤差,噪聲脈沖條件下,可對(duì)PRI調(diào)制進(jìn)行有效識(shí)別[4]。由于電子偵察中所截獲信號(hào)的信噪比通常較低,加之接收機(jī)的性能限制及去交錯(cuò)算法本身的局限性,TOA的估計(jì)誤差、噪聲脈沖的存在是無法避免的。
3)所選取的分類特征應(yīng)具有一定的不變性[5]。所謂分類特征的不變性是指調(diào)制分類特征應(yīng)基本不受PRI調(diào)制參數(shù)變化的影響。因?yàn)橥环NPRI調(diào)制方式其具體的調(diào)制參數(shù)是變化的,而用來區(qū)分不同的PRI調(diào)制的特征若受參數(shù)變化影響較大,將導(dǎo)致分類識(shí)別算法的頑健性下降。
針對(duì)PRI調(diào)制類型識(shí)別中出現(xiàn)的問題,本文提出了一種基于DAE(深度自編碼器)的類型識(shí)別新方法。該方法主要由2部分組成,首先采用濾波器思想將不同調(diào)制方式的PRI序列特征顯性化,然后對(duì)預(yù)處理之后的序列通過等間隔采樣進(jìn)行數(shù)據(jù)降維,在不丟失數(shù)據(jù)特征的前提下盡可能縮短網(wǎng)絡(luò)訓(xùn)練的時(shí)間,達(dá)到快速識(shí)別分類的目的,最后將樣本送入DAE模型進(jìn)行樣本數(shù)據(jù)訓(xùn)練,最后采用softmax分類器完成分類識(shí)別任務(wù)。
雷達(dá)信號(hào)脈間PRI調(diào)制是指雷達(dá)脈沖信號(hào)重復(fù)間隔的有規(guī)律變化。脈間PRI調(diào)制方式主要有固定、參差、抖動(dòng)、滑變、正弦調(diào)制及駐留與切換等,對(duì)于抖動(dòng)、滑變、正弦調(diào)制及駐留與切換等PRI調(diào)制方式,在去交錯(cuò)處理時(shí)只能粗略地識(shí)別成“復(fù)雜”類型,無法做出具體的判斷[6]。在偵察接收機(jī)接收到脈沖序列后,與傳統(tǒng)的識(shí)別流程不同,本文省略對(duì)脈沖序列進(jìn)行特征提取和去交錯(cuò)等步驟,直接將截獲的中頻數(shù)據(jù)經(jīng)過簡(jiǎn)單的預(yù)處理后送入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練及分類識(shí)別。因?yàn)榭紤]到對(duì)于搜索雷達(dá),其旋轉(zhuǎn)一周,電子偵察機(jī)只能收到近100個(gè)脈沖,所以本文提出的算法可以在脈沖樣本數(shù)量較少時(shí),對(duì)PRI調(diào)制方式進(jìn)行有效識(shí)別。
通過對(duì)雷達(dá)脈沖信號(hào)PRI序列特點(diǎn)的分析,可以得知,對(duì)于不同調(diào)制方式的PRI,在中頻數(shù)據(jù)中主要體現(xiàn)在每個(gè)脈沖的到達(dá)時(shí)間不同,如果不進(jìn)行數(shù)據(jù)預(yù)處理,在中頻數(shù)據(jù)中就存在很多干擾信息,如脈內(nèi)調(diào)制方式、脈內(nèi)高斯噪聲、脈沖強(qiáng)度,一定程度上影響了PRI調(diào)制方式識(shí)別的識(shí)別率和識(shí)別速度[7]。針對(duì)此問題,本文提出了一種基于濾波器思想的數(shù)據(jù)預(yù)處理方法,其數(shù)學(xué)模型為:
設(shè)截獲到的脈沖序列的采樣幅值集合A作為濾波器輸入,濾波器的響應(yīng)為H,輸入與響應(yīng)之間的數(shù)學(xué)關(guān)系為:
根據(jù)(1)式得到的響應(yīng)集合H過濾掉了對(duì)于PRI調(diào)制識(shí)別無效的脈內(nèi)信息,然后根據(jù)響應(yīng)集合H的總長(zhǎng)度L,對(duì)集合進(jìn)行等間隔采樣,在保留數(shù)據(jù)特征的同時(shí)降低數(shù)據(jù)維度。以滑變PRI調(diào)制方式說明以上流程,如圖1所示。
圖1 預(yù)處理流程
PRI序列的圖片經(jīng)過放大后可以看到在每個(gè)脈沖內(nèi)的調(diào)制方式為L(zhǎng)FM(線性調(diào)頻),如圖2所示,而圖1的濾波后PRI序列和采樣后PRI序列中是不包含脈內(nèi)調(diào)制信息的。
圖2 原始信號(hào)脈內(nèi)信息
在圖1中,原始PRI序列的點(diǎn)數(shù)為120 000,濾波后PRI序列的點(diǎn)數(shù)為12 000,再經(jīng)過采樣后的PRI序列點(diǎn)數(shù)變?yōu)? 000,從點(diǎn)數(shù)的變化可以看到,預(yù)處理過程對(duì)長(zhǎng)序列數(shù)據(jù)也起到了很好的降維效果,在保留PRI調(diào)制本質(zhì)特征信息的同時(shí)有助于降低后期的網(wǎng)絡(luò)訓(xùn)練速度及網(wǎng)絡(luò)維度。
自編碼器是一種理想狀態(tài)下輸出和輸入相同的特殊神經(jīng)網(wǎng)絡(luò)算法,輸出向量是對(duì)輸入向量的復(fù)現(xiàn)[8]。整個(gè)輸入層和隱藏層稱為編碼器,輸入向量映射到具有不同隱藏層維度的向量[9]。整個(gè)隱藏層和輸出層稱為解碼器,隱藏層的向量映射到輸出向量。隱藏層向量可以復(fù)現(xiàn)輸入向量。自編碼器的主要功能就是生成輸入數(shù)據(jù)的主要特征表示向量。
圖3 含2個(gè)隱藏層的深度自編碼器
深度自編碼器是由2個(gè)或2個(gè)以上的單個(gè)自編碼組合而成的,實(shí)則就是增加了隱藏層的數(shù)量,經(jīng)過貪婪算法預(yù)訓(xùn)練和多層非線性網(wǎng)絡(luò),最后從復(fù)雜高維的輸入數(shù)據(jù)中學(xué)習(xí)到不同維度和層次的抽象特征向量[10]。深度自編碼器中的每一個(gè)隱藏層都是輸入特征的另一種表示,并降低了輸入數(shù)據(jù)的維度,具有提取輸入特征的強(qiáng)大學(xué)習(xí)能力,如圖3所示。整個(gè)深度自編碼器的訓(xùn)練過程包括2個(gè)步驟[11]:第一步是預(yù)訓(xùn)練,通過無監(jiān)督學(xué)習(xí)方式去訓(xùn)練單個(gè)自編碼器,每當(dāng)上一層訓(xùn)練完時(shí),輸出被當(dāng)作下一層的輸入,再繼續(xù)訓(xùn)練,直到訓(xùn)練完整個(gè)隱含層,最后輸出。假設(shè)有3個(gè)隱藏層的深度自編碼器,X表示輸入要素向量,hi表示每個(gè)隱藏層的表示向量,X′,h1′和h2′表示單個(gè)自編碼器重建的輸出向量,w和wT都是權(quán)重矩陣。預(yù)訓(xùn)練的具體步驟如下,如圖4所示。
圖4 預(yù)訓(xùn)練含三個(gè)隱藏層的深度自編碼器圖
1)用無監(jiān)督訓(xùn)練的方式訓(xùn)練深度自編碼器的第一隱藏層;
2)上一個(gè)隱藏層訓(xùn)練完成的輸出被視為下一個(gè)隱藏層的輸入,再以無監(jiān)督方式進(jìn)行訓(xùn)練;
3)重復(fù)執(zhí)行步驟2),直到把所有的隱藏層都訓(xùn)練結(jié)束。
第二步是微調(diào)。是在預(yù)訓(xùn)練結(jié)束后,再訓(xùn)練整個(gè)深度自編碼器,并利用誤差反向傳播調(diào)整整個(gè)系統(tǒng)的參數(shù),使得權(quán)值和偏置值都達(dá)到最優(yōu)。
分別構(gòu)建3個(gè)3層的自編碼器,其中第1個(gè)自編碼器的結(jié)構(gòu)為:由1 000個(gè)單元組成的輸入層、由128個(gè)單元組成的全連接隱含層、由1 000個(gè)單元組成的重構(gòu)層;第2個(gè)自編碼器的結(jié)構(gòu)為:由128個(gè)單元組成的輸入層、由64個(gè)單元組成的全連接隱含層、由128個(gè)單元組成的重構(gòu)層;第3個(gè)自編碼器的結(jié)構(gòu)為:由64個(gè)單元組成的輸入層、由32個(gè)單元組成的全連接隱含層、由64個(gè)單元組成的重構(gòu)層。深度自編碼器網(wǎng)絡(luò)的設(shè)計(jì)過程如下:
1)先分別計(jì)算3個(gè)自編碼器中每層單元的權(quán)重和偏置,作為3個(gè)自編碼器的初始化權(quán)重值和偏置值:
式中,w(i)表示自編碼器中第l層的權(quán)重,x表示每次初始化權(quán)重值和偏置值時(shí)在范圍內(nèi)隨機(jī)選取的一個(gè)不同的數(shù),ni表示自編碼器中第l層的單元總數(shù),b(i)表示自編碼器中第l層的偏置。
2)從樣本矩陣中取一批行向量輸入到搭建的第1個(gè)自編碼器中進(jìn)行預(yù)訓(xùn)練,將第1個(gè)自編碼器隱含層單元的輸出值組成第1個(gè)特征矩陣;利用損失函數(shù)公式,計(jì)算第1個(gè)自編碼器的損失值,利用自編碼器權(quán)重和偏置的更新公式,用第1個(gè)自編碼器損失值更新其權(quán)重和偏置后拋棄第1個(gè)自編碼器的重構(gòu)層。
所述損失函數(shù)公式如下:
式中,J表示自編碼器的損失值,m表示預(yù)訓(xùn)練的批大小,表示自編碼器的輸入層的單元總數(shù),xij表示輸入數(shù)據(jù),zij表示自編碼器的輸出值。所述自編碼器權(quán)重和偏置的更新公式為:
式中,w表示自編碼器的權(quán)重,b表示自編碼器的偏置,μ表示值為0.1的學(xué)習(xí)率。
3)將第1個(gè)特征矩陣輸入到第2個(gè)自編碼器中進(jìn)行訓(xùn)練,將第2個(gè)自編碼器隱含層單元的輸出值組成第2個(gè)特征矩陣;利用損失函數(shù)公式,計(jì)算第2個(gè)自編碼器的損失值,利用自編碼器權(quán)重和偏置的更新公式,用第2個(gè)自編碼器損失值更新第1個(gè)自編碼器的權(quán)重和偏置后拋棄第2個(gè)自編碼器的重構(gòu)層。
4)將第2個(gè)特征矩陣輸入到第3個(gè)自編碼器中進(jìn)行訓(xùn)練;利用損失函數(shù)公式,計(jì)算第3個(gè)自編碼器的損失值,再利用自編碼器權(quán)重和偏置的更新公式,用損失值更新第3個(gè)自編碼器的權(quán)重和偏置后拋棄第3個(gè)自編碼器重構(gòu)層。
5)將第1個(gè)自編碼器的輸入層、第1個(gè)自編碼器的隱含層、第2個(gè)自編碼器的隱含層、第3個(gè)自編碼器隱含層、由4個(gè)單元組成且激活函數(shù)為Softmax函數(shù)的輸出層,依次連接組成一個(gè)5層結(jié)構(gòu)的深度自編碼器網(wǎng)絡(luò)。
6)將訓(xùn)練集分批輸入深度自編碼器網(wǎng)絡(luò),利用深度自編碼器網(wǎng)絡(luò)的損失函數(shù)公式,計(jì)算深度自編碼器網(wǎng)絡(luò)的損失值,再利用深度自編碼器網(wǎng)絡(luò)權(quán)重和偏置的更新公式,用損失值更新深度自編碼器網(wǎng)絡(luò)的權(quán)重和偏置,完成深度自編碼器網(wǎng)絡(luò)的微調(diào)訓(xùn)練。
所述深度自編碼器網(wǎng)絡(luò)的損失函數(shù)公式為:
式中,C表示深度自編碼器網(wǎng)絡(luò)的損失函數(shù)值,p表示訓(xùn)練的批大小,q表示深度自編碼器網(wǎng)絡(luò)輸出大小,yij表示標(biāo)簽數(shù)據(jù),aij表示深度自編碼器網(wǎng)絡(luò)輸出。
所述深度自編碼器網(wǎng)絡(luò)權(quán)重和偏置的更新公式為:
式中,C表示深度自編碼器網(wǎng)絡(luò)的損失函數(shù)值,v表示深度自編碼器網(wǎng)絡(luò)的權(quán)重,d表示深度自編碼器網(wǎng)絡(luò)的偏置,α表示為值0.01的學(xué)習(xí)率。
基于深度學(xué)習(xí)的PRI調(diào)制方式識(shí)別的處理流程主要包括2部分[12]:訓(xùn)練過程和測(cè)試過程。訓(xùn)練階段首先根據(jù)數(shù)據(jù)特性進(jìn)行降維和采樣的預(yù)處理;然后訓(xùn)練深度學(xué)習(xí)模型中的參數(shù),使模型在盡可能保存信息的同時(shí)可以較好地表達(dá)當(dāng)前的訓(xùn)練數(shù)據(jù)。在測(cè)試階段,對(duì)測(cè)試數(shù)據(jù)進(jìn)行同樣的預(yù)處理,由模型對(duì)測(cè)試數(shù)據(jù)提取可分性的特征,最后由分類器對(duì)測(cè)試數(shù)據(jù)特征進(jìn)行判決,最終輸出測(cè)試數(shù)據(jù)的識(shí)別結(jié)果。
本實(shí)驗(yàn)采用的4種PRI調(diào)制類型分別為:抖動(dòng)、正弦調(diào)制、駐留與切換、滑變,如圖5所示。
圖5 駐留與切換PRI變化波形及脈沖波形
Matlab仿真產(chǎn)生上述4種不同PRI調(diào)制的信號(hào),通過產(chǎn)生1~4的隨機(jī)數(shù),在上述的4種信號(hào)中循環(huán)產(chǎn)生10 000個(gè)隨機(jī)信號(hào),前9 000作為網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù),9 000~10 000作為網(wǎng)絡(luò)的測(cè)試數(shù)據(jù)。4種信號(hào)的參數(shù)分別都有設(shè)置合理的變化范圍,在合理的范圍內(nèi)通過隨機(jī)選擇來設(shè)置參數(shù)。
數(shù)據(jù)處理時(shí),以中頻數(shù)據(jù)作為一個(gè)樣本進(jìn)行訓(xùn)練和測(cè)試,由于數(shù)據(jù)維度的不一致和數(shù)量不均衡等問題,為了提高數(shù)據(jù)質(zhì)量,本文對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,對(duì)于維度不一致問題,通過等點(diǎn)數(shù)采樣,本文實(shí)驗(yàn)中設(shè)定采樣點(diǎn)數(shù)為M=1 000,即所有樣本長(zhǎng)度即為1 000點(diǎn)。
在深度自編碼器中,本文拋棄了自編碼器的重構(gòu)層,整個(gè)網(wǎng)絡(luò)的結(jié)構(gòu)由輸入層、隱藏層、輸出層構(gòu)成,每一層隱藏層都是對(duì)原始數(shù)據(jù)進(jìn)行特征變換,整個(gè)網(wǎng)絡(luò)的訓(xùn)練逐層進(jìn)行,通過改變自編碼器個(gè)數(shù)從而影響網(wǎng)絡(luò)的特征提取性能,因?yàn)樵诿總€(gè)自編碼器訓(xùn)練結(jié)束后拋棄了自編碼器的重構(gòu)層,并以該自編碼器的輸出作為下一個(gè)自編碼器的輸入,所以在網(wǎng)絡(luò)的最終架構(gòu)上,自編碼器的個(gè)數(shù)體現(xiàn)在隱藏層的個(gè)數(shù)。
本實(shí)驗(yàn)主要驗(yàn)證了DAE模型的特征提取和分類識(shí)別性能,并分析了不同網(wǎng)絡(luò)層數(shù)和不同的batch-size對(duì)最終識(shí)別效果的影響。實(shí)驗(yàn)設(shè)計(jì)了網(wǎng)絡(luò)層數(shù)為7、8、9、10、11層,batch-size從25、50到100的不同網(wǎng)絡(luò)參數(shù)的分類識(shí)別實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果如表1所示。
表1 網(wǎng)絡(luò)參數(shù)設(shè)計(jì)
可以看到,在網(wǎng)絡(luò)層數(shù)為8層(輸入層,6層隱藏層,輸出層),batch-size為50時(shí),網(wǎng)絡(luò)識(shí)別效果最好。
無監(jiān)督逐層貪心預(yù)訓(xùn)練只是在一定程度上解決了局部最小問題[13],隨著隱含層個(gè)數(shù)、神經(jīng)元數(shù)量和數(shù)據(jù)復(fù)雜程度的增加,梯度稀釋越發(fā)嚴(yán)重,現(xiàn)有方法依然不能遏制局部最小?;谔荻壤碚摰碾S機(jī)初始果,使DAE不能擬合一些高維復(fù)雜函數(shù),但沒有文獻(xiàn)指出其原因。
3.3.1 仿真實(shí)驗(yàn)1
在數(shù)據(jù)輸入網(wǎng)絡(luò)前,對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理,通過對(duì)原始序列、濾波后序列、最終采樣后序列分別進(jìn)行數(shù)據(jù)集產(chǎn)生和網(wǎng)絡(luò)識(shí)別后可得到對(duì)比結(jié)果,如表2所示。
表2 實(shí)驗(yàn)結(jié)果對(duì)比
從表2可以看出經(jīng)過預(yù)處理后的數(shù)據(jù)在保證識(shí)別率的同時(shí)大幅度降低了訓(xùn)練所需時(shí)間,可以證明本文所提到的預(yù)處理在降低數(shù)據(jù)維度的同時(shí)沒有損失任何有助于識(shí)別的特征。
3.3.2 仿真實(shí)驗(yàn)2
研究算法在脈沖丟失下的識(shí)別正確率。本文取脈沖丟失率從1%步進(jìn)至25%。文獻(xiàn)[14]提出了一種特征提取法來區(qū)分4種復(fù)雜PRI調(diào)制樣式。通過仿真發(fā)現(xiàn),上述特征提取法雖然對(duì)復(fù)雜PRI調(diào)制樣式能夠較好識(shí)別,但是在脈沖序列樣本較少以及脈沖丟失嚴(yán)重的情況下,其識(shí)別正確率卻不理想。
圖6表明2種算法在脈沖丟失的情況下對(duì)4種PRI調(diào)制樣式識(shí)別的準(zhǔn)確率對(duì)比情況。結(jié)果表明,本文算法的識(shí)別正確率明顯要優(yōu)于文獻(xiàn)[14]中的算法。本文的識(shí)別正確率始終保持在95%以上,而文獻(xiàn)[14]算法的識(shí)別正確率最低已經(jīng)降到80%。從圖6中還可以看到,隨著脈沖丟失率的增加,文獻(xiàn)[14]與本文識(shí)別正確率的差距越來越大,本文優(yōu)勢(shì)更加明顯。
圖6 不同脈沖丟失率下2種算法對(duì)比
本文對(duì)PRI調(diào)制方式的識(shí)別不需要對(duì)脈沖序列的先驗(yàn)知識(shí),不需要從原始數(shù)據(jù)中提取特征,所以在脈沖數(shù)較少和脈沖丟失的情況下,識(shí)別率也保持穩(wěn)定。
比較而言,基于深度學(xué)習(xí)的PRI調(diào)制方式識(shí)別具有更高的識(shí)別率,但是傳統(tǒng)方法在模型的可解釋性上優(yōu)于基于深度學(xué)習(xí)的方法。
實(shí)驗(yàn)現(xiàn)象結(jié)合深度學(xué)習(xí)理論表明,基于深度學(xué)習(xí)的PRI調(diào)制方式識(shí)別的應(yīng)用上應(yīng)有如下限制條件:
1)模型遵循的假設(shè)是訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)是服從同一個(gè)分布。因此,測(cè)試數(shù)據(jù)要同訓(xùn)練數(shù)據(jù)基本特性相同,才能保證模型的普適性。
2)數(shù)據(jù)預(yù)處理是必須的環(huán)節(jié)。雷達(dá)對(duì)抗數(shù)據(jù)是復(fù)雜電磁環(huán)境下的非配合數(shù)據(jù),存在嚴(yán)重的混疊、交錯(cuò)、不完整等情況,同時(shí)截獲裝備的差異導(dǎo)致精度、數(shù)據(jù)維度、采樣率也不盡相同,因此通過數(shù)據(jù)預(yù)處理對(duì)數(shù)據(jù)做整齊統(tǒng)一化處理非常關(guān)鍵。
與傳統(tǒng)的TOA統(tǒng)計(jì)直方圖的方法不同,本文提出一種基于深度自編碼器的PRI調(diào)制方式識(shí)別,DAE網(wǎng)絡(luò)利用其無監(jiān)督學(xué)習(xí)的模式提取了不同PRI調(diào)制序列的抽象深層次特征。實(shí)驗(yàn)表明,基于深度自編碼器的PRI調(diào)制方式識(shí)別取得了很好的分類效果。另外,結(jié)合PRI調(diào)制序列的特點(diǎn),通過濾波器思想對(duì)其進(jìn)行了特征明顯化處理,通過等點(diǎn)數(shù)采樣實(shí)現(xiàn)了數(shù)據(jù)降維和歸一化,對(duì)分類識(shí)別效果有了進(jìn)一步的保證。