姜在陽,孫思月,李華旺,梁廣
(1 中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所,上海 201250;2 中國科學(xué)院微小衛(wèi)星創(chuàng)新研究院,上海 201203; 3 中國科學(xué)院大學(xué),北京 100049)
雷達(dá)信號(hào)分選是現(xiàn)代電子偵察技術(shù)的核心技術(shù)之一,可實(shí)現(xiàn)從密集交錯(cuò)的脈沖數(shù)據(jù)流中有效分離不同雷達(dá)輻射源,是進(jìn)行輻射源目標(biāo)有效識(shí)別、無源定位的前提。近年來,雷達(dá)輻射源數(shù)目激增,且信號(hào)體制及工作模式日益復(fù)雜以提高測量精度及隱蔽性,星載電子偵察系統(tǒng)檢測到的脈沖數(shù)據(jù)龐大而復(fù)雜。由于接收機(jī)晶振的不穩(wěn)定性、接收信號(hào)的強(qiáng)弱變化,實(shí)際應(yīng)用中脈沖到達(dá)時(shí)間的測量存在誤差,進(jìn)而造成測得的雷達(dá)信號(hào)重復(fù)周期存在抖動(dòng),進(jìn)一步導(dǎo)致目前工程實(shí)踐中脈沖信號(hào)聚類困難、時(shí)序分析可靠性差[1-3],信號(hào)分選工作面臨巨大的挑戰(zhàn)。另外,為提高電子偵察系統(tǒng)的靈活性、隱蔽性,許多新穎的無源定位體制(如旋轉(zhuǎn)長基線干涉儀[4-5])在實(shí)際應(yīng)用中引起嚴(yán)重的信號(hào)脈沖丟失問題,進(jìn)一步增加了信號(hào)分選的難度,降低了分選成功概率及準(zhǔn)確性。
傳統(tǒng)的雷達(dá)信號(hào)分選方法主要采用累積差值直方圖(cumulative difference histogram,CDIF)[6]和序列差值直方圖(sequential difference histogram,SDIF)[7]等方法。這些方法是利用周期性脈沖時(shí)間相關(guān)原理估計(jì)原始脈沖序列中可能存在的脈沖重復(fù)間隔并進(jìn)行序列搜索,實(shí)現(xiàn)對(duì)雷達(dá)輻射源的分選。然而這些分選方法需要從足夠長的信號(hào)中提取出足夠的脈沖重復(fù)間隔來滿足統(tǒng)計(jì)特征[8-9],在對(duì)脈沖進(jìn)行分組時(shí),可能丟失可用的統(tǒng)計(jì)特征[10]。這些缺點(diǎn)導(dǎo)致傳統(tǒng)方法難以適用于具有脈沖丟失率高、脈沖重復(fù)間隔(pulse repetition interval,PRI)抖動(dòng)等特征的星載雷達(dá)信號(hào)的有效、實(shí)時(shí)分選。
針對(duì)以上問題,本文面向缺失脈沖序列提出一種基于長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)變體JANET網(wǎng)絡(luò)(just another network)[11]的信號(hào)分選方法。通過使用JANET網(wǎng)絡(luò)模型建立一個(gè)分類器,有監(jiān)督地對(duì)脈沖流進(jìn)行輻射源分類,從而進(jìn)行信號(hào)分選工作。在訓(xùn)練過程中,JANET網(wǎng)絡(luò)可以根據(jù)輸入輸出自動(dòng)調(diào)整網(wǎng)絡(luò)參數(shù)。網(wǎng)絡(luò)模型訓(xùn)練好后,可利用模型對(duì)輸入的脈沖流做出相應(yīng)的分類。值得強(qiáng)調(diào)的是,該分類器不僅能實(shí)現(xiàn)脈沖丟失嚴(yán)重情況下的信號(hào)分選,還同時(shí)解決了測量信號(hào)重復(fù)周期時(shí)的抖動(dòng)對(duì)分選性能造成的影響,并且能夠?qū)崿F(xiàn)在線分選,滿足信號(hào)分選準(zhǔn)確度以及實(shí)時(shí)性要求。
在傳統(tǒng)研究中脈沖流主要由到達(dá)時(shí)間(time of arrival, ToA)、脈寬(pulse width,PW)、到達(dá)方向角(direction of arrival,DoA)、頻率等特征描述[12]。這種表示方法容易理解但無法被機(jī)器學(xué)習(xí)使用,在機(jī)器學(xué)習(xí)中,應(yīng)當(dāng)對(duì)數(shù)值進(jìn)行數(shù)字化表示。在本文中,將會(huì)討論一種PRI和PW聯(lián)合的脈沖流表示方式作為輸入的信號(hào)分選方法。由于本文中未引入脈沖幅度作為輸入,所以可以忽略其脈沖幅度,僅將信號(hào)描述為0/1信號(hào)。
脈沖流信號(hào)中往往包含多類不同輻射源發(fā)出的信號(hào),每類輻射源信號(hào)的PRI、PW以及DoA等特征各不相同,其中最主要的特征為PRI,它體現(xiàn)了各脈沖信號(hào)與前后信號(hào)間的時(shí)序相關(guān)特性。脈沖流通過數(shù)值的形式表現(xiàn)出來,可以同時(shí)包含每個(gè)脈沖的頻率、脈寬和脈沖到達(dá)時(shí)間,其中脈沖到達(dá)時(shí)間對(duì)于分選工作是最重要的參數(shù),通過脈沖到達(dá)時(shí)間計(jì)算得到PRI,如圖1所示(其中虛線脈沖為無抖動(dòng)時(shí)脈沖理想位置)。利用統(tǒng)計(jì)特征對(duì)脈沖流進(jìn)行初步的分類后,再通過PRI對(duì)輻射源進(jìn)行分類[6-7]。本文同樣以PRI為主要特征對(duì)脈沖流進(jìn)行信號(hào)分選,并引入PW作為聯(lián)合特征,能夠更加有效地利用數(shù)據(jù)。為了后續(xù)脈沖流處理的需要,可將脈沖流從傳統(tǒng)的數(shù)值形式表示轉(zhuǎn)換為序列形式表示。其脈沖流數(shù)值表示形式為
相應(yīng)的序列表示形式為
{pri1,pw1},{pri2,pw2},…{prin,pwn}
其中:prik表示第k個(gè)脈沖與第k-1個(gè)脈沖到達(dá)時(shí)間的差值,pwk表示第k個(gè)脈沖的脈沖寬度。每個(gè)數(shù)據(jù)不僅能代表當(dāng)前脈沖信號(hào),還能在時(shí)間上關(guān)聯(lián)前一脈沖信號(hào)。由于PRI是通過ToA的差值運(yùn)算得到的,故在序列的最前端額外加入一個(gè)零點(diǎn)以方便后續(xù)處理。這樣,就可用一組序列來代替一段時(shí)間內(nèi)的脈沖流信號(hào),后續(xù)將通過對(duì)連續(xù)序列的有效處理提取出蘊(yùn)含在其中的序列模式。
圖1 帶抖動(dòng)的脈沖流示意圖Fig.1 Pulse stream with jitters
在將每個(gè)脈沖的PRI和PW 2個(gè)特征組成序列中的一個(gè)元素后,得到脈沖流序列。由于存在漏脈沖的情況,對(duì)PRI和PW進(jìn)行處理時(shí)還需要分別設(shè)置一個(gè)上限PRImax和PWmax,當(dāng)PRI超過這個(gè)上限時(shí),可以認(rèn)為開始了一段新的信號(hào),將下一個(gè)脈沖的ToA計(jì)時(shí)重置,并歸為起始點(diǎn)0。在[0,PRImax]和[0,PWmax]范圍內(nèi)對(duì)PRI和PW做如下線性數(shù)字化處理
pridigital=?pri/priunit」,
(1)
pwdigital=?pw/pwunit」.
(2)
其中:pri為當(dāng)前脈沖的重復(fù)周期,pw為當(dāng)前脈沖的寬度,priunit為pri的量化間隔,pwunit為pw的量化間隔,?n」表示不大于n的整數(shù)。量化間隔的大小取決于接收機(jī)的消隱,其作用是將pri數(shù)字化并將其數(shù)值進(jìn)行一定比例的縮小,防止后續(xù)獨(dú)熱編碼過于稀疏而造成機(jī)器學(xué)習(xí)過程中的不穩(wěn)定。數(shù)字化后,得到的序列元素均在[0,?PRImax/priunit」]和[0,?PWmax/pwunit」]范圍內(nèi)。
取priunit=5 μs,pwunit=0.2 μs,其數(shù)字化表示為{0,10},{120,10},{110,10},{120,10}。對(duì)數(shù)字化的pri和pw分別進(jìn)行獨(dú)熱編碼處理。假設(shè)PRImax=5 000 μs、PWmax=5 μs,priunit=5 μs、pwunit=0.2 μs,則pri=11.3 μs的獨(dú)熱編碼為[0,0,1,0,…,0]T∈1 001×1,pw=0.32 μs的獨(dú)熱編碼為[0,1,0,0,…,0]T∈26×1。
本文主要對(duì)pridigital和pwdigital進(jìn)行處理,所以下文中除非特殊說明,所有pridigital與pwdigital均相應(yīng)地替換為pri和pw。在機(jī)器學(xué)習(xí)中,將特征數(shù)值轉(zhuǎn)換為獨(dú)熱編碼作輸入可以更高效。
然而,由于獨(dú)熱編碼的特征,其數(shù)據(jù)過于稀疏,這種特性會(huì)導(dǎo)致機(jī)器學(xué)習(xí)過程中的不穩(wěn)定。文獻(xiàn)[13-14]提出一種通過嵌入矩陣壓縮數(shù)據(jù)的方式來穩(wěn)定機(jī)器學(xué)習(xí)過程。通過這種嵌入矩陣的方式,pri和pw的獨(dú)熱編碼被映射為
epri=Eprikpri,
(3)
epw=Epwkpw.
(4)
其中:kpri∈L1×1和kpw∈L2×1為pri和pw的獨(dú)熱編碼,Epri∈l1×L1和Epw∈l2×L2為pri和pw的嵌入矩陣且l1?L1、l2?L2,epri∈l1×1和epw∈l2×1是映射后向量。嵌入矩陣會(huì)在機(jī)器學(xué)習(xí)中自動(dòng)生成合適的大小以及數(shù)值。Epri和Epw的作用類似于查找表,每個(gè)給定的獨(dú)熱編碼將根據(jù)其元素1所在的位置選定矩陣中的對(duì)應(yīng)列來代替表示,將映射后的向量epri、epw作為輸入序列輸入到JANET中,神經(jīng)網(wǎng)絡(luò)就可以根據(jù)其內(nèi)部的時(shí)間關(guān)聯(lián)信息對(duì)其進(jìn)行分類識(shí)別。
由于神經(jīng)網(wǎng)絡(luò)具有大規(guī)模并行結(jié)構(gòu)、容錯(cuò)能力強(qiáng)、能夠處理不完整的脈沖流信號(hào)等特點(diǎn),用于輻射源識(shí)別已經(jīng)被廣泛研究[15]。在自然語言處理(natural language processing,NLP)領(lǐng)域中,循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)[16]憑借其考慮到上下文的特性取得了巨大的成功。但由于RNN的長序列依賴問題無法解決,LSTM模型應(yīng)運(yùn)而生,LSTM借助遺忘門有效地解決了這個(gè)問題。然而由于LSTM中輸入門及輸出門的結(jié)構(gòu),造成額外的運(yùn)算開銷,降低了算法的運(yùn)算速度,所以本文引入一種新的JANET模型[11]。JANET模型僅保留一個(gè)遺忘門,在保證分類精度的同時(shí),減少算法的運(yùn)算時(shí)間。本節(jié)將介紹LSTM、JANET結(jié)構(gòu)以及如何用JANET分類器處理輸入序列并得到分類結(jié)果。
傳統(tǒng)的LSTM網(wǎng)絡(luò)的具體算法如下所示:
ft=σ(Wfxt+Ufht-1+bf),
(5)
it=σ(Wixt+Uiht-1+bi),
(6)
at=tanh(Waxt+Uaht-1+ba),
(7)
Ct=Ct-1?ft+it?at,
(8)
ot=σ(Woxt+Uoht-1+bo),
(9)
ht=ot?tanh(Ct).
(10)
其中:W()、U()和b()表示各部分的線性關(guān)系系數(shù)和偏置。式(5)描述遺忘門的工作原理,在遺忘門中將上一時(shí)刻的隱藏狀態(tài)ht-1和本時(shí)刻輸入數(shù)據(jù)xt通過激活函數(shù)σ得到遺忘門的輸出ft,激活函數(shù)表示如下:
(11)
式(6)、式(7)描述了輸入門的工作原理,輸入門輸出由兩部分組成:第1部分使用激活函數(shù)σ,輸出為it;第2部分使用激活函數(shù)tanh,輸出為at。tanh表示如下
(12)
式(8)描述了細(xì)胞狀態(tài)Ct的更新,其由兩部分的和構(gòu)成,一部分為輸入門的輸出結(jié)果it和at的點(diǎn)積,另一部分是上一時(shí)刻細(xì)胞狀態(tài)Ct-1和遺忘門的輸出ft的點(diǎn)積。式(9)、式(10)描述輸出門的工作原理,從圖2可以看出輸出門輸出由兩部分組成:第1部分是ot,它由上一序列的隱藏狀態(tài)ht-1和本序列輸入數(shù)據(jù)xt通過激活函數(shù)σ得到;第2部分是ht由當(dāng)前時(shí)刻細(xì)胞狀態(tài)Ct通過激活函數(shù)tanh后與ot做點(diǎn)積得到。
圖2 JANET分類器對(duì)脈沖流分類流程示意圖Fig.2 Structure of JANET classifier
為了將LSTM結(jié)構(gòu)轉(zhuǎn)換為JANET結(jié)構(gòu),需要?jiǎng)h除LSTM結(jié)構(gòu)中的輸入、輸出門,僅保留其中的遺忘門。此外,ht的激活函數(shù)tanh有可能在反向傳播期間加劇梯度消失的問題,并且由于權(quán)重U()可以超過[-1,1]的范圍,因此消除這種不必要的并且可能造成梯度消失的非線性激活函數(shù)tanh。JANET網(wǎng)絡(luò)結(jié)構(gòu)如下
ft=σ(Wfxt+Ufht-1+bf),
(13)
Ct=Ct-1?ft+(1-ft)?
tanh(Wcxt+Ucht-1+bc),
(14)
ht=Ct.
(15)
從直觀的角度看,積累的信息量比被遺忘的信息量更多可以使序列分析更容易。所以在輸入中減去一個(gè)預(yù)先設(shè)定的值β,以此得到最終的JANET網(wǎng)絡(luò)模型
st=Wfxt+Ufht-1+bf,
(16)
(17)
(18)
ht=Ct.
(19)
(20)
其中歸一化指數(shù)函數(shù)表示如下
(21)
分類是一種有監(jiān)督的學(xué)習(xí)(supervised learning)。有監(jiān)督的學(xué)習(xí)需要有訓(xùn)練樣本,故將已接受的脈沖流信號(hào)處理后作為輸入,將其中一部分作為訓(xùn)練集,一部分作為驗(yàn)證集,最后剩下的部分作為測試集(本文選取比例為6∶1.5∶2.5)。將帶有標(biāo)簽的序列輸入JANET中估計(jì)各分類的概率,然后將結(jié)果與事先對(duì)應(yīng)的標(biāo)簽進(jìn)行比較,計(jì)算損失,根據(jù)損失的大小調(diào)整網(wǎng)絡(luò)參數(shù),使得損失沿梯度下降的方向減少[17]。經(jīng)過一段時(shí)間的迭代,網(wǎng)絡(luò)參數(shù)會(huì)被調(diào)整到一個(gè)相對(duì)理想的值,這時(shí)候訓(xùn)練好的模型就可以作為一個(gè)可使用的分類器了。
(22)
由式(22)可知,當(dāng)損失函數(shù)達(dá)到最小值即0的時(shí)候分類器效果最理想。為找到能讓損失函數(shù)最小的參數(shù),本文使用自適應(yīng)矩陣估計(jì)法,此方法是將動(dòng)量梯度下降和RMSprop相結(jié)合:
vdW=β1vdW+(1-β1)dW,
(23)
vdb=β1vdb+(1-β1)db,
(24)
SdW=β2SdW+(1-β2)dW2,
(25)
Sdb=β2Sdb+(1-β2)db2.
(26)
其中:β1=0.9,β2=0.999,vdW、vdb為動(dòng)量梯度下降部分,SdW、Sdb為RMSprop部分。起始偏置修正為
(27)
(28)
(29)
(30)
更新網(wǎng)絡(luò)參數(shù)為
(31)
(32)
其中:α為學(xué)習(xí)速率,=10-8。通過對(duì)參數(shù)的更新以達(dá)到全局最小的損失函數(shù)。
本文將脈沖流截取成短序列作為輸入,其脈沖丟失率為0~70%,工作模式多變(包含固定類型和多參差類型),并運(yùn)用JANET分類器對(duì)其進(jìn)行分選,初步解決了傳統(tǒng)方法難以對(duì)漏脈沖嚴(yán)重、工作模式復(fù)雜的脈沖流的統(tǒng)計(jì)特征進(jìn)行區(qū)分的性能瓶頸。仿真信號(hào)參數(shù)如表1所示。
表1 脈沖流參數(shù)Table 1 Attributes of pulse streams
其中總樣本數(shù)為10 000個(gè)脈沖信號(hào),隨機(jī)選取其中6 000個(gè)脈沖信號(hào)為訓(xùn)練集,1 500個(gè)脈沖信號(hào)為驗(yàn)證集以及2 500個(gè)脈沖信號(hào)為測試集,批處理參數(shù)batchsize為256,步長timesteps為10,pri獨(dú)熱編碼長度L1為1 001,pw獨(dú)熱編碼長度L2為18,pri經(jīng)嵌入矩陣映射后得到向量初始長度l1為512,pw經(jīng)嵌入矩陣映射后得到向量初始長度l2為16。本文實(shí)驗(yàn)的硬件環(huán)境是:處理器為Intel(R)Core(TM)i5-8300 H CPU@2.30 GHz,內(nèi)存16 GB,顯卡是6 GB的NVIDIA GeForce GTX1060,系統(tǒng)類型為64位Ubuntu18.04操作系統(tǒng),仿真軟件為Jupyter Notebook。整個(gè)深度模型基于keras框架及其工具包實(shí)現(xiàn),版本為2.2.4。
本文采用多種常用的機(jī)器學(xué)習(xí)評(píng)價(jià)指標(biāo),如精度(accuracy)、召回率(recall)等。其中,準(zhǔn)確率定義為正確預(yù)測的正樣本數(shù)占總的預(yù)測為正樣本數(shù)的比率,召回率則定義為正確預(yù)測的正樣本數(shù)占實(shí)際正樣本總數(shù)的比率,值越高說明分類器性能越好。測試集分類結(jié)果的混淆矩陣如表2所示,在不同脈沖丟失率下,隨機(jī)重復(fù)10次得到脈沖分類準(zhǔn)確度的平均值。混淆矩陣中每個(gè)值為其實(shí)際分類對(duì)應(yīng)其所在行,預(yù)測分類對(duì)應(yīng)其所在列的概率分布。在測試集上,當(dāng)脈沖丟失概率從0上升到70%時(shí),分選精度略有降低,但仍高于90%,這表明基于JANET的信號(hào)分選方法可有效應(yīng)對(duì)漏脈沖嚴(yán)重的情況。當(dāng)漏脈沖率較低(0、30%)時(shí),混淆矩陣對(duì)角線上準(zhǔn)確度基本高于99%;當(dāng)漏脈沖率較高(50%、70%)時(shí),混淆矩陣對(duì)角線上準(zhǔn)確度基本高于96%。僅在漏脈沖率為70%時(shí),第4類信號(hào)分選正確率為90.2%,這是由于當(dāng)脈沖丟失率高時(shí),第4類信號(hào)時(shí)序相關(guān)性被破壞后與第1、2兩類信號(hào)較為相似。第5類信號(hào)由于其pri/pw類型為參差+參差,其模式與前4類均不相同,故其分選準(zhǔn)確率不受漏脈沖率的影響,一直為100%。尤其值得注意的時(shí),脈沖流中的第4、5類信號(hào)由于工作模式復(fù)雜,PRI和/或PW具有多參差的工作模式,但基于JANET 網(wǎng)絡(luò)模型的信號(hào)分選方法仍可對(duì)其有效分類,說明此分類器可以有效解決非合作輻射源脈沖流信號(hào)工作模式復(fù)雜的難題。相對(duì)于傳統(tǒng)的分選方法如CDIF[6]和SDIF[7]無法應(yīng)對(duì)脈沖丟失嚴(yán)重及工作模式復(fù)雜的特點(diǎn),此方法性能優(yōu)勢更顯著。
表2 混淆矩陣Table 2 Confusion matrix
圖3展示5種不同網(wǎng)絡(luò)即LSTM、門控循環(huán)單元(gated recurrent unit,GRU)神經(jīng)網(wǎng)絡(luò)、RNN、SRU (simple recurrent unit)神經(jīng)網(wǎng)絡(luò)以及JANET網(wǎng)絡(luò),在信號(hào)脈沖重復(fù)間隔的置信度為95%,脈沖丟失率為0~50%的情況下,其各自獨(dú)立運(yùn)行5次得到的平均值。通過對(duì)比可以看出在其他條件均相同的情況下JANET分選精度和召回率最高,分選耗時(shí)近似于RNN且明顯優(yōu)于其他神經(jīng)網(wǎng)絡(luò),可以滿足在高漏脈沖率的情況下快速準(zhǔn)確地對(duì)信號(hào)進(jìn)行分選。圖4展示5種網(wǎng)絡(luò)在虛警率為0~50%的情況下的分選精度。如圖4所示,隨著虛警率提高,不同算法表現(xiàn)均出現(xiàn)不同程度的下降。其中,虛警的分布服從泊松分布,pri和pw服從均勻分布。JANET網(wǎng)絡(luò)的分選精度近似于GRU網(wǎng)絡(luò),低于SRU網(wǎng)絡(luò),優(yōu)于另外2種網(wǎng)絡(luò),其分選精度可滿足要求。造成此現(xiàn)象的主要原因是虛警出現(xiàn)的隨機(jī)性極大破壞了信號(hào)原有的重頻規(guī)律,使得原不同組信號(hào)更有可能被混淆,最終導(dǎo)致算法分選性能下降。綜上分析,在信號(hào)重頻規(guī)律復(fù)雜的情況下,JANET網(wǎng)絡(luò)在簡化輸入門和輸出門后,依然可以有效提取序列的上下文特性,并且提高了運(yùn)算速率,減少了分選所需時(shí)間,滿足了信號(hào)分選工作的快速準(zhǔn)確性。
圖3 不同漏脈沖率下不同網(wǎng)絡(luò)分選性能Fig.3 Performance of different networks at different miss ratios
圖4 不同虛警率下不同網(wǎng)絡(luò)分選精度Fig.4 Accuracy of different networks at different noise ratios
本文針對(duì)高脈沖率下傳統(tǒng)分選方法無法有效分選的問題,提出一種基于JANET的信號(hào)分選方法,該方法通過有監(jiān)督的學(xué)習(xí)進(jìn)行訓(xùn)練實(shí)現(xiàn)了快速準(zhǔn)確的信號(hào)分選。仿真分析表明該方法能在無知識(shí)庫的情況下,有效、快速地解決漏脈沖嚴(yán)重、工作模式復(fù)雜的脈沖流分選。分選精度并未隨漏脈沖概率的提高而有較大影響,對(duì)于復(fù)雜工作模式的輻射源脈沖流也能準(zhǔn)確分選,以上均證明了該方法的魯棒性。此方法局限性在于,當(dāng)輸入脈沖數(shù)較少時(shí),其訓(xùn)練網(wǎng)絡(luò)訓(xùn)練效果不佳,很快就會(huì)過擬合,測試集的分選精度不佳;其次,當(dāng)待分選脈沖較少時(shí),其分選速度無明顯優(yōu)勢。在下一步工作中,將研究其他RNN的變體結(jié)構(gòu),提高網(wǎng)絡(luò)的計(jì)算速度及分類精度。