魯東生,黃 琳,龍 華
(1.昆明理工大學(xué),云南 昆明 650100;2.云南省無線電監(jiān)測中心,云南 昆明 650100;3.云南省科學(xué)技術(shù)院,云南 昆明 650100)
近年來,隨著我國經(jīng)濟(jì)社會(huì)的快速發(fā)展,民航運(yùn)輸業(yè)發(fā)展迅速,民航全球定位系統(tǒng)(Global Positioning System,GPS)信號(hào)受不明無線電干擾的事件也頻頻發(fā)生。由于GPS 在民航領(lǐng)域的應(yīng)用十分普遍,所以不明無線電干擾對(duì)飛機(jī)飛行安全造成了嚴(yán)重威脅,也給廣大人民群眾的生命財(cái)產(chǎn)安全帶來巨大的隱患[1-4]。因而,識(shí)別GPS 干擾信號(hào)對(duì)于無線電監(jiān)測和干擾排查顯得十分必要。
現(xiàn)有研究表明,信號(hào)特征的提取方法和分類算法的設(shè)計(jì)對(duì)干擾識(shí)別的準(zhǔn)確率有直接影響。在特征提取方面,Kang 等人[5]采用自適應(yīng)陷波器和自適應(yīng)級(jí)聯(lián)濾波器來識(shí)別GPS 信號(hào)中的單音、多音、掃頻連續(xù)波干擾和帶限高斯白噪聲的特征,這與濾波器的設(shè)計(jì)密切相關(guān)。許永毅[6]則采用觀察頻譜的方法來提取干擾特征,但該方法嚴(yán)重依賴于人工經(jīng)驗(yàn)。陳必然等人[7]利用受欺騙的信噪比與正常衛(wèi)星的信噪比不同這一特征,通過模糊聚類的方法來判斷GPS 欺騙式干擾。史文森等人[8]則利用GPS 信號(hào)的空域特征,結(jié)合接收機(jī)的波達(dá)方向(Direction Of Arrival,DOA)數(shù)據(jù)來識(shí)別GPS 欺騙式干擾。但以上兩種方法的識(shí)別類型有限。張婧等人[9]針對(duì)典型的GPS 干擾信號(hào),提取了8 個(gè)特征,并設(shè)計(jì)了反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)分類器,在干信比為3 dB 時(shí),對(duì)于部分噪聲干擾的平均識(shí)別率較高,但是該研究缺乏實(shí)際數(shù)據(jù)作為支撐,且未考慮干擾疊加的影響。
筆者考慮到典型GPS 干擾在時(shí)頻域的差異明顯,在時(shí)頻域提取相應(yīng)的統(tǒng)計(jì)量,再結(jié)合深度學(xué)習(xí)網(wǎng)絡(luò)在分類識(shí)別問題上的優(yōu)異性能,期望解決復(fù)雜干擾疊加情況下的干擾識(shí)別問題。
根據(jù)實(shí)際無線電監(jiān)測情況,可將民航GPS 干擾分為人為干擾、無意干擾[10]兩類。從現(xiàn)有干擾案例來看,影響最大的是人為干擾,數(shù)量最多的是無意干擾,這些干擾嚴(yán)重時(shí)可造成用戶無法正常捕獲粗捕獲碼(Code Coarse/Acquisition Code,C/A),導(dǎo)致通信中斷。人為干擾主要來自因個(gè)人隱私、敏感區(qū)域、無人機(jī)管控、軍事對(duì)抗等特殊需要而人為架設(shè)的專用GPS 發(fā)射裝置[11]。無意干擾包括頻帶內(nèi)射頻干擾、頻帶外射頻干擾和環(huán)境噪聲等,主要來自自然環(huán)境變化、接收機(jī)內(nèi)部或近場電磁環(huán)境因素,以及其他人為非故意的無線電干擾,如故障無線電發(fā)射機(jī)或其他電子電氣設(shè)備的電磁泄漏、諧波、雜散及發(fā)射機(jī)互調(diào)等。表1[12-13]給出了GPS 射頻干擾的分類。
表1 典型射頻干擾的信號(hào)分類
當(dāng)接收機(jī)同時(shí)收到干擾信號(hào)與GPS 信號(hào)的疊加信號(hào)時(shí):
式中:x0(t)為疊加干擾后的信號(hào);xs(t)為GPS 信號(hào);xj(t)為干擾信號(hào);Psn為受衛(wèi)星信道衰落影響的歸一化信號(hào)功率;D(t)為數(shù)據(jù)碼序列;C(t)為擴(kuò)頻偽碼序列;ω0和ωd分別為標(biāo)稱載頻和載波多普勒頻率;φs為服從[0,2π)上均勻分布的載波相位;t為時(shí)序。
則接收機(jī)輸出為:
式中:Kn為第n階系數(shù)。
假設(shè)接收系統(tǒng)是線性的,且不考慮接收機(jī)互調(diào),則式(3)變?yōu)椋?/p>
由于近地干擾源相對(duì)于被干擾對(duì)象的距離都遠(yuǎn)小于衛(wèi)星與用戶的通信距離,所以GPS 信號(hào)到達(dá)地球表面進(jìn)入接收機(jī)前端的信號(hào)功率通常沒有潛在干擾源的功率大[14]。此時(shí),對(duì)于GPS 接收機(jī)而言,在不考慮機(jī)器內(nèi)部噪聲的前提下,輸出干信比近似等于輸入干信比,故利用干信比ε=20 lgUj/Us(Uj為xj(t)的最大電平值,Us為xs(t)的最大電平值)來調(diào)節(jié)干擾信號(hào)的強(qiáng)度。
若假設(shè)接收機(jī)收到的信號(hào)信息量為J(s+j,s)=H(s+j)-Hj(H(s+j)為干擾與信號(hào)之和的熵,Hj為干擾的熵)。當(dāng)J(s+j,s)減小到某一閾值時(shí),傳輸?shù)男畔o法正?;謴?fù),故在信號(hào)確定的條件下,增加Hj,可以減小J(s+j,s),達(dá)到增加干擾效果的目的。根據(jù)香農(nóng)定理,在功率受限情況下,服從高斯分布的噪聲熵值最大,所以現(xiàn)實(shí)中,常把有限帶寬的高斯噪聲用作固定帶寬的干擾。當(dāng)噪聲引起的誤碼率達(dá)到10%時(shí),通信將遭到破壞。有限帶寬的高斯噪聲干擾可由高斯噪聲通過帶通濾波器獲得,其數(shù)學(xué)模型為:
式中:f為調(diào)制頻率;fc為載波頻率;為雙邊功率譜密度;B為濾波器帶寬。則干擾信號(hào)為:
寬帶均勻頻譜干擾是鋸齒波寬帶調(diào)頻和噪聲窄帶調(diào)頻相結(jié)合的干擾方式,其數(shù)學(xué)模型為:
式中:A為調(diào)頻信號(hào)幅度;ω0為調(diào)頻信號(hào)中心頻率;Kf為調(diào)頻指數(shù);?0為調(diào)頻信號(hào)初始相位;Vs(t)為鋸齒波函數(shù)。
噪聲調(diào)幅干擾的數(shù)學(xué)模型為:
式中:u0為載波電平;un(t)為調(diào)制噪聲,且E[un(t)]=0,D[un(t)]=σ2;φ為初相,服從[0,2π)上的均勻分布且與un(t)獨(dú)立。
單頻脈沖干擾[15]是一種呈周期狀態(tài)、持續(xù)時(shí)間短且頻帶較寬的干擾。受其影響,誤碼率可能會(huì)增加,短時(shí)間內(nèi)發(fā)生傳輸錯(cuò)誤,影響通信系統(tǒng)的傳輸性能或?qū)е孪到y(tǒng)無法正常工作。其數(shù)學(xué)模型為:
式中:uj為干擾信號(hào)電平;ωj為干擾信號(hào)頻率;θ為干擾信號(hào)隨機(jī)相位。
線性調(diào)頻干擾主要來自雷達(dá),是一種頻率隨時(shí)間線性變化的信號(hào)。在時(shí)域上,隨著時(shí)間的增加,譜線越來越密集,在頻域上頻譜圖像則呈現(xiàn)出類似矩形窗的特點(diǎn)。其數(shù)學(xué)模型為:
式中:U為幅度;ωc為載頻;ω0為調(diào)制頻率;T為脈沖寬度;rect 為矩形窗函數(shù);φ0為初相且服從[0,2π)上的均勻分布。
寬帶梳狀干擾是在有用信號(hào)的頻帶內(nèi)疊加k個(gè)窄帶干擾,覆蓋整個(gè)頻帶,主要來自人為設(shè)置的干擾機(jī)。寬帶梳狀干擾的數(shù)學(xué)模型為:
式中:k為調(diào)頻干擾個(gè)數(shù);Pk、ωk分別為每個(gè)正弦調(diào)頻的功率和中心頻率;?ω為每個(gè)分量信號(hào)的帶寬;α、β為每個(gè)信號(hào)的調(diào)制參數(shù)。
本文使用的特征參數(shù)及其對(duì)應(yīng)的符號(hào)和意義如表2 所示。采用Z-score 標(biāo)準(zhǔn)化法對(duì)x(t)進(jìn)行預(yù)處理,使樣本均值為0,方差為1,并提取表2 中的信號(hào)特征,得到信號(hào)特征向量X。
表2 特征參數(shù)
計(jì)算信號(hào)時(shí)域電平的一階矩統(tǒng)計(jì)平均值α1:
式中:xi(t)為數(shù)據(jù)樣本x(t)的第i個(gè)時(shí)域采樣值;N為時(shí)域采樣點(diǎn)數(shù)。
計(jì)算信號(hào)時(shí)域電平的二階中心距α2:
計(jì)算時(shí)域、頻域和時(shí)頻域三階累積量的標(biāo)準(zhǔn)差α3,α9,α12:
計(jì)算時(shí)域、頻域和時(shí)頻域四階累積量的標(biāo)準(zhǔn)差α4,α10,α13:
式中:count為計(jì)數(shù)函數(shù);uT為時(shí)域閾值電平。
對(duì)時(shí)域信號(hào)進(jìn)行傅里葉變換后得P(f),估算頻帶占用度:
式中:fH為頻帶占用的最高頻道;fL為頻帶占用的最低頻道;Pg為頻道占用閾值功率;?f為頻道總數(shù)。
計(jì)算功率譜動(dòng)態(tài)范圍α7:
式中:Pmax為頻譜最大幅值;Pmin為頻譜最小非0幅值。
計(jì)算頻譜沖擊部分方差α8:
式中:L為滑動(dòng)窗口長度;L=0.01M;M為頻帶寬度;Pp(m)為歸一化頻譜的沖激部分;為沖激部分的均值。Pp(m)的計(jì)算方式為:
計(jì)算信號(hào)時(shí)頻數(shù)據(jù)的譜熵α11:
式中:Ps為xi(t)短時(shí)傅里葉變換后歸一化的功率譜概率密度函數(shù)。
對(duì)X進(jìn)行主成分分析(Principal Component Analysis,PCA)和降維。設(shè)原數(shù)據(jù)矩陣X的無偏樣本協(xié)方差矩陣為Var[x]=E(XXT),其中E[x]=0。對(duì)Var[x]特征分解后得到Var[x]=WΛWT,其中,Λ=diag(λ1,λ2,…,λn)。再 令Y=WTX=(y1,y2,…,yn)T,然后選取Λ中最大的k個(gè)特征值所對(duì)應(yīng)的Y中的元素,組成維度更低的向量,WT即為轉(zhuǎn)移矩陣。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種專門用于處理具有矩陣結(jié)構(gòu)數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),它通過逐層非線性變換實(shí)現(xiàn)復(fù)雜函數(shù)的逼近,能夠有效提取深層次的數(shù)據(jù)特征[16-18]。把一個(gè)序列數(shù)據(jù)在時(shí)間軸上有規(guī)律地采樣便能形成一維的網(wǎng)格,就能用卷積神經(jīng)網(wǎng)絡(luò)來進(jìn)行處理。而長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)是一種時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò),通過自循環(huán)來產(chǎn)生梯度長時(shí)間持續(xù)流動(dòng)的路徑作為初始長短期記憶,可以很好地解決循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)存在的長期依賴問題。兩種網(wǎng)絡(luò)的聯(lián)用,在處理序列分類問題上可能有更好的識(shí)別效果。于是,采用圖1 所示的雙層CNN+LSTM 網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練。
圖1 深度學(xué)習(xí)網(wǎng)絡(luò)模型
將信號(hào)特征矩陣Y輸入雙層卷積神經(jīng)網(wǎng)絡(luò),采用線性整流函數(shù)作為卷積神經(jīng)元激活函數(shù),可得遞推激活關(guān)系:
式中:f表示采用線性整流函數(shù)(Rectified Linear Unit,ReLU)作為神經(jīng)元激活函數(shù);w為傳遞權(quán)重;b為傳遞偏置;上標(biāo)n表示神經(jīng)元所在層數(shù),n∈N*且n>1;下標(biāo)i表示本層神經(jīng)元序號(hào);“·”表示輸入信源;=Y。
為了減少隱層節(jié)點(diǎn)間的相互作用,達(dá)到緩解過擬合的作用,并達(dá)到正則化的效果,于是設(shè)隨機(jī)因子ri~Bernouli(ρ),則卷積層輸出變?yōu)椋?/p>
式中:ri是服從伯努利分布的隨機(jī)因子,以ρ為概率隨機(jī)生成只含0 和1的向量;“⊙”表示對(duì)應(yīng)元素的相乘。
為避免超短波信道上干擾信號(hào)混疊造成弱信號(hào)特征不明顯的情況,第一層卷積層采用最大池化,第二層卷積層采用平均池化。于是池化后的數(shù)據(jù)為:
式中:f為ReLu 函數(shù);β為權(quán)重;d為偏置;down表示下采樣函數(shù),含最大池化和平均池化函數(shù)。
通過flatten 層處理得到序列,再經(jīng)LSTM網(wǎng)絡(luò),輸出結(jié)果為:
使用歐氏距離作為損失函數(shù):
式中:zo為真實(shí)結(jié)果;z為識(shí)別結(jié)果;m為統(tǒng)計(jì)平均長度。
于是,可在損失函數(shù)最小的情況下用式(27)更新網(wǎng)絡(luò)參數(shù)w,b,β,d,u,v,c,完成深度學(xué)習(xí)。
式中:mt為梯度的第一時(shí)刻平均值;vt為梯度的第二時(shí)刻非中心方差值;β1=0.9;β2=0.998 5;η為學(xué)習(xí)率;?=10-8。
最后,利用準(zhǔn)確率來描述識(shí)別結(jié)果準(zhǔn)確性,由結(jié)果混淆矩陣M來計(jì)算:
式中:nij為M中的元素;k為類別數(shù)。
再用卡帕值(kappa)來反映識(shí)別結(jié)果的一致程度:
表3 卡帕值的意義
使用MATLAB 2019b 進(jìn)行軟件模擬,并使用CA5000 接收機(jī)采集真實(shí)數(shù)據(jù)進(jìn)行驗(yàn)證。信號(hào)采樣時(shí)間均為1 ms,采樣點(diǎn)1 024 個(gè),采樣率1.024 MHz,采集GPS 信號(hào)樣本21 000 個(gè),軟件模擬干擾各3 000 個(gè),按式(1)合成干擾疊加信號(hào)樣本。選取70%的樣本作為訓(xùn)練集,經(jīng)反復(fù)實(shí)驗(yàn),最小批量化長度設(shè)為256 個(gè)樣本,具體參數(shù)如表4 所示時(shí),實(shí)驗(yàn)收斂效果最佳,用時(shí)最少。
表4 網(wǎng)絡(luò)參數(shù)表
為驗(yàn)證本文模型對(duì)大信號(hào)干擾和GPS 信號(hào)的識(shí)別效果,在干擾信號(hào)的功率超過GPS 地面用戶接收信號(hào)50 dB 且尚未阻塞接收機(jī)的情況下,設(shè)置Uj=0,Us=1,即認(rèn)為GPS 信號(hào)遭到完全壓制,此時(shí)本文模型的干擾識(shí)別效果優(yōu)于LSTM 網(wǎng)絡(luò)模型。LSTM 網(wǎng)絡(luò)與本文模型的訓(xùn)練效果對(duì)比如圖2 和圖3 所示。圖2 給出了LSTM 網(wǎng)絡(luò)的訓(xùn)練進(jìn)度,準(zhǔn)確率為0.817 5,均方誤差為1.519 3,kappa為0.787 1;圖3 給出了本文模型的訓(xùn)練進(jìn)度,準(zhǔn)確率為0.883 3,均方誤差為1.291 0,kappa值為0.863 9。這說明強(qiáng)信號(hào)干擾GPS 信號(hào)時(shí),本文模型具有明顯的識(shí)別優(yōu)勢。
圖2 LSTM 訓(xùn)練進(jìn)度
圖3 本文模型訓(xùn)練進(jìn)度
為驗(yàn)證功率相近干擾的識(shí)別效果,設(shè)置干信比ε的范圍為-3~3 dB(∈ [0.707,1.412]),此時(shí)本文模型的平均識(shí)別準(zhǔn)確率為0.915 5,比LSTM 模型平均高出5.23%。圖4 給出了不同干信比條件下兩種模型識(shí)別準(zhǔn)確率的對(duì)比情況,在所設(shè)干信比范圍內(nèi),LSTM 模型識(shí)別準(zhǔn)確率相近,而本文模型識(shí)別準(zhǔn)確率隨干信比一起提高,當(dāng)干信比為2 dB 時(shí),本文方法識(shí)別準(zhǔn)確率為0.937 5,較LSTM 模型高7%左右。
圖4 本文模型與LSTM 模型的識(shí)別準(zhǔn)確率比較
圖5 給出了兩種模型在識(shí)別誤差方面的比較,本文模型的平均誤差較小,且隨著干信比的增大,本文模型的誤差逐步降低。這說明當(dāng)干擾信號(hào)的功率超過GPS 信號(hào)的功率1~3 dB 時(shí),本文方法比LSTM 模型的識(shí)別誤差更小。
圖5 本文模型與LSTM 模型的均方根誤差比較
表5 給出了LSTM 模型與真實(shí)分類對(duì)比的卡帕值為0.840 5,本文模型與真實(shí)分類對(duì)比的卡帕值為0.901 4,兩種模型都達(dá)到了與真實(shí)分類幾乎完全一致的程度,而且本文模型與LSTM 模型對(duì)比的卡帕值為0.895 5,說明兩種模型的識(shí)別結(jié)果相近,但本文模型更接近于真實(shí)值。
表5 識(shí)別結(jié)果一致性對(duì)比
圖6 給出了不同干信比條件下兩種模型識(shí)別結(jié)果與真實(shí)結(jié)果之間的卡帕值比較,隨著干信比的提高,本文模型識(shí)別結(jié)果的一致性逐漸增加,而LSTM 模型則幾乎沒有變化,這是導(dǎo)致兩種模型識(shí)別差異的主要因素,同時(shí)也說明當(dāng)干擾信號(hào)的功率超過GPS 信號(hào)的功率1~3 dB 時(shí),本文方法的識(shí)別結(jié)果均較高。
圖6 識(shí)別結(jié)果一致性對(duì)比
圖7 給出了干信比為2 dB 時(shí)兩種模型識(shí)別結(jié)果與真實(shí)分類之間的混淆矩陣,由于窄帶高斯噪聲與寬帶高斯噪聲的分布相似,在樣本數(shù)據(jù)有限的情況下,容易造成誤判。但是,本文模型的誤判比例比LSTM 模型的誤判比例低。
圖7 識(shí)別結(jié)果混淆矩陣
圖8、圖9 分別給出了兩種模型在干信比為2 dB時(shí)的訓(xùn)練進(jìn)度。顯然,本文模型在網(wǎng)絡(luò)訓(xùn)練過程中損失下降明顯,收斂速度快,平均準(zhǔn)確率更高。
圖8 干信比2 dB 時(shí),LSTM的訓(xùn)練進(jìn)度
圖9 干信比2 dB 時(shí),本文模型的訓(xùn)練進(jìn)度
綜上,本文模型可以有效識(shí)別功率強(qiáng)于GPS 信號(hào)的無線電干擾,對(duì)于干信比為-3~3 dB的干擾信號(hào)也有較好的識(shí)別效果,且具備一定的抗噪聲和抗混疊干擾的能力。另外,在一致性相近的前提下,較傳統(tǒng)LSTM 模型具有更高的識(shí)別準(zhǔn)確率。
本文面向無線電監(jiān)測工作需求,根據(jù)實(shí)際干擾情形研究了GPS 干擾模型,并選取合適特征參數(shù)作為干擾信號(hào)的識(shí)別依據(jù),構(gòu)建了“雙層CNN+LSTM”的深度學(xué)習(xí)網(wǎng)絡(luò)模型。該模型通過特征提取和分類識(shí)別,達(dá)到由無線電監(jiān)測數(shù)據(jù)區(qū)分GPS 干擾的目的,有助于縮小目標(biāo)干擾源的排查范圍,提高工作效率。實(shí)驗(yàn)結(jié)果表明,本文所述方法能夠有效識(shí)別帶限高斯噪聲、寬帶均勻噪聲、噪聲調(diào)幅、單頻脈沖、線性調(diào)頻等典型GPS 干擾,識(shí)別結(jié)果與真實(shí)值幾乎一致。在強(qiáng)信號(hào)干擾時(shí),干擾識(shí)別的準(zhǔn)確率為0.883 3,對(duì)于干信比為-3~3 dB的干擾信號(hào)也有較好的識(shí)別效果,平均識(shí)別準(zhǔn)確率為0.915 5,具備一定的抗噪聲和抗混疊干擾的能力,說明本文方法在功率相近的干擾識(shí)別方面有一定的優(yōu)勢。但是,本文的研究仍具有局限性,提取的信號(hào)特征數(shù)量與樣本類型的種類有關(guān),且不同特征參數(shù)對(duì)于分類識(shí)別的貢獻(xiàn)程度是不同的,仍需繼續(xù)深入研究。另外,對(duì)于有監(jiān)督的深度學(xué)習(xí),尚不能遍歷可能的干擾類型,對(duì)于未知類別,仍需更多真實(shí)、可靠的樣本數(shù)據(jù)作為訓(xùn)練集的有效補(bǔ)充,以豐富數(shù)據(jù)集,提高準(zhǔn)確率。下一步將在兼顧深度學(xué)習(xí)的網(wǎng)絡(luò)訓(xùn)練速度和保證識(shí)別準(zhǔn)確率的前提下,深入研究GPS 干擾信號(hào)的特征提取方法,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)。