張 敏1,羅正華,黃建剛
(1.電信科學(xué)技術(shù)第五研究所有限公司,成都 610020;2.成都學(xué)院 信息科學(xué)與工程學(xué)院,成都 610106)
無線電通信個體識別在無線網(wǎng)絡(luò)監(jiān)控和安全中起著重要的作用[1-3]。它可以通過無線電信號識別不同的個體,通過雙向的個體識別可以提高通信的安全性。研究發(fā)現(xiàn),因為集成無線電的組件、電路或芯片在制造上存在差異性,所以即使是由同一管道產(chǎn)生出來的相同類型的無線電,也可能存在特性差異,這些特性差異即為無線電的“指紋特征”——硬件差異。這些特征差異是無線電“與生俱來”的,是不能被篡改的特性。由于這些特性,無線電“指紋特征”方面的個體研究也越來越受到關(guān)注。
目前,無線電的“指紋特征”個體研究根據(jù)研究信號的類別主要可以分為瞬態(tài)信號的研究和穩(wěn)態(tài)信號的研究兩個方面。瞬態(tài)信號的研究主要是研究當(dāng)無線電打開或關(guān)閉瞬間,它產(chǎn)生的瞬態(tài)信號上攜帶的個體差異特征[3]。瞬態(tài)信號是沒有承載數(shù)據(jù)信息的,它只與無線電的硬件特性有關(guān)。但是瞬態(tài)信號的持續(xù)時間非常短,對信號的起始點的檢測精確度要求極高。由于無線電通信的非合作性,瞬態(tài)信號不易獲得,所以研究起來存在很大的困難。
因此,人們將無線電的“指紋特征”個體研究視線移到了穩(wěn)態(tài)信號的研究上。穩(wěn)態(tài)信號特征的引入主要是在信號的調(diào)制階段,由于硬件存在的差異性,信號在進行調(diào)制時是會產(chǎn)生很多的雜散信號成分,這些雜散信號即為個體調(diào)制信號。個體調(diào)制信號會因硬件差異的不同而不同,且其具有非線性、非平穩(wěn)性的特點。所以研究者們試圖從雜散信號的研究上找到無線電的“指紋特征”個體研究的突破點。但是由于現(xiàn)代電子設(shè)備設(shè)計和制造的逐步規(guī)范化,個體間的差異越來越小,同時也越來越難以提取,而且,當(dāng)無線電之間建立了穩(wěn)定的通信時,穩(wěn)態(tài)信號遠高于個體調(diào)制信號和系統(tǒng)噪聲信號,此時的個體差異更難獲得。也就是說,穩(wěn)態(tài)信號為主要成分,將個體差異掩蓋在無線電信號的深處。因此,通過穩(wěn)定信號來識別無線電個體是一個難題。目前在該類研究方法的領(lǐng)域中,現(xiàn)有的方法有雙譜法、小波分析、Wigner-Ville分布(Wigner-Ville distribution,WVD)、希爾伯特黃變換(HHT)等,這些算法都存在缺點,主要是計算復(fù)雜度高、存在交叉項干擾、所需設(shè)備昂貴或識別性能有限等問題[4-7]。
為能更好地對無線電個體進行識別,找到一種性能優(yōu)異的基于穩(wěn)定信號的無線電個體“指紋特征”提取方法就顯得尤為迫切。本文提出了一種結(jié)合EWT和成分分析的無線電“指紋特征”提取方法,該方法與希爾伯特黃變換(HHT)和局部積分雙譜分析方法相比,具有更加優(yōu)越的識別性能和更加優(yōu)良特征穩(wěn)定性,同時具有受信噪比的影響較小的特點。實測數(shù)據(jù)實驗結(jié)果表明了所提方法的有效性。
考慮到個體調(diào)制信號的非線性、非平穩(wěn)性特點,常用的且具有一定代表性的時頻分析方法有希爾伯特黃變換(HHT)和局部積分雙譜。其中,希爾伯特黃變換(HHT)首先利用經(jīng)驗?zāi)B(tài)分解(EMD)方法將信號分解成若干個固有模態(tài)函數(shù)(IMF)分量,再對IMF分量進行Hilbert變換,得到信號的Hilbert譜,根據(jù)提取到的信號的Hilbert譜特征對進行信號的區(qū)分。但是由于EMD的理論基礎(chǔ)不夠完善,存在模態(tài)混疊、端點效應(yīng)、過包絡(luò)、欠包絡(luò)等問題,信號經(jīng)EMD分解后會有很多的虛假分量產(chǎn)生,使得計算量變大,提取到的Hilbert譜特征的準(zhǔn)確度降低,從而造成個體識別率降低。
局部積分雙譜時頻分析方法則是利用雙譜自身具有的時移不變性、相位保持性和尺度變換性特點,它能夠?qū)⒊€性相位外所有的信號信息完備的保留下來,而且對高斯噪聲具有抑制作用,使得此方法在個體識別領(lǐng)域的應(yīng)用很廣泛。但是,由于直接對信號進行雙譜計算的運算量極大,所以人們采用將信號局部化的方法,提取局部信號的雙譜特征進行個體識別,雖然極大程度地降低了計算量,但是計算量大的問題依然存在。
針對特征提取在這些方面的不足,文章引入了EWT信號處理方法,對信號的傅里葉譜進行自適應(yīng)的劃分,構(gòu)建自適應(yīng)的濾波器組,提取出固有模態(tài)分量。通過固有模態(tài)分量對信號進行無線電的“指紋特征”,此方法不存在虛假分量問題,而且計算量小。
EWT經(jīng)驗小波變換是將小波分析的理論框架和EMD分解的特點結(jié)合起來的一種新的信號處理方法。它是先對信號進行傅里葉變換,同時,對得到的傅里葉頻譜進行自適應(yīng)分割劃分,然后構(gòu)造與每個劃分區(qū)域相適應(yīng)的小波函數(shù)和尺度函數(shù),并生成一組帶通濾波器組并對傅里葉頻譜進行處理,最終實現(xiàn)復(fù)雜信號頻率成分不同模態(tài)的分離[8]。
令復(fù)雜信號的傅里葉變換為F(ω),將相應(yīng)規(guī)范化頻率范圍為[0,π]的傅里葉頻譜劃分為N個頻帶。將分割的每個區(qū)間定義為Λn=[ωn-1,ωn],n=1,2,…,N,ωn為頻帶邊界的中心頻率[9]。以每一個ωn為中心,定義一個寬度為Tn=2τn過渡段,這樣就需要N+1個邊界,除去第一條邊界為0(ω=0),最后一條邊界為π(ωn=π),另外還需要N-1條邊界,如圖1所示。
圖1 頻譜分割圖
在確定每個后,根據(jù)Littlewood-Paley和Meyer小波的方式構(gòu)建經(jīng)驗小波,則經(jīng)驗尺度函數(shù)和經(jīng)驗小波函數(shù)分別為:
(1)
(2)
設(shè)τn=γωn,在式(1)、(2)中,
β(x)=x4(35-84x+70x2-20x3)。
借鑒經(jīng)典小波變換的構(gòu)造方法構(gòu)造經(jīng)驗小波變換,可以得到它的細節(jié)系數(shù)和近似系數(shù)通分別為:
(3)
(4)
信號重構(gòu)的結(jié)果為:
(5)
由以上公式可得經(jīng)驗?zāi)B(tài)函數(shù)fk的公式為:
(6)
(7)
在式(6)、(7)中,*為卷積。
EMD經(jīng)驗?zāi)B(tài)分解是通過算法的過程來定義的,它利用信號的局部均值信息來真實的反映信號的內(nèi)在結(jié)構(gòu)和波動模式。該算法步驟如下:
1)首先找到輸入信號x(t)的所有極大值點和極小值點,接著用曲線將極大值點和極小值點分別串聯(lián)起來,得到輸入信號x(t)上包絡(luò)曲線fmax(x)和下包絡(luò)曲線fmax(x),然后求取上包絡(luò)曲線和下包絡(luò)曲線的均值曲線,最后用輸入信號減去均值曲線,得到差值曲線包絡(luò)。令m(t)為fmax(x)和fmin(x)的平均值。記輸入信號x(t)與m(t)的差值為h1(t),即:
h1(t)=x(t)-m(t)
(8)
若h1(t)不是基本模式分量(不滿足基本模式分量的兩個基本條件:①模態(tài)分量的極大值點和極小值點數(shù)N與過零點數(shù)相等或最多相差1;②任意時刻,極大值包絡(luò)曲線fmax(x)與極小值包絡(luò)曲線fmax(x)的平均值為零),則將h1(t)作為‘新’的輸入信號x′(t),重復(fù)以上的求差值操作,直到h1(t)滿足基本模式分量的兩個條件,為基本模式分量,記作c1(t),即:
c1(t)=h1(t)
(9)
2)用輸入信號x(t)減去c1(t)得到余下的信號分量,即:
x1(t)=x(t)-c1(t)
(10)
將x1(t)視為新的x(t),對x1(t)做類似處理。其算法過程可以表述為:
(11)
有式(11)可以看出,對輸入信號x(t)進行了n此分解,直到余下的分量不能再進行分解(通常是限制兩個連續(xù)的分解分量之間的標(biāo)差滿足在0.2~0.3,則將剩下的原始輸入信號的余下分量作為殘差rn(t),不再進行分解)。即將輸入信號x(t)被分解為n個基本分量ci(t),i=1,2,…,n和一個余項rn(t)的線性和,即:
(12)
無線電信號可以劃分為3種成分:無線電的自身調(diào)制信息成分,無線電的個體特征成分,系統(tǒng)噪聲成分。即可以表示為:
X=S+Z+N
(13)
在式(8)中,X表示無線電信號,S表示信號自身調(diào)制信息成分,Z表示個體特征成分,N表示系統(tǒng)噪聲成分。這3種成分的能量大小關(guān)系滿足‖S‖>‖Z‖>‖N‖,即S為主要成分,Z為次要成分,無線電的個體差異主要是由次要成分體現(xiàn)出來的。
受到機器學(xué)習(xí)中“特征臉”的啟發(fā)[10-13],為了提取到無線電的個體差異,我們將采用成分分析方法,將個體差異放大,達到識別的效果。成分分析方法的步驟如下:
1)記提取的單個樣本信號表示為xi=(xi1,xi2,…,xip),則n個樣本組成采樣矩陣可以表示為X=[x1,x2,…,xn]。
2)求采樣矩陣的協(xié)方差陣∑。
(14)
3)對協(xié)方差矩陣作Σ進行特征值分解。
∑αi=λαi,i=1,2,…,p
(15)
4)對求得的特征值從大到小進行排列,即λ1≥λ2≥…≥λp
5)記第k個特征值對應(yīng)的特征向量對應(yīng)的變換矩陣為:A=[αk]。
6)樣本xi在第k個特征值對應(yīng)的特征向量上的投影為:
ξk=ATxi
(16)
7)樣本xi的第k個成分可以表示為:
(17)
支持向量機(SVM)是一種以結(jié)構(gòu)風(fēng)險最小理論(SRM)和VC維理論為基礎(chǔ),能有效解決小樣本、非線性、高維模式分類識別等問題的一種機器學(xué)習(xí)方法[14-15]。但是SVM是針對二分類問題的解決算法,對于多分類問題并不適用,為了實現(xiàn)多類別分類需要對SVM算法進行一些改進。
1.4.1 SVM算法
SVM算法主要是求得一個最優(yōu)的劃分平面,將兩個不同種類的樣本分離開。令U為一個可分的二分類的樣本集。U={(xi,y)},其中,i=1,2,…,n,n為樣本的數(shù)目。xi為待分類樣本數(shù)據(jù),yi∈{-1,1}為類別屬性。
若能夠找到一個劃分平面ωT*x+b=0,其中,ω=(ω1,ω2,…,ωn),將上述的二分類樣本集準(zhǔn)確無誤的劃分開,則可以認定該訓(xùn)練集是線性可分的,即滿足:
(18)
在樣本集中,有一些離劃分平面距離很近的樣本點,這些樣本點即為支持向量。SVM的最優(yōu)劃分平面就是在滿足式(14)的前提下使兩類樣本的支持向量距離最大化。即將求最優(yōu)劃分平面問題轉(zhuǎn)化為凸二次規(guī)劃問題:
(19)
利用拉格朗日乘子法對式(15)進行分析,可得:
(20)
其中:α=(α1,α2,…,αn)T為拉格朗日乘子向量,可以用SMO算法進行求解。利用α可以求得ω和b,即可以得到最優(yōu)的劃分平面。
1.4.2 多分類支持向量機算法
如圖2所示為DAG-SVM算法的6分類示意圖。將一個待分類的信號,首先通過SVM1,6分類器判斷該信號是否為類別1和類別6,如果不是類別1信號則進入SVM2,6分類器繼續(xù)進行分類判別,否則進入SVM1,5分類器繼續(xù)進行分類判別……以此類推,直到能夠完全判別確定信號的種類,最復(fù)雜的情況是需要到達分類節(jié)點的最低層才能夠確認信號的種類,但是從總體分析可以得出該分類器的分類效率能夠滿足需求。
圖2 DAG-SVM算法6分類
為了對EWT算法的有效性進行驗證,構(gòu)造如下仿真信號:
(21)
由式(13)可知,仿真信號x4(t)是由一個線性信號x1(t)、一個4 Hz的余弦信號、一個20 Hz的余弦信號組成。然后給x4(t)添加高斯白噪聲,信噪比設(shè)置為10 dB。
首先對仿真信號進行EWT分解。EWT是用一個尺度函數(shù)和N個小波函數(shù)分別對輸入信號進行自適應(yīng)濾波分解的信號處理方法,即對信號的頻譜進行自適應(yīng)分割。對此仿真信號取N=3,即將仿真信號的頻譜自適應(yīng)的劃分成4個頻帶。仿真信號經(jīng)EWT分解后得到4個信號分量C1、C2、C3與C4,如圖3所示,這4個信號分量是按照頻率由低到高依次排列的。由圖3可以看出EWT分解得到的4個分量分別對應(yīng)仿真信號的線性信號分量、兩個余弦信號分量和高斯噪聲信號分量,即仿真信號成分都被有效的分解出來了。由此可以看出EWT對信號的分解準(zhǔn)確性很高。
圖3 仿真信號的EWT分解結(jié)果
其次,對仿真信號進行EMD分解。EMD是依據(jù)數(shù)據(jù)自身的時間尺度特征進行信號分解(局部平穩(wěn)化),而無須預(yù)先設(shè)定任何的基函數(shù)的信號處理方法,即利用信號的局部信息反映真實信號的內(nèi)在結(jié)構(gòu)和波動方式。仿真信號的EMD分解結(jié)果如圖4所示。信號分量按照頻率由高到低的順序排列,可以看到,仿真信號經(jīng)EMD分解后的分量有10個之多。將圖3和圖4進行對比可得,信號經(jīng)EMD分解后明顯有很多的虛假分量產(chǎn)生,而這些分量在仿真信號的組成成分中并不存在。可見EMD對仿真信號的分解的準(zhǔn)確度不高。
圖4 仿真信號的EMD分解結(jié)果
本文根據(jù)短波電臺信號采集的實測數(shù)據(jù)進行實驗研究,實驗信號數(shù)據(jù)采集自同一型號同一批次的4部短波電臺No.1~4,信號的實測載頻8.067 MHz,采樣頻率39.2 kHz,調(diào)制方式2 PSK,時長1 s,信噪比為20 dB。
首先研究的是結(jié)合EWT和成分分析的無線電指紋提取方法,采樣樣本長度取L=1000,參數(shù)設(shè)置為p=100,n=1 024。從實測數(shù)據(jù)中任意選取一個樣本,對其進行EWT分解,取N=7,得到的結(jié)果如圖5所示。由于EWT分解得結(jié)果分量的頻率是由低到高的,個體調(diào)制信號成分可能位于后面的分量中,因此,選取得到的c3~c7分量的歸一化特征值譜作為無線電的“指紋特征”用于個體識別分類。
圖5 信號的EWT方法分解結(jié)果
依次選取4部短波電臺No.1~4的一個信號樣本進行EWT分解處理。然后對EWT分解的c3~c7分量進行成分分析,得到No.1~4無線電信號的歸一化特征值譜結(jié)果如圖6所示。從圖6可以看到4部短波電臺的c3~c7分量的歸一化特征值譜的差異明顯,特別是c6、c7分量的特征值曲線,低頻率分量的特征值曲線的差異較小,可以證明前面的推測個體調(diào)制信號成分位于后面的分量中是正確的。以此作為無線電的“指紋特征”是可行的。
圖6 No.1~4無線電信號特征值譜
其次研究的是結(jié)合EWT和成分分析的無線電指紋提取方法的識別性能。選取No.1電臺的100個樣本,每個樣本長度為1024,將其中一半樣本作為訓(xùn)練集,另一半樣本作為測試集。根據(jù)成分分析的方法和特征值曲線的差異大小的情況,用DAG-SVM多類別分類器對c7、c6、c7+c6、c7+c5、c6+c5、c3~c7這6種成分分量的特征值曲線特征進行分類識別實驗,得到的識別率如表1所示。
表1 7種成分分量的特征識別率
從表1的結(jié)果可以看出組合分量的識別率明顯高于單一分量的識別率,而c3~c7的組合分量的識別率最高。說明雜散成量主要分布在高頻率段,使得低頻率段的信號差異不大,區(qū)分效果不明顯。
最后研究的是結(jié)合EWT和成分分析的無線電指紋提取識別方法與其他識別方法的性能效果對比。對No.1~4電臺分別選取100個樣本,每個樣本長度為1 024,將其中一半樣本作為訓(xùn)練集,另一半樣本作為測試集。通過估計信噪比的方法分別測出信號在15 dB、10 dB、5 dB條件下的數(shù)據(jù),利用DAG-SVM多類別分類器,分別運用本文提出方法、HHT和局部積分雙譜分析方法進行識別分類,得到的識別結(jié)果如圖7所示。由圖7可以得出結(jié)論,EWT成分分析的識別方法不僅優(yōu)于基于經(jīng)驗?zāi)B(tài)分解的成分分析方法,而且優(yōu)于雙譜分析方法??梢钥闯龃朔N方法受信噪比影響較小,在信噪比很低的情況下仍然識別效果良好。
圖7 不同信噪比下不同方法的識別率
無線電指紋識別在電子對抗領(lǐng)域具有很大的應(yīng)用前景。本文提出了一種結(jié)合EWT和成分分析的無線電指紋提取方法,該方法首先對信號進行成分分離,然后選取其中能反映個體差異的分解成分進行信號的特征值分析和識別。實測數(shù)據(jù)實驗結(jié)果表明,該方法不僅優(yōu)于HHT分析方法,而且優(yōu)于局部積分雙譜分析方法,在信噪比很低的情況下仍然識別效果良好,可以看出此方法對噪聲不敏感。