唐哲,雷迎科
(電子工程學(xué)院,安徽 合肥 230037)
基于最大相關(guān)熵的通信輻射源個(gè)體識(shí)別方法
唐哲,雷迎科
(電子工程學(xué)院,安徽 合肥 230037)
采用相關(guān)熵度量輻射源細(xì)微特征之間的相似性,提出一種基于最大相關(guān)熵的通信輻射源個(gè)體識(shí)別方法。首先提取矩形積分雙譜特征來表征輻射源個(gè)體差異,并基于最大相關(guān)熵準(zhǔn)則構(gòu)造優(yōu)化函數(shù);其次利用半二次優(yōu)化技術(shù),將非線性的優(yōu)化問題轉(zhuǎn)化為加權(quán)線性最小二乘問題;最后利用有效集算法得到稀疏系數(shù)構(gòu)造分類器,實(shí)現(xiàn)通信輻射源的個(gè)體識(shí)別。在實(shí)際采集的同廠家同型號(hào)的FM電臺(tái)數(shù)據(jù)集上,驗(yàn)證了方法的可行性與有效性。
通信輻射源個(gè)體識(shí)別;最大相關(guān)熵;稀疏表示;半二次優(yōu)化;線性互補(bǔ)問題;有效集算法
早期的通信輻射源個(gè)體識(shí)別問題,主要結(jié)合“turn-on”暫態(tài)信號(hào)特征[2,3]和小波分析、分形等理論,針對(duì)不同型號(hào)的電臺(tái)信號(hào)進(jìn)行研究。但由于實(shí)際應(yīng)用中暫態(tài)信號(hào)特征存在難以提取和難以用于識(shí)別同廠家同工作模式的輻射源個(gè)體等問題[4],近年來,大部分研究主要利用穩(wěn)態(tài)信號(hào)特征[5~7]對(duì)輻射源進(jìn)行個(gè)體識(shí)別。由于雙譜能夠很好地抑制高斯噪聲,被廣泛用于表征信號(hào)的穩(wěn)態(tài)特征,在雙譜的基礎(chǔ)上,矩形積分雙譜(SIB,square integral bispectra)具有時(shí)移不變性、尺度變化性以及部分相位保持性等特點(diǎn),并且不會(huì)漏掉或重復(fù)雙譜信息。Xu等[8]在提取SIB特征的基礎(chǔ)上,利用主成分分析(PCA,principal component analysis)進(jìn)行特征降維,在實(shí)際采集的數(shù)據(jù)集上的識(shí)別率高達(dá)90%以上,但該方法的識(shí)別性能容易受PCA約簡維數(shù)的影響,算法穩(wěn)定性較差。針對(duì)高階譜特征的高維特性,結(jié)合機(jī)器學(xué)習(xí)等相關(guān)理論來實(shí)現(xiàn)輻射源的個(gè)體識(shí)別逐漸成為新的研究熱點(diǎn)[9,10]。在實(shí)際應(yīng)用中,輻射源發(fā)射機(jī)產(chǎn)生的信號(hào)都是非平穩(wěn)和非高斯的,導(dǎo)致其細(xì)微特征通常是不穩(wěn)定、非高斯和非線性的,此時(shí)高階譜特征并不能夠很好地表征輻射源個(gè)體特征。信息論中的相關(guān)熵(correntropy)在處理非高斯噪聲[11]、沖激噪聲[12]以及度量局部相似度[13]方面具有良好的性能,從而能夠深刻地表征信號(hào)的細(xì)微差異。He[14]將相關(guān)熵與稀疏表示(SR,sparse representation)[15]相結(jié)合,提出了基于相關(guān)熵的稀疏表示(CESR,correntropy-based sparse representation)算法,在人臉數(shù)據(jù)集上取得了頑健而高效的分類效果。
針對(duì)同型號(hào)同廠家同工作模式下的通信輻射源個(gè)體識(shí)別問題,本文提出基于最大相關(guān)熵的通信輻射源個(gè)體識(shí)別方法(MCER)。首先,在特征提取階段利用SIB特征去除高斯噪聲影響,來表征輻射源的個(gè)體差異,而在稀疏表示階段利用最大相關(guān)熵模型去除非高斯噪聲影響,增強(qiáng)算法的頑健性;其次,利用l2范數(shù)約束系數(shù),挖掘樣本之間的相關(guān)性來緩解“小樣本”問題,并通過有效集算法得到稀疏系數(shù);最后,進(jìn)一步利用系數(shù)中的判別性信息,構(gòu)造分類器。在實(shí)際采集的FM電臺(tái)數(shù)據(jù)集下,驗(yàn)證了算法的有效性和實(shí)際應(yīng)用價(jià)值。
2.1 最大相關(guān)熵表示算法
綜合孵化器是專業(yè)孵化器的基礎(chǔ),專業(yè)孵化器是綜合孵化器的升華??茖W(xué)統(tǒng)籌綜合孵化器和專業(yè)孵化器的發(fā)展,才能既推動(dòng)孵化企業(yè)的繁榮,又助推孵化集群的顯現(xiàn)。統(tǒng)籌綜合孵化器與專業(yè)孵化器的發(fā)展,就是要針對(duì)兩種孵化器特點(diǎn),開展專業(yè)的協(xié)調(diào)和服務(wù)。
其中,kσ為高斯核函數(shù)。當(dāng)兩隨機(jī)變量的相關(guān)性越強(qiáng)時(shí),相關(guān)熵越大;反之,相關(guān)熵越小。假定在RD中訓(xùn)練集X=[x1,x2,…,xn]∈RD×n包含n個(gè)訓(xùn)練樣本,y∈RD表示測試樣本。則第i類訓(xùn)練子集包含ni個(gè)訓(xùn)練樣本,,訓(xùn)練集由m類訓(xùn)練樣本組成,即X=[X1,X2,…,Xi,…,Xm]由m個(gè)訓(xùn)練子集構(gòu)成。通過最大化相關(guān)熵,可以得到對(duì)測試樣本的表示系數(shù),使訓(xùn)練樣本的線性表示與測試樣本的差異最小
根據(jù)凸共軛函數(shù)[16]的性質(zhì),式(2)可轉(zhuǎn)化為
其中,p=[p1,p2,…,pD]T是由于半二次優(yōu)化而引入的輔助變量,β為系統(tǒng)向量,當(dāng)β固定時(shí),,某一局部最大值(β,p)可以通過迭代計(jì)算
其中,t表示第t次迭代,diag(·)表示將向量p轉(zhuǎn)換為一個(gè)對(duì)角陣。式(5)顯示,在計(jì)算之后,輔助變量p在優(yōu)化βt+1時(shí)退化為一權(quán)重系數(shù)。基于Karush-Kuhn Tucker (KKT)優(yōu)化條件[17],式(5)可以轉(zhuǎn)化成以下單調(diào)線性互補(bǔ)問題。
最終,最大相關(guān)熵表示算法(MCER)得到的優(yōu)化結(jié)果可以寫成。MCER中的核寬度可以表示為
其中,θ為控制噪聲的常數(shù),D為訓(xùn)練樣本量長度。為簡化優(yōu)化問題,本文令θ恒為1進(jìn)行相關(guān)計(jì)算。
最大相關(guān)熵表示算法如下所示:步驟1到步驟4計(jì)算了在確定的tp下,目標(biāo)函數(shù)的一個(gè)可行解β。在步驟5計(jì)算了第t+1次迭代中的輔助變量t+1p。該算法不斷最大化目標(biāo)函數(shù)式(3)直至其收斂,得到最終的系數(shù)β。
MCER算法如下。
輸入訓(xùn)練集X,測試樣本y,p1=?1,F(xiàn)=φ,,β=0,α=?XTy。
輸出系數(shù)β。
步驟1計(jì)算。
步驟2計(jì)算最小項(xiàng)下標(biāo)。如果,令;否則,停止算法:β?=β即為最優(yōu)解。
步驟3通過式(8)計(jì)算。如果,令轉(zhuǎn)至步驟4;否則令r為
步驟3根據(jù)式(6)計(jì)算α。
步驟4分別根據(jù)式(4)和式(10)更新輔助向量t+1p和核尺寸σ。并返回步驟1。
在沒有稀疏約束的條件下,MCER中的有效集算法保證了系數(shù)β的稀疏性,從而在l2范數(shù)的約束下同樣得到了對(duì)測試樣本的稀疏表示。
2.2 最大相關(guān)熵表示算法的分類器設(shè)計(jì)
在分類階段,為了防止產(chǎn)生較大的系數(shù),造成錯(cuò)誤的分類結(jié)果,需要進(jìn)一步利用系數(shù)β中包含的判別性信息,構(gòu)造殘差
其中,δi(β)表示屬于類別i的系數(shù),g(·)中的2個(gè)核寬度計(jì)算如下
其中,k為測試樣本長度,同樣,本文將θ1和θ2設(shè)為1進(jìn)行相關(guān)計(jì)算。最后,利用得到的每類樣本的殘差,實(shí)現(xiàn)對(duì)測試樣本y的分類
實(shí)驗(yàn)數(shù)據(jù)為在相同工作模式下實(shí)際采集的10部同廠家同型號(hào)FM電臺(tái)的零中頻I/Q正交信號(hào)。信號(hào)的中心頻率160 MHz,信號(hào)帶寬為25 kHz,接收機(jī)的信道帶寬為100 kHz。將信號(hào)降至零中頻后,以204.8 kHz的采樣頻率對(duì)信號(hào)進(jìn)行采樣,采樣2.5 s后,得到由511 829個(gè)樣本點(diǎn)構(gòu)成的樣本序列,每個(gè)電臺(tái)采集18個(gè)樣本序列。
對(duì)于實(shí)際采集的FM復(fù)信號(hào),瞬時(shí)相位包含了FM信號(hào)豐富的頻率信息,反映了數(shù)據(jù)的實(shí)部和虛部之間的非線性比例關(guān)系以及頻率合成器在調(diào)制信號(hào)時(shí)的工作特性。因此,本文選擇FM復(fù)信號(hào)的瞬時(shí)相位來提取SIB特征作為輻射源的細(xì)微特征,用于表征通信輻射源的個(gè)體差異。SIB特征提取時(shí),分別利用每部電臺(tái)的18個(gè)樣本序列進(jìn)行SIB計(jì)算,共得到180個(gè)256維的SIB特征向量,構(gòu)成總的SIB特征集,即為180×256的矩陣,如圖1所示。
圖1 180個(gè)原始信號(hào)SIB特征集
本文采用最大相關(guān)熵分類器(MCERC)對(duì)電臺(tái)進(jìn)行個(gè)體識(shí)別,而近鄰數(shù)為1的最近鄰分類器(NNC)、基于高斯核的支持向量機(jī)分類器(SVM)以及基于相關(guān)熵的稀疏表示分類器(CESRC)作為參考同樣對(duì)提取的SIB特征進(jìn)行分類。實(shí)驗(yàn)結(jié)果均為20次實(shí)驗(yàn)得到的平均值。
3.1 對(duì)10部FM電臺(tái)的識(shí)別
為了衡量訓(xùn)練樣本個(gè)數(shù)對(duì)分類結(jié)果的影響,將每部電臺(tái)18個(gè)樣本序列的SIB特征向量按比例隨機(jī)劃分為訓(xùn)練樣本和測試樣本,構(gòu)成訓(xùn)練集和測試集,實(shí)驗(yàn)結(jié)果如表1所示。當(dāng)訓(xùn)練樣本較少(20~40)時(shí),MCERC識(shí)別率在70%以下;當(dāng)訓(xùn)練樣本充足時(shí),MCERC的識(shí)別率能夠達(dá)到80%以上。
表1 10部FM電臺(tái)的平均識(shí)別率
表1中的數(shù)據(jù)顯示,在不同的實(shí)驗(yàn)中,隨著訓(xùn)練樣本的增多,SVM的識(shí)別效果最差,MCERC均取得最好的識(shí)別效果,比NNC的識(shí)別率高出10%左右。以訓(xùn)練樣本個(gè)數(shù)為60(測試樣本個(gè)數(shù)為120)為例,MCERC通過l2范數(shù)松弛對(duì)系數(shù)的稀疏約束,一定程度上緩解了識(shí)別過程中的“小樣本”問題,從而得到更為優(yōu)異的識(shí)別效果,比NNC高10%左右,比SVM高20%左右,而比CESRC高20%左右。
圖2顯示,在訓(xùn)練樣本個(gè)數(shù)分別為20、80以及140時(shí),MCERC和CESRC對(duì)不同電臺(tái)的平均識(shí)別效果。電臺(tái)1~3的識(shí)別難度最小,SIB特征能夠很好地表征其個(gè)體差異;而電臺(tái)6~8的識(shí)別難度較大,彼此的SIB特征較為相似并互相影響識(shí)別,使各自的分類識(shí)別效果較差。在對(duì)不同電臺(tái)的識(shí)別中,采用l2范數(shù)松弛對(duì)系數(shù)的稀疏約束,通過有效集算法保證系數(shù)稀疏性,并利用系數(shù)內(nèi)包含的判別性信息,MCERC的識(shí)別結(jié)果更為穩(wěn)定優(yōu)異。
圖2 對(duì)不同電臺(tái)的平均識(shí)別率
3.2 算法的稀疏表示特性
通過計(jì)算系數(shù)β的稀疏度S,可以衡量算法對(duì)測試樣本稀疏表示的能力,體現(xiàn)算法的稀疏表示特性,其計(jì)算式為
從圖3中可以看到,當(dāng)訓(xùn)練樣本增多時(shí),由于l2范數(shù)的稀疏約束弱于l1范數(shù),CESR能夠得到比MCER更為稀疏的系數(shù)。在不同訓(xùn)練樣本個(gè)數(shù)的條件下, MCER算法與CESR算法所得的系數(shù)稀疏度相差約為5%,說明在沒有稀疏約束的情況下,SIB特征的高維性和有效集算法彌補(bǔ)了l2范數(shù)的稀疏約束能力,保證MCER算法的稀疏表示特性。
圖3 ε=0.001時(shí)CESR和MCER算法的稀疏度
本文提出一種基于相關(guān)熵的通信輻射源個(gè)體識(shí)別方法,該方法提取FM信號(hào)瞬時(shí)相位的SIB特征來表征輻射源個(gè)體差異,在最大相關(guān)熵模型的基礎(chǔ)上引入l2正則項(xiàng)來緩解“小樣本”問題,通過有效集算法保證了系數(shù)的稀疏性,并利用系數(shù)內(nèi)包含的判別性信息構(gòu)造分類器,實(shí)現(xiàn)輻射源的個(gè)體識(shí)別。在實(shí)際的FM復(fù)信號(hào)數(shù)據(jù)集上取得了較好的識(shí)別效果,對(duì)實(shí)際應(yīng)用當(dāng)中的輻射源個(gè)體識(shí)別具有較強(qiáng)理論與應(yīng)用價(jià)值。
[1]DIETRICH J.A wavelet analysis of transients in phase-locked loops[D].Winnipeg,Canada,University of Manitoba,1994.
[2]TEKBAS ? H,üRETEN O,SERINKEN N.Improvement of transmitter identification system for low SNR transients[J].Electronics Letters,2004,40(3):182-183.
[3]SERINKEN N,üRETEN O.Generalised dimension characterisation of radio transmitter turn-on transients[J].Electronics Letters,2000,36(12):1064-1066.
[4]GERDES R,DANIELS T,MINA M,et al.Device identification via analog signal fingerprinting:a matched filter approach[C]//13th Annual Network and Distributed System Security Symposium.2006.
[5]蔡忠偉,李建東.基于雙譜的通信輻射源個(gè)體識(shí)別[J].通信學(xué)報(bào),2007,28(2):75-79.CAI Z W,LI J D.Study of transmitter individual identification based on bispectra[J].Journal on Communications,2007,28(2):75-79.
[6]張旻,鐘子發(fā),王若冰.通信電臺(tái)個(gè)體識(shí)別技術(shù)研究[J].電子學(xué)報(bào),2009,37(10):2125-2129.ZHANG M,ZHONG Z F,WANG R B.Research on the technique of individual communication transmitter identification[J].Acta Electronica Sinica,2009,37(10):2125-2129.
[7]顧晨輝,王倫文.基于瞬時(shí)包絡(luò)特征的跳頻電臺(tái)個(gè)體識(shí)別方法[J].信號(hào)處理,2012,28(9):1335-1340.GU C H,WANG L W,Individual frequency hopping radio identification method based on instantaneous envelope characteristics[J].Signal Processing,2012,28(9):1335-1340.
[8]XU S H,HUANG B X,XU Z G.Identification of individual radio transmitters based on selected surrounding-line integral bispectra[C]//The 9th International Conference on Advanced Communication Technology.Gangwon-Do,South Korea,2007:1147-1150.
[9]WANG X B,WU Y Y,CARON B.Transmitter identification using embedded spread spectrum sequences[C]//2003 International Conference on Communication Technology.Beijing,China,2003:1517-1523.
[10]WANG X B,WU Y Y,CARON B.Transmitter identification using embedded pseudo random sequences[J].IEEE Transactions on Broadcasting,2004,50(3):244-252.
[11]LIU W,POKHAREL P P,PRINCIPE J C.Correntropy:properties and applications in non-Gaussian signal processing[J].IEEE Transactions on Signal Processing,2007,55(11):5286-5298.
[12]POKHAREL P P,LIU W F,PRINCIPLE J C.A low complexity robust detector in impulsive noise[J].Signal Processing,2009,89(10):1902-1909.
[13]LIU W F,POKHAREL P P,PRINCIPLE J C.Correntropy:a localized similarity measure[C]//2006 International Joint Conference on Neural Networks.Vancouver,Canada,2006:4919-4924.
[14]HE R,ZHENG W S,HU B G.Maximum correntropy criterion for robust face recognition[C]//IEEE Transactions on Pattern Analysis and Machine Intelligence,2011,33(8):1561-1576.
[15]WRIGHT J,YANG A Y,GANESH A,et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(2):210-217.
[16]BOYD S,VANDENBERGHE L.Convex optimization[M].New York:Cambridge University Press,2004.
[17]WRIGHT S J.On reduced convex QP formulations of monotone LCPs[J].Mathematical Programming,2001,90(3):459-473.
[18]LEE H,BATTLE A,RAINA R,et al.Efficient sparse coding algorithms[C]//The Twentieth Annual Conference on Neural Information Processing Systems.Vancouver,Canada,2006:4-7.
唐哲(1991-),男,山東臨沂人,電子工程學(xué)院碩士生,主要研究方向?yàn)橥ㄐ判盘?hào)處理。
雷迎科(1975-),男,安徽安慶人,博士,電子工程學(xué)院副教授,主要研究方向?yàn)橥ㄐ判盘?hào)處理。
Method of individual communication transmitter identification based on maximum correntropy
TANG Zhe,LEI Ying-ke
(Electronic Engineering Institute,Hefei 230037,China)
To measure the similarity between the fine features of communication transmitters,a method of individual communication transmitter identification based on maximum correntropy was put forward.Firstly,the square integral bispectra was extracted to characterise the communication transmitters,and then optimization function based on maximum correntropy criterion was constructed.Secondly,the half-quadratic technique transformed the nonlinear optimization problem to a weighted linear least squares problem.Finally,for identifying the communication transmitters,the sparse coefficient computed by active set algorithm was utilized to construct the classifier.Using the FM radios with same manufacturer and model,the actually collected data sets verified the feasibility and effectiveness of the method.
individual communication transmitter identification,maximum correntropy,sparse representation,half-quadratic,linear complementary problem,active set algorithm
s:National Defense Science and Technology Key Laboratory Fund Project (No.9140C130502140C13068),Preliminary Assembling Project Fund (No.9140A33030114JB39470),The National Natural Science Foundation of China (No.61272333)
TN911.7
A
10.11959/j.issn.1000-436x.2016283
2015-11-03;
2016-08-23
雷迎科,leiyingke@163.com
國防科技重點(diǎn)實(shí)驗(yàn)室基金資助項(xiàng)目(No.9140C130502140C13068);總裝預(yù)研基金資助項(xiàng)目(No.9140A33030114JB39470);國家自然科學(xué)基金資助項(xiàng)目(No.61272333)