葛聽雨, 應雨龍, 王申華, 張菲菲, 李靖超
(1.上海電力大學, 上海 200090; 2.國網浙江武義縣供電有限公司, 浙江 金華 321200;3.上海電機學院, 上海 200240)
近年來,無線通信網絡加速構建,物聯(lián)網飛速發(fā)展[1],推動了各領域的產業(yè)升級。作為物聯(lián)網設備相互連接的起點,無線通信輻射源負責信息的交互傳輸,而無線通信輻射源識別是物聯(lián)網安全的最重要一環(huán)。為了保障設備信息安全,阻止敏感信息泄露,構建有效的無線通信輻射源識別模型很有必要。除了攜帶表征含義的信息外,無線通信輻射源所發(fā)出的射頻信號還富含射頻輻射源本身的物理特征,通過射頻信號統(tǒng)計量分析和譜分析能夠提煉出無線通信輻射源的物理特征,使無線輻射源物理層認證成為可能。
以往的輻射源信號識別技術往往處于應用層,基于編碼技術或是信道技術,容易受到竊聽、跟蹤、仿冒等諸多安全威脅[2]。應用層認證機制可以在一定程度上保障信息傳輸安全及終端設備身份認證,如輕量級射頻識別認證方案、基于哈希消息認證碼的輕量級密碼認證方案[3]、基于節(jié)點微控制器實現低資源消耗的傳感網密碼算法[4]等。各類輕量級加密算法能在一定程度上滿足物聯(lián)網的認證安全,但面對大規(guī)模網絡帶來的認證數據,會大量占用物聯(lián)網的計算資源,難以適應物聯(lián)網設備本就稀缺的計算能力。此外,隨著硬件計算能力的大幅度增強,引入了更多安全風險,非法人員很容易破解傳統(tǒng)非動態(tài)加密的結點身份,假冒數據流的身份,導致數據被篡改、喪失終端控制權等安全問題[5]。面對物聯(lián)網設備所具備的有限計算能力和存儲空間,以及苛刻的資源限制需求,無線通信輻射源物理層認證相關技術的出現,突破了傳統(tǒng)意義上物聯(lián)網應用層的認證機制,可以低錯誤率、高效及低成本來完成通信輻射源的個體識別,確保物聯(lián)網的安全穩(wěn)健運行。
無線通信輻射源識別最早起源于特定輻射源識別,即將輻射源獨特的電磁特性與輻射源個體關聯(lián)起來的能力。2003年,加拿大的HALL J等人提出了射頻指紋(Radio Frequency Fingerprint,RFF)這一概念[6],從發(fā)射機信號中提取一組具有差異性的細微特征集合,作為設備的物理層本質特征?,F階段工業(yè)制造技術所制造的發(fā)射機存在一定的缺陷,包括數模轉換器中存在的量化誤差和取整非線性誤差[7],因IQ 路增益不平衡、相位不平衡、延時不平衡和載波泄露等原因引入非線性畸變[8],鎖相環(huán)因混入諧波而造成的相位噪聲[9]等。這些缺陷不會干擾正常的信息傳輸,但會對調制信號產生一定影響。相比于傳統(tǒng)要求苛刻的物聯(lián)網應用層認證技術,物理層認證能夠有效抵御模仿攻擊,具有認證速度快、計算復雜度低、多系統(tǒng)易移植的特點,無需考慮各種通信協(xié)議及編碼設定。射頻指紋的出現突破了一定的傳統(tǒng)思維,使物理層的認證機制為無線通信安全再添一層保護。各類射頻指紋提取算法成為近年熱門的研究對象,尤其是對易于獲取的穩(wěn)態(tài)信號射頻指紋的研究,如對于固有尺度分解提取出的信號特征,采取時頻能量分布灰度圖進行間紋理特征分析[10];改進雙譜和時域分析相結合的方法來提取穩(wěn)態(tài)信號中的射頻指紋[11];基于時域特征、小波特征、短時傅里葉變換和維格納分布的綜合射頻指紋提取方法[12]等。
本文提出了一種無線射頻源識別模型。該模型基于軸向積分雙譜(Axially Integrated Bispectra,AIB)、主成分分析(Principal Component Analysis,PCA)的特征提取理論及灰色關聯(lián)分類理論,能夠精確且高效地識別無線射頻輻射源穩(wěn)態(tài)信號,完成同廠同型號設備的認證。
中心壓縮化是信號預處理的重要一環(huán),根據后續(xù)要求裁剪接收機所接收到的穩(wěn)態(tài)信號,能夠保證數字信號特征提取的規(guī)范化、高效化。截取穩(wěn)態(tài)信號(選取I路或者Q路信號)經重采樣后,一定程度上減少了計算的復雜度,但因量綱原因,數值仍處于標準狀態(tài)。不同的量綱可能導致方差差異過大,無法提取出射頻指紋,導致無法進行后續(xù)計算。經由數據標準化處理(中心化-壓縮處理)實現無量綱化,消除指標之間的量綱影響,以解決數據指標之間的可比性,適合進行綜合對比評價。
設通信輻射源穩(wěn)態(tài)信號為k,有限長數字序列為k(i),i=1,2,3,…,經中心化-壓縮處理后數據為
(1)
雙譜分析屬于高階統(tǒng)計量信號處理方法,更大程度上保留了信號的幅值和相位信息[13]。經裁剪后的無線通信源射頻信號,若以傳統(tǒng)的二階統(tǒng)計量進行處理,則存在識別不出最小相位系統(tǒng)、對加性噪聲敏感等缺陷。為能提取出無線通信輻射源的細微特征,本文以高階譜中的雙譜(三階譜)作為射頻信號處理。
設通信輻射源穩(wěn)態(tài)信號對應的三階累積量為
a3x=E{x*(i)x(i+τ1)x(i+τ2)}
(2)
式中:E——對應值的數學期望;
x*(i)——穩(wěn)態(tài)信號的共軛;
x(i)——穩(wěn)態(tài)信號;
τ1,τ2——延遲。
其對應的雙譜(三階累積量的二階傅里葉變換)為
B(ω1,ω2)=
X(ω1)X(ω2)X*(ω1+ω2)
(3)
式中:B(ω1,ω2)——累積是a3x的雙譜表示;
X(ω)——x(t)的傅里葉變換;
X*(ω1+ω2)——X(ω1+ω2)的共軛。
雙譜變換能夠有效保留信號的相位幅值特征信息,但由于無線通信源信號的雙譜變換會直接導致計算復雜的二維模板匹配,引發(fā)“維數災難”,在各類時效性要求高的項目中,無法達到目標要求。鑒于此,為克服信號特征值計算復雜的問題,添加積分路徑,將二維特征值映射至一維特征。
積分雙譜主要有徑向積分雙譜、軸向積分雙譜(AIB)、圓周積分雙譜和矩形積分雙譜4種[14],分別沿著不同路徑完成特征值降維。AIB具有良好的尺度變換性,在保留了雙譜幅值信息的同時丟失了信號的部分相位信息。針對含幅值信息的樣本集,可以采用AIB的方法完成二維特征至一維特征的映射。在雙譜的雙頻率平面上沿平行與ω1軸或ω2軸的路徑進行積分,如圖1所示,即可得到AIB。
圖1 軸向積分雙譜AIB示意
穩(wěn)態(tài)信號的AIB為
(4)
PCA是一種用于探索高維數據結構的技術。作為一種線性方法,它借助投影矩陣將高維度的信息數據映射到低維空間,通過協(xié)方差矩陣強大的分類特性,使之在所投影的維度上數據的方差最大,然后提取特征維度,形成一組新的相互無關(正交)的新特征代替原指標[15],消除無關冗余信息,保留出原數據的細微特征,最后在AIB的基礎上進一步完成維數下降。假設樣本矩陣為W,每一列是同一樣本中經AIB處理過后的一維數據。
(5)
式中:n——特征點數;
m——樣本數。
為了找到能最大化方差的投影矩陣,設原數據矩陣W的協(xié)方差矩陣為C,即
C=
(6)
協(xié)方差矩陣C為對稱矩陣,主對角線上元素為樣本內數據離散程度的表征,其余元素為樣本間數據分類程度的表征。
為約束高維數據,重構數據值,通過特征根與特征向量的關系式推導出正交基,以線性關系映射至合理的特征空間。設協(xié)方差矩陣C滿足
C×I=t×I
(7)
式中:t——特征值;
I——特征向量。
t=[t1,t2,t3,…,tn]
(8)
(9)
為達到射頻指紋提取及降維,特征值t降序排列,取前x個特征值,并將對應的特征向量I對應排列組成轉移矩陣T
T=[I1,I2,I3,…,Ix]
(10)
將原數據矩陣W經轉移矩陣T投影后,得到新數據矩陣S
S=W×T
(11)
經PCA映射過的數據矩陣,數據特征得以重構,表現出類內數據離散特性及類間數據分類特性。
灰色關聯(lián)分類器(Grey Relation Classification,GRC)是基于灰色關聯(lián)度分析(Grey Relation Analysis,GRA)的多分類器。其基本思想是通過確定參考數據列和若干個比較數據列的數值相似程度來判斷樣本間的聯(lián)系是否緊密,以反映類間的關聯(lián)程度。
將關聯(lián)系數和關聯(lián)度作為類間區(qū)分指標。在非線性系統(tǒng)中,通過灰色關聯(lián)度這一指標來獲知不同特征對類間樣本的影響程度。在無線通信信號識別中,GRA具有良好的特性,如強抗噪聲性能、優(yōu)秀的分類特性、高效的計算速度及簡潔的模板數據庫匹配能力[16-18]等。
設從無線通信輻射源提取待識別的特征向量為
(12)
式中:Bi——待識別的無線通信輻射源樣本,i=1,2,3,…;
bi——某一測試樣本特征參數。
設所建立無線通信輻射源特征向量模板為
(13)
式中:Cj——無線通信輻射源樣本特征向量模板,j=1,2,3…;
cj——某一特征樣本特征參數。
設灰色關聯(lián)系數為ζ(bi(x),cj(x)),灰色關聯(lián)度為ζ(Bi,Cj),則
(14)
(15)
式中:ρ——分辨系數,通常取0.5。
求得Bi與每一個線通信輻射源樣本特征向量模板Cj(j=1,2,3…)的灰色關聯(lián)度ζ(Bi,Cj),選取最大關聯(lián)度,匹配至相應通信輻射源樣本特征向量模板。
基于AIB-PCA-GRC的模型建立的射頻信號主要分為如下7個部分:
(1) 采集接收機所收到射頻基帶信號,采集I/Q兩路信號,選取I路或者Q路信號進行方差軌跡檢測,以截取穩(wěn)態(tài)信號片段;
(2) 信號數據進行降采樣、中心化及壓縮化處理,完成數據的預處理;
(3) 將數據以3∶2的比例分為訓練樣本和測試樣本;
(4) 將用于訓練樣本的穩(wěn)態(tài)信號片段進行AIB變換;
(5) 通過PCA降維得到多維特征向量模板;
(6) 將用于訓練樣本的穩(wěn)態(tài)信號片段進行AIB變換及PCA降維;
(7) 運用GRC進行測試樣本與模板樣本匹配,實現物理層認證。
射頻指紋認證模型整體構建如圖2所示。
圖2 射頻指紋認證模型構建
本文以同廠家、同型號、同批次的100個WiFi網卡設備為例,基帶信號采集設備為FSW26頻譜儀,采集環(huán)境為實驗室LOS,100個WiFi網卡為待檢測設備,每個設備采集50個樣本;信號采集帶寬為80 MHz,每次采集1.75 ms,即每樣本有140 000個樣本點(以單路為例),其中經過方差軌跡檢測除去信號噪聲段的有效數據傳輸段為80 000個樣本點(均為穩(wěn)態(tài)信號),再對其進行切片(以40 000個點為新的樣本)處理。切片信號波形如圖3所示(以設備1樣本1為例)。
圖3 切片信號波形
為進一步減少計算復雜度,進行降采樣處理,為1 334個樣本點。重采樣信號波形如圖4所示(以設備1樣本1為例)。
圖4 重采樣信號波形
將5 000個總樣本按3∶2的比例隨機抽取分為3 000個訓練樣本以及2 000個測試樣本(100個設備分類情況下),由雙譜變換提取雙譜特征,由AIB完成二維至一維的映射,PCA降維特征提取射頻指紋模板,再選擇測試樣本進行識別模板匹配測試。以下內容將圍繞不同PCA降維點數、設備數量、添加不同程度的高斯白噪聲以及不同分類算法對于模型效果的影響,設計最優(yōu)參數并驗證模型的高效性和精確性。同時,由于采用隨機收取樣本,所以在使用相同方法測試時,會出現3%左右的誤差,但這在可接受范圍內。
PCA降維參數選取過大則影響效率,選取過小則不能保障模型的感知能力[19]。為追求模型的最大效益,以20個設備的樣本作為實驗對象,每個設備所采集的樣本數以3∶2的比例隨機分成訓練集和驗證集,由PCA提取不同維數的射頻指紋,由GRC的分類結果判斷降維參數的好壞。
經PCA降維提取射頻指紋,當射頻指紋維數從1增至10,識別準確率從10.5%提升至84%,其準確率曲線如圖5所示。
圖5 射頻指紋維數為1到10的識別準確率曲線
由圖5可知,射頻指紋維數的提升帶來顯著的準確率的提升,因此后續(xù)還需繼續(xù)增加指紋維數來探索射頻指紋的最佳構成。
當射頻指紋維數從10增至120,識別準確率從84%提升至96%,其準確率曲線如圖6所示。
圖6 射頻指紋維數為10到250的識別準確率曲線
由圖6可知,分類器識別準確率保持上升,并達到最高點,表明120個特征點所組成的特征向量已經能夠在很大程度上映射出無線通信輻射源信號本身的射頻指紋。當射頻指紋維數大于120時,識別準確率已經維持在95%左右,沒有繼續(xù)增長。表明維數在120之后的特征點已經不足以當成射頻指紋的成分,增加的維數不能提高識別準確率,只會增加特征向量的冗余,浪費計算資源。
為驗證基于AIB-GRC模型的抗噪聲能力,人為添加高斯噪聲,改變信噪比,在其他影響因素不變的情況下(PCA降維數為120,設備數為20),研究噪聲對基于AIB-GRC識別模型的影響程度。
經實驗驗證,在信噪比為0 db和10 db的情況下,模型識別準確率達到90.0%和92.0%,但是當信噪比下降至-10 db,識別準確率僅為28.2%,表明一定程度的高斯白噪聲無法對無線射頻源信號識別產生影響。信噪比與識別準確率的關系如表1所示。
表1 信噪比與識別準確率的關系
由表1可知,基于AIB-GRC的模型具有強的抗干擾能力,適用于日常實際非極端通信場景下,但若是處于多噪聲或強噪聲環(huán)境下,還需要對無線通信輻射源進行抗噪聲處理,以增加魯棒性。
為驗證GRC的分類效果,與射頻指紋提取方法保持一致(原數據經AIB,PCA降維后,單個射頻指紋由120個特征值組成),選取最鄰近(K-Nearest Neighbor,KNN)分類器和支持向量機(Support Vector Machine,SVM)分類器進行比較驗證。KNN和SVM都是目前常用的數據分類器,在分類任務中均能取得良好的效果[20-23]。
基于GRC的識別模型展示出優(yōu)良的識別準確率及識別速度。在設備數為10個的情況下,識別準確率達到了99%,基于AIB-GRC的模型完全適用于小規(guī)模設備組;在設備數從20增加至100個的情況下,設備數的改變并未對識別準確率造成過大的影響,識別準確率始終保持在90%以上;當待認證設備數達到100個時,GRC的識別準確率比SVM高了2.1%,比KNN高了7.55%。3種分類算法的識別準確率比較如圖7所示。
圖7 3種分類算法識別準確率對比
在識別效率方面,KNN分類器的識別效率要遠優(yōu)于其他兩類分類器,主要在于其單一的時間復雜性。相同的前提條件下,當設備數大于等于70個(驗證樣本為1 400個)時,GRC識別通過AIB和PCA的射頻指紋所花費的時間要少于SVM的識別時間。當設備數為100個(驗證樣本為2 000個)時,GRC花費的時間為156.35 s,為SVM所消耗時間(182.3 s)的85.76%。3種算法耗時對比如圖8所示。
圖8 3種分類算法耗時對比
由此可知,GRC在占據較少計算機資源的情況下,還能夠保持平穩(wěn)的高識別準確率。
針對于現有技術對通信輻射源個體識別率低的問題,本文提出了一種基于AIB和PCA降維,通過實現無線通信輻射源個體識別模型。通過實驗可以得到以下結論:
(1) 對于小規(guī)模設備(設備數小于10個),基于AIB-GRC的識別模型能準確識別,識別準確率達到99%;
(2) 對于中大規(guī)模設備(設備數在10~100個),基于AIB-GRC的識別模型的識別準確率能維持在90%以上;
(3) 針對無線通信輻射源信號,GRC的識別效率顯著,可達KNN分類器和SVM分類器的3倍以上;
(4) 所建模型具備優(yōu)良的魯棒性,抗噪聲能力強,適用于日常非極端通信場景。