楊亮亮
(中國西南電子技術研究所,成都 610036)
隨著無線電技術的快速發(fā)展,現(xiàn)代戰(zhàn)場中的通信電子設備規(guī)模和數(shù)量不斷增長,對通信電臺實現(xiàn)精準分選與識別已成為電子偵察對抗領域的研究熱點,但也是難點。電臺的分選能夠快速分析兵力規(guī)模及部署,個體識別可以有效判別目標,對掌握戰(zhàn)場態(tài)勢具有很大的支撐作用,而傳統(tǒng)只針對信號層面的分析識別顯然已不能完全滿足需求。
通信電臺不同于雷達系統(tǒng),通信類設備技術參數(shù)差異小,尤其是同型號電臺進行組網(wǎng)后,很難從同頻帶、同帶寬、同調(diào)制的非協(xié)同信號中分離出個體。另外,隨著復雜加密技術的廣泛應用,非授權的接收方在沒有密匙的條件下也很難解析出在線電臺的組網(wǎng)信息。
但是電臺自身固有的一些特征與其他不同個體之間存在差異,為分選識別提供了依據(jù)。研究人員從不同的角度提出了不同的特征提取方法。從信號參數(shù)角度出發(fā),有時頻域參數(shù)特征(短時傅里葉變換[1])、高階矩高階譜參數(shù)特征(積分雙譜特征[2])等。從變換域角度出發(fā),有小波分析方法[3]、EMD變換(也稱為HHT)[4]等。但由于各自產(chǎn)生機理不同,很多特征不具備普適性。
另外,很多先進的機器學習算法也被應用到了輻射源的分選識別中,有基于最鄰近距離分類器[5]的識別方法,有基于貝葉斯分類器[6]、神經(jīng)網(wǎng)絡分類器[7]的輻射源指紋特征識別,有基于支持向量機(Support Vector Machine,SVM)的雷達輻射源識別[8]等。上述均為有監(jiān)督或半監(jiān)督的學習算法,需要事先提供已知正確的數(shù)據(jù)信息集進行訓練,在訓練的基礎上進行分選識別。而在實際應用中,很多場景是針對未知輻射源的,并沒有足夠的先驗知識。
綜上,本文從電臺物理層面出發(fā),針對其輻射信號的雜散、暫態(tài)細微特征,提出采用基于K-means聚類算法的技術,能夠在沒有先驗知識的條件下對未知信號進行高效分選識別。
電臺發(fā)射機的模擬部分一般由數(shù)模轉換器(Digital-to-Analog Converter,DAC)、放大器、濾波器、混頻器、射頻功放等器件級聯(lián)組成,相比數(shù)字電路,模擬器件的細微差異更明顯也更易提取。
DAC會引入量化誤差和取整非線性誤差。量化誤差具有均勻分布的性質(zhì),不會有太大特征差異。取整非線性誤差則會帶來實際步進值與理想步進值的差異,從而引入非線性失真,從頻域觀察為不同程度的諧波形式,不同器件的諧波失真會有所差異;中頻本振、射頻本振等頻率源器件受相位噪聲影響,會體現(xiàn)一定非線性特征,從頻域觀察不再是單一譜線,這些相噪?yún)⑴c混頻、調(diào)制等非線性處理后,會引入更為復雜的諧波形式;功率放大器同樣具有非線性特性,理想的放大器輸出端的信號比輸入信號大且形狀與輸入信號完全一樣,但現(xiàn)實不同的放大器件傳輸曲線不能保證完全相同的線性特性,尤其在鄰近放大器飽和區(qū)域,為了提高放大器的工作效率,輸出功率范圍一般都會達到P1 dB壓縮點,不同放大器器件線性區(qū)的差異以及壓縮點的不同均會使得輸出信號產(chǎn)生非線性的畸變失真,從而擴展信號頻譜,出現(xiàn)雜散。
綜上,不同的電臺個體,即使同型號、同批次產(chǎn)品,由于內(nèi)部各級物理元器件特性以及工藝差異性等影響,使得其輻射信號除主成分外會有噪聲以及一定的雜散分量,這些雜散特性由電臺個體本身的物理屬性決定,相互之間具有一定的細微差異。
圖1(a)為某型電臺能量歸一化后一段時域波形圖,時域放大可以觀察到噪聲與諧波雜散波形的存在。圖1(b)為某型同一批次三部電臺進行無線通信時,用同一接收系統(tǒng)多次接收采集后的能量譜圖,可以看到不同電臺輻射信號在不同頻點的雜散特性相互之間略有差異,而自身卻相對穩(wěn)定。
(a)時域
在電臺狀態(tài)切換時,尤其是發(fā)射能量的加載及釋放的過度過程中,由于內(nèi)部電源及元器件差異,使得不同電臺輻射信號之間也存在相應暫態(tài)特性的差異。雖然隨著使用時間增加元器件老化等影響使得這些特性有所變化,但短時間內(nèi)該特性相對比較穩(wěn)定,也可作為細微特征進行提取使用。圖2(a)為電臺通信啟動時的能量前沿瞬時時域波形,啟動過程為一個階躍振蕩過程,其中沒有夾雜任何調(diào)制,只包含個體自身特征信息。圖2(b)為某型同一批次的三部電臺分別進行多次無線通信啟停,用相同接收系統(tǒng)進行接收采集后,對啟動過程的能量前沿波形的譜圖分析,可以看到不同的電臺啟動過程的頻譜能量分布略有差異,而本身相對穩(wěn)定。
(a)時域
與分類不同,聚類沒有任何先驗知識作為依據(jù),其目的就是要從沒有標記的樣本集中提取其內(nèi)部性質(zhì)和規(guī)律。聚類算法作為無監(jiān)督學習的核心問題,在機器學習領域被廣泛研究[9-11]。
K-means是一種從劃分角度[12]出發(fā)的聚類算法,對大樣本數(shù)據(jù)具有較高效率和良好伸縮性。該算法依據(jù)距離衡量樣本間相似度,距離越近相似度越高,通過迭代更新方式,不斷降低類內(nèi)樣本跟質(zhì)心的誤差平方和,最終將樣本數(shù)據(jù)聚成K類,K值為提前設定值。算法具體步驟如下:
Step1 收集樣本集{x1,x2,x3,…,xn},n為總樣本數(shù),每個樣本向量為xj={xj1,xj2,xj3,…,xjm},xjt為第j個樣本第t個屬性,共m維屬性。
Step2 根據(jù)給定K值,選K個樣本(也可以非樣本點)作為初始質(zhì)心,初始質(zhì)心向量集為{a1,a2,a3,…,ak}。
Step3 計算每一個樣本點xi到每個類質(zhì)心向量ak的距離(歐氏距離或余弦距離),歐氏距離為
(1)
依次比較樣本到每個質(zhì)心的距離大小,將樣本歸為距離最小的類內(nèi),分別為{c1c2c3…ck}類,aj為cj類的質(zhì)心。
Step4 所有樣本歸類后,根據(jù)類內(nèi)樣本更新質(zhì)心位置:
(2)
質(zhì)心即為類內(nèi)所有對象各個維度屬性的均值。
Step5 使用更新后的質(zhì)心,重復Step 3,直到所有質(zhì)心向量收斂,則表示聚類完成。
K-means算法進行聚類的前提,是要事先給出確定的類的數(shù)目K值,而實際應用中樣本的類別數(shù)目往往未知,需尋找最優(yōu)K值。通過對一定范圍的k(2≤k≤kmax)值進行遍歷搜索,用聚類質(zhì)量效果的評價指標來選取最優(yōu)值。常用指標有CH(Calinski-Harabaz)指標、SC(Silhouette Coefficient)指標、DB指標、Dunn指標、I指標等?;陔娕_雜散和暫態(tài)細微特征分布形式與特點,本文分別選取CH和SC兩種指標進行聚類質(zhì)量評價。
CH系數(shù)主要衡量聚類的緊密度和離散度,通過計算類內(nèi)協(xié)方差度量類內(nèi)的緊密程度,通過計算類間協(xié)方差度量離散度。CH系數(shù)由兩個協(xié)方差的比值得到,值越大代表類內(nèi)越緊密、類間越分散。
(3)
SC系數(shù)也叫輪廓系數(shù),主要衡量類內(nèi)相似度和類間差異度,通過計算樣本與同類中所有其他樣本的平均距離度量類內(nèi)的相似度,通過計算樣本與其相近類中的所有樣本的平均距離度量類間的差異度。SC系數(shù)由兩個平均距離的比值得到,SC值越大代表類內(nèi)越緊密、類間越分散。
(4)
式中:n為總樣本數(shù),a(i)為樣本i與同類內(nèi)其他樣本的平均距離,b(i)為樣本i與非同類的所有樣本的平均距離。
傳統(tǒng)的電臺分選方法在信號協(xié)議層面進行,在接收無線電信號后,進行參測、識別、解調(diào),然后解碼、解析,從而掌握電臺個體信息及其之間的通聯(lián)關系。但針對非協(xié)同電臺,往往不具備解析條件。尤其對于加密電臺,在沒有密匙的條件下,無法破解報文內(nèi)涵,更無法獲取節(jié)點信息;對于搶占式、主屬式電臺通信,沒有采用網(wǎng)絡協(xié)議,無法通過截獲信號信息對在線電臺進行有效分離。
結合前文,針對電臺細微特征進行K-means聚類,以實現(xiàn)對電臺的分選并獲取個體特征信息。分選步驟如下:
Step1 采集M個同頻點同調(diào)制在線電臺樣本值(電臺數(shù)未知,2~M個)。
Step2 將樣本進行歸一化處理后,進行時頻域轉換,提取特征值作為參與聚類的樣本向量。
Step3 從K=2開始,對樣本集進行K-means聚類。
Step4 計算當前K值聚類的評價指數(shù),選取合適的評價指數(shù),雜散特性聚類評價指數(shù)選擇CH值,暫態(tài)特性聚類評價指數(shù)選擇SC值。
Step5 重復Step 3,直到K=M(或某一個指定可能最大值Kmax)。
Step6 遍歷所有評價指數(shù),尋找最優(yōu)評價指數(shù)對應K值,即可視為目標電臺個數(shù),每個分類即為各對應電臺的信號樣本。
分選流程圖如圖3所示。最優(yōu)K值對應的每個類的質(zhì)心向量,可作為其對應電臺個體的特征屬性值,該特征屬性值可入庫作為對新樣本進行有監(jiān)督分選和個體識別的依據(jù)。
圖3 分選流程圖
經(jīng)過K-means聚類,一方面將目標電臺進行了分選,同時提取了各個個體的特征屬性值。個體識別即為新樣本與各個體特征屬性值之間相似性的判斷,可通過相關運算來判斷相似性,相關值作為相似程度的判據(jù)。相關運算公式如下:
(5)
其中特征屬性值a=[a1,a2,a2,…,am],樣本特征值x=[x1,x2,x2,…,xm]。相關值越大,相似度越高,當前信號樣本判斷為該電臺個體輻射的置信度就越高,最大值為1。
實驗選取了三部同型號、同批次生產(chǎn)的手持式超短波通信電臺,固定選擇60.25 MHz作為發(fā)射中心頻點進行組網(wǎng)通信,使用同一個超短波接收系統(tǒng)對不同電臺輻射信號接收采集。
4.1.1 可行性實驗
采集雜散特征樣本,將所有樣本隨機排列。假設未知電臺數(shù)目的條件下進行分選,采用K-means算法進行聚類,遍歷不同K值(大樣本情況下,選擇合適最大K值,確保評價指數(shù)達到收斂即可)。
選擇CH值作為評價指數(shù),圖4為不同K值聚類后的CH評價指數(shù)值,可以看出最優(yōu)指數(shù)對應的K值為3,與實際電臺數(shù)目相符。隨著K值增大,評價指數(shù)區(qū)域衰減收斂。
圖4 雜散特征CH評價指數(shù)
同樣隨機采集暫態(tài)特性樣本進行聚類。由于其暫態(tài)特征分布具有類內(nèi)較發(fā)散、類間距離較近的特點,選用輪廓系數(shù)SC作為評價指數(shù)。圖5為不同K值聚類對應的SC評價指數(shù)值,可以看出最優(yōu)指數(shù)對應的K值為3,與實際電臺數(shù)目相符。
圖5 暫態(tài)特征SC評價指數(shù)
選取75 kHz、120 kHz、172 kHz三個頻點的雜散特性觀察分選效果,如圖6所示,每部電臺的樣本均能被正確分選。
圖6 雜散特征樣本分選結果
4.1.2 高效性對比實驗
為驗證采用K-means聚類算法進行分選的高效性,對比2.1節(jié)中提到的Linkage、DBSCAN、GMM三種聚類算法進行分選的運算時間。
在相同樣本、相同運算環(huán)境下,分選用時的對比結果如圖7所示。可以看出,采用其他算法用時較多,且隨著樣本數(shù)的增加,分選用時也隨之存在不同程度的增多,而采用K-means聚類算法進行分選始終具有較高效率,特別在大樣本的條件下分選效率優(yōu)勢更為明顯。
圖7 運算時間對比
K-means聚類后每個類的質(zhì)心可作為對應電臺的特征屬性值,可以用來作為個體識別的參考特征向量。從圖8和圖9中可以看出,提取的特征屬性值基本位于樣本中心。
圖8 雜散樣本及特征屬性值
圖9 暫態(tài)樣本及特征屬性值
采集三部電臺的新樣本,用3.2節(jié)方法進行個體識別。表1為不同的電臺新樣本與提取的特征屬性值相關運算的結果。電臺樣本與其自身特征屬性的相關值最高,均達到93%以上,可有效實現(xiàn)信號樣本的個體識別。
表1 電臺識別相關系數(shù)表
本文從電臺物理層面出發(fā)分析了輻射信號雜散和暫態(tài)細微特征的產(chǎn)生機理,并提出了對其進行K-means聚類的電臺分選識別技術。通過實驗驗證,該技術方法可行、高效,易于工程實現(xiàn)。后續(xù)工作,一方面針對通信電臺研究提取更多其他維度的個體特征屬性,以提高分選方法的魯棒性和適應性;另一方面研究如何將本文所提出的分選識別方法進行改進,以擴展應用到其他類型輻射源。