翁永祥,趙萬(wàn)磊,鄭志娟
(中國(guó)電子科技集團(tuán)公司第五十一研究所,上海201802)
雷達(dá)信號(hào)分選是指對(duì)偵察接收機(jī)截獲到的密集信號(hào)流進(jìn)行解耦合,形成脈沖描述字(PDW),并從中提取信息將PDW映射到不同輻射源。信號(hào)分選是后續(xù)電子對(duì)抗決策的基礎(chǔ),也是當(dāng)前電子偵察系統(tǒng)中信號(hào)處理的核心部分[12]。隨著新體制雷達(dá)技術(shù)的發(fā)展,其采取的復(fù)雜波形、參數(shù)捷變等技術(shù)導(dǎo)致當(dāng)前戰(zhàn)場(chǎng)電磁環(huán)境愈加復(fù)雜,已有文獻(xiàn)顯示,相對(duì)于20世紀(jì)70年代,當(dāng)前電磁環(huán)境的信號(hào)流密度和信號(hào)波形種類(lèi)都已呈現(xiàn)指數(shù)級(jí)的增長(zhǎng)[3],在這種情況下,傳統(tǒng)的基于直方圖的信號(hào)分選算法已不能適應(yīng)當(dāng)前作戰(zhàn)需求。
聚類(lèi)分析作為統(tǒng)計(jì)學(xué)習(xí)理論中一種常用的非監(jiān)督數(shù)據(jù)挖掘方法,具備計(jì)算簡(jiǎn)單、收斂速度快、易于實(shí)現(xiàn)等優(yōu)點(diǎn),逐漸被應(yīng)用于復(fù)雜電磁環(huán)境下的信號(hào)分選,并取得了一定的成果。文獻(xiàn)[4]針對(duì)噪聲背景下的雷達(dá)信號(hào)分選問(wèn)題,提出一種基于自組織特征映射神經(jīng)網(wǎng)絡(luò)的聚類(lèi)方法,對(duì)捷變頻雷達(dá)信號(hào)取得了較好的分選效果;文獻(xiàn)[5]提出一種基于密度聚類(lèi)(DBSCAN)的PDW數(shù)據(jù)二次分選方法,在一次分選結(jié)果的基礎(chǔ)上進(jìn)一步提取微弱雷達(dá)信號(hào),并利用仿真數(shù)據(jù)驗(yàn)證了其有效性;文獻(xiàn)[6]針對(duì)存在重頻參差、信號(hào)交疊、局部脈沖丟失等復(fù)雜電磁環(huán)境信號(hào)分選問(wèn)題,基于PRI估計(jì)變換提出一種聯(lián)合數(shù)據(jù)場(chǎng)和聚類(lèi)的雷達(dá)信號(hào)分選方法,具備運(yùn)算效率高、對(duì)噪聲不敏感等優(yōu)點(diǎn);文獻(xiàn)[7]和文獻(xiàn)[8]研究了K-Means算法在雷達(dá)信號(hào)分選領(lǐng)域的應(yīng)用,針對(duì)K-Means算法存在的聚類(lèi)數(shù)目需要預(yù)先設(shè)定問(wèn)題,分別利用蟻群算法,數(shù)據(jù)場(chǎng)方法等對(duì)K-Means算法進(jìn)行優(yōu)化,自動(dòng)確定聚類(lèi)數(shù)目的同時(shí)能夠獲得較好的信號(hào)分選結(jié)果。上述分析都是假設(shè)接收到的雷達(dá)信號(hào)信噪比較高,而實(shí)際電磁環(huán)境較為復(fù)雜,接收到的雷達(dá)信號(hào)不可避免地會(huì)混雜著噪聲分量,而噪聲分量的存在會(huì)導(dǎo)致PDW數(shù)據(jù)中也存在隨機(jī)噪聲,從而影響隨后的信號(hào)分選性能[9]。
本文在上述研究的基礎(chǔ)上,針對(duì)K-Means算法存在聚類(lèi)數(shù)目確定及對(duì)噪聲數(shù)據(jù)敏感問(wèn)題,提出一種基于主成分分析(PCA)模型[1011]聯(lián)合K-Means算法的雷達(dá)信號(hào)分選方法,首先利用PCA算法將PDW投影至特征空間,然后在特征空間中根據(jù)特征值分布情況確定聚類(lèi)個(gè)數(shù)的同時(shí)實(shí)現(xiàn)對(duì)PDW中存在噪聲分量的抑制,最后利用K-Means算法將主分量個(gè)數(shù)作為聚類(lèi)個(gè)數(shù),并對(duì)噪聲抑制后的數(shù)據(jù)進(jìn)行聚類(lèi)?;诜抡鏀?shù)據(jù)的試驗(yàn)結(jié)果表明,所提方法可以獲得更高的正確分選性能,并且具備噪聲穩(wěn)健性。
(1)設(shè)定聚類(lèi)個(gè)數(shù)K;
(2)從數(shù)據(jù)集中任意選出K個(gè)樣本作為初始的聚類(lèi)中心,記為C i1,C i2,…,C iK,上標(biāo)i表示當(dāng)前的迭代次數(shù);
(3)計(jì)算數(shù)據(jù)集中每個(gè)樣本與當(dāng)前聚類(lèi)中心的距離,并將其分配至離它最近的聚類(lèi)中心對(duì)應(yīng)的子集中,得到K個(gè)子集,記為S i1,S i2,…,S iK,樣本與聚類(lèi)中心之間的距離定義如下:
(4)根據(jù)步驟(3)的聚類(lèi)劃分,按照下式計(jì)算當(dāng)前劃分下的聚類(lèi)中心,其中n k為第k個(gè)子集中的樣本數(shù)。如果聚類(lèi)中心不再發(fā)生變化,即C i+1k=C ik,則迭代終止,此時(shí)的聚類(lèi)結(jié)果即為誤差平方和最小準(zhǔn)則下的最優(yōu)聚類(lèi),若Ci+1k≠C ik,轉(zhuǎn)至步驟(3)重新進(jìn)行子集劃分:
從上述步驟可以看出,K-Means算法是根據(jù)預(yù)設(shè)的聚類(lèi)數(shù)目K實(shí)現(xiàn)對(duì)數(shù)據(jù)的初始劃分,在此基礎(chǔ)上對(duì)初始劃分進(jìn)行優(yōu)化,因此聚類(lèi)數(shù)目K的確定對(duì)聚類(lèi)結(jié)果影響很大,同時(shí)K-Means算法對(duì)噪聲數(shù)據(jù)較為敏感[8,10]。在戰(zhàn)場(chǎng)復(fù)雜電磁環(huán)境下,很難獲取用于確定聚類(lèi)數(shù)目K的先驗(yàn)信息,同時(shí)截獲的PDW中必然存在一定的噪聲,因此需要一種基于數(shù)據(jù)驅(qū)動(dòng)的方法實(shí)現(xiàn)對(duì)聚類(lèi)中心K的自適應(yīng)確定,同時(shí)該方法要具備對(duì)噪聲數(shù)據(jù)的魯棒性。
表1 仿真雷達(dá)參數(shù)表
根據(jù)所提方法的算法流程,此時(shí)可以得到式(8)所示觀測(cè)數(shù)據(jù)矩陣,其中N=450。然后對(duì)3個(gè)參數(shù)向量標(biāo)準(zhǔn)化后分別進(jìn)行PCA處理,滑窗長(zhǎng)度W設(shè)置為15,得到的特征值譜如圖1所示,可以看出經(jīng)過(guò)PCA 處理后和三維參數(shù)向量呈現(xiàn)出一致的分布特性,即前3個(gè)特征值相對(duì)較大,第4個(gè)特征值以后急劇減小,根據(jù)式(5)計(jì)算得到大特征值個(gè)數(shù)均為3,即主分量個(gè)數(shù)K=3,與雷達(dá)個(gè)數(shù)一致。值得注意的是,在對(duì)和三維參數(shù)向量進(jìn)行特征值分解時(shí),并不能保證得到的特征值譜分布特性總是一致的,此時(shí)可以采用投票的方式確定最終的主分量個(gè)數(shù)K。
圖1 歸一化特征值譜圖
在PCA分解的基礎(chǔ)上,設(shè)置聚類(lèi)個(gè)數(shù)為3,利用K-Means算法對(duì)450組噪聲抑制后的脈沖數(shù)據(jù)和進(jìn)行聚類(lèi),得到的結(jié)果如圖2所示。采用正確分選率指標(biāo)對(duì)結(jié)果進(jìn)行定量分析,正確分選率為正確分選的脈沖數(shù)與總脈沖數(shù)的比值,表2給出了分選結(jié)果的混淆矩陣,其中“K-Means”表示采用傳統(tǒng)K-Means方法進(jìn)行聚類(lèi),初始聚類(lèi)個(gè)數(shù)設(shè)置為2,3,4分別進(jìn)行試驗(yàn)得到聚類(lèi)結(jié)果,并將結(jié)果進(jìn)行平均;“蟻群+K-Means”為文獻(xiàn)[8]提出的利用蟻群算法優(yōu)化K-Means的聚類(lèi)方法。從圖2和表2所示結(jié)果可以看出,所提方法對(duì)雷達(dá)C 的正確分選率可以達(dá)到100%,對(duì)雷達(dá)A 和雷達(dá)B的正確分選率均達(dá)到了98%,相對(duì)于另外2種方法,所提方法對(duì)每一部雷達(dá)都可以獲得最優(yōu)的分選性能。
圖2 聚類(lèi)結(jié)果
表2 分選結(jié)果混淆矩陣
為了評(píng)估所提方法在低信噪比條件下的分選性能,采取向觀測(cè)數(shù)據(jù)加入高斯白噪聲的方式構(gòu)造不同的信噪比數(shù)據(jù)。圖3給出了上述3種方法的正確分選率隨信噪比的變化曲線,可以看出隨著信噪比的降低,3種方法的分選性能都出現(xiàn)不同程度的下降,但是所提方法在不同信噪比條件下的分選性能均優(yōu)于其它2種方法,特別是當(dāng)信噪比高于15 d B時(shí)所提方法可獲得超過(guò)85%的正確分類(lèi)率,具備較高的噪聲魯棒性。圖4、圖5和圖6分別給出了當(dāng)信噪比為15 dB時(shí),傳統(tǒng)K-Means方法(K=3),蟻群+K-Means算法和所提方法的聚類(lèi)結(jié)果,可以看出噪聲的存在導(dǎo)致數(shù)據(jù)分布更加分散,在三維空間中的交疊較為嚴(yán)重,K-Means 方法和蟻群+KMeans方法沒(méi)有進(jìn)行噪聲抑制處理,得到的分選結(jié)果相對(duì)較差。
圖3 不同信噪比條件下的正確分選率
圖4 信噪比為15 dB時(shí)K-Means的聚類(lèi)結(jié)果
圖5 信噪比為15 dB時(shí)蟻群+K-Means的聚類(lèi)結(jié)果
圖6 信噪比為15 dB時(shí)所提方法的聚類(lèi)結(jié)果
隨著電磁環(huán)境的愈加復(fù)雜,傳統(tǒng)基于直方圖和K-Means的聚類(lèi)方法逐漸不能滿足實(shí)際需要。本文在K-Means聚類(lèi)方法的基礎(chǔ)上,將PCA引入信號(hào)分選領(lǐng)域,提出一種基于PCA聯(lián)合K-Means聚類(lèi)的噪聲穩(wěn)健雷達(dá)信號(hào)分選方法,利用PCA對(duì)PDW數(shù)據(jù)進(jìn)行噪聲抑制處理并自動(dòng)確定K-Means算法的初始類(lèi)別數(shù),然后利用K-Means對(duì)噪聲抑制后的數(shù)據(jù)進(jìn)行聚類(lèi)。最后采用仿真數(shù)據(jù)對(duì)所提方法在不同信噪比條件下的分選性能進(jìn)行驗(yàn)證,從實(shí)驗(yàn)結(jié)果可以看出,噪聲的存在導(dǎo)致PDW分布特性發(fā)生變化,并影響最終的聚類(lèi)結(jié)果,而PCA具備的噪聲魯棒特性,在實(shí)現(xiàn)噪聲抑制的同時(shí)保持原始PDW的分布特性,從而可以在低信噪比條件下獲得較好的正確分選結(jié)果。當(dāng)然,該技術(shù)作為信號(hào)分選方法新的探索,在未來(lái)工程裝備的成熟使用還需開(kāi)展進(jìn)一步研究。