趙貴喜,王博通,姚四偉,鄭洪濤
(1.解放軍93199部隊,黑龍江 哈爾濱 150001;2.解放軍93108部隊,黑龍江 齊齊哈爾 161000)
信號分選是電子偵察中的重要技術(shù),是實(shí)現(xiàn)雷達(dá)輻射源識別的重要基礎(chǔ)。隨著雷達(dá)技術(shù)爆炸式的發(fā)展,戰(zhàn)場雷達(dá)信號環(huán)境越來越復(fù)雜,信號密度與數(shù)量大幅度增加,傳統(tǒng)的基于脈沖重復(fù)間隔(PRI)單參數(shù)分選在處理當(dāng)前雷達(dá)信號時就顯得效率十分低下。
近些年,學(xué)者們嘗試將數(shù)據(jù)挖掘中的聚類算法應(yīng)用于雷達(dá)信號分選。代表性的有許丹[1]探討了在單站無源定位條件下當(dāng)測角精度不高時的信號分選問題,提出了一種二次聚類方法;張萬軍[2]使用K-Means聚類對參數(shù)相近、互相交疊的非常規(guī)雷達(dá)信號進(jìn)行分選,并取得了一些成果;黎蓉[3]等人通過采用集對分析對脈沖流進(jìn)行預(yù)分選,再結(jié)合高維數(shù)據(jù)聚類,提出了基于改進(jìn)集對分析聚類的雷達(dá)信號分選方法;趙貴喜等[4]人將數(shù)據(jù)場算法與K-Means聚類算法相結(jié)合,針對幾種特殊體制雷達(dá)進(jìn)行了仿真實(shí)驗。支持向量聚類(SVC)是由Asa Ben.Hur等[5-6]人在支持向量機(jī)的基礎(chǔ)上提出的一種非參數(shù)聚類算法,人們已經(jīng)將其應(yīng)用在雷達(dá)信號分選中,并取得了一些成果。黎蓉等[7]將支持向量聚類與集對分析相結(jié)合,在一定程度上提高了分選的正確率,但在處理大批量數(shù)據(jù)時由于不斷使用SVC聚類,導(dǎo)致運(yùn)算時間過長;吳連慧[8]等為了提高復(fù)雜體制雷達(dá)信號分選的正確率,提出了加權(quán)SVC和K-Mediods聯(lián)合聚類算法,但是運(yùn)算速度不理想。本文將云模型引入到雷達(dá)信號分選中,云模型通過期望(Ex)、熵(En)、超熵(He)3個數(shù)字特征來整體表征一個定性概念,利用其完成雷達(dá)特征參數(shù)的定性向定量之間的轉(zhuǎn)換,同時結(jié)合SVC聚類與K-Means聚類算法,提出了一種新的融合聚類雷達(dá)信號分選算法。
云模型是李德毅院士提出的一種定性定量轉(zhuǎn)換模型,是云運(yùn)算、云聚類、云控制等操作的基礎(chǔ)[9]。云模型的提出解決了定性概念和其對應(yīng)定量數(shù)值之間的轉(zhuǎn)換問題,為不確定性人工智能提出了新的研究方向,并在數(shù)據(jù)挖掘、質(zhì)量評估、雷達(dá)信號識別、空間數(shù)據(jù)庫的不確定性查詢和推理等領(lǐng)域取得了一些研究成果。
云模型理論發(fā)展二十余年來,在理論研究上不斷得到完善,云模型發(fā)生器、云規(guī)則發(fā)生器、逆向云算法、云變換和云模型的粒度計算等理論相繼被提出。其中云模型發(fā)生器主要包括正向云發(fā)生器和逆向云發(fā)生器。本文主要采用X條件正向云發(fā)生器。
云模型通過期望(Ex)、熵(En)、超熵(He)3個數(shù)字特征來整體表征一個定性概念,是實(shí)現(xiàn)定性定量轉(zhuǎn)換的有效工具。本文采用X條件正向云發(fā)生器對雷達(dá)特征參數(shù)進(jìn)行從定性到定量轉(zhuǎn)換的研究。
X條件正向云生成算法:
(1) 生成以Ex為期望值、En為均方差的正態(tài)隨機(jī)數(shù)x;
(2) 生成以En為期望、He為均方差的正態(tài)隨機(jī)數(shù)En′;
(3) 計算隸屬度公式如下:
(1)
則(x,y)就是生成的云滴。其中x是屬于定向概念的一個隨機(jī)數(shù),y屬于定性概念的確定度。
本文主要選擇了雷達(dá)輻射源脈沖描述字中的載頻(RF),脈寬(PW)和脈沖到達(dá)角(DOA)3個特征參數(shù)。它們都是區(qū)間段的數(shù)據(jù),即存在最大最小邊界[Bmin,Bmax]。那么期望值就可以作為約束條件的中值,其云參數(shù)的計算公式為:
(2)
式中:k為常數(shù),可以根據(jù)具體的數(shù)據(jù)模糊與隨機(jī)性確定,本文選擇為0.01。
根據(jù)上述算法,可以實(shí)現(xiàn)雷達(dá)的特征參數(shù)向定量區(qū)間的轉(zhuǎn)換,以雷達(dá)載頻為例,假設(shè)雷達(dá)偵察設(shè)備接收到的載頻范圍為[6.75,7.05] GHz,根據(jù)公式(2)可以確定Ex=6.9 GHz,En=0.05,He=0.01,給定特征可靠系數(shù)大于0.6的云滴。采用云正向發(fā)生器生成的云滴如圖1所示。
圖1 置信度區(qū)間轉(zhuǎn)換模型
從圖1可以看出,置信度大于0.6對應(yīng)的載頻范圍為[6.85,6.95] GHz,即對描述定性概念“RF很大”有重要貢獻(xiàn)的云滴主要落在區(qū)間[6.85,6.95]GHz上。
支持向量聚類算法的基本思想是:將待聚類的數(shù)據(jù)點(diǎn)通過一個非線性變換映射到一個高維特征空間,然后在此空間中尋找一個最優(yōu)超球面,該球面為包圍樣本點(diǎn)且具有最小半徑的超球,位于球表面的點(diǎn)即為支持向量。這種非線性變換最大的好處是將原來聚類數(shù)據(jù)中的有用特征更好地提取、放大,從而更好地實(shí)現(xiàn)聚類。SVC能處理任意形狀的聚類,并能劃分有重疊區(qū)域的聚類形狀,對噪聲也能有效分析。其定義如下:
定義1:設(shè)數(shù)據(jù)空間xi∈Rd,數(shù)據(jù)集{xi}∈X,包含d維空間i個數(shù)據(jù)點(diǎn),運(yùn)用非線性變換將數(shù)據(jù)從x映射到高維特征空間,尋找Hilbert空間最小包絡(luò)x點(diǎn)的超球體半徑R。為了發(fā)現(xiàn)帶有軟邊界的最小包絡(luò)球體,表達(dá)為:
minR2
‖Φ(x)-a‖2≤R2
(3)
式中:‖·‖為歐基里德函數(shù);a為球體中心。
引入松弛系數(shù)ξj,式(3)變?yōu)椋?/p>
minR2
‖Φ(x)-a‖2≤R2+ξj
(4)
引入拉格朗日乘式:
∑ξjμj+C∑ξj
(5)
(6)
(7)
由卡羅需-庫恩-塔克(KKT)條件得:
ξjμj=0
(8)
(R2+ξj-‖Φ(xj)-a‖2)βj=0
(9)
由上述優(yōu)化可得:
(10)
(11)
如果βi=C,點(diǎn)xi的映像位于特征空間的球體之外,被稱作約束支持向量(BSV)。如果0<βj 用高斯核函數(shù)K(xi,xj)表示點(diǎn)積,則得到只包含βj的Wolfe對形式為: (12) (13) 經(jīng)過大量實(shí)驗發(fā)現(xiàn),SVC聚類算法針對小樣本數(shù)據(jù)具有很大的優(yōu)勢,在處理大樣本數(shù)據(jù)時運(yùn)算時間過長,容易陷入具備最優(yōu)解。而實(shí)際中處理雷達(dá)全脈沖數(shù)據(jù)量很大,如果將它們?nèi)孔鳛樘幚順颖?,則將極大地影響運(yùn)算的速度。 K-Means聚類算法的基本思想:隨機(jī)地選擇k個聚類數(shù)據(jù)點(diǎn)作為初始聚類中心,每個聚類中心代表了一個類的平均值或中心。然后計算剩余的每個對象與初始聚類的中心距離,將它賦給最近的類,再重新計算每個類的平均值或中心。不斷重復(fù)上述聚類過程,直到準(zhǔn)則函數(shù)收斂。 K-Means聚類算法的效果嚴(yán)重依賴于初始聚類中心的選擇,隨機(jī)的初始聚類中心如果選取不當(dāng)會導(dǎo)致收斂于局部最優(yōu)解,同時可能會增加運(yùn)算時間。同時K-Means聚類算法需要事先指定聚類數(shù)目,無法適應(yīng)未知雷達(dá)數(shù)目的信號分選。針對以上缺點(diǎn),本文提出了云模型改進(jìn)的SVC算法與K-Means算法相互彌補(bǔ)的融合聚類算法。 (1) 雷達(dá)數(shù)據(jù)標(biāo)準(zhǔn)化 在實(shí)際的雷達(dá)信號分選處理中,偵察設(shè)備接受雷達(dá)信號數(shù)據(jù)流復(fù)雜多變,不同特征參數(shù)數(shù)值往往不會在同一數(shù)量級上。為了更好的雷達(dá)信號分選效果,需要對雷達(dá)信號數(shù)據(jù)流進(jìn)行預(yù)處理,使其分布在[0,1]之間,以消除數(shù)據(jù)在量綱上的影響。 (2) 算法描述 SVC聚類分選算法是一種無監(jiān)督聚類分選算法,優(yōu)點(diǎn)是不需要事先確定聚類數(shù)目,正好符合目前復(fù)雜的雷達(dá)信號分選環(huán)境,但是面對大量雷達(dá)脈沖數(shù)據(jù)時又存在著運(yùn)算時間過長的缺點(diǎn)。針對這些問題,本文首先利用云模型對雷達(dá)特征參數(shù)進(jìn)行定量區(qū)間轉(zhuǎn)換,縮小雷達(dá)樣本數(shù)據(jù)量,同時能最大程度地保存雷達(dá)脈沖數(shù)據(jù)的信息,然后用SVC聚類算法得到雷達(dá)數(shù)據(jù)的初始聚類中心,最后利用K-Means聚類算法完成最后的聚類分選,從而縮短聚類分選時間和復(fù)雜程度。融合聚類算法采用雷達(dá)脈沖到達(dá)角、脈沖重頻和脈沖寬度3個參數(shù)聯(lián)合分選,步驟執(zhí)行如圖2所示。 圖2 融合算法流程圖 為了驗證本文提出的融合算法的有效性,仿真實(shí)驗?zāi)M了3部復(fù)雜體制的雷達(dá)數(shù)據(jù),按照到達(dá)時間進(jìn)行混合,對同時到達(dá)的信號進(jìn)行丟失處理,共得到230個脈沖信號。由于實(shí)際的雷達(dá)偵察過程中不可避免地出現(xiàn)誤差,所以在模擬生成雷達(dá)數(shù)據(jù)時,隨機(jī)地給每個特征參數(shù)加上一個1%以內(nèi)偏差。仿真雷達(dá)信號參數(shù)如表1所示。 表1 雷達(dá)仿真數(shù)據(jù) 經(jīng)過標(biāo)準(zhǔn)化處理后,雷達(dá)混合數(shù)據(jù)分布如圖3所示(圖中“*”代表雷達(dá)脈沖)。 圖3 歸一化雷達(dá)混合數(shù)據(jù)分布圖 利用本文提出的融合聚類算法聚類,得到的分選效果如圖4所示。 圖4 融合聚類分選效果圖 從圖3的雷達(dá)混合數(shù)據(jù)分布圖可以看出,3部雷達(dá)數(shù)據(jù)在不同維度上都有著嚴(yán)重的重疊,從圖4的分選結(jié)果可以看出,本文提出的融合聚類分選算法準(zhǔn)確地將混合數(shù)據(jù)分選成了3類。通過對圖4的詳細(xì)對比可以看出,雷達(dá)A中有7個數(shù)據(jù)被錯誤地分選成了雷達(dá)C,還有1個數(shù)據(jù)被誤分選為雷達(dá)B;雷達(dá)B中的6個數(shù)據(jù)被錯誤地分選成了雷達(dá)A,雷達(dá)C中的數(shù)據(jù)有5個被誤分選成了雷達(dá)C,總的分選正確率為97%。本文將同組雷達(dá)數(shù)據(jù)利用SVC聚類算法對比結(jié)果如表2所示。 表2 分選算法對比結(jié)果 由表2可以看出,本文提出的融合聚類算法用時較SVC聚類算法短,并且分選正確率高。 本文提出了基于云模型的融合聚類算法,在基于SVC聚類與K-Means聚類聯(lián)合分選的基礎(chǔ)上,引入了云模型,實(shí)現(xiàn)了雷達(dá)分選參數(shù)的區(qū)間轉(zhuǎn)換,將數(shù)據(jù)進(jìn)行一個初始的軟劃分,提高了聚類分選的準(zhǔn)確度,縮短了分選時間。這只是本文對雷達(dá)信號分選算法的一種嘗試,還存在很多缺點(diǎn),這些都有待進(jìn)一步研究。3 融合算法
3.1 K-Means聚類算法
3.2 融合聚類算法
3.3 仿真實(shí)驗
4 結(jié)束語