(空軍預(yù)警學(xué)院 武漢 430019)
空中目標(biāo)識(shí)別是防空預(yù)警的研究熱點(diǎn),一直受到學(xué)者、工程技術(shù)人員及軍事部門的極大關(guān)注[1],如何根據(jù)雷達(dá)回波信息對(duì)目標(biāo)進(jìn)行分類識(shí)別,是長(zhǎng)期困擾人們的難題。近年來,隨著計(jì)算機(jī)技術(shù)、人工智能以及神經(jīng)網(wǎng)絡(luò)技術(shù)的快速發(fā)展,利用專家系統(tǒng)進(jìn)行目標(biāo)分類識(shí)別已越來越受到重視[2~6]。
基于聚類方法的分類器的種類有很多,但傳統(tǒng)的分類問題總是將每個(gè)待識(shí)別的對(duì)象,嚴(yán)格地劃分到某一類別集合里,而忽視了同一模式特征對(duì)各模式類別的重疊性。目標(biāo)的運(yùn)動(dòng)特征在很大程度上存在著模糊性,基于以上考慮,本文將模糊C均值聚類方法(Fuzzy c-mean clustering,F(xiàn)CM)應(yīng)用于空中目標(biāo)識(shí)別,先用頻數(shù)直方圖得到運(yùn)動(dòng)特征分布,再將特征分布值作為FCM算法輸入得到識(shí)別結(jié)果,最后通過實(shí)際數(shù)據(jù)實(shí)驗(yàn)進(jìn)行驗(yàn)證,與傳統(tǒng)的K均值聚類方法相比效果更理想。
為了保障飛行的安全和方便空管部門的管控,空中目標(biāo)通常都是按照規(guī)劃好的航線運(yùn)行,一方面要考慮空中目標(biāo)飛行安全,另一方面要考慮飛機(jī)本身執(zhí)行任務(wù)的需求,同類目標(biāo)飛行的航線通常有其約束和規(guī)劃[7],因此,歷史積累的目標(biāo)樣本庫(kù)內(nèi)必定隱含了目標(biāo)身份信息,這是能夠依據(jù)目標(biāo)運(yùn)動(dòng)特征進(jìn)行目標(biāo)識(shí)別的基礎(chǔ)。準(zhǔn)確完整地揭示出目標(biāo)的速度、高度、加速度等運(yùn)動(dòng)特征信息,是實(shí)現(xiàn)目標(biāo)分類的前提。
頻數(shù)直方圖是十分經(jīng)典的統(tǒng)計(jì)分析方法,它由一系列高度不一的豎條紋或者線段表述數(shù)據(jù)的分布情況,橫軸一般和具體的數(shù)據(jù)類型有關(guān)。它能較好揭示數(shù)據(jù)的集中趨勢(shì)、數(shù)據(jù)離散程度、數(shù)據(jù)的分布情況[8],其實(shí)現(xiàn)步驟如下。
Step1:將樣本觀測(cè)值x1,x2,…,xn進(jìn)行歸一化預(yù)處理,從小到大排序并去除多余的重復(fù)值,得到x(1)<x(2)<…<x(l);
Step2:適當(dāng)選取略小于x(l)的數(shù)a與略大于x(l)的數(shù)b,將區(qū)間(a,b)隨意分為k個(gè)不相交的小區(qū)間,記第i個(gè)小區(qū)間為Ii,其長(zhǎng)度為hi;
Step3:把樣本觀測(cè)值逐個(gè)分到各區(qū)間內(nèi),并計(jì)算樣本觀測(cè)值落在各區(qū)間內(nèi)的頻數(shù)ni;
Step4:在x軸上截取各區(qū)間,并以各區(qū)間為底,以ni為高作小矩形,就得到頻數(shù)直方圖。
圖2 飛行高度分布
在頻數(shù)直方圖的構(gòu)造過程中,首先需要對(duì)數(shù)據(jù)進(jìn)行分組,此時(shí)一個(gè)關(guān)鍵的問題就是如何進(jìn)行有效合理的分組。通常意義上的做法是,按照組距相同的原則進(jìn)行劃分,組距選擇要結(jié)合實(shí)際應(yīng)用背景進(jìn)行考慮。這里對(duì)某批目標(biāo)的運(yùn)動(dòng)特征參數(shù)用直方圖的方法進(jìn)行特征提取,從圖1可以看出目標(biāo)飛行速度主要分布在350km/h~850km/h,直方圖中組距為100km/h;從圖2可以看出飛行高度主要集中在14500m~17500m,直方圖中組距為1000m。從圖中可以看出,頻數(shù)直方圖的方法很好地揭示了運(yùn)動(dòng)特征分布情況。另外,直方圖方法有兩個(gè)優(yōu)點(diǎn):一是對(duì)野值點(diǎn)不敏感,不受其影響,個(gè)別野值點(diǎn)由于數(shù)量少,在直方圖中高度幾乎為零;二是在每個(gè)子區(qū)間有聚類的內(nèi)涵,例如,時(shí)速400km/h與401km/h對(duì)目標(biāo)的判斷差異不大,符合人的認(rèn)知。
直方圖提取運(yùn)動(dòng)特征后,得到一組離散值,再用相應(yīng)的專家系統(tǒng)進(jìn)行識(shí)別分類。聚類分析的目的是把分類對(duì)象按一定規(guī)則分成若干類,這些類不是事先給定的,而是根據(jù)數(shù)據(jù)的特征確定的,對(duì)類的數(shù)目和結(jié)構(gòu)不做任何假定。在同一類里這些對(duì)象在某種意義上傾向于彼此相似,而在不同類里的對(duì)象傾向于不相似[9]。
在很多分類問題中,分類對(duì)象之間沒有明確的界限,往往具有亦此亦彼的表現(xiàn),例如,好與壞、高與矮等,兩者之間沒有明確的界限,如果用傳統(tǒng)的的聚類方法進(jìn)行分類,把每個(gè)待分類的對(duì)象嚴(yán)格地劃分到某個(gè)類中,存在一定的不合理。模糊C均值聚類分析方法將模糊的方法與聚類的方法相結(jié)合,有了很好的分類效果[10~12]。
其中U=(uik)c×n為隸屬度矩陣;。顯然J(U,V)表示各類樣本到聚類中心的加權(quán)平方距離之和,權(quán)重是樣本xk屬于第i類的隸屬度的m次方。模糊C均值聚類法的聚類準(zhǔn)則是求U,V,使得J(U,V)取得最小值。模糊C均值聚類法的具體步驟如下。
Step1:確定類的個(gè)數(shù)c,冪指數(shù)m>1和初始隸屬度矩陣,通常的做法是取[0,1]上的均勻分布隨機(jī)數(shù)來確定初始隸屬度矩陣U(0)。令l=1表示第1步迭代。
Step2:通過式(2)計(jì)算第l步的聚類中心V(l)。
Step3:修正隸屬度矩陣U(l)
Step4:計(jì)算目標(biāo)函數(shù)值J(l)
現(xiàn)采集了四類機(jī)型(下文用A、B、C、D表示)數(shù)據(jù),每型25批,共100批近75萬(wàn)個(gè)航跡點(diǎn),用本文所提出的基于FCM的空中目標(biāo)運(yùn)動(dòng)特征識(shí)別方法進(jìn)行驗(yàn)證。
先采用頻數(shù)直方圖對(duì)四類機(jī)型總樣本的速度和高度運(yùn)動(dòng)特征進(jìn)行提取,分布結(jié)果如圖3~圖10所示。
圖3 A機(jī)速度分布
從四型目標(biāo)總樣本的速度、高度特征分布可以看出,速度特征表現(xiàn)出較強(qiáng)的混疊性,目標(biāo)高度特征分布值則有很強(qiáng)的抗混疊性,更有代表性。數(shù)據(jù)包括100批目標(biāo),提取每批目標(biāo)高度從0~21000的分布值,組距為1000,因而直方圖提取運(yùn)動(dòng)特征分布是100*22的數(shù)據(jù)集,作為FCM的輸入,設(shè)置目標(biāo)函數(shù)(4)中隸屬度的冪指數(shù)為m=2,分類的個(gè)數(shù)c為4,目標(biāo)函數(shù)終止誤差εJ=0.00001,最大迭代次數(shù)為100。迭代次數(shù)如圖11所示,可見經(jīng)過24次迭代就達(dá)到了終止條件。
圖4 A機(jī)高度分布
圖5 B機(jī)速度分布
圖6 B機(jī)高度分布
圖7 C機(jī)速度分布
圖8 C機(jī)高度分布
圖9 D機(jī)速度分布
圖10 D機(jī)高度分布
圖11 迭代收斂曲線
FCM算法迭代結(jié)束后,得到類中心矩陣V是一個(gè)4*22的矩陣,如表1所示,每一行是一個(gè)類的類中心坐標(biāo)。
隸屬度矩陣U是一個(gè)4*100的矩陣,由于矩陣太大,用前4*10矩陣舉例說明,如表2所示。每i列表示第i批目標(biāo)屬于4類的隸屬度,例如U的第1列元素分別為0.2069,0.1757,0.3334和0.2846。由于第1批目標(biāo)屬于第3類的隸屬度比其他3個(gè)都大,可把該批目標(biāo)歸為第3類,其他批目標(biāo)的分類原理與之類似。
通過查找隸屬度矩陣U的每一列中最大值的行標(biāo),來確定每一批目標(biāo)所屬的類,為了對(duì)算法效果進(jìn)行定量描述,用識(shí)別率η來表示識(shí)別效果,其定義為
其中TN是正確識(shí)別數(shù),TF是錯(cuò)誤識(shí)別數(shù)。將FCM算法與K均值聚類算法進(jìn)行比對(duì),識(shí)別率如表3所示,從中可以看出基于模糊C均值聚類法識(shí)別率效果要優(yōu)于K均值聚類方法。
表1 類中心矩陣
表2 屬于第3類目標(biāo)的隸屬度
表3 四類目標(biāo)識(shí)別率
本文給出了一個(gè)新的基于運(yùn)動(dòng)特征的目標(biāo)識(shí)別方法,采用頻數(shù)直方圖提取速度、高度運(yùn)動(dòng)特征分布,將分布值作為FCM的輸入進(jìn)行迭代計(jì)算,其識(shí)別效果較K均值聚類法更理想。
算法中所需要的參數(shù)包括,直方圖的分組、分類個(gè)數(shù)、迭代終止閾值、最大迭代次數(shù)四個(gè),易于設(shè)置。其中,直方圖分組是采用基于平均劃分組距的方法來完成的,如何更有效地結(jié)合目標(biāo)的特點(diǎn),以不等距的方式進(jìn)行分組,是下一步需要研究方向。