魏居輝, 王炯琦*, 穆京京, 何章鳴,3, 周萱影
1. 國防科技大學(xué), 長沙 410073 2. 中國航天科技集團(tuán)有限公司, 北京 100090 3. 北京空間飛行器總體設(shè)計部, 北京 100090
衛(wèi)星電源系統(tǒng)作為衛(wèi)星的重要組成部分,承擔(dān)著為星上負(fù)載或產(chǎn)品供電的功能.衛(wèi)星在軌運(yùn)行期間,復(fù)雜的太空環(huán)境會導(dǎo)致衛(wèi)星電源系統(tǒng)異常,使得衛(wèi)星供電系統(tǒng)中斷,影響衛(wèi)星的平穩(wěn)運(yùn)行,或?qū)е滦l(wèi)星的失效.開展衛(wèi)星電源系統(tǒng)的異常檢測研究,能夠有效監(jiān)測衛(wèi)星電源系統(tǒng)狀態(tài),實(shí)現(xiàn)系統(tǒng)異常的預(yù)警,從而提升衛(wèi)星在軌運(yùn)行可靠性.近年來,針對衛(wèi)星電源系統(tǒng)的異常檢測研究已引起國內(nèi)外研究學(xué)者的關(guān)注,主要有兩種[1-2]:基于解析模型的方法和基于數(shù)據(jù)驅(qū)動的方法.1)基于解析模型的異常檢測方法.系統(tǒng)具備一個較準(zhǔn)確的數(shù)學(xué)模型,可以將量測信息和參考輸出進(jìn)行比較得到殘差,通過對殘差進(jìn)行分析處理從而實(shí)現(xiàn)異常檢測[3].具體包括參數(shù)估計方法、狀態(tài)估計方法和等價空間方法等[4].2)基于數(shù)據(jù)驅(qū)動的異常檢測方法.系統(tǒng)不具備一個精確的數(shù)學(xué)模型,只能對研究對象的結(jié)構(gòu)特性以及各類型故障發(fā)生時各傳感器數(shù)據(jù)進(jìn)行分析處理從而實(shí)現(xiàn)異常檢測[5].具體包括信號處理方法、信息融合方法、機(jī)器學(xué)習(xí)方法、多元統(tǒng)計分析方法以及專家知識方法等[6].
為滿足不同的任務(wù)需求,衛(wèi)星電源系統(tǒng)會在不同的工作模式之間進(jìn)行切換,使得建立精確模型變得困難.從而導(dǎo)致了系統(tǒng)可測信息和參考模型輸出偏差較大,使得基于解析模型的異常檢測方法應(yīng)用受限[7].相反,對衛(wèi)星電源系統(tǒng)實(shí)施觀測相對更容易,根據(jù)目前已經(jīng)掌握大量歷史數(shù)據(jù)的現(xiàn)況,基于數(shù)據(jù)驅(qū)動的衛(wèi)星電源系統(tǒng)異常檢測方法更具有發(fā)展前景[8].因此,大量的學(xué)者就數(shù)據(jù)驅(qū)動的異常檢測方法開展了深入的研究,主要工作如下:
文獻(xiàn)[9]最先提出基于距離的異常檢測方法,將異常點(diǎn)定義為沒有足夠多相鄰數(shù)據(jù)點(diǎn)的數(shù)據(jù)點(diǎn),利用數(shù)據(jù)分布不一致性對異常點(diǎn)進(jìn)行檢測.但在高維空間中,基于歐式距離的度量變得不穩(wěn)定,使得異常檢測效果降低.文獻(xiàn)[10-11]進(jìn)一步提出了基于角度的異常檢測方法,利用角度在高維數(shù)據(jù)中的穩(wěn)定表現(xiàn)來提升異常檢測的穩(wěn)定性.但是,該方法需要計算全局的信息,計算負(fù)荷較大.為了減少計算負(fù)荷,文獻(xiàn)[12-13]提出了基于局部密度的異常檢測方法,利用局部向量點(diǎn)積密度來度量各數(shù)據(jù)點(diǎn)的異常程度,并利用最大斜率模型確定異常檢測閾值,該方法確實(shí)顯著降低了計算負(fù)荷.進(jìn)一步,文獻(xiàn)[14-15]提出了基于概率的異常檢測方法,利用貝葉斯后驗(yàn)概率構(gòu)建了一種異常檢測算法,用于識別一類更新速度快、變化趨勢平緩、缺少人工類別標(biāo)識的時間序列異常值.但是,該方法需要預(yù)先假定數(shù)據(jù)符合某個概率模型,然后才能根據(jù)此分布模型對待檢測數(shù)據(jù)進(jìn)行不一致性檢測來判別異常值.
對于具有多種工作模式的衛(wèi)星電源系統(tǒng),實(shí)際觀測數(shù)據(jù)(或數(shù)據(jù)統(tǒng)計特征)難以用預(yù)設(shè)的概率模型進(jìn)行刻畫,且無法事先知道數(shù)據(jù)中的異常值個數(shù),因此,上述方法具有一定的局限性.當(dāng)數(shù)據(jù)缺少標(biāo)記時,由于無法獲取異常標(biāo)記,該方法會失效.文獻(xiàn)[16-19]提出了一種基于高斯混合模型(GMM)的異常檢測算法,利用高斯混合模型對歷史數(shù)據(jù)進(jìn)行聚類分析,獲取不同模式的聚類中心,并生成統(tǒng)計模型.該方法應(yīng)用于工業(yè)領(lǐng)域取得了理想的效果.目前,針對狀態(tài)標(biāo)識缺失的多模式衛(wèi)星電源系統(tǒng)開展的異常檢測研究仍然較少.其研究主要存在下述兩個難點(diǎn):1)如何實(shí)現(xiàn)無標(biāo)識的數(shù)據(jù)建模;2)如何辨識建模過程中的參數(shù).
由于衛(wèi)星電源系統(tǒng)是典型的多模式系統(tǒng),因此基于高斯混合模型的異常檢測方法可以適用于衛(wèi)星電源系統(tǒng)的異常檢測.本文在基于高斯混合模型的衛(wèi)星電源系統(tǒng)異常檢測方法上,構(gòu)建了可區(qū)分性、穩(wěn)定性和擬合優(yōu)良性3個準(zhǔn)則對模型的擬合效果進(jìn)行評價,解決了高斯混合模型易受到聚類簇數(shù)和初始迭代點(diǎn)影響的問題.同時,本文將該方法用于衛(wèi)星電源系統(tǒng)異常檢測中,在缺少系統(tǒng)模型和模式標(biāo)識的情況下,取得較好的檢測結(jié)果,驗(yàn)證了該方法在衛(wèi)星系統(tǒng)中的應(yīng)用可行性.
衛(wèi)星電源系統(tǒng)中的大多數(shù)設(shè)備都存在多種不同的工作模式(或工作環(huán)境),記這些不同的工作模式為D={D1,D2,…,Ds}.對于在指定模式Di,i=1,2,…,s下穩(wěn)定工作的設(shè)備,其觀測數(shù)據(jù)本身(或觀測數(shù)據(jù)的特征)通常表現(xiàn)出平穩(wěn)的特性.因此,通常假設(shè)模式Di下的觀測數(shù)據(jù)xij滿足如下的觀測方程
xij=ηi+Aiε,j=1,2,…,mi
(1)
式中,xij∈Rn×1是n維的系統(tǒng)觀測數(shù)據(jù),ηi∈Rn×1表示數(shù)據(jù)均值,Ai∈Rn×n是誤差生成矩陣,ε∈Rn×1表示觀測過程中不可觀不可控因素引起的隨機(jī)誤差.通常認(rèn)為ε服從均值為0,方差為In的標(biāo)準(zhǔn)正態(tài)分布
ε~N(0,In)
(2)
(3)
由于系統(tǒng)會在多種工作模式之間進(jìn)行切換,因此在事先不確定系統(tǒng)運(yùn)行模式時,通常認(rèn)為觀測數(shù)據(jù)以一定的概率來自某個模式.為了后續(xù)表述方便,做如下記號:
(4)
式中,η表示所有模式均值的集合,Σ表示所有模式方差的集合.此時,多模式下的觀測數(shù)據(jù)xij滿足如下的高斯混合模型(Gaussian mixture models, GMM)
(5)
(6)
由于衛(wèi)星電源系統(tǒng)的實(shí)際觀測數(shù)據(jù)往往無法提供狀態(tài)模式標(biāo)識作為先驗(yàn)信息,而模型中包含與模式標(biāo)識相關(guān)的隱變量αi,無法通過直接求解獲得GMM的最大似然解,因此,需要使用迭代的方法對模型進(jìn)行求解.
為了通過訓(xùn)練數(shù)據(jù)獲得高斯混合模型的極大似然解,需要使用迭代的方法.期望最大化算法(EM)是求解該模型的典型算法,同時,文獻(xiàn)[20]表明該算法可以收斂到一個穩(wěn)定解,其具體迭代步驟如下.
步驟1.初始化,給定精度ε選定初始迭代參數(shù)
步驟2.E步驟,使用t(t=0,1,…,tmax)次迭代的參數(shù)值計算
利用EM算法可以對GMM模型進(jìn)行求解.由于模型的聚類結(jié)果易受聚類簇數(shù)和初始參數(shù)的影響,因此,需要對GMM的建模精度進(jìn)行評估,以確保模型不出現(xiàn)欠擬合和過擬合的問題.進(jìn)一步,本文考慮了以下幾種評價準(zhǔn)則.
2.2.1 可區(qū)分性準(zhǔn)則
首先,設(shè)備在不同模式下的觀測數(shù)據(jù)應(yīng)當(dāng)具有顯著差異,這是顯而易見的一點(diǎn).實(shí)際上,這暗示著每個模式有明確可區(qū)分的聚類中心,換言之,每種模式的聚類中心不應(yīng)當(dāng)位于其他模式的置信區(qū)間內(nèi).因此,準(zhǔn)則1給出了GMM模型可區(qū)分性的定義,而一個好的GMM模型總是可區(qū)分的.
準(zhǔn)則1.(可區(qū)分性) 稱兩個模式Di,Dj是可區(qū)分的,如果其滿足下述條件
(7)
式中,ηi,ηj分別是模式Di,Dj的觀測數(shù)據(jù)的聚類中心1-α是置信水平,一般為0.05.進(jìn)一步,稱一個GMM模型的任意兩個模式Di,Dj都是可區(qū)分則稱該模型是可區(qū)分的.在準(zhǔn)則1的條件下,圖1直觀地展現(xiàn)兩個模式是否是可區(qū)分的.
圖1 模式可區(qū)分性示意圖Fig.1 Model distinguishability diagram
圖1中,模式1和模式2的聚類中心并不落在彼此的置信區(qū)間內(nèi),因此模式1和模式2是可區(qū)分的;然而,模式2和模式3的聚類中心落在了彼此的置信區(qū)間內(nèi),因此模式2和模式3是不可區(qū)分的.綜合上述,選擇模式數(shù)量為3時,該模型是一個不可區(qū)分的模型.
2.2.2 穩(wěn)定性準(zhǔn)則
其次,在選取合適的模式簇數(shù)后,GMM模型應(yīng)當(dāng)是穩(wěn)定的.這也就是說,對于不同的初始參數(shù),最終的模型聚類結(jié)果應(yīng)當(dāng)不存在顯著差異.因此,準(zhǔn)則2給出了GMM模型穩(wěn)定性的定義,而一個好的GMM模型總是穩(wěn)定的.
準(zhǔn)則2.(穩(wěn)定性)稱一個模型是穩(wěn)定的,如果其對任意的初始參數(shù){η(0),Σ(0),α(0)},迭代后獲得的{η*,Σ*,α*}是無顯著差異的,則稱該模型是穩(wěn)定的.由于,針對任意初始參數(shù)來驗(yàn)證模型穩(wěn)定性是一件困難的事情,因此,通常僅利用2組不同的初始參數(shù)進(jìn)行驗(yàn)證.在準(zhǔn)則2的條件下,圖2直觀地展現(xiàn)GMM模型是否是穩(wěn)定的.
圖2 模式穩(wěn)定性示意圖Fig.2 Telemetry Data Chart
在圖2中,仍然采用圖1中的數(shù)據(jù),模式簇數(shù)仍然選擇為3,但是選用了不同的初始迭代點(diǎn).可見模式2的聚類中心發(fā)生了改變,因此,該模型是不穩(wěn)定的.
2.2.3 AIC準(zhǔn)則和BIC準(zhǔn)則
上述兩個準(zhǔn)則從定性的角度對GMM模型的好壞進(jìn)行了評價.為了定量地評估GMM模型的聚類精度,下文考慮了AIC準(zhǔn)則和BIC準(zhǔn)則.這兩個準(zhǔn)則是常用的衡量統(tǒng)計模型擬合優(yōu)良性的準(zhǔn)則.
為了檢驗(yàn)GMM模型的擬合優(yōu)良性,總是考察模型的似然函數(shù)值和未知參數(shù)個數(shù).通常,似然函數(shù)值越大說明模型擬合的效果越好;未知參數(shù)個數(shù)越多,說明模型越靈活,擬合準(zhǔn)確度就會越高.盡管增加模型參數(shù)個數(shù)會提高模型擬合準(zhǔn)確度,但是,這會增加模型過擬合的風(fēng)險.因此,一個好的擬合模型應(yīng)該是一個擬合精度和未知參數(shù)個數(shù)的綜合最優(yōu)配置.AIC準(zhǔn)則和BIC準(zhǔn)則都是基于這一思想提出的.
AIC準(zhǔn)則(akaike information criterion)[21]:對于GMM模型而言,可以用擬合精度和參數(shù)個數(shù)的加權(quán)函數(shù)來表征模型的擬合優(yōu)良性,公式如下:
AIC=s-Lη,Σ(x)
(8)
式中,s代表GMM模型的參數(shù)數(shù)量,Lη,Σ(x)代表GMM模型的對數(shù)似然函數(shù),AIC函數(shù)值越小表明模型擬合效果越好.
BIC準(zhǔn)則(bayesian information criterion)[22]:對于GMM模型而言,可以用擬合精度和參數(shù)個數(shù)的加權(quán)函數(shù)來表征模型的擬合優(yōu)良性,公式如下:
BIC=slnm-2Lη,Σ(x)
(9)
式中,s代表GMM模型的參數(shù)數(shù)量,m為樣本容量,Lη,Σ(x)代表GMM模型的對數(shù)似然函數(shù),BIC函數(shù)值越小表明模型擬合效果越好.
相比較于AIC準(zhǔn)則,BIC準(zhǔn)則將未知參數(shù)個數(shù)的懲罰權(quán)重由常數(shù)變成了樣本容量的對數(shù)函數(shù)lnm.由于BIC準(zhǔn)則考慮了樣本容量,因此可以有效防止模型擬合準(zhǔn)確度造成的模型復(fù)雜度過高的問題.
在第2節(jié)中,EM算法被用于高斯混合模型的求解,從而實(shí)現(xiàn)了通過歷史數(shù)據(jù)對不同模式特征的聚類分析.接下來,就可以構(gòu)建合適的異常檢測準(zhǔn)則來實(shí)現(xiàn)待檢測數(shù)據(jù)的異常檢測,最后,還應(yīng)當(dāng)對異常檢測的精度進(jìn)行分析與評估.
通常,相比較于使用單次觀測數(shù)據(jù)進(jìn)行異常檢測,利用多次觀測數(shù)據(jù)進(jìn)行異常檢測能取得更高的檢測精度,因此,考慮待檢測數(shù)據(jù)集Z={z1,z2,…,zk}.在基于距離的判別方法下,待檢測數(shù)據(jù)Z所屬模式Di由下式確定
(10)
式中,d2(Z,Di)表示待檢測數(shù)據(jù)集Z到模式Di的距離.一般而言,馬氏距離是一個合適的度量準(zhǔn)則,其計算方法由下式確定
(11)
確定待檢測數(shù)據(jù)集Z所屬模式Di后,還需要檢驗(yàn)Z是否確屬于模式Di.通??梢詷?gòu)建如下統(tǒng)計量:
(12)
文獻(xiàn)[23]表明,該統(tǒng)計量滿足參數(shù)為n和mi+k-n-1的F分布,即
F~F(n,mi+k-n-1)
(13)
由于
mi=mp(Di)=mαi
(14)
從而可以寫成如下形式:
F~F(n,mαi+k-n-1)
(15)
在置信水平α下,若統(tǒng)計量F滿足
F (16) 則認(rèn)為待檢測數(shù)據(jù)集Z中數(shù)據(jù)都正常,否則認(rèn)為待檢測數(shù)據(jù)集Z中存在異常數(shù)據(jù). 由于衛(wèi)星電源系統(tǒng)通常是高可靠的,系統(tǒng)出現(xiàn)異常的情況總是相對少的,所以,利用多次觀測數(shù)據(jù)進(jìn)行異常檢測通常能夠減少工作量.但是,待檢測數(shù)據(jù)集Z中存在異常數(shù)據(jù)時,仍然需對數(shù)據(jù)集Z進(jìn)行更細(xì)致的分析來定位異常.因此,下述流程被用于異常數(shù)據(jù)的精確定位. 如果待檢測數(shù)據(jù)集Z中存在異常數(shù)據(jù),則構(gòu)建刪減數(shù)據(jù)集Zi如下: Zi=Z-{zi}={z1,z2,…,zi-1,zi+1,…,zk} 類似于公式(12),在刪減數(shù)據(jù)集Zi上構(gòu)建統(tǒng)計量 (17) 由于該統(tǒng)計量表征了刪減數(shù)據(jù)集Zi與模式Di的偏離程度,所以,有理由認(rèn)為異常數(shù)據(jù)zi是使得統(tǒng)計量Fzi最小的數(shù)據(jù),即 (18) 同理,式(17)中的統(tǒng)計量Fzi滿足參數(shù)為n和mαi+k-n-2的F分布,即 Fzi~F(n,mαi+k-n-2) (19) 在置信水平α下,若統(tǒng)計量Fzi滿足 Fzi (20) 則認(rèn)為刪減數(shù)據(jù)集Zi中數(shù)據(jù)都是正常的,而zi確是一個異常數(shù)據(jù);否則,刪減數(shù)據(jù)集Zi中仍然存在異常數(shù)據(jù),需要針對Zi繼續(xù)構(gòu)建刪減數(shù)據(jù)集,并重復(fù)上述過程,直到確定所有的異常數(shù)據(jù),整個流程如圖3所示. 圖3 異常檢測流程圖Fig.3 Abnormal detection flow chart 注1.式(14)中mi=mαi不一定是整數(shù),因此需要考慮參數(shù)為n1和n2的F分布的概率密度函數(shù) (21) 其中,B(·|·)表示貝塔函數(shù),具有如下的形式 (22) 為了評估異常檢測效果,采用精確度(Pre)、召回率(Rec)和F1分?jǐn)?shù)三個指標(biāo)對異常檢測效果進(jìn)行評估,如式(23)所示,各項指標(biāo)越高,表示檢測效果越好. (23) 式中:TN是被正確檢出的正常樣本個數(shù);FP是被錯誤檢出的異常樣本個數(shù);FN是被錯誤檢出的正常樣本個數(shù);TP是被正確檢出的異常樣本個數(shù),相互關(guān)系如表1所示. 表1 標(biāo)簽相互關(guān)系表Tab.1 The relationship between label 在實(shí)際應(yīng)用中,數(shù)據(jù)標(biāo)簽是未知的,這導(dǎo)致實(shí)際的異常檢測結(jié)果是不可預(yù)見的,也就是說無法在沒有外界信息輸入的情況下進(jìn)行精度評估.因此,為了對方法效果進(jìn)行評估,在已經(jīng)標(biāo)注的數(shù)據(jù)集上進(jìn)行訓(xùn)練測試是必要的.值得注意的是,數(shù)據(jù)的標(biāo)注并不作為先驗(yàn)信息來輔助模型的訓(xùn)練、測試以及異常檢測,而僅在后續(xù)的精度評估中發(fā)揮作用. 衛(wèi)星帆板驅(qū)動機(jī)構(gòu)(SADA)是衛(wèi)星電源系統(tǒng)的核心機(jī)構(gòu),如圖4所示,在衛(wèi)星的正常運(yùn)行中發(fā)揮著重要的作用.由于衛(wèi)星帆板系統(tǒng)直接暴露在太空中,容易受到空間碎片等侵襲,造成系統(tǒng)異常.因此,在衛(wèi)星運(yùn)行過程中,開展衛(wèi)星帆板驅(qū)動機(jī)構(gòu)的異常檢測,能夠?qū)ο到y(tǒng)異常是一項很重要的任務(wù).下面,以衛(wèi)星帆板驅(qū)動機(jī)構(gòu)為對象,開展了衛(wèi)星電源系統(tǒng)異常檢測的數(shù)值仿真和實(shí)驗(yàn)驗(yàn)證. 圖4 SADA系統(tǒng)示意圖Fig.4 Structure model of the SADA system 文獻(xiàn)[24]給出了衛(wèi)星帆板驅(qū)動機(jī)構(gòu)的數(shù)學(xué)模型: (24) 式中,ISADA是太陽電池陣的輸出電流,U是輸出電壓,θ為太陽光照射在太陽能帆板上時與太陽能帆板法線方向的夾角.Tb=25℃表示參考溫度,Gb=1 000 W/m2表示參考光照強(qiáng)度,T表示實(shí)際溫度,G表示實(shí)際光照強(qiáng)度.Vk,Vm,Id,Im為衛(wèi)星太陽能帆板的固定參數(shù),分別表示開路電壓、最大功率點(diǎn)電壓、短路電流、最大功率電流點(diǎn).Nb是電池片并聯(lián)數(shù)目,Nc是電池片串聯(lián)數(shù)目.A,B,C表示補(bǔ)償系數(shù),分別為 A=0.002 5℃-1,B=0.000 5 m2/W, C=0.002 9℃-1 上述模型表明GEO衛(wèi)星的太陽能帆板機(jī)構(gòu)在不同工作模式(或工作環(huán)境)下通常具有穩(wěn)定的輸出.因此,在后續(xù)的建模過程中,無需進(jìn)行額外的特征提取,同時,這表明高斯混合模型是適用的. 注2.實(shí)際情況中,衛(wèi)星的工作環(huán)境不斷變化,真實(shí)光照強(qiáng)度和真實(shí)溫度都是不斷變化的.在數(shù)值仿真中,為了簡化模型,總是認(rèn)為真實(shí)光照強(qiáng)度和真實(shí)溫度都是固定值. 注3.GEO衛(wèi)星的運(yùn)行周期為24 h,全年中只有春分和秋分前后存在地影期,共92天,持續(xù)時間約為72 min,其余時間系統(tǒng)均運(yùn)行于光照期.在數(shù)值仿真中,為了簡化模型,不考慮光-地影過渡期. 注4.為了模擬實(shí)際環(huán)境中的溫度變化、系統(tǒng)數(shù)據(jù)觀測時的噪音干擾和數(shù)據(jù)傳輸過程中的傳輸損耗等影響,對測試參數(shù)的模擬量中加入±5%的高斯噪聲. 文獻(xiàn)[25]表明,衛(wèi)星電源系統(tǒng)的故障以突變故障為主,主要包括: 1)電路異常,通常表現(xiàn)為部分太陽能板短路失效.在仿真過程中,可以等價為有效工作單元減少,即電池片并聯(lián)數(shù)目Nb和串聯(lián)數(shù)目Nc減少,本文假設(shè)并聯(lián)數(shù)目Nc減少為0.95Nc. 2)定向機(jī)構(gòu)異常,通常表現(xiàn)為太陽能帆板軸承機(jī)構(gòu)卡死.在仿真過程中,可以等價為太陽光照射在太陽能帆板上時與太陽能帆板法線方向的夾角θ發(fā)生偏移,本文中假設(shè)存在θ產(chǎn)生10°的固定偏移. 因此,本文僅針對突變故障進(jìn)行仿真.本文所有仿真在 Lenovo Ryzen 3700X CPU with 3.60 GHz processor, 16 GB RAM上進(jìn)行.根據(jù)實(shí)際的情況,考慮衛(wèi)星的兩種運(yùn)行環(huán)境,分別為光照期和地影期.兩種環(huán)境下的參數(shù)設(shè)置如下 (25) 仿真時間設(shè)置為40 000 s,光照期和地影期的每次持續(xù)時間為5 000 s.前10 000 s系統(tǒng)正常運(yùn)行,得到的數(shù)據(jù)作為訓(xùn)練集數(shù)據(jù),隨后的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù).在10 000 s時發(fā)生定向機(jī)構(gòu)故障,在20 000 s時發(fā)生電路故障,30 000 s后,異常解除,衛(wèi)星帆板驅(qū)動機(jī)構(gòu)恢復(fù)正常運(yùn)行.整個過程中,衛(wèi)星帆板驅(qū)動機(jī)構(gòu)的觀測數(shù)據(jù)如圖5所示. 圖5 訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)圖Fig.5 Training data and test data 首先,針對不同的聚類簇數(shù),計算了不同聚類簇數(shù)下的AIC和BIC指標(biāo),結(jié)果如下圖6所示.從圖中可以發(fā)現(xiàn),選擇聚類簇數(shù)k=2時,AIC指標(biāo)和BIC指標(biāo)均取得極小值.同時,根據(jù)參數(shù)設(shè)置式(25)可知,衛(wèi)星驅(qū)動機(jī)構(gòu)主要存在兩種工作模式,這驗(yàn)證了使用聚類簇數(shù)k=2是合理的.下圖7給出了訓(xùn)練集數(shù)據(jù)的聚類結(jié)果,從圖中可以發(fā)現(xiàn),該方法能夠較好地實(shí)現(xiàn)光照期數(shù)據(jù)和地影期數(shù)據(jù)的聚類. 圖6 不同聚類簇數(shù)下的AIC指標(biāo)和BIC指標(biāo)變化趨勢圖Fig.6 Trend chart of AIC and BIC 圖7 訓(xùn)練集數(shù)據(jù)聚類結(jié)果散點(diǎn)圖Fig.7 Clustering results of training data (Take s=2 as an example) 在后續(xù)的異常檢測中,以每10個數(shù)據(jù)作為1組測試數(shù)據(jù)集為例進(jìn)行異常檢測.此時,由式(16)可知,在置信度水平為95%的情況下,由F檢驗(yàn)方法所確定的異常檢測的閾值為 Threshold=Fα/2(n,mαi+k-n-1)=2.997 5 對訓(xùn)練集和測試集的檢測結(jié)果如圖8所示. 圖8 異常檢測結(jié)果圖(以s=7,k=5為例)Fig.8 Abnormal detection results (take s=7,k=5 as examples) 從圖8中可以發(fā)現(xiàn),該方法可以識別發(fā)生在光照期的電路異常和驅(qū)動機(jī)構(gòu)異常.這是由于,在光照期時,系統(tǒng)發(fā)生異常時會導(dǎo)致系統(tǒng)觀測狀態(tài)改變,從而可以對異常進(jìn)行有效檢測;而在地影期時,系統(tǒng)的異常無法對電流電壓的觀測值造成改變,從而導(dǎo)致無法對異常進(jìn)行有效檢測.事實(shí)上,為了檢驗(yàn)地影期的異常數(shù)據(jù),往往需要更多的觀測信息,比如溫度變化、蓄電池工作狀態(tài)、軸承溫度等.為了更直觀地表現(xiàn)檢測效果,將不同聚類簇數(shù)、不同待檢測集長度下的檢測效果匯總?cè)绫?. 表2 不同聚類簇數(shù)和不同待檢測集長度下檢測效果表Tab.2 Test results under different cluster number and length of different testing data 從表2中可以發(fā)現(xiàn),在聚類簇數(shù)為s=2時,當(dāng)待檢測數(shù)據(jù)集長度增加時,各項指標(biāo)都存在顯著下降.這是由于衛(wèi)星電源系統(tǒng)在地影期發(fā)生異常時,沒有對電流和電壓這兩個指標(biāo)產(chǎn)生影響,從而也就無法基于當(dāng)前數(shù)據(jù)對衛(wèi)星電源系統(tǒng)的異常做出檢測.而隨著待檢測數(shù)據(jù)集長度的增加,該方法仍認(rèn)為地影期數(shù)據(jù)沒有與歷史數(shù)據(jù)產(chǎn)生偏移,從而導(dǎo)致了對系統(tǒng)異常檢測效果的下降. 上述數(shù)值仿真初步驗(yàn)證了基于高斯混合模型的異常檢測方法在以衛(wèi)星太陽能帆板機(jī)構(gòu)為代表的衛(wèi)星電源系統(tǒng)上的有效性.該方法在AIC指標(biāo)和BIC指標(biāo)極小的情況下,可以有效檢出系統(tǒng)異常.因此,可以為后續(xù)的實(shí)際實(shí)驗(yàn)驗(yàn)證奠定基礎(chǔ). 本文的實(shí)驗(yàn)驗(yàn)證數(shù)據(jù)為某衛(wèi)星電源系統(tǒng)的在軌遙測數(shù)據(jù),由中國空間技術(shù)研究院提供.數(shù)據(jù)采樣信息包括衛(wèi)星太陽帆板的輸出總電流、軸承溫度和機(jī)構(gòu)外殼溫度等,采用PCA方法對所使用數(shù)據(jù)進(jìn)行了降維,僅保留了3個主要特征. 訓(xùn)練集數(shù)據(jù)為2016年6月1日到2018年6月1日衛(wèi)星太陽帆板機(jī)構(gòu)的各信道遙測數(shù)據(jù),測試集數(shù)據(jù)為2018年7月1日到2020年8月1日衛(wèi)星太陽帆板機(jī)構(gòu)的各信道遙測數(shù)據(jù),在2020年7月7日到2020年7月13日期間,衛(wèi)星太陽帆板發(fā)生執(zhí)行器異常,觀測數(shù)據(jù)如圖9所示. 圖9 某衛(wèi)星電源系統(tǒng)訓(xùn)練數(shù)據(jù)圖Fig.9 The training data and testing data (Actual observation data) 相比仿真數(shù)據(jù),實(shí)際數(shù)據(jù)在空間中同樣保持有兩個明顯的中心,但在不同模式之間存在狀態(tài)轉(zhuǎn)移過程,弱化了兩個模式的界限.進(jìn)一步,衛(wèi)星的故障模式主要為定向機(jī)構(gòu)故障,但比仿真數(shù)據(jù)中的故障形式更加復(fù)雜,從觀測數(shù)據(jù)上來看,其分布也沒有形成明顯的聚類. 4.2.1 實(shí)驗(yàn)過程 首先,選取不同的聚類簇數(shù),利用EM算法對模型進(jìn)行求解,并計算了不同聚類簇數(shù)下的AIC函數(shù)值和BIC函數(shù)值,其結(jié)果如圖10所示. 從圖10中可以發(fā)現(xiàn),當(dāng)聚類簇數(shù)k>20時,AIC和BIC幾乎沒有發(fā)生改變.因此,在后續(xù)的研究中,僅考慮聚類簇數(shù)k=1,2,…,20的情況.進(jìn)一步,考慮到GMM模型的可區(qū)分性,計算了不同聚類簇數(shù)下,聚類中心的可區(qū)分性,其結(jié)果如下圖11所示(展示了k=7,8的情況).可以發(fā)現(xiàn),當(dāng)k>7時,GMM模型是不可區(qū)分性,因此,在后續(xù)的討論中,僅考慮k=1,2,…,7的情況. 圖10 不同數(shù)下的AIC和BIC函數(shù)值Fig.10 Trend chart of AIC and BIC 圖11 不同聚類簇數(shù)下的模型可區(qū)分性(上圖為k=7,下圖為k=8)Fig.11 Distance between cluster centers under different cluster numbers 為此,以k=7為例,圖12給出了聚類的效果. 圖12 訓(xùn)練數(shù)據(jù)的聚類結(jié)果(以s=7為例)Fig.12 Cluster results of training data (Take s=7 as an example) 4.2.2 異常檢測結(jié)果評估 在前文的基礎(chǔ)上,分別選取聚類簇數(shù)s=1,2,…,7和待檢測數(shù)據(jù)窗口長度k=1,5,10,30對異常檢測結(jié)果進(jìn)行評估. 表3表明如下的幾點(diǎn)問題: 表3 不同聚類簇數(shù)和待檢測集長度下檢測效果表Tab.3 Test results under different cluster number and different length of testing data 1)Rec指標(biāo)幾乎沒有改變.這是由于異常數(shù)據(jù)和正常數(shù)據(jù)存在較大的差異,容易被檢測出來; 2) 在選擇相同聚類簇數(shù)的情況下,隨著測試數(shù)據(jù)窗口長度的增加,檢測效果不斷提升.這是由于數(shù)據(jù)窗口長度的增加帶來了更多的信息,從而有助于提升異常檢測效果. 3) 但是,在相同長度的測試數(shù)據(jù)窗口下,聚類簇數(shù)的增加并沒有提升檢測效果.這是由于,隨著聚類簇數(shù)的增加,對訓(xùn)練數(shù)據(jù)的擬合精度增加,從而導(dǎo)致對檢測數(shù)據(jù)的偏離敏感,使得正常數(shù)據(jù)也容易被誤判為異常,導(dǎo)致檢測效果降低.因此,在實(shí)際應(yīng)用中,往往選取較小的聚類簇數(shù)來避免這個問題. 針對狀態(tài)標(biāo)識缺失的多模式衛(wèi)星電源系統(tǒng),本文提出了基于高斯混合模型的異常檢測方法.首先,高斯混合模型被用于觀測數(shù)據(jù)的建模;其次,EM算法被用于高斯混合模型的求解,可區(qū)分性準(zhǔn)則、穩(wěn)定性準(zhǔn)則、AIC和BIC被用于模型的評估;隨后,在高斯混合模型的基礎(chǔ)上,模式判別準(zhǔn)則和異常檢測準(zhǔn)則被用于衛(wèi)星電源系統(tǒng)異常檢測. 仿真和實(shí)驗(yàn)結(jié)果表明,高斯混合模型適合于衛(wèi)星電源系統(tǒng)的建模,并且AIC和BIC的幅值變化過程表明了該方法的優(yōu)良性.同時,在模式判別準(zhǔn)則和異常檢測準(zhǔn)則下,Pre、Rec和F1等表明了該方法能夠有效識別系統(tǒng)異常.最后,實(shí)驗(yàn)還表明,適當(dāng)增加族類個數(shù)能夠提高高斯混合模型的數(shù)據(jù)擬合精度并減小高斯參數(shù)的估計偏差,適當(dāng)增加檢測數(shù)據(jù)窗口長度能夠提高異常數(shù)據(jù)識別精度,從而提高衛(wèi)星電源系統(tǒng)的異常檢測效果.3.4 精度評估
4 數(shù)值仿真和實(shí)驗(yàn)驗(yàn)證
4.1 仿真數(shù)據(jù)驗(yàn)證
4.2 實(shí)際數(shù)據(jù)驗(yàn)證
5 結(jié) 論