楊 青,吳松麗
(1.河南師范大學(xué) 計算機(jī)科學(xué)與技術(shù)系,河南 新鄉(xiāng) 453007;2.駐馬店職業(yè)技術(shù)學(xué)院,河南 駐馬店 463000)
船舶通信系統(tǒng)內(nèi)設(shè)備種類較多,包含有線、無線等多種通信設(shè)備,其在航行過程中的信息流通量較大。船舶通信系統(tǒng)內(nèi)各種設(shè)備共享通信結(jié)構(gòu)[1-2],使船舶通信高度自動化,保障信息傳輸安全可靠、聯(lián)絡(luò)通暢。但受船舶通信系統(tǒng)設(shè)備之間的兼容性以及航行過程中不可控因素影響,船舶通信系統(tǒng)內(nèi)關(guān)鍵設(shè)備一旦出現(xiàn)問題,會導(dǎo)致船舶與地面站連接中斷,接收不到地面指令,同時影響其雷達(dá)導(dǎo)航、避障等多個功能,為船舶航行帶來潛在威脅,因此分析船舶通信系統(tǒng)關(guān)鍵設(shè)備狀態(tài)意義重大。現(xiàn)在也有很多學(xué)者致力于分析船舶通信系統(tǒng)關(guān)鍵設(shè)備狀態(tài),如藍(lán)志威等[3]使用大數(shù)據(jù)挖掘技術(shù),從入侵監(jiān)測角度分析船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行狀態(tài),該方法通過采集船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行異常時的信息后,將其轉(zhuǎn)換成頻域信號,在分析該頻域信號特征,使用聚類算法實(shí)現(xiàn)其設(shè)備運(yùn)行狀態(tài)監(jiān)測。但該方法受聚類算法參數(shù)選擇存在主觀性影響,導(dǎo)致其分析結(jié)果不夠準(zhǔn)確,因此應(yīng)用效果不佳。王瑞涵等[4]以機(jī)器學(xué)習(xí)算法為基礎(chǔ),使用流形學(xué)習(xí)方式獲取船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行時的有效數(shù)據(jù)特征后,將其輸入到機(jī)器學(xué)習(xí)算法內(nèi),通過訓(xùn)練構(gòu)建檢測器,實(shí)現(xiàn)船舶通信系統(tǒng)關(guān)鍵設(shè)備狀態(tài)分析。但該方法在提取數(shù)據(jù)有效特征時,受數(shù)據(jù)維度影響提取結(jié)果不佳,影響其應(yīng)用效果。在信息時代,大數(shù)據(jù)挖掘技術(shù)是從海量信息內(nèi),挖掘出信息之間存在的關(guān)聯(lián)關(guān)系,通過用戶容易理解的方式呈現(xiàn)出來[5],用于監(jiān)測、識別、預(yù)警等。本文以大數(shù)據(jù)挖掘技術(shù)為基礎(chǔ),研究基于大數(shù)據(jù)挖掘的船舶通信系統(tǒng)關(guān)鍵設(shè)備狀態(tài)分析方法,為提升船舶通信系統(tǒng)通信質(zhì)量提供技術(shù)支持。
采集船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行信息過程為:用戶通過PC 端登錄船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行信息采集控制中心,將北向接口和設(shè)備直連協(xié)議封裝到協(xié)議棧內(nèi),通過協(xié)議棧向船舶通信系統(tǒng)關(guān)鍵設(shè)備發(fā)出連接請求,判斷當(dāng)前關(guān)鍵設(shè)備是否為北向接口,若是則連接北向設(shè)備接口,反之則直接連接設(shè)備;然后判斷設(shè)備是否連接成功,若是,則向采集控制中心返回關(guān)鍵設(shè)備運(yùn)行信息采集結(jié)果,反之則重新判斷是否為北向接口,重新連接設(shè)備。
利用運(yùn)行狀態(tài)信息構(gòu)建數(shù)據(jù)集X=[x1,x2,···,xn],n表示數(shù)據(jù)集內(nèi)狀態(tài)信息總數(shù),使用大數(shù)據(jù)挖掘算法中的自組織映射神經(jīng)網(wǎng)絡(luò)(SOM)挖掘船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行信息的時間序列變化過程,得到其運(yùn)行狀態(tài)變化規(guī)律,詳細(xì)過程如下:
將X=[x1,x2,···,xn]輸入到自組織映射神經(jīng)網(wǎng)絡(luò)后,神經(jīng)網(wǎng)絡(luò)將該信息映射成神經(jīng)元,然后使用一階轉(zhuǎn)移概率P描述神經(jīng)元之間的關(guān)系。Qt表示經(jīng)過該神經(jīng)網(wǎng)絡(luò)量化后的船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行狀態(tài)信息時間序列,t為時刻,則第n個自組織神經(jīng)網(wǎng)絡(luò)模型AR(n)內(nèi),神經(jīng)元之間的一階轉(zhuǎn)移概率可由P[qt+1|qt,···,表示qt∈Qt。時間序列[Q1,Q2,···,Qt]的取值為[1,2,···,N],則在t時刻,qt取值為Qi的概率計算式如下:
式中:QI為時間序列[Q1,Q2,···,Qt]內(nèi)的第I個時間狀態(tài);i(xt)表示第i個船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行信息單量時間狀態(tài)。
計算i(xt)的概率密度,表達(dá)公式如下:
式中:Qj為[Q1,Q2,···,QN]內(nèi)任意時間狀態(tài);||·||為歐式距離。
狀態(tài)信息x和時間狀態(tài)q均為一維數(shù)組,且狀態(tài)信息滿足正態(tài)分布規(guī)律[5],則可用正態(tài)分布函數(shù)簡化公式(2),其變更如下:
當(dāng)I數(shù)值分別等于1 和等于N時,則式(3)變更為:
自組織映射神經(jīng)網(wǎng)絡(luò)迭代過程具備平穩(wěn)性,在其內(nèi)部距離較近的神經(jīng)元之間轉(zhuǎn)移概率較大,因此其神經(jīng)元二階概率分布函數(shù)表達(dá)公式如下:
以式(5)結(jié)果為基礎(chǔ),船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行狀態(tài)信息的二階正態(tài)密度分布函數(shù)為:
自組織映射神經(jīng)網(wǎng)絡(luò)對船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行狀態(tài)信息進(jìn)行擬合,得到神經(jīng)網(wǎng)絡(luò)模型參數(shù),再將船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行狀態(tài)信息輸入到訓(xùn)練好的模型內(nèi),依據(jù)式(6)二階正態(tài)密度分布函數(shù)對船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行狀態(tài)信息進(jìn)行量化,輸出船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行狀態(tài)信息隨著時間變化的向量序列
步驟1建立X′的區(qū)間集,δ=[r,w]。
步驟2使用長度為m的滑動窗口,將X′等長劃分成為H個子序列,其中第k個子序列由={xp,xp+1,···,xp+m-1}表示,p和p+m-1分別為子序列起點(diǎn)和終點(diǎn)。
步驟3建立第k個子序列區(qū)間集,δk=[rk,wk]。
步驟4任意選擇2 個子序列和,計算它們相似度,具體為
式中:Sδij為子序列和之間的相似度;δi,δj分別為子序列和的區(qū)間。
步驟5計算多個子序列的相似度。選擇s個任意連續(xù)滑動的子序列區(qū)間集,將該s個連續(xù)滑動子序列區(qū)間集看作一個整體,計算該整體與另一個s個連續(xù)滑動子序列區(qū)間集的相似度,前者標(biāo)記為i,后者標(biāo)記為j,該2 個子序列區(qū)間集相似度計算式如下:
式中,Sij為第i個和第j個具備s個連續(xù)滑動子序列區(qū)間集相似度。
步驟6計算上一步中第i個子序列和不包含第i個子序列公共元素其他子序列之間的最大相似度,該最大相似度被稱為第i個子序列的相似度評分,其表達(dá)式如下:
式中,ηi為第i個子序列的相似度評分。
步驟7計算序列異常值評分,則第i個序列異常值評分表達(dá)式如下:
式中,F(xiàn)i為第i個序列異常值評分。
步驟8經(jīng)過上述步驟得到船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行狀態(tài)信息時間序列所有子區(qū)間異常值評分,篩選出異常值評分大于0.55 的子區(qū)間,在該自區(qū)間內(nèi)的船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行狀態(tài)信息即為該設(shè)備運(yùn)行異常分析結(jié)果。
以某船上的通信系統(tǒng)關(guān)鍵設(shè)備作為實(shí)驗(yàn)對象,該船通信系統(tǒng)包含維修通信船站、AIS 船舶自動識別設(shè)備、GPS 電子海圖儀、中高頻接收機(jī)、氣象傳真機(jī)、衛(wèi)星接收發(fā)送設(shè)備、電視衛(wèi)星天線、SSB 電話通信設(shè)備、WHF 設(shè)備以及不同功率接收機(jī)等。該船舶執(zhí)行遠(yuǎn)洋航行任務(wù),運(yùn)行環(huán)境較為復(fù)雜,因此會出現(xiàn)某些關(guān)鍵通信設(shè)備失靈情況。將本文方法應(yīng)用在該船通信系統(tǒng)關(guān)鍵設(shè)備狀態(tài)分析過程中,檢驗(yàn)本文方法應(yīng)用效果。
以該船通信系統(tǒng)內(nèi)某信號接收機(jī)作為實(shí)驗(yàn)對象,通過本文方法采集該信號接收機(jī)運(yùn)行時的信號頻寬信息,采集結(jié)果如圖1 所示。分析可知,該通信系統(tǒng)信號接收機(jī)呈現(xiàn)運(yùn)行狀態(tài),其通信信號頻寬呈現(xiàn)不斷變化趨勢,而本文方法可采集到其信號頻寬隨著時間變化曲線信息,說明本文方法可有效采集船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行信息,為后續(xù)分析其運(yùn)行狀態(tài)打下良好的基礎(chǔ)。
圖1 通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行信息采集結(jié)果Fig.1 Operation information collection results of key equipment of communication system
以該船舶系統(tǒng)某關(guān)鍵設(shè)備作為實(shí)驗(yàn)對象,該設(shè)備24 h 不間斷運(yùn)行,設(shè)備自身溫度呈現(xiàn)不斷變化趨勢,使用本文方法采集該設(shè)備運(yùn)行溫度信息,挖掘其隨時間變化規(guī)律,并以向量的方式呈現(xiàn),結(jié)果如圖2 所示。由圖可知,該設(shè)備運(yùn)行時,溫度隨著時間呈現(xiàn)波動變化趨勢,波動區(qū)間為25℃~30℃之間。而本文方法對該船舶通信系統(tǒng)關(guān)鍵設(shè)備溫度序列進(jìn)行挖掘后,可將其溫度序列量化到1.5~4.5 量化值區(qū)間內(nèi),且在量化區(qū)間內(nèi)的溫度序列曲線分布狀態(tài)與其時間序列曲線分布狀態(tài)極其吻合。上述結(jié)果說明:本文方法可有效量化船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行狀態(tài)信息,其挖掘船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行狀態(tài)隨時間變化規(guī)律能力較好,也從側(cè)面說明本文方法分析船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行狀態(tài)能力較好。
圖2 關(guān)鍵設(shè)備狀態(tài)時間序列挖掘測試結(jié)果Fig.2 Test results of mining time series of key equipment status
以該船通信系統(tǒng)內(nèi)的中高頻接收機(jī)作為實(shí)驗(yàn)對象,在不同時刻時中斷中高頻接收機(jī)信號接收器連接線,測試在不同實(shí)驗(yàn)次數(shù)情況下,本文方法分析該中高頻接收機(jī)運(yùn)行狀態(tài)結(jié)果如表1 所示。分析可知,在10 次中高頻接收機(jī)運(yùn)行狀態(tài)分析過程中,本文方法分析結(jié)果與實(shí)際運(yùn)行狀態(tài)結(jié)果均完全相同,說明本文方法分析船舶通信系統(tǒng)關(guān)鍵設(shè)備狀態(tài)較為準(zhǔn)確,可應(yīng)用在船舶通信系統(tǒng)關(guān)鍵設(shè)備狀態(tài)分析過程中。
表1 中高頻接收機(jī)運(yùn)行狀態(tài)分析結(jié)果Tab.1 Analysis results of operation status of medium and high frequency receiver
本文研究基于大數(shù)據(jù)挖掘的船舶通信系統(tǒng)關(guān)鍵設(shè)備狀態(tài)分析方法,在其中應(yīng)用到了大數(shù)據(jù)挖掘技術(shù)中的自組織映射神經(jīng)網(wǎng)絡(luò)和區(qū)間集聚類分析方法,分別得到船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行信息時間序列和狀態(tài)分析結(jié)果。經(jīng)過實(shí)際驗(yàn)證,本文方法可有效采集船舶通信系統(tǒng)關(guān)鍵設(shè)備運(yùn)行狀態(tài)信息,分析關(guān)鍵設(shè)備狀態(tài)精度較高,應(yīng)用效果較佳。