摘" 要: 由于云服務(wù)器通信網(wǎng)中數(shù)據(jù)流量龐大且復(fù)雜,同時受到網(wǎng)絡(luò)結(jié)構(gòu)和配置的多樣性以及動態(tài)變化的影響,傳統(tǒng)的主動探測或人工分析方法難以準(zhǔn)確識別漏洞弧段,導(dǎo)致故障數(shù)據(jù)識別的準(zhǔn)確性和效率受到限制。因此,研究一種基于被動分簇的云服務(wù)器通信串口故障數(shù)據(jù)識別方法。由被動分簇算法確定云服務(wù)器通信串口的通信網(wǎng)的漏洞弧段,基于信息熵的量化方法,提取云服務(wù)器通信串口通信網(wǎng)漏洞弧段中節(jié)點流量數(shù)據(jù)的熵值特征,將其作為串口故障數(shù)據(jù)分類方法的分類目標(biāo),并以K?means聚類的方式判定云服務(wù)器通信串口流量數(shù)據(jù)的故障類型,實現(xiàn)被動分簇下云服務(wù)器通信串口故障數(shù)據(jù)識別。實驗結(jié)果表明,所提方法在多種網(wǎng)絡(luò)入侵行為下對云服務(wù)器通信串口故障數(shù)據(jù)識別時,都有較好的識別效果。
關(guān)鍵詞: 被動分簇; 云服務(wù)器; 通信串口; 故障數(shù)據(jù)識別; 分類識別; K?means聚類
中圖分類號: TN929.5?34; TP391" " " " " " " " "文獻標(biāo)識碼: A" " " " " " " " " " " 文章編號: 1004?373X(2025)04?0068?05
Cloud server communication serial port fault data identification under passive clustering
YU Yanpeng, HUI Xianghui
(College of Information and Management Sciences (College of Software), Henan Agricultural University, Zhengzhou 450000, China)
Abstract: Due to the large and complex data flow in the cloud server communication network, as well as the diversity and dynamic changes in network structure and configuration, traditional active detection or manual analysis methods are difficult to accurately identify vulnerability arcs, which limits the accuracy and efficiency of fault data identification. Therefore, a method of cloud server communication serial port fault data identification based on passive clustering is studied. The passive clustering algorithm is used to determine the vulnerability arc of the communication network of the cloud server communication serial port. Based on the quantification method of information entropy, the entropy characteristics of node traffic data in the vulnerability arc of the cloud server communication serial port communication network are extracted, which are used as the classification target of the serial port fault data classification method. K?means clustering is used to determine the type of fault in the cloud server communication serial port traffic data and realize the identification of cloud server communication serial port fault data under passive clustering. The experimental results show that the proposed method has good recognition performance for cloud server communication serial port fault data under various network intrusion behaviors.
Keywords: passive clustering; cloud server; communication serial port; fault data identification; classification identification; K?means clustering
0" 引" 言
在云服務(wù)器中,通信串口是連接服務(wù)器與其他設(shè)備(如傳感器、外部設(shè)備等)的關(guān)鍵通道[1?2]。然而,由于各種原因(如硬件老化、軟件錯誤、外部干擾等),通信串口可能會出現(xiàn)故障,導(dǎo)致數(shù)據(jù)傳輸錯誤、連接丟失等問題,從而影響云服務(wù)器的正常運行[3]。傳統(tǒng)的故障識別方法依賴于手動監(jiān)控和分析,不僅效率低下,而且容易遺漏故障信息。因此,研究通信串口故障數(shù)據(jù)識別方法具有重要的實際意義和應(yīng)用價值。
文獻[4]利用集成學(xué)習(xí)模型提升了通信網(wǎng)絡(luò)故障數(shù)據(jù)的預(yù)測準(zhǔn)確性和穩(wěn)定性,但模型參數(shù)調(diào)優(yōu)復(fù)雜,需要消耗大量實驗和計算資源。文獻[5]研究一種云服務(wù)器虛擬機通信串口數(shù)據(jù)安全監(jiān)控方法,能實時監(jiān)測并防范安全威脅,但仿真環(huán)境與實際環(huán)境的差異可能導(dǎo)致結(jié)果偏差,需謹(jǐn)慎對待仿真結(jié)果。文獻[6]提出一種基于淺分類器的網(wǎng)絡(luò)入侵?jǐn)?shù)據(jù)識別方法,在動態(tài)IP地址工況中表現(xiàn)良好,但深度神經(jīng)網(wǎng)絡(luò)的復(fù)雜性易導(dǎo)致過擬合,使淺分類器在未知故障數(shù)據(jù)識別中性能下降。文獻[7]設(shè)計一種基于生物啟發(fā)的混合深度學(xué)習(xí)網(wǎng)絡(luò)入侵檢測模型,結(jié)合深度學(xué)習(xí)和生物啟發(fā)技術(shù),能有效識別網(wǎng)絡(luò)流量異常;但自動編碼器在特征提取時易受無關(guān)特征和噪聲干擾,影響模型性能。
因此,本文提出一種基于被動分簇的云服務(wù)器通信串口故障數(shù)據(jù)識別方法。
1" 云服務(wù)器通信串口故障數(shù)據(jù)識別方法
1.1" 基于被動分簇的串口通信漏洞弧段檢測
傳統(tǒng)方法難以有效識別串口通信安全漏洞,而通過引入被動分簇方法可以更好地確定安全漏洞位置,并提取關(guān)鍵特征、實現(xiàn)漏洞檢測,有助于增強串口通信的安全防護。當(dāng)云服務(wù)器通信中出現(xiàn)異常節(jié)點時,使用被動分簇算法確定通信網(wǎng)漏洞弧段,縮小檢測范圍,可為故障數(shù)據(jù)識別提供重要支持。異常節(jié)點需依賴中間節(jié)點完成流量數(shù)據(jù)傳輸,如果云服務(wù)器通信串口通信網(wǎng)絡(luò)的簇中存在異常節(jié)點,便需要借助中間節(jié)點完成流量數(shù)據(jù)傳輸[8]。因此,云服務(wù)器通信串口通信網(wǎng)絡(luò)節(jié)點[y]出現(xiàn)安全漏洞的概率為:
[Py=ρRy] (1)
式中:[ρ]、[Ry]分別代表比率系數(shù)、節(jié)點[y]映射范圍中的簇首數(shù)目。本文中利用漏洞弧段檢測安全漏洞,由通信網(wǎng)絡(luò)節(jié)點判斷安全漏洞弧序列。正常情況下,串口通信網(wǎng)絡(luò)節(jié)點分布狀態(tài)存在隨機性,串口通信網(wǎng)絡(luò)節(jié)點的相對位置關(guān)系如圖1所示。
以圖1中節(jié)點1為例,引入虛擬移動法來分析每個節(jié)點之間相對位置的關(guān)聯(lián)性。將節(jié)點1按照圖2所示移動軌跡移動至位置1?1,位置1?1與節(jié)點2之間的線段和原始節(jié)點1與節(jié)點2之間線段的角度設(shè)成[ξ]。由此方法來控制節(jié)點1按照圖2所示移動軌跡移動至位置1?2,位置1?2與節(jié)點2之間的線段和原始節(jié)點1與節(jié)點2之間線段的角度設(shè)成v。根據(jù)節(jié)點1與節(jié)點2之間相對位置,設(shè)置串口通信網(wǎng)絡(luò)兩個節(jié)點的位置信息為[o1,ξ],[o1]代表串口通信網(wǎng)絡(luò)節(jié)點1與節(jié)點2的相對距離,[ξ]、[v]的關(guān)系是:
[ξ+v=π2] (2)
利用每個通信網(wǎng)絡(luò)節(jié)點的相對位置數(shù)據(jù),基于節(jié)點感知半徑[9][?]的協(xié)助分析,使用式(3)計算近鄰2個串口通信網(wǎng)絡(luò)節(jié)點的安全漏洞弧長:
[Z=2Pyarccoso2?] (3)
結(jié)合所得漏洞弧長數(shù)據(jù),便可判斷安全漏洞弧的方位角[ξ-Z2,ξ+Z2]。因串口通信網(wǎng)絡(luò)節(jié)點之間存在相交問題,各個節(jié)點的2段安全漏洞弧也存在相交性,因此,每個近鄰節(jié)點之間的距離將小于[?]的2倍。此時結(jié)合每個節(jié)點之間的距離狀態(tài),便可判斷漏洞弧段。
1.2" 云服務(wù)器通信串口流量數(shù)據(jù)特征量化方法
利用被動分簇算法成功確定了云服務(wù)器通信串口的通信網(wǎng)漏洞弧段,然而僅僅確定漏洞弧段的位置并不足以全面揭示其內(nèi)在的安全風(fēng)險。在串口通信網(wǎng)絡(luò)漏洞弧段中,各節(jié)點的正常流量和異常流量具有明顯的差異和分布特征[10?11],因此,采用基于信息熵的量化方法來提取節(jié)點流量數(shù)據(jù)的熵值特征。信息熵能夠客觀地描述數(shù)據(jù)的混亂程度和不確定性,從而準(zhǔn)確反映流量數(shù)據(jù)的復(fù)雜性和隨機性。
將串口通信網(wǎng)絡(luò)漏洞弧段中通信網(wǎng)絡(luò)節(jié)點的[M]個數(shù)據(jù)包以時間先后為基準(zhǔn),分成一個單位流量某特征屬性出現(xiàn)的次數(shù),設(shè)成[Y=Y1,Y2,…,YM]。按照單位流量,當(dāng)云服務(wù)器通信時,若出現(xiàn)運算異常流量數(shù)據(jù),則流經(jīng)通信串口的流量數(shù)據(jù)熵值為:
[KY=Zj=1MmjAlnmjA] (4)
式中:[Y=mj,j=1,2,…,M]代表云服務(wù)器通信串口流量數(shù)據(jù)中某特征屬性[j]出現(xiàn)[m]次;[A]代表某流量特征出現(xiàn)次數(shù)總值。將[A=j=1Mmj=j=1MY]代入式(4),便可提取單位流量數(shù)據(jù)熵值[12?13]。
1.3" 串口故障數(shù)據(jù)識別
在云服務(wù)器通信串口的安全防護中,盡管已通過被動分簇算法確定了通信網(wǎng)的漏洞弧段,并基于信息熵提取了節(jié)點流量數(shù)據(jù)的熵值特征,但這些特征數(shù)據(jù)仍需有效分類以精準(zhǔn)識別串口故障數(shù)據(jù)。因此,采用K?means聚類算法作為故障數(shù)據(jù)識別方法,該算法能無監(jiān)督地根據(jù)數(shù)據(jù)內(nèi)在特征自動劃分聚類,以此對提取的熵值特征進行聚類分析,以識別不同故障類型。將上文提取的漏洞弧段中串口通信網(wǎng)絡(luò)節(jié)點流量數(shù)據(jù)熵作為分類樣本,則分類樣本集合是:
[K=K′1,K′2,…,K′m] (5)
式中[m]代表樣本總數(shù)。聚類中心集合為[W=w1,w2,…,wm]。串口故障數(shù)據(jù)分類方法的分類步驟如下。
1) 將提取的漏洞弧段中節(jié)點流量數(shù)據(jù)熵值設(shè)置成完全圖的連接點,生成完全圖[FK=U,C,E],[U]、[C]、[E]分別代表完全圖的頂點、邊、邊的權(quán)重。引入Kruskal 算法設(shè)計完全圖的最小生成樹,由此樹檢索云服務(wù)器通信串口流量數(shù)據(jù)熵樣本的關(guān)鍵點。先篩選漏洞弧段中云服務(wù)器通信串口流量數(shù)據(jù)熵關(guān)鍵點的候選點,運算[FK]中全部邊的[E],檢索[E]最小值所在邊的樣本點,若串口通信流量數(shù)據(jù)熵樣本點[ki∈K]、[kj∈K]都屬于權(quán)重最小邊上的點,則把[ki]、[kj]歸為集合[Uk],把邊歸為集合[Ck]。[Uk]、[Ck]中存在所有的點和邊,[Ck]內(nèi)串口通信流量數(shù)據(jù)熵樣本點會結(jié)合邊權(quán)重數(shù)值從大至小排列。
分析[Ck],把權(quán)重最小的邊轉(zhuǎn)移至最小生成樹,如果轉(zhuǎn)移一條邊后最小生成樹生成回路,便可在邊集[Ck]、點集[Uk]中去除相應(yīng)的串口通信流量數(shù)據(jù)熵樣本點,最后生成最小生成樹[H=C1,C2,…,Ck]。使用最小生成樹逐層檢索距離最近的2個樣本點,2個點中心[L=dki,kj2],[dki,kj]代表樣本點之間的歐氏距離。通過[L]取代2個樣本點的邊,然后將其設(shè)成父節(jié)點,更新[Uk]、[Ck],[Uk]、[Ck]中數(shù)據(jù)均減少1。循環(huán)上述操作,當(dāng)最小生成樹僅存在[b]個連接點時,便可把最小生成樹剩下的連接點設(shè)成被動分簇的初始聚類中心。
2) 把最小生成樹算法獲取的樣本點設(shè)成初始聚類中心[W=w1,w2,…,wm],如果漏洞弧段中串口通信流量數(shù)據(jù)熵值樣本和聚類中心點的距離小于半徑[R],便將此串口通信數(shù)據(jù)樣本分類至此聚類中心;反之大于半徑[R],便把此串口通信數(shù)據(jù)熵值樣本和剩下聚類中心進行對比。
3) 計算漏洞弧段中各節(jié)點流量數(shù)據(jù)熵樣本點的類內(nèi)距離[?]、類間距離[φ],并提取距離比值[Q]。
[?=i=1vidwi,kivi] (6)
[φ=i=1m1m-1vidwi,ki] (7)
式中:[vi]代表漏洞弧段中,某類串口通信節(jié)點流量數(shù)據(jù)熵樣本的數(shù)量;[dwi,ki]代表串口通信節(jié)點流量數(shù)據(jù)熵樣本與聚類中心的歐氏距離。
[Q=?φ] (8)
如果[Q]大于閾值,便需要重新聚類。
漏洞弧段中,節(jié)點流量數(shù)據(jù)熵樣本聚類時,會出現(xiàn)邊緣值,樣本點處于交界處,此類樣本會出現(xiàn)難以識別的問題。為此,引入余弦相似度,用于識別此類串口通信節(jié)點流量數(shù)據(jù)熵樣本。余弦相似度計算公式為:
[cosk,k=j=1mkjkjj=1mk2j·j=1mk2j] (9)
式中:[k]、[k]分別代表交界類內(nèi)通信節(jié)點流量數(shù)據(jù)熵樣本、交界處通信節(jié)點流量數(shù)據(jù)熵樣本。[k]將被劃分至余弦相似度數(shù)值最高的類內(nèi)。
2" 實驗分析
為了驗證被動分簇下云服務(wù)器通信串口故障數(shù)據(jù)識別方法的識別性能,以基于云服務(wù)器的智能家居監(jiān)測系統(tǒng)作為測試系統(tǒng),主要使用所提方法作為測試系統(tǒng)的故障數(shù)據(jù)檢測技術(shù)。此測試系統(tǒng)主要使用RS 485串口為通信總線,總線的主設(shè)備是ARM開發(fā)板,且引入輪詢的模式實現(xiàn)每個接入模塊的傳感器狀態(tài)數(shù)據(jù)通信。傳感器接入模塊屬于RS 485串口的接入設(shè)備。接入檢測電路接入單片機的引腳,其功能是實現(xiàn)傳感器接入和移除管理。信號調(diào)理電路的功能是將傳感器發(fā)送信號和后端電路分離,并轉(zhuǎn)換成標(biāo)準(zhǔn)輸入信號。此系統(tǒng)主要使用RS 485串口來實現(xiàn)傳感器數(shù)據(jù)和云端服務(wù)器的遠程通信。本文方法所識別的RS 485串口具體參數(shù)如表1所示。
為了設(shè)計故障數(shù)據(jù),在基于云服務(wù)器的智能家居監(jiān)測系統(tǒng)運行時,對通信網(wǎng)絡(luò)引入ARP欺騙式入侵行為,入侵目的是改變傳感器傳輸與云服務(wù)器數(shù)據(jù)包中的輪詢地址(監(jiān)測位置),從而影響系統(tǒng)對家居環(huán)境的監(jiān)測數(shù)據(jù)。設(shè)置2個傳感器的線程輪詢信息,如表2表示。將濕度傳感器線程1中輪詢地址的02刪除,加入入侵輪詢篡改數(shù)據(jù);將溫度傳感器線程2中輪詢地址的03刪除,加入入侵輪詢篡改數(shù)據(jù),以此構(gòu)建串口故障數(shù)據(jù)。串口故障數(shù)據(jù)詳情如表3所示。
ARP欺騙式入侵行為的入侵示意圖如圖3所示。
設(shè)置串口通信時,在輪詢周期為200 ms時基于正常數(shù)據(jù),會出現(xiàn)500組故障數(shù)據(jù),并持續(xù)到500 ms輪詢周期。所提方法對云服務(wù)器通信串口故障數(shù)據(jù)的識別結(jié)果如圖4所示。
由圖4可知,云服務(wù)器通信串口故障數(shù)據(jù)的識別結(jié)果與前提條件設(shè)定的正常數(shù)據(jù)、故障數(shù)據(jù)信息一致,說明所提方法在云服務(wù)器通信串口故障數(shù)據(jù)識別中可用。
上述實驗僅對ARP欺騙式入侵行為下的通信串口故障數(shù)據(jù)識別性能進行測試,為深入測試所提方法對通信串口故障數(shù)據(jù)的識別能力,設(shè)置入侵行為:跨站攻擊、DDoS攻擊、CC攻擊。不同攻擊行為下通信串口數(shù)據(jù)詳情如表4所示。
基于表4所示數(shù)據(jù),測試所提方法對云服務(wù)器通信故障數(shù)據(jù)識別后,識別結(jié)果和對應(yīng)故障類型的關(guān)聯(lián)度,數(shù)值較高,表示故障數(shù)據(jù)識別結(jié)果和對應(yīng)故障類型數(shù)據(jù)的匹配度較顯著,識別結(jié)果的可信度較顯著;反之,若關(guān)聯(lián)度數(shù)值較低,表示故障數(shù)據(jù)識別結(jié)果和對應(yīng)故障類型數(shù)據(jù)的匹配度較差。所提方法對表4中三種攻擊行為下通信串口數(shù)據(jù)中故障數(shù)據(jù)識別后,識別結(jié)果的關(guān)聯(lián)度測試結(jié)果如圖5所示。
根據(jù)圖5實驗數(shù)據(jù)顯示,不同攻擊行為下通信串口數(shù)據(jù)中,故障數(shù)據(jù)識別結(jié)果關(guān)聯(lián)度均大于0.96,說明故障數(shù)據(jù)識別結(jié)果和對應(yīng)故障類型數(shù)據(jù)的匹配度符合理想狀態(tài),所提方法的適用性較好。
3" 結(jié)" 論
為了有效識別出串口通信故障數(shù)據(jù),本文提出一種基于被動分簇的云服務(wù)器通信串口故障數(shù)據(jù)識別方法。該方法結(jié)合了被動分簇技術(shù),在識別串口通信網(wǎng)絡(luò)漏洞弧段后,通過對云服務(wù)器通信串口數(shù)據(jù)進行聚類分析,將具有相似特征的數(shù)據(jù)歸為一類,從而識別異?;蚬收蠑?shù)據(jù)類型。經(jīng)實驗數(shù)據(jù)顯示,所提方法通過被動分簇技術(shù)可以識別出串口故障數(shù)據(jù)。
參考文獻
[1] 程順達.基于安全性驗證的云數(shù)據(jù)存儲與訪問算法[J].沈陽工業(yè)大學(xué)學(xué)報,2023,45(5):565?570.
[2] 魏立斐,王勤,張蕾,等.半可信云服務(wù)器輔助的高效隱私交集計算協(xié)議[J].軟件學(xué)報,2023,34(2):932?944.
[3] 孟海寧,童新宇,石月開,等.基于ARIMA?RNN組合模型的云服務(wù)器老化預(yù)測方法[J].通信學(xué)報,2021,42(1):163?171.
[4] 朱圳,劉立芳,齊小剛.基于數(shù)據(jù)挖掘的通信網(wǎng)絡(luò)故障分類研究[J].智能系統(tǒng)學(xué)報,2022,17(6):1228?1234.
[5] 劉芳,曹進克.云服務(wù)器虛擬機通信串口數(shù)據(jù)安全性監(jiān)控仿真[J].計算機仿真,2023,40(8):174?177.
[6] JMILA H, IBN K M. Adversarial machine learning for network intrusion detection: a comparative study [J]. Computer networks, 2022, 214: 1?14.
[7] MOIZUDDIN M D, JOSE M V. A bio?inspired hybrid deep learning model for network intrusion detection [J]. Knowledge?based systems, 2022, 238: 107894.1?107894.20.
[8] 賈珺,馮春燕,夏海輪,等.基于樣本均衡與特征交互的通信網(wǎng)絡(luò)故障預(yù)測方法[J].北京郵電大學(xué)學(xué)報,2021,44(6):59?66.
[9] 鄭臣明,姚宣霞,周芳,等.基于硬件虛擬化的云服務(wù)器設(shè)計與實現(xiàn)[J].工程科學(xué)學(xué)報,2022,44(11):1935?1945.
[10] 周由勝,陳律君.基于區(qū)塊鏈的細粒度云數(shù)據(jù)安全存儲與刪除方案[J].電子與信息學(xué)報,2021,43(7):1856?1863.
[11] 王曉湘,劉洞天,劉南江,等.基于LSTM的震后通信數(shù)據(jù)異常檢測分析[J].中國地震,2022,38(2):270?279.
[12] 盛忠明.地鐵列車FIP網(wǎng)絡(luò)通信故障起因判別及解決方法[J].城市軌道交通研究,2021,24(z1):132?136.
[13] 王杰,周正江,朱小青,等.海上風(fēng)電機組與Scada系統(tǒng)間通信故障分析[J].船舶工程,2022,44(z2):84?86.
[14] 譚艷嫻,程允麗,雷耀花.基于邊緣計算的人臉身份認證系統(tǒng)中的隱私保護技術(shù)研究[J].電子設(shè)計工程,2024,32(16):183?186.
作者簡介:于艷朋(1987—),男,河南安陽人,碩士研究生,講師,研究方向為計算機應(yīng)用、計算機教育教學(xué)、計算機理論方向、軟件工程、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)。
惠向暉(1980—),男,河南西華人,碩士研究生,副教授,研究方向為云計算、計算機應(yīng)用、智能機器人。