王爽,陸月明
?
基于旋轉(zhuǎn)門(mén)算法的安全網(wǎng)關(guān)控制信息采集策略
王爽1,2,陸月明1,2
(1. 北京郵電大學(xué)網(wǎng)絡(luò)空間安全學(xué)院,北京 1000876; 2. 可信分布式計(jì)算與服務(wù)教育部重點(diǎn)實(shí)驗(yàn)室,北京 100876)
安全網(wǎng)關(guān)控制信息采集是天地一體化網(wǎng)絡(luò)中的一種重要安全感知技術(shù),傳統(tǒng)的等時(shí)間間隔采集策略存在網(wǎng)絡(luò)帶寬浪費(fèi)、數(shù)據(jù)大量冗余、采集節(jié)點(diǎn)數(shù)據(jù)采集量過(guò)大、傳輸次數(shù)過(guò)多等問(wèn)題,針對(duì)這些問(wèn)題,提出了一種基于旋轉(zhuǎn)門(mén)算法的安全網(wǎng)關(guān)控制信息采集策略,該策略通過(guò)改進(jìn)的旋轉(zhuǎn)門(mén)算法分析判斷安全網(wǎng)關(guān)控制信息(如網(wǎng)關(guān)流量、CPU利用率等)的變化幅度,自適應(yīng)調(diào)整安全網(wǎng)關(guān)控制信息采集間隔。實(shí)驗(yàn)結(jié)果表明,該策略與傳統(tǒng)等時(shí)間間隔采集策略相比,能在保證數(shù)據(jù)準(zhǔn)確率的情況下,減少數(shù)據(jù)采集次數(shù)和數(shù)據(jù)傳輸次數(shù),有效降低網(wǎng)絡(luò)開(kāi)銷(xiāo),提高數(shù)據(jù)采集效率。
數(shù)據(jù)采集;旋轉(zhuǎn)門(mén)算法;網(wǎng)關(guān)監(jiān)測(cè);自適應(yīng)變頻
隨著地面互聯(lián)網(wǎng)、移動(dòng)通信網(wǎng)絡(luò)和空間網(wǎng)絡(luò)的融合[1],天地一體化網(wǎng)絡(luò)架構(gòu)逐漸形成。在此網(wǎng)絡(luò)架構(gòu)下,移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等技術(shù)迅速發(fā)展,帶來(lái)了技術(shù)和經(jīng)濟(jì)發(fā)展,同時(shí)也產(chǎn)生了更加復(fù)雜的網(wǎng)絡(luò)安全問(wèn)題。針對(duì)網(wǎng)絡(luò)安全問(wèn)題,天地一體化網(wǎng)絡(luò)中安全網(wǎng)關(guān)聯(lián)動(dòng)防護(hù)控制需要感知攻擊來(lái)源,并且需要實(shí)現(xiàn)網(wǎng)關(guān)負(fù)載均衡分布,因此產(chǎn)生對(duì)通信資源、網(wǎng)關(guān)負(fù)載、威脅等進(jìn)行量化感知的需求,而傳統(tǒng)等時(shí)間間隔感知時(shí)間間隔難以設(shè)置標(biāo)準(zhǔn),時(shí)間間隔設(shè)置過(guò)長(zhǎng),容易丟失重要數(shù)據(jù),降低數(shù)據(jù)準(zhǔn)確率;時(shí)間間隔設(shè)置過(guò)短,造成網(wǎng)絡(luò)帶寬浪費(fèi)、數(shù)據(jù)大量冗余、采集量過(guò)大等問(wèn)題[2]。因此,在實(shí)際應(yīng)用中采用等時(shí)間間隔采集策略,雖然實(shí)現(xiàn)簡(jiǎn)單,但由于數(shù)據(jù)動(dòng)態(tài)變化的特性,單位時(shí)間內(nèi)的平均數(shù)據(jù)獲取信息量較少。因此,如何設(shè)計(jì)出既保證數(shù)據(jù)準(zhǔn)確率,又可以降低網(wǎng)絡(luò)消耗的高效數(shù)據(jù)采集策略是當(dāng)前網(wǎng)關(guān)信息感知亟待解決的重要問(wèn)題。針對(duì)采集策略問(wèn)題,自適應(yīng)變頻采集技術(shù)受到廣泛關(guān)注,自適應(yīng)指的是針對(duì)采集數(shù)據(jù)的動(dòng)態(tài)變化特性,動(dòng)態(tài)調(diào)整采集時(shí)間間隔,因而自適應(yīng)變頻采集的核心問(wèn)題是如何判斷采集數(shù)據(jù)的變化幅度。
針對(duì)判斷采集數(shù)據(jù)變化幅度的問(wèn)題,國(guó)內(nèi)外做了大量基于線性回歸模型的相關(guān)研究改進(jìn)。宋欣等[3]提出了一種基于分段線性回歸的無(wú)線傳感器網(wǎng)絡(luò)分布式數(shù)據(jù)采集壓縮優(yōu)化策略,通過(guò)應(yīng)用線性回歸分析方法構(gòu)建感知數(shù)據(jù)模型,并且節(jié)點(diǎn)只傳輸回歸模型的參數(shù)信息,傳輸網(wǎng)絡(luò)消耗較小,但當(dāng)采集時(shí)間間隔較大時(shí),該方法的誤差絕對(duì)值也較大,無(wú)法保證數(shù)據(jù)準(zhǔn)確性;王玲等[4]提出了一種基于時(shí)間相關(guān)性的網(wǎng)絡(luò)數(shù)據(jù)壓縮與優(yōu)化算法,該算法的線性回歸策略能夠?qū)崟r(shí)判斷數(shù)據(jù)變化幅度,動(dòng)態(tài)調(diào)整采集時(shí)間間隔,并實(shí)時(shí)修正回歸模型。Padhy等[5]在收集與冰川相關(guān)的環(huán)境數(shù)據(jù)時(shí),提出了基于有限窗口線性回歸模型預(yù)測(cè)未來(lái)數(shù)據(jù),通過(guò)判斷預(yù)測(cè)數(shù)據(jù)范圍動(dòng)態(tài)調(diào)整采集時(shí)間間隔。Gupta等[6]提出了一種基于指數(shù)雙平滑新的自適應(yīng)采樣技術(shù),采用不規(guī)則數(shù)據(jù)序列預(yù)測(cè),結(jié)合變化檢測(cè)來(lái)降低采樣率,以保持?jǐn)?shù)據(jù)保真度,可以在資源受限的傳感器節(jié)點(diǎn)上容易地實(shí)現(xiàn)預(yù)測(cè)。但后3種改進(jìn)算法模型比較復(fù)雜,應(yīng)用在網(wǎng)關(guān)采集數(shù)據(jù)時(shí)實(shí)現(xiàn)較為困難。
針對(duì)線性回歸模型算法實(shí)現(xiàn)較為復(fù)雜,在安全網(wǎng)關(guān)控制信息采集中應(yīng)用可行性不高的問(wèn)題,考慮使用旋轉(zhuǎn)門(mén)算法進(jìn)行數(shù)據(jù)變化趨勢(shì)的判斷。Bristol[7]提出了旋轉(zhuǎn)門(mén)算法(SDT, swing door trending algorithm),該算法實(shí)現(xiàn)了存儲(chǔ)壓縮數(shù)據(jù),并且提供搜索還原歷史數(shù)據(jù),可以有效地存儲(chǔ)和分析實(shí)際的過(guò)程歷史數(shù)據(jù)作為趨勢(shì)記錄,并用于評(píng)估工作。Feng等[8]提出了根據(jù)強(qiáng)制存儲(chǔ)限制(FSRL, forced storage-recording limit)和壓縮區(qū)間長(zhǎng)度(CIL, compression interval length)動(dòng)態(tài)調(diào)整旋轉(zhuǎn)門(mén)算法的壓縮閾值,該改進(jìn)算法的問(wèn)題在于當(dāng)FSRL取值較大時(shí)算法不能正常工作,而在實(shí)際應(yīng)用中FSRL往往很大。Gang等[9]對(duì)旋轉(zhuǎn)門(mén)壓縮算法和Douglas-Peucker算法進(jìn)行了比較總結(jié),提出了一種優(yōu)化的采用“搜索最遠(yuǎn)可行點(diǎn)”策略的實(shí)時(shí)數(shù)據(jù)有損壓縮算法及其在一定約束條件下的一種變形算法,該算法在壓縮率、整體誤差和效率方面有一定提高。Liu等[10]針對(duì)數(shù)控機(jī)床數(shù)據(jù)實(shí)時(shí)采集需求和消耗大量存儲(chǔ)單元的問(wèn)題,提出了一種改進(jìn)的旋轉(zhuǎn)門(mén)壓縮算法來(lái)壓縮海量數(shù)據(jù)??筛鶕?jù)數(shù)據(jù)的波動(dòng)趨勢(shì)動(dòng)態(tài)調(diào)整其容差。但后2種算法在安全網(wǎng)關(guān)的控制信息采集中對(duì)數(shù)據(jù)實(shí)時(shí)性有一定影響。
上述工作對(duì)網(wǎng)關(guān)數(shù)據(jù)自適應(yīng)變頻采集策略的研究起了一定的推動(dòng)作用,但在網(wǎng)關(guān)數(shù)據(jù)采集效率、成本,數(shù)據(jù)準(zhǔn)確性,歷史數(shù)據(jù)查詢是否容易,方案實(shí)施難易程度等方面存在部分局限和問(wèn)題。而旋轉(zhuǎn)門(mén)算法應(yīng)用在網(wǎng)關(guān)數(shù)據(jù)采集時(shí)實(shí)現(xiàn)相對(duì)容易,能在保證數(shù)據(jù)準(zhǔn)確率的情況下,降低數(shù)據(jù)采集和傳輸次數(shù),有效降低網(wǎng)絡(luò)開(kāi)銷(xiāo),提高數(shù)據(jù)采集效率,通過(guò)線性插值還原查詢歷史數(shù)據(jù)也很容易。
本文提出的基于改進(jìn)旋轉(zhuǎn)門(mén)算法的安全網(wǎng)關(guān)控制信息采集策略,針對(duì)旋轉(zhuǎn)門(mén)算法應(yīng)用在安全網(wǎng)關(guān)控制信息采集中存在的問(wèn)題,對(duì)算法提出了改進(jìn),并通過(guò)實(shí)驗(yàn)進(jìn)行了可行性及性能驗(yàn)證。
天地一體網(wǎng)絡(luò)有天基骨干網(wǎng)絡(luò)、地基骨干網(wǎng)絡(luò)、衛(wèi)星接入網(wǎng)絡(luò)等,覆蓋全球,互聯(lián)地面互聯(lián)網(wǎng)絡(luò)和移動(dòng)通信網(wǎng)絡(luò),設(shè)置了多個(gè)可以進(jìn)行接入控制、網(wǎng)絡(luò)隔離控制、網(wǎng)間互聯(lián)控制的關(guān)口站。然而,關(guān)口站單點(diǎn)極易成為網(wǎng)絡(luò)攻擊的對(duì)象,并且難以防范分布式DDoS攻擊、跨域攻擊擴(kuò)散等。所以需要聯(lián)合多個(gè)安全控制網(wǎng)關(guān),進(jìn)行聯(lián)動(dòng)防護(hù),提高防護(hù)能力,減少網(wǎng)絡(luò)受攻擊的范圍。通過(guò)在終端、服務(wù)器中內(nèi)嵌感知組件,在安全網(wǎng)關(guān)中內(nèi)嵌感知器獲取采集數(shù)據(jù),實(shí)現(xiàn)管理系統(tǒng)的全網(wǎng)威脅態(tài)勢(shì)感知、攻擊檢測(cè),最終能夠及時(shí)下發(fā)策略至安全網(wǎng)關(guān),及早阻斷攻擊,避免攻擊擴(kuò)散,因此安全網(wǎng)關(guān)威脅感知尤為重要??紤]網(wǎng)關(guān)數(shù)據(jù)采集效率、準(zhǔn)確性、方案可行性,本文提出采用基于改進(jìn)旋轉(zhuǎn)門(mén)算法的安全網(wǎng)關(guān)控制信息采集策略。在關(guān)口站等處設(shè)立中間代理服務(wù)器,負(fù)責(zé)采集關(guān)口站安全網(wǎng)關(guān)控制信息并上報(bào)至管理系統(tǒng)匯集,以及接收管理系統(tǒng)的下發(fā)策略并分發(fā)至各個(gè)網(wǎng)關(guān)。
圖1 系統(tǒng)流程
基于改進(jìn)旋轉(zhuǎn)門(mén)算法的安全網(wǎng)關(guān)控制信息采集系統(tǒng)流程如圖1所示,主要流程包括安全網(wǎng)關(guān)向中間代理傳輸發(fā)布安全控制信息、系統(tǒng)向中間代理傳輸訂閱消息,其中包含3個(gè)組成參與者。
1) 安全網(wǎng)關(guān),作為整個(gè)感知采集系統(tǒng)中的信息發(fā)布者,其上部署著網(wǎng)關(guān)的感知采集程序負(fù)責(zé)采集通信狀態(tài)、設(shè)備性能等安全控制信息,其中,某些海量性能數(shù)據(jù)利用基于改進(jìn)旋轉(zhuǎn)門(mén)算法的自適應(yīng)變頻采集策略進(jìn)行動(dòng)態(tài)自適應(yīng)采集,并且進(jìn)行數(shù)據(jù)消冗壓縮,安全網(wǎng)關(guān)可以通過(guò)連接中間代理服務(wù)器發(fā)布消息。
2) 中間代理,代理服務(wù)器作為網(wǎng)關(guān)與匯集模塊之間傳遞消息數(shù)據(jù)的核心,可以實(shí)現(xiàn)處理大量網(wǎng)關(guān)客戶端的并發(fā)連接。代理服務(wù)器主要負(fù)責(zé)接收網(wǎng)關(guān)的消息并進(jìn)行網(wǎng)絡(luò)中數(shù)據(jù)分集,將分集后消息發(fā)送給訂閱的系統(tǒng)。
3) 互聯(lián)安全控制系統(tǒng)/聯(lián)動(dòng)防護(hù)控制系統(tǒng)匯集模塊、最終所有數(shù)據(jù)傳遞的終點(diǎn),作為整個(gè)感知采集系統(tǒng)中的信息訂閱者,實(shí)現(xiàn)最終數(shù)據(jù)的匯集處理,并將在傳輸過(guò)程中壓縮的數(shù)據(jù)進(jìn)行數(shù)據(jù)重建處理。
自適應(yīng)變頻采集策略主要根據(jù)采集數(shù)據(jù)變化幅度動(dòng)態(tài)調(diào)整采集時(shí)間間隔,當(dāng)數(shù)據(jù)變化平緩時(shí)增大采集時(shí)間間隔,節(jié)省資源消耗;當(dāng)數(shù)據(jù)變化劇烈時(shí)減小采集時(shí)間間隔,保證采集數(shù)據(jù)準(zhǔn)確無(wú)丟失。利用旋轉(zhuǎn)門(mén)算法進(jìn)行數(shù)據(jù)壓縮時(shí)發(fā)現(xiàn),當(dāng)能被套住的數(shù)據(jù)越多,即壓縮數(shù)據(jù)段越長(zhǎng),數(shù)據(jù)的變化越平緩;而當(dāng)數(shù)據(jù)不能被套住,即壓縮數(shù)據(jù)段越短,數(shù)據(jù)變化越劇烈。因此可以利用旋轉(zhuǎn)門(mén)算法判斷數(shù)據(jù)變化幅度,利用判斷結(jié)果采用乘法減小加法增大的方法動(dòng)態(tài)調(diào)整采集時(shí)間間隔,保證數(shù)據(jù)變化劇烈時(shí)能快速縮小采集間隔,避免丟失重要數(shù)據(jù),并將網(wǎng)關(guān)處采集的安全控制信息數(shù)據(jù)消冗壓縮后傳輸,最終在系統(tǒng)處進(jìn)行壓縮數(shù)據(jù)恢復(fù)重建。
旋轉(zhuǎn)門(mén)算法[8]是一種比較快速的線性擬合算法,算法原理如圖2所示,該算法根據(jù)數(shù)據(jù)點(diǎn)構(gòu)建多個(gè)高度固定為壓縮閾值兩倍的平行四邊形去套歷史數(shù)據(jù)點(diǎn),在不能套住時(shí)將前一個(gè)數(shù)據(jù)點(diǎn)存儲(chǔ)。圖2中以點(diǎn)各自上下距離為的4個(gè)點(diǎn)構(gòu)建平行四邊形,歷史數(shù)據(jù)點(diǎn)在此平行四邊形中,繼續(xù)壓縮;同理構(gòu)成兩處的平行四邊形,歷史數(shù)據(jù)點(diǎn)在此平行四邊形中,繼續(xù)壓縮;同樣處理點(diǎn);而在點(diǎn)處構(gòu)建的平行四邊形并不能套住點(diǎn),因此存儲(chǔ)點(diǎn)構(gòu)成一段壓縮段,連接,顯然與上對(duì)應(yīng)點(diǎn)的誤差控制在之內(nèi),因此點(diǎn)能由線性插值得到誤差小于的解壓值。
算法實(shí)質(zhì)是將一系列連續(xù)數(shù)據(jù)點(diǎn)代替為一條由起點(diǎn)和終點(diǎn)確定的直線,從而實(shí)現(xiàn)將海量數(shù)據(jù)壓縮為直線趨勢(shì)的壓縮段,并能保證數(shù)據(jù)還原的誤差在壓縮閾值之內(nèi)。該算法最后得到的每段壓縮段需要記錄每段時(shí)間間隔長(zhǎng)度、起點(diǎn)數(shù)據(jù)和終點(diǎn)數(shù)據(jù),并且前一段的終點(diǎn)數(shù)據(jù)為下一段的起點(diǎn)數(shù)據(jù)。旋轉(zhuǎn)門(mén)即為不斷擴(kuò)張的平行四邊形,平行四邊形的高度定為壓縮閾值的2倍,在每次擴(kuò)張時(shí)檢查平行四邊形是否能把所有數(shù)據(jù)點(diǎn)套在其內(nèi)部,若能把所有數(shù)據(jù)點(diǎn)套住則說(shuō)明目前數(shù)據(jù)變化平穩(wěn),若有數(shù)據(jù)點(diǎn)未被套住,則說(shuō)明數(shù)據(jù)變化劇烈需要進(jìn)行壓縮存儲(chǔ)操作。
具體算法實(shí)現(xiàn)時(shí),只需要比較不斷擴(kuò)張的兩扇門(mén)的斜率即可判斷數(shù)據(jù)是否被套住,若上面的旋轉(zhuǎn)門(mén)斜率小于下面旋轉(zhuǎn)門(mén)斜率則表示數(shù)據(jù)能被套住,否則不能套住。
圖2 旋轉(zhuǎn)門(mén)算法原理
定義上旋轉(zhuǎn)門(mén)斜率為
定義下旋轉(zhuǎn)門(mén)斜率為
其中,[][]為壓縮段的開(kāi)始和結(jié)束數(shù)據(jù)點(diǎn),包括時(shí)間和數(shù)據(jù)值這2個(gè)屬性。
若>,壓縮存儲(chǔ)此數(shù)據(jù)點(diǎn)并發(fā)布數(shù)據(jù)點(diǎn)到中間代理服務(wù)器,增大采集時(shí)間間隔并開(kāi)始新的采集壓縮;否則減小采集時(shí)間間隔。
旋轉(zhuǎn)門(mén)算法在安全網(wǎng)關(guān)控制信息采集中存在一些問(wèn)題:1) 如何確定一個(gè)合適的壓縮閾值;2) 采集失誤或者網(wǎng)關(guān)異常產(chǎn)生異常數(shù)據(jù)點(diǎn)的影響,采集值過(guò)大或者過(guò)小的數(shù)據(jù)點(diǎn)會(huì)影響算法的整個(gè)壓縮解壓過(guò)程,造成數(shù)據(jù)變化趨勢(shì)判斷失誤,并且增加了壓縮段,增多了數(shù)據(jù)傳輸次數(shù),影響后續(xù)數(shù)據(jù)重建,增大數(shù)據(jù)還原的誤差值。
針對(duì)上述2個(gè)問(wèn)題,本文提出了旋轉(zhuǎn)門(mén)算法的2個(gè)改進(jìn)。
針對(duì)問(wèn)題1)的改進(jìn)為:定義壓縮閾值
針對(duì)問(wèn)題2)的改進(jìn)為:定義變化值
以下是本文提出的基于改進(jìn)旋轉(zhuǎn)門(mén)算法的安全網(wǎng)關(guān)控制信息采集間隔動(dòng)態(tài)調(diào)整算法。
定義3 當(dāng)采集數(shù)據(jù)在被套住的范圍內(nèi)時(shí)判斷數(shù)據(jù)變化平緩,加法增大采集時(shí)間間隔。
定義4 當(dāng)采集數(shù)據(jù)在超出旋轉(zhuǎn)門(mén)套住的范圍時(shí)判斷數(shù)據(jù)變化劇烈,乘法減小采集時(shí)間間隔。
這樣加法增大、乘法減小動(dòng)態(tài)調(diào)整數(shù)據(jù)采集間隔,既能夠迅速減小采集時(shí)間間隔并且避免在數(shù)據(jù)變化劇烈時(shí)丟失重要數(shù)據(jù),也能夠在數(shù)據(jù)變化平緩時(shí)有效增大采集間隔,減小網(wǎng)絡(luò)帶寬浪費(fèi),同時(shí)避免異常點(diǎn)對(duì)算法的影響。
數(shù)據(jù)重建即將壓縮數(shù)據(jù)傳輸?shù)较到y(tǒng)后,系統(tǒng)進(jìn)行數(shù)據(jù)處理還原成原始數(shù)據(jù),即解壓數(shù)據(jù)。SDT壓縮算法為線性壓縮,重建算法對(duì)應(yīng)線性壓縮,即線性插值,保證了數(shù)據(jù)還原重建誤差絕對(duì)值不超過(guò)壓縮閾值。
1) 定義1,2,3,…,S為壓縮存儲(chǔ)數(shù)據(jù),其中每個(gè)壓縮數(shù)據(jù)有時(shí)間和數(shù)據(jù)值這2個(gè)屬性。
2) 定義[]為[],[1]壓縮段的還原數(shù)據(jù),那么[],[1]壓縮段斜率為
則
為了清楚地描述本文的自適應(yīng)變頻采集算法,需要做出以下定義,如表1所示。
表1 符號(hào)定義
算法流程如下(如圖3所示)。1) 進(jìn)行相關(guān)參數(shù)的初始化;2) 采集數(shù)據(jù)D,計(jì)算此時(shí)的上下旋轉(zhuǎn)門(mén)斜率及變化值;3) 判斷是否是異常點(diǎn),若是則直接壓縮存儲(chǔ)D,間隔不變繼續(xù)采集數(shù)據(jù);4) 判斷上下旋轉(zhuǎn)門(mén)斜率大小,得出數(shù)據(jù)變化幅度,然后動(dòng)態(tài)調(diào)整采集時(shí)間間隔。在實(shí)際應(yīng)用中,網(wǎng)關(guān)采集的數(shù)據(jù)只需壓縮段的起始點(diǎn)和終點(diǎn),在系統(tǒng)處可以根據(jù)壓縮段還原出原始數(shù)據(jù),這樣減小了傳輸開(kāi)銷(xiāo),降低了網(wǎng)絡(luò)流量。
圖3 算法流程
本文提出的基于改進(jìn)旋轉(zhuǎn)門(mén)算法的安全網(wǎng)關(guān)控制信息采集策略主要針對(duì)安全網(wǎng)關(guān)控制信息數(shù)據(jù)采集時(shí)間間隔的動(dòng)態(tài)控制和數(shù)據(jù)的還原處理,網(wǎng)絡(luò)拓?fù)鋵?duì)策略的影響不大,所以可以先對(duì)一臺(tái)網(wǎng)關(guān)利用本文提出的采集策略進(jìn)行實(shí)驗(yàn)仿真,簡(jiǎn)單清楚地分析本策略的性能。圖4仿真實(shí)驗(yàn)數(shù)據(jù)來(lái)自實(shí)驗(yàn)室單臺(tái)網(wǎng)關(guān)的利用本文提出的基于改進(jìn)旋轉(zhuǎn)門(mén)算法的安全網(wǎng)關(guān)控制信息采集策略(圖中sdt采集)和傳統(tǒng)的等時(shí)間間隔采集(圖中原始采集)得到的某24 h CPU利用率,基于改進(jìn)旋轉(zhuǎn)門(mén)算法的安全網(wǎng)關(guān)控制信息采集策略相關(guān)參數(shù)設(shè)置如表2所示,而等時(shí)間間隔每60 s采集一次。
表2 實(shí)驗(yàn)參數(shù)設(shè)置
采集的實(shí)驗(yàn)結(jié)果如圖4所示。當(dāng)數(shù)據(jù)變化平緩時(shí)采集數(shù)據(jù)點(diǎn)和存儲(chǔ)點(diǎn)較稀疏,從而節(jié)省資源消耗;當(dāng)數(shù)據(jù)變化劇烈時(shí)采集數(shù)據(jù)點(diǎn)和存儲(chǔ)點(diǎn)較密集,保證了采集數(shù)據(jù)準(zhǔn)確無(wú)丟失。
本文提出了對(duì)旋轉(zhuǎn)門(mén)算法的改進(jìn),改進(jìn)了對(duì)異常大小數(shù)據(jù)點(diǎn)的處理和確定壓縮閾值的大小,可以看到在本文的應(yīng)用場(chǎng)景中,在采集數(shù)據(jù)量相同的情況下,改進(jìn)后可以減少數(shù)據(jù)的采集次數(shù)和傳輸次數(shù),如表3所示。
表3 改進(jìn)前后性能對(duì)比
等時(shí)間間隔采集數(shù)據(jù)100個(gè)時(shí),需要的采集次數(shù)與傳輸次數(shù)均為100次。由表3可知,在采集數(shù)據(jù)量相同的情況下,改進(jìn)前的數(shù)據(jù)采集次數(shù)為65次,減少35%,數(shù)據(jù)傳輸次數(shù)為38次,減少了62%;改進(jìn)后的數(shù)據(jù)采集次數(shù)為50次,減少了50%,數(shù)據(jù)傳輸次數(shù)為30次,減少了70%。
由實(shí)驗(yàn)結(jié)果可知,改進(jìn)后的采集傳輸效率有一定程度提高,對(duì)于異常大小數(shù)據(jù)點(diǎn)的處理確實(shí)能夠避免它對(duì)算法的影響。
圖4 采集實(shí)驗(yàn)結(jié)果
4.2.1 實(shí)驗(yàn)環(huán)境及參數(shù)設(shè)置
通過(guò)搭建真實(shí)實(shí)驗(yàn)環(huán)境測(cè)試本文提出的基于改進(jìn)旋轉(zhuǎn)門(mén)算法的安全網(wǎng)關(guān)控制信息采集策略的可行性和性能。在3臺(tái)網(wǎng)關(guān)上部署動(dòng)態(tài)自適應(yīng)采集感知程序,并發(fā)布數(shù)據(jù)到中間代理服務(wù)器,中間代理服務(wù)器將數(shù)據(jù)推送給訂閱的匯集系統(tǒng)。3個(gè)網(wǎng)關(guān)以及代理服務(wù)器、系統(tǒng)匯集模塊的連接關(guān)系如圖5所示。
其中,網(wǎng)關(guān)1采用傳統(tǒng)等時(shí)間間隔采集方法,時(shí)間間隔每60 s采集一次。網(wǎng)關(guān)2采用基于旋轉(zhuǎn)門(mén)算法的自適應(yīng)數(shù)據(jù)采集方法,網(wǎng)關(guān)3采用本文的基于改進(jìn)旋轉(zhuǎn)門(mén)算法的自適應(yīng)數(shù)據(jù)采集方法,連續(xù)采集24 h網(wǎng)關(guān)的CPU利用率。通過(guò)誤差分析、單位時(shí)間數(shù)據(jù)采集量、單位時(shí)間數(shù)據(jù)傳輸量3個(gè)方面對(duì)本文提出的數(shù)據(jù)采集策略的性能進(jìn)行驗(yàn)證分析。
網(wǎng)關(guān)1采用傳統(tǒng)等時(shí)間間隔采集方法,時(shí)間間隔=60 s。
網(wǎng)關(guān)2采用基于旋轉(zhuǎn)門(mén)算法的自適應(yīng)數(shù)據(jù)采集方法,相關(guān)參數(shù)設(shè)置如表4所示。
表4 改進(jìn)前算法參數(shù)設(shè)置
網(wǎng)關(guān)3采用本文的基于改進(jìn)旋轉(zhuǎn)門(mén)算法的自適應(yīng)數(shù)據(jù)采集策略,相關(guān)參數(shù)除了新增參數(shù)之外與網(wǎng)關(guān)2一樣,具體設(shè)置如表5所示。
表5 改進(jìn)后算法參數(shù)設(shè)置
圖5 實(shí)驗(yàn)環(huán)境
圖6 誤差分析
4.2.2 誤差分析
不同采集策略下的誤差分析如圖6所示,實(shí)驗(yàn)數(shù)據(jù)選取了網(wǎng)關(guān)1、2、3的100個(gè)數(shù)據(jù)點(diǎn),誤差值為最后系統(tǒng)還原重建網(wǎng)關(guān)2、3數(shù)據(jù)與網(wǎng)關(guān)1等時(shí)間間隔采集的數(shù)據(jù)誤差的絕對(duì)值。
由圖6可知,由于排除了異常點(diǎn)對(duì)壓縮算法的影響和確定了合適的壓縮閾值,基于旋轉(zhuǎn)門(mén)算法的自適應(yīng)數(shù)據(jù)采集策略的誤差絕對(duì)值最大為5,而基于改進(jìn)旋轉(zhuǎn)門(mén)算法的自適應(yīng)數(shù)據(jù)采集策略的誤差絕對(duì)值最大為4,并且改進(jìn)后的誤差有一定程度減小。
4.2.3 采集量分析
不同采集策略下的單位時(shí)間數(shù)據(jù)采集量分析如圖7所示,實(shí)驗(yàn)數(shù)據(jù)選取了網(wǎng)關(guān)2、3的4個(gè)時(shí)間段每小時(shí)的數(shù)據(jù)采集量。
圖7 采集量分析
由圖7可知,由于排除了異常點(diǎn)對(duì)壓縮算法的影響,減少了異常采集數(shù)據(jù)次數(shù),采用基于改進(jìn)旋轉(zhuǎn)門(mén)算法的自適應(yīng)數(shù)據(jù)采集策略,單位時(shí)間內(nèi)數(shù)據(jù)采集量?jī)?yōu)于未改進(jìn)的。
4.2.4 傳輸量分析
不同采集策略下的單位時(shí)間數(shù)據(jù)傳輸量分析如圖8所示,實(shí)驗(yàn)數(shù)據(jù)選取了網(wǎng)關(guān)2、3的4個(gè)時(shí)間段每小時(shí)的數(shù)據(jù)采集量。
圖8 傳輸量分析
由圖8可知,由于排除了異常點(diǎn)對(duì)壓縮算法的影響,減少了壓縮段數(shù)量,采用基于改進(jìn)旋轉(zhuǎn)門(mén)算法的自適應(yīng)數(shù)據(jù)采集策略,單位時(shí)間內(nèi)數(shù)據(jù)傳輸量?jī)?yōu)于未改進(jìn)的。
針對(duì)網(wǎng)關(guān)節(jié)點(diǎn)數(shù)據(jù)采集和傳輸存在的問(wèn)題,本文把用于數(shù)據(jù)壓縮的旋轉(zhuǎn)門(mén)算法應(yīng)用到安全網(wǎng)關(guān)控制信息采集場(chǎng)景中,并對(duì)它存在的問(wèn)題進(jìn)行了改進(jìn),提出了基于改進(jìn)旋轉(zhuǎn)門(mén)算法的安全網(wǎng)關(guān)控制信息采集策略;改進(jìn)了對(duì)異常大小數(shù)據(jù)點(diǎn)的處理和確定壓縮閾值的大小方法。最終通過(guò)實(shí)驗(yàn)驗(yàn)證可以看到,在本文的應(yīng)用場(chǎng)景中,在采集數(shù)據(jù)量相同的情況下,改進(jìn)后可以減少數(shù)據(jù)的采集次數(shù)和傳輸次數(shù),能夠有效降低網(wǎng)絡(luò)開(kāi)銷(xiāo),提高數(shù)據(jù)采集效率。
[1] 李賀武, 吳茜, 徐恪, 等. 天地一體化網(wǎng)絡(luò)研究進(jìn)展與趨勢(shì)[J]. 科技導(dǎo)報(bào), 2016, 34(14): 95-106.
LI H W, WU Q, XU K, et al. Progress and tendency of space and earth integrated network[J]. Science & Technology Review, 2016, 34(14): 95-106.
[2] 宋欣. 面向無(wú)線傳感器網(wǎng)絡(luò)的分布式數(shù)據(jù)收集關(guān)鍵技術(shù)研究[D]. 沈陽(yáng): 東北大學(xué), 2012.
SONG X. Research on key technologies for distributed data gathering in wireless sensor networks[D]. Shenyang: Northeastern University, 2012.
[3] 宋欣, 王翠榮. 基于線性回歸的無(wú)線傳感器網(wǎng)絡(luò)分布式數(shù)據(jù)采集優(yōu)化策略[J]. 計(jì)算機(jī)學(xué)報(bào), 2012, 35(3): 568-580
SONG X, WANG C R, et al. Linear regression based distributed data gathing optimization strategy for wireless sensor networks[J]. Chinese Journal of Computers,2012,35(3):568-580.
[4] 王玲, 石為人, 石欣, 等. 基于時(shí)間相關(guān)性的無(wú)線傳感器網(wǎng)絡(luò)數(shù)據(jù)壓縮與優(yōu)化算法[J]. 計(jì)算機(jī)應(yīng)用, 2013, 33(12): 3453-3456
WANG L, SHI W R, et al. Data compression and optimization algorithm for wireless sensor network based on temporal correlation[J]. Journal of Computer Applications, 2013, 33(12): 3453-3456
[5] PADHY, PARITOSH, RAJDEEP K, et al. A utility-based sensing and communication model for a glacial sensor network[C]//The 5th Int Conf on Autonomous Agents and Multi-Agent Systems. 2006: 1353-1360
[6] GUPTA M, SHUM L V, BODANESE E, et al. Design and evaluation of an adaptive sampling strategy for a wireless air pollution sensor network[C]//Local Computer Networks IEEE, 2011. 1003- 1010.
[7] BRISTOL E H. Swinging door trending: Adaptive trend recording[C]//ISA National Conference Proceedings. 1990:749-753.
[8] FENG X D, CHENG C L, LIU C L, et al. An improved process data compression algorithm[C]//The 4th World Congress on Intelligent Control and Automation (Cat. No.02EX527), 2002: 2190-2193.
[9] GANG G, LI L. An optimized algorithm for lossy compression of real-time data[C]//2010 IEEE International Conference on Intelligent Computing and Intelligent Systems. 2010: 187-191.
[10] LIU J S, DONG Y U, YI H U, et al. Application of improved SDT Algorithm in CNC Machine Monitoring Field[C]//2017 10th International Conference on Intelligent Computation Technology and Automation (ICICTA). 2017: 16-20.
Information acquisition strategy for security gate-ways based on swing door trending algorithm
WANG Shuang1,2, LU Yueming1,2
1. School of Cyber Security, Beijing University of Posts and Telecommunications, Beijing 100876, China 2. Key Laboratory of Trustworthy Distributed Computing and Service, Ministry of Education, Beijing 100876, China
Acquisition the control information of security gateway is an important security awareness method in the space and earth integrated network, but the traditional equal interval time data method acquisition has problems, such as waste of network bandwidth, a large amount of data redundancy, excessive data collection of acquisition node and excessive transmission times. In order to solve these problems, a data acquisition strategy based on improved swing door trending algorithm was proposed, which analyzed and improved swing door trending algorithm to determine the control information of security gateway such as the rangeability of gateway traffic and CPU utilization, and to adjust the data acquisition interval adaptively. The experimental results show that compared with the traditional equal interval time data method acquisition, under the condition of ensuring the data accuracy, the proposed strategy can lower the times of data acquisition and transmission, effectively reduce network overhead and improve data acquisition efficiency.
data acquisition, swing door trending algorithm, gateway monitoring, self-adaptive frequency conversion
TP393.08
A
10.11959/j.issn.2096-109x.2018079
王爽(1994-),女,四川巴中人,北京郵電大學(xué)碩士生,主要研究方向?yàn)榉植际接?jì)算與信息安全。
陸月明(1969-),男,江蘇蘇州人,北京郵電大學(xué)教授、博士生導(dǎo)師,主要研究方向?yàn)榉植际接?jì)算、信息安全。
2018-08-09;
2018-09-26
陸月明,yml@bupt.edu.cn
國(guó)家重點(diǎn)研發(fā)計(jì)劃基金資助項(xiàng)目(No.2016YFB0800302)
The National Key R & D Program of China(No.2016YFB0800302)