王 楠,于志偉,王利軍,劉 健
(中國電子科技集團公司第二十八研究所,南京 210007)
隨著現(xiàn)代互聯(lián)網(wǎng)信息技術的不斷發(fā)展,網(wǎng)絡安全、信息安全相關的需求也有所爆發(fā)。尤其是云安全、物聯(lián)網(wǎng)安全、工業(yè)互聯(lián)網(wǎng)安全等新興領域?qū)⒂瓉肀l(fā)機遇,這將為網(wǎng)絡安全帶來市場增量[1]。網(wǎng)絡信息多通過Web 實現(xiàn)互通,海量數(shù)據(jù)信息中部分是有價值的,部分信息則具有破壞性,將其歸屬為不良信息范疇,其一方面會影響到網(wǎng)絡的正常運行;另一方面也帶來了網(wǎng)絡安全問題?;赪eb 網(wǎng)絡業(yè)務的拓展,網(wǎng)絡公司對不良信息過濾系統(tǒng)需求與日俱增[2]。傳統(tǒng)對網(wǎng)絡不良信息的過濾采用的是識別數(shù)據(jù)過濾系統(tǒng),需要將所有信息全部接收后,再進行逐一排查、比對,不僅工作量大、處理速度慢,而且過濾效果不甚理想。此次研究提出了Web 環(huán)境下大數(shù)據(jù)動態(tài)不良信息安全過濾系統(tǒng),以下對其進行具體分析。
大數(shù)據(jù)下動態(tài)不良信息安全過濾設計,首先要具備對實時信息內(nèi)容的審查功能,能夠高效排查出敏感信息、不良信息等內(nèi)容,并對上述內(nèi)容進行追查,實現(xiàn)對互聯(lián)網(wǎng)信息自動化過濾、篩查。其次,大數(shù)據(jù)動態(tài)不良信息安全過濾系統(tǒng)要能夠針對復雜的網(wǎng)絡事物作出有效的處理,高效執(zhí)行服務器端的各項工作,結(jié)合實際情況選擇相應的算法對動態(tài)不良信息進行過濾,準確處理互聯(lián)網(wǎng)不良信息,與此同時要對處理信息作出明確的規(guī)范,而這一切的實現(xiàn)都需要依賴算法[3]。由于動態(tài)不良信息數(shù)目多,處理復雜,應通過縮短處理信息的時間提升信息過濾處理效率?;ヂ?lián)網(wǎng)動態(tài)信息具有未知性,在設計不良信息安全過濾系統(tǒng)時,必須注重其拓展性,便于以后系統(tǒng)拓展設計操作。在網(wǎng)絡帶寬參數(shù)設計方面,一般按照30K/次數(shù)據(jù)量進行調(diào)試,結(jié)合全國各個省份實際數(shù)據(jù)量,每秒所占用的寬帶約為18M,要切實保障對動態(tài)不良信息的安全過濾速率。
此次研究采用C/S 系統(tǒng)模式設計了基于Web 環(huán)境下大數(shù)據(jù)動態(tài)不良信息安全過濾,傳統(tǒng)N/S 安全過濾系統(tǒng)已經(jīng)不能夠滿足當前大數(shù)據(jù)時代海量信息的需求,且應用C/S 模式能夠支持后期系統(tǒng)維護及系統(tǒng)升級,實用性強、便捷,能夠高效過濾、篩查動態(tài)不良信息。從其硬件構(gòu)成來看,其主要包括三個層面:
(1)前端控制層。該層為命令控制中心,其主要負責對Web環(huán)境下大數(shù)據(jù)動態(tài)不良信息的過濾。
(2)運行系統(tǒng)。對不良信息的安全過濾都依賴運行系統(tǒng)實現(xiàn),其構(gòu)件主要包括計算器、數(shù)據(jù)庫以及數(shù)據(jù)調(diào)控器等,其正常運行狀態(tài)下能夠確保不良信息的高效過濾[4]。
(3)用戶端。用戶端主要由文件驅(qū)動器、感知運行器以及CVDO 三個部件構(gòu)成,其能夠有效識別用戶命令,并下達、傳遞命令。
研究設計系統(tǒng)針對前端主機控制端實施了一系列優(yōu)化選擇,以提升對數(shù)據(jù)信息過濾的精準性,對前端主機控制端的優(yōu)化一方面能夠促進系統(tǒng)過濾能力的提升,另一方面能夠加強系統(tǒng)邏輯計算能力,從整體情況看,其對系統(tǒng)篩選能力有著顯著的提升作用[5]。需要注意的是,在過濾海量信息時,不能夠影響常規(guī)數(shù)據(jù)的自由運行,這就對安全過濾系統(tǒng)對信息的把控能力提出了更高的要求,必須具備強大的邏輯計算能力才能夠滿足這一需求。此次研究設計的大數(shù)據(jù)動態(tài)不良信息安全過濾系統(tǒng)運行流:數(shù)據(jù)預處理—利用條件初次過濾—閾值選取和閾值預處理—閾值過濾—分組整理。
采用網(wǎng)閘過濾系統(tǒng)完成信息過濾:
研究設計了基于Web 環(huán)境下大數(shù)據(jù)動態(tài)不良信息安全過濾系統(tǒng),在過濾操作中引入了網(wǎng)閘過濾系統(tǒng),其能夠?qū)Σ涣夹畔⑦M行高效的過濾。網(wǎng)閘過濾系統(tǒng)一方面能夠規(guī)避傳統(tǒng)方法配差計算失衡問題,另一方面能夠?qū)ο到y(tǒng)整體計算能力起到提升作用,數(shù)據(jù)信息不同,其所應用的符號型屬性也會呈現(xiàn)出明顯的差異性[6],其中數(shù)據(jù)信息能夠覆蓋文字、圖片以及邏輯等多個方面。其屬性選擇中,數(shù)據(jù)信息、數(shù)值型屬性及符號型屬性相應數(shù)據(jù)為:1/2/X,2/5/Z,3/8/Y,4/5/Z,5/7/X,6/6/Y。
在網(wǎng)閘過濾系統(tǒng)下,可以根據(jù)符號型屬性的不同對其進行分類處理,這一操作能夠便于對不同數(shù)據(jù)實施精準化過濾。初級過濾完成后,可以進入條件矩陣,下一步完成矩陣過濾。首先需要設計攜帶符號型信息數(shù)據(jù)的矩陣,假設為Tij,其數(shù)據(jù)互換對比設計的條件矩陣為T’ij,完成對比后,能夠有效過濾去除與條件矩陣不同的數(shù)據(jù),這一操作實際上就是一次初級過濾。然而,僅通過一次初級過濾難以將動態(tài)不良信息完全過濾掉,無法滿足實際需求。接下來需要過濾閾值,需要注意的是,閾值的過濾需要首先對數(shù)據(jù)進行預處理,其預處理計算公式為:
式中,數(shù)據(jù)信息權(quán)重系數(shù)采用FYLK表示,F(xiàn)Y2K表示的是符號屬性,且已經(jīng)經(jīng)過初級條件矩陣過濾;La表示的是符號型屬性,其通過了閾值過濾;Iz與LB分別表示的是甄別系數(shù)與屬性只讀。預處理參數(shù)在公式中表示為rk-1,預處理屬性參數(shù)集合表示方式為Rk。已經(jīng)進行過預處理的數(shù)據(jù)需要再經(jīng)過閾值選定,便能夠完成閾值計算,數(shù)據(jù)信息經(jīng)過過濾后,其會自動生成以下分組:
式中,數(shù)據(jù)識別屬性采用字母T表示;D表示的是數(shù)據(jù)集中能夠用于數(shù)據(jù)分組的集合;△t代表數(shù)據(jù)轉(zhuǎn)化值,其能夠為數(shù)據(jù)分類管理提供可靠的依據(jù);B表示序列號。需要注意的是采用閾值對數(shù)據(jù)進行過濾時,不可能所有數(shù)據(jù)信息都能夠達到條件,因此,可以采用如下條件公式進行限定:
此次研究采用閾值計算方法對數(shù)據(jù)信息進行過濾,已經(jīng)能夠?qū)eb 環(huán)境下動態(tài)不良信息進行有效的過濾,然而該過濾方式對于圖片數(shù)據(jù)信息還存在一定的局限性[7~8],基于這一問題,研究提出了隨機自適應算法,用于對圖片信息得到過濾,其預處理計算公式為:
此次研究設計了基于Web 環(huán)境下大數(shù)據(jù)動態(tài)不良信息安全過濾系統(tǒng),為確保該系統(tǒng)能夠?qū)?shù)據(jù)信息進行有效的過濾,首先對數(shù)據(jù)信息權(quán)重系數(shù)FYLK進行設計[9],假設其數(shù)值為55.94,數(shù)據(jù)信息專屬閾值yi 為5,其讀取屬性為0.65,那么在[1.0~55]范圍內(nèi),各項試驗參數(shù)中,試驗次數(shù)、數(shù)值型屬性、過濾數(shù)量及數(shù)據(jù)修正參數(shù)對應的數(shù)據(jù)分別為:1/2/11/10-4,2/4/150/10-4,3/8/200/10-4,4/8/250/10-4,5/6/300/10-4,6/5/350/10-4,7/7/400/10-4。
在互聯(lián)網(wǎng)領域,對系統(tǒng)穩(wěn)定性的衡量通常采用的是魯棒性,此次研究對大數(shù)據(jù)動態(tài)不良信息安全過濾系統(tǒng)魯棒性進行測試[10],結(jié)果如圖1所示,可以發(fā)現(xiàn)其具有較高的魯棒性,可以發(fā)現(xiàn)當過濾數(shù)據(jù)增加后,該系統(tǒng)的過濾錯誤率持續(xù)降低,可以將該系統(tǒng)應用于不良信息安全過濾,其能夠準確過濾、篩選不良信息。
圖1 仿真試驗結(jié)果
此次研究設計了基于Web 環(huán)境下大數(shù)據(jù)動態(tài)不良信息安全過濾系統(tǒng),在C/S 系統(tǒng)構(gòu)架下,應用網(wǎng)閘式數(shù)據(jù)信息過濾系統(tǒng),不僅實現(xiàn)了對數(shù)據(jù)信息的準確、有效過濾,而且錯誤率低,可以將該系統(tǒng)應用于不良信息的過濾,其能夠為大數(shù)據(jù)動態(tài)信息安全管理提供可靠的技術支持。