梁雪霆
摘 要:隨著互聯(lián)網(wǎng)的快速發(fā)展和普及,信息傳播方式發(fā)生重大轉變,人們的生活、生產也更加便利。但是,不可否認的是,計算機網(wǎng)絡病毒同樣發(fā)展起來,嚴重威脅人們的信息安全。數(shù)據(jù)挖掘技術是一種新型的技術,可以挖掘、出來、分析計算機網(wǎng)絡中的數(shù)據(jù),可用于防御計算機網(wǎng)絡病毒,從而進一步保障人們的信息安全。本文先簡單概述數(shù)據(jù)挖掘技術,然后從數(shù)據(jù)挖掘技術的構成、計算機網(wǎng)絡病毒防御系統(tǒng)兩個方面來研究計算機網(wǎng)絡病毒防御技術,旨在為后續(xù)研究提供一定的參考。
關鍵詞:數(shù)據(jù)挖掘技術;網(wǎng)絡病毒;計算機
在現(xiàn)代化技術的高速發(fā)展下,人們已經進入一個嶄新的時代——網(wǎng)絡時代,人們的衣、食、住、行均與網(wǎng)絡息息相關。與此同時,計算機網(wǎng)絡病毒不斷增多,由于其種類、傳播方式均具有多樣性,嚴重威脅計算機網(wǎng)絡系統(tǒng)安全,也損害了廣大計算機網(wǎng)絡用戶的信息安全[1]?;诖?,計算機網(wǎng)絡病毒防御技術越來越受到人們的關注,且成為該領域的研究熱點。
1 數(shù)據(jù)挖掘技術概述
所謂數(shù)據(jù)挖掘技術,指的是以所處一定范圍之內的所有數(shù)據(jù)為研究對象,對其進行收集、分類、歸類,根據(jù)數(shù)據(jù)處理結果,判斷是否存在某種潛在關系和數(shù)據(jù)規(guī)律的技術。它主要包含三個環(huán)節(jié):即準備數(shù)據(jù)、尋找數(shù)據(jù)存在的規(guī)律、表現(xiàn)數(shù)據(jù)規(guī)律,數(shù)據(jù)挖掘技術的工作流程如下:當設置好數(shù)據(jù)挖掘模式后,挖掘引擎就會根據(jù)數(shù)據(jù)庫的相關要求展開工作,即對準備好的數(shù)據(jù)進行分析、歸類,利用相關技術找出各個數(shù)據(jù)之間存在的關系,或是數(shù)據(jù)規(guī)律,從而為后期的數(shù)據(jù)分析提供依據(jù)。在實際的應用中,數(shù)據(jù)挖掘技術的過程比較繁雜,很大一部分屬于準備、規(guī)劃階段,但其重點在于對數(shù)據(jù)的預處理,它屬于基礎環(huán)節(jié),同時也是后續(xù)工作的必要條件[2]。數(shù)據(jù)預處理階段涉及的操作過程也比較多,比如數(shù)據(jù)的凈化過程、轉化過程、整合過程等。
2 數(shù)據(jù)挖掘技術的計算機網(wǎng)絡病毒防御技術
近年來,隨著人們對數(shù)據(jù)挖掘技術研究的深入,人們將其用于保障計算機信息安全中,即防御計算機網(wǎng)絡病毒。
(一)數(shù)據(jù)挖掘技術的構成分析
計算機網(wǎng)絡病毒發(fā)展迅速,嚴重威脅計算機信息安全。在計算機網(wǎng)絡病毒進行傳播時,通過對有關數(shù)據(jù)進行掃描,比如系統(tǒng)數(shù)據(jù)、網(wǎng)絡用戶數(shù)據(jù),可以為數(shù)據(jù)挖掘技術提供依據(jù)。在計算網(wǎng)絡病毒防御中,數(shù)據(jù)挖掘技術的應用過程比較復雜,涉及的步驟也比較繁雜,為了有效掌握每個環(huán)節(jié)的特征,需要進行分模塊分析研究,包括預處理模塊、數(shù)據(jù)挖掘模塊等。
從數(shù)據(jù)挖掘技術的構成來看,主要包括以下幾個成分:(1)數(shù)據(jù)預處理模塊,它主要是借助數(shù)據(jù)預處理模塊,可以對數(shù)據(jù)挖掘、分析操作進行簡化,并且還能整體提高數(shù)據(jù)挖掘效果,確保其準確度、辨識度。具體來講,其操作流程如下:完成數(shù)據(jù)收集后,對數(shù)據(jù)進行導入處理,將其傳輸?shù)筋A處理模塊,對數(shù)據(jù)進行分析、歸類,并且使其轉變成可被系統(tǒng)識別、處理的內容,然后以數(shù)據(jù)包(比如目標IP地址、端口信息等)所包含的信息為依據(jù),事實相關流程。(2)決策模塊,它主要是通過對數(shù)據(jù)的挖掘來構建數(shù)據(jù)庫,實施匹配處理,并且將數(shù)據(jù)庫與關聯(lián)庫二者聯(lián)系起來,若二者之間出現(xiàn)高度聯(lián)系的信息,則提示可能感染計算機病毒。(3)數(shù)據(jù)收集模塊,它通過抓取、收集計算機網(wǎng)絡中的數(shù)據(jù)包,實現(xiàn)對數(shù)據(jù)信息的收集。通常情況下,當數(shù)據(jù)信息被收集后,就會獲取比較重要的功能信息。(4)數(shù)據(jù)挖掘模塊,它是數(shù)據(jù)挖掘技術中最核心的部分。在數(shù)據(jù)挖掘模塊中,同樣包含多個部位,但比較關鍵的是事件庫和數(shù)據(jù)庫挖掘算法。通過數(shù)據(jù)挖掘,可以獲取較為準確的數(shù)據(jù)結構。(5)規(guī)則庫模塊,它的作用在于幫助優(yōu)化數(shù)據(jù)挖掘信息庫。若網(wǎng)絡病毒出現(xiàn)在計算機系統(tǒng)中,啟動規(guī)則庫模塊,可以分析、識別數(shù)據(jù)信息。當然,在實際的運行中,在數(shù)據(jù)挖掘時,網(wǎng)絡病毒屬性的獲取規(guī)則會被改變或調整,并且還會將其保留、使用于數(shù)據(jù)挖掘中,從而協(xié)助計算機系統(tǒng),分析潛在的網(wǎng)絡病毒。
(二)計算機網(wǎng)絡病毒防御系統(tǒng)分析
以數(shù)據(jù)挖掘技術為基礎的計算機網(wǎng)絡病毒防御系統(tǒng)中,其主要包括三個主要的操作過程中,即關聯(lián)規(guī)則、聚類、分類。
(1)關聯(lián)規(guī)則分析
它指的是在同一類別的數(shù)據(jù)中,存在可以被發(fā)現(xiàn)的知識,以≥2個變量為對象,實施取值處理,若結果顯示數(shù)據(jù)存在一定的規(guī)律,則提示數(shù)據(jù)之間具有某種關聯(lián)。在數(shù)據(jù)挖掘技術中,主要的幾種關聯(lián)關系包括:簡單關聯(lián)、及時序關聯(lián)、因果關聯(lián)。在計算機網(wǎng)絡病毒防御中,要想找到數(shù)據(jù)庫中的關聯(lián)網(wǎng),關聯(lián)分析這一環(huán)節(jié)必不可少。
(2)聚類分析
在數(shù)據(jù)挖掘技術中,聚類操作同樣發(fā)揮著不可取代的作用,它主要是根據(jù)數(shù)據(jù)的不同類別、特點,分解所獲取到的數(shù)據(jù)信息。當完成系統(tǒng)中所有數(shù)據(jù)的聚類操作后,就可以有效了解系統(tǒng)中數(shù)據(jù)分布的情況,主要是疏密情況,這樣一來,一方面,它可以呈現(xiàn)出組與組之間數(shù)據(jù)存在的關系;另一方面,還能體現(xiàn)出全局的分布模式。
(3)分類分析
所謂分類分析,它指的是對個體進行分類、歸類處理,使其處于預先設定的類別當中。該操作的主要目的是利用多種機器學習方法、統(tǒng)計方法,并且采用相關計算機處理技術,建立數(shù)據(jù)的分類模型,然后以數(shù)據(jù)庫中存在的數(shù)據(jù)為對象,實施分類出來,并以此為依據(jù),對其他數(shù)據(jù)進行分析、歸類處理。
3 結語
綜上所述,在互聯(lián)網(wǎng)的發(fā)展是一把雙刃劍,既給人們的生產、生活帶來極大便利,同時也給用戶的計算機信息安全帶來嚴重威脅。
參考文獻:
[1]王娜.數(shù)據(jù)挖掘技術在計算機網(wǎng)絡病毒防御中的應用分析[J].計算機光盤軟件與應用,2013(08):155,157.
[2]李英杰.數(shù)據(jù)挖掘技術的計算機網(wǎng)絡病毒防御技術研究[J].電腦知識與技術,2015(02):1-2.