呂 睿(鄭州輕工業(yè)學(xué)院民族職業(yè)學(xué)院,河南鄭州,450000)
數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中的應(yīng)用分析
呂 睿
(鄭州輕工業(yè)學(xué)院民族職業(yè)學(xué)院,河南鄭州,450000)
隨著計(jì)算機(jī)的普及,其日益成為我們生活和工作中不可或缺的組成部分,在促進(jìn)我們生活工作方式改善的同時(shí),也因?yàn)榫W(wǎng)絡(luò)環(huán)境的不安全隱患給人們?cè)斐晌:?。文章從?jì)算機(jī)網(wǎng)絡(luò)病毒防御的角度出發(fā),倡導(dǎo)將數(shù)據(jù)挖掘技術(shù)運(yùn)用到此領(lǐng)域,以便保證計(jì)算機(jī)網(wǎng)絡(luò)處于比較安全的狀態(tài)。
數(shù)據(jù)挖掘技術(shù);計(jì)算機(jī)網(wǎng)絡(luò)病毒;病毒防御
計(jì)算機(jī)技術(shù)發(fā)展的同時(shí),計(jì)算機(jī)網(wǎng)絡(luò)病毒也越來(lái)越多,給予計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境的安全性構(gòu)成了極大的危害。而數(shù)據(jù)挖掘技術(shù)以全新的數(shù)據(jù)分析反思,去判斷和查找數(shù)據(jù)中潛在的聯(lián)系,以保證數(shù)據(jù)處于相對(duì)安全的狀態(tài)下運(yùn)行,這對(duì)于促進(jìn)計(jì)算機(jī)網(wǎng)絡(luò)安全度提升有著很大的幫助性作用。
1.1 數(shù)據(jù)挖掘技術(shù)
所謂數(shù)據(jù)挖掘技術(shù)就是對(duì)于領(lǐng)域內(nèi)部的全部數(shù)據(jù)展開(kāi)分析,進(jìn)行歸類總結(jié),在此基礎(chǔ)上去判斷和查找數(shù)據(jù)中的潛在觀念,以達(dá)到數(shù)據(jù)應(yīng)用和挖掘的目的。一般情況下,其技術(shù)流程需要遵循以下幾個(gè)步驟:信息收集,數(shù)據(jù)集成,數(shù)據(jù)規(guī)約,數(shù)據(jù)清理,數(shù)據(jù)變換,數(shù)據(jù)挖掘,模式評(píng)估和知識(shí)表示。下圖為其在稅務(wù)系統(tǒng)中的應(yīng)用結(jié)構(gòu)示意圖。
1.2 計(jì)算機(jī)網(wǎng)絡(luò)病毒
計(jì)算機(jī)病毒(Computer Virus)是編制者在計(jì)算機(jī)程序中插入的破壞計(jì)算機(jī)功能或者數(shù)據(jù)的代碼,能影響計(jì)算機(jī)使用,能自我復(fù)制的一組計(jì)算機(jī)指令或者程序代碼。依照這樣的界定,其有著以下幾方面的基本特點(diǎn):網(wǎng)絡(luò)病毒種類繁多,并且處于不斷變化的過(guò)程中,以下為2005年病毒的種類分布示意圖;傳播方式較為廣泛,存在擴(kuò)散的特點(diǎn);網(wǎng)絡(luò)病毒破壞性比較強(qiáng);病毒的防御應(yīng)該從病毒緣起出發(fā),有針對(duì)性的去解決,才能夠保證其有效性。依據(jù)公安部網(wǎng)絡(luò)安全保衛(wèi)局2009年全國(guó)信息網(wǎng)絡(luò)安全狀況以及病毒疫情調(diào)查結(jié)果來(lái)看,僅僅在2009年發(fā)生網(wǎng)絡(luò)安全事件中,新增加的病毒樣本數(shù)量為299萬(wàn)個(gè),相當(dāng)于上一年數(shù)量的3.2倍,新發(fā)現(xiàn)的木馬病毒約為246萬(wàn)個(gè),木馬樣本總計(jì)數(shù)量為330萬(wàn)多個(gè)。
2.1 數(shù)據(jù)挖掘技術(shù)應(yīng)用于計(jì)算機(jī)網(wǎng)絡(luò)病毒防御的可能性
為了更好地實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)的應(yīng)用,需要對(duì)網(wǎng)絡(luò)病毒的傳播過(guò)程進(jìn)行進(jìn)一步了解和分析,為數(shù)據(jù)挖掘的應(yīng)用提供依據(jù)。如蠕蟲(chóng)病毒感染計(jì)算機(jī),首先需要對(duì)網(wǎng)絡(luò)上的主機(jī)進(jìn)行掃描,這過(guò)程是檢測(cè)蠕蟲(chóng)病毒的關(guān)鍵,也是計(jì)算機(jī)預(yù)防系統(tǒng)建設(shè)的突破口。以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ),構(gòu)建全新的網(wǎng)絡(luò)病毒防御系統(tǒng)。一般情況下由數(shù)據(jù)源模塊,預(yù)處理模塊,數(shù)據(jù)挖掘模塊,規(guī)則庫(kù)模塊,決策模塊和防御模塊等幾個(gè)部分。其工作原理是這樣的:來(lái)自網(wǎng)絡(luò)的,發(fā)向本地的數(shù)據(jù)包形成數(shù)據(jù)源之后,由預(yù)處理模塊來(lái)進(jìn)行處理,并且對(duì)于網(wǎng)絡(luò)信息傳輸?shù)牟《具M(jìn)行記錄,對(duì)于后期同等性質(zhì)的病毒形成免疫力,一旦出現(xiàn)非法入侵,就會(huì)及時(shí)的產(chǎn)生警報(bào),并且啟動(dòng)對(duì)于主機(jī)的保護(hù)防御程序。下圖為數(shù)據(jù)挖掘結(jié)構(gòu)示意圖。
2.2 數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中的應(yīng)用
基于數(shù)據(jù)挖掘技術(shù)形成全新的計(jì)算機(jī)網(wǎng)絡(luò)病毒防御體系,是全新的計(jì)算機(jī)網(wǎng)絡(luò)病毒防御方式,其能夠更加全面,更加有效的處理計(jì)算機(jī)網(wǎng)絡(luò)信息的安全性問(wèn)題。具體來(lái)講,可以從以下幾個(gè)角度來(lái)探析其在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御過(guò)程中的應(yīng)用:其一,數(shù)據(jù)源模塊,此模塊是以抓包程序?yàn)榛A(chǔ),對(duì)于網(wǎng)絡(luò)向主機(jī)發(fā)送數(shù)據(jù)包的信息進(jìn)行截獲。因此在數(shù)據(jù)源模塊中存在最為原始的數(shù)據(jù)包以及數(shù)據(jù)結(jié)構(gòu),在獲取這樣的數(shù)據(jù)源之后將其交給預(yù)處理模塊進(jìn)行下一步操作;其二,數(shù)據(jù)預(yù)處理模塊,這是數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)性工作,做好這步驟可以使得后期數(shù)據(jù)分析打下良好基礎(chǔ),不僅僅關(guān)系到數(shù)據(jù)挖掘成效,還牽涉到數(shù)據(jù)挖掘時(shí)間成本的縮短;其三,規(guī)則庫(kù)模塊,其效能主要在于存儲(chǔ)檢測(cè)到的病毒特征,并且將其積累起來(lái)形成規(guī)則集,反映出病毒特點(diǎn)和連接數(shù)據(jù)的規(guī)則,為后期病毒數(shù)據(jù)特點(diǎn)分析和收集提供相應(yīng)的依據(jù);其四,數(shù)據(jù)挖掘模塊,借助科學(xué)的算法,對(duì)于事件庫(kù)進(jìn)行分析,并且在此基礎(chǔ)上生產(chǎn)出請(qǐng)求記錄,在完成這樣的環(huán)節(jié)之后,將其交給決策模塊;其五,決策模塊,此模塊的效能在于將數(shù)據(jù)挖掘的結(jié)果和規(guī)則庫(kù)的規(guī)則進(jìn)行匹配度分析,如果發(fā)現(xiàn)兩者之間的匹配度比較高,說(shuō)明在數(shù)據(jù)包中可能存在病毒,如果發(fā)現(xiàn)兩者之間的匹配度很低,可以在此基礎(chǔ)上發(fā)動(dòng)預(yù)警機(jī)制,并且找到新的蠕蟲(chóng)病毒,并且將其納入到規(guī)則庫(kù)中去,以實(shí)現(xiàn)規(guī)則庫(kù)的擴(kuò)展。
2.3 數(shù)據(jù)挖掘技術(shù)下的病毒防御系統(tǒng)
基于數(shù)據(jù)挖掘技術(shù)的病毒防御系統(tǒng),往往會(huì)以多樣化的分析方式去進(jìn)行處理。一般情況下,主要涉及到以下幾種分析方式:其一,分類分析,簡(jiǎn)單來(lái)講就是將各個(gè)主體提前設(shè)定到幾種類別中去,以統(tǒng)計(jì)方法或者機(jī)械方法去建立分類模型,在數(shù)據(jù)庫(kù)的環(huán)境中實(shí)現(xiàn)特定類的數(shù)據(jù)映射,由此去實(shí)現(xiàn)分類處理和分析;其二,聚類分析,是指將所得到的數(shù)據(jù)包進(jìn)行分解,將其歸納總結(jié)到不一樣的組別中去,處于同樣組別中的往往都是有著相似點(diǎn)的彼此,不同組別之間都代表著不同的特點(diǎn)事物。以聚類分析的方式去處理數(shù)據(jù),可以找到數(shù)據(jù)分布的疏密情況,在此基礎(chǔ)上形成全局的分布模式,以使得數(shù)據(jù)之間的關(guān)系得以展現(xiàn);其三,異類分析,異類分析又稱孤立點(diǎn)分析,指分析數(shù)據(jù)庫(kù)中明顯偏離其他數(shù)據(jù),具有明顯不同點(diǎn)的數(shù)據(jù),指偏離了一般模式的數(shù)據(jù)。異類分析包括了孤立點(diǎn)的發(fā)現(xiàn)和孤立點(diǎn)的分析,孤立點(diǎn)的發(fā)現(xiàn)常會(huì)產(chǎn)生有違常理的結(jié)果;孤立點(diǎn)的分析過(guò)程中則可能發(fā)現(xiàn)與一般數(shù)據(jù)相比更有價(jià)值的數(shù)據(jù);其四,序列分析,以動(dòng)態(tài)化的數(shù)據(jù)除了你方式去進(jìn)行統(tǒng)計(jì),對(duì)于隨機(jī)數(shù)據(jù)序列歸納進(jìn)行研究,從而找到相應(yīng)的病毒數(shù)據(jù)序列。一般情況下,序列分析的目的在于最大限度的獲取序列模式模型,以找到事件發(fā)生的時(shí)間序列。
理論研究是數(shù)據(jù)挖掘技術(shù)的前提,軟件企業(yè)其推廣數(shù)據(jù)挖掘技術(shù)的動(dòng)力,標(biāo)準(zhǔn)體系的構(gòu)建穩(wěn)定運(yùn)行環(huán)境的重點(diǎn),而數(shù)據(jù)挖掘技術(shù)的應(yīng)用人才是促進(jìn)各項(xiàng)工作的關(guān)鍵性因素。顯然,上述是從技術(shù)的角度上去構(gòu)建數(shù)據(jù)挖掘技術(shù)的計(jì)算機(jī)網(wǎng)絡(luò)病毒防御體系,實(shí)際上要想全面的發(fā)揮數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)網(wǎng)病毒防御方面的作用,還需要做好以下幾方面的工作:
3.1 高度重視數(shù)據(jù)挖掘技術(shù)的理論研究
技術(shù)理論研究是實(shí)踐應(yīng)用效能發(fā)揮的基礎(chǔ)和前提,為了更好的實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)的應(yīng)用,應(yīng)該積極做好以下幾方面的工作:其一,注重?cái)?shù)據(jù)挖掘技術(shù)的理論研究,鼓勵(lì)學(xué)者和專家針對(duì)于此方面進(jìn)行研究,廣泛的去借鑒西方國(guó)家的先進(jìn)技術(shù)理論,以不斷實(shí)現(xiàn)理論體系的健全;其二,注重學(xué)術(shù)界與實(shí)業(yè)界之間的交流和溝通,倡導(dǎo)理論聯(lián)系實(shí)際,形成理論引導(dǎo)實(shí)際,實(shí)際促進(jìn)理論的良性循環(huán),在此基礎(chǔ)上實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)理論體系的全面發(fā)展;其三,積極研究數(shù)據(jù)挖掘技術(shù)與計(jì)算機(jī)網(wǎng)絡(luò)病毒防御之間的關(guān)系,并且在此基礎(chǔ)上開(kāi)發(fā)設(shè)計(jì)出以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ)的計(jì)算機(jī)網(wǎng)絡(luò)病毒防御體系。
3.2 鼓勵(lì)國(guó)內(nèi)軟件廠家的健康發(fā)展進(jìn)步
相對(duì)于國(guó)外軟件企業(yè)來(lái)講,其在數(shù)據(jù)挖掘技術(shù)方面的研究體系相對(duì)成熟,并且都能夠積極運(yùn)用到實(shí)際的生產(chǎn)中去。而我國(guó)類似于這樣的軟件企業(yè)還不是很多,在數(shù)據(jù)挖掘技術(shù)方面的研究開(kāi)發(fā)還處于初級(jí)階段。因此需要積極鼓勵(lì)國(guó)內(nèi)軟件廠家的發(fā)展,為其構(gòu)建相對(duì)健康的市場(chǎng)環(huán)境。當(dāng)然對(duì)于這樣的軟件廠家,應(yīng)該不斷去學(xué)習(xí)和研究國(guó)外先進(jìn)的數(shù)據(jù)挖掘技術(shù)經(jīng)驗(yàn),引導(dǎo)數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御領(lǐng)域的運(yùn)用。除此之外,國(guó)內(nèi)軟件廠家之間應(yīng)該建立健全的行業(yè)交流機(jī)制,積極針對(duì)于數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御方面的應(yīng)用經(jīng)驗(yàn),促進(jìn)行業(yè)內(nèi)部的發(fā)展和進(jìn)步。
3.3 建立健全數(shù)據(jù)挖掘技術(shù)的標(biāo)準(zhǔn)體系
類似于SQL語(yǔ)言的形式化和標(biāo)準(zhǔn)化,數(shù)據(jù)挖掘技術(shù)也會(huì)朝著標(biāo)準(zhǔn)化的方向發(fā)展,將其運(yùn)用到知識(shí)和發(fā)現(xiàn)的數(shù)據(jù)語(yǔ)言體系,往往可以使得數(shù)據(jù)挖掘質(zhì)量得以不斷提高,使得顧客更加清晰的理解對(duì)方,實(shí)現(xiàn)更加高效的人機(jī)互動(dòng)效果,處理好挖服務(wù)器和數(shù)據(jù)庫(kù)服務(wù)器之間的關(guān)系,使得其在非結(jié)構(gòu)化數(shù)據(jù)方面的效能得以發(fā)揮。在建立數(shù)據(jù)挖掘技術(shù)標(biāo)準(zhǔn)體系的過(guò)程中,應(yīng)該始終堅(jiān)持以市場(chǎng)需求為導(dǎo)向,做到具體問(wèn)題具體分析,滿足市場(chǎng)對(duì)于挖掘技術(shù)的不同需求。
3.4 注重培養(yǎng)專業(yè)化的網(wǎng)絡(luò)管理人才
歸根結(jié)底來(lái)講,將數(shù)據(jù)庫(kù)技術(shù)運(yùn)用到計(jì)算機(jī)網(wǎng)絡(luò)病毒防御體系中去,其目的在于保證網(wǎng)絡(luò)的安全性和穩(wěn)定性,使得在網(wǎng)絡(luò)環(huán)境下實(shí)現(xiàn)更好的業(yè)務(wù)往來(lái)。無(wú)論是構(gòu)建以數(shù)據(jù)挖掘技術(shù)為基礎(chǔ)的計(jì)算機(jī)網(wǎng)絡(luò)病毒網(wǎng)絡(luò)防御體系,還是切實(shí)的發(fā)揮計(jì)算機(jī)網(wǎng)絡(luò)病毒防御系統(tǒng)的作用,都需要專業(yè)化的技術(shù)人才去進(jìn)行。由此就需要高度重視專業(yè)化人才的培養(yǎng)。一方面,積極實(shí)現(xiàn)與高校之間的聯(lián)系,將數(shù)據(jù)挖掘技術(shù)作為課程內(nèi)容,培養(yǎng)專業(yè)化的網(wǎng)絡(luò)安全管理人才,以保證此項(xiàng)技術(shù)的切實(shí)使用;另外一方面,注重開(kāi)展企業(yè)內(nèi)部的專業(yè)培訓(xùn),使得其技能素質(zhì)得以提升,以保證計(jì)算機(jī)網(wǎng)絡(luò)病毒防御體系的形成。
面對(duì)信息化的浪潮,充分利用數(shù)據(jù)挖掘來(lái)計(jì)算機(jī)網(wǎng)絡(luò)病毒防御的實(shí)際應(yīng)用,是當(dāng)前數(shù)據(jù)庫(kù)高層應(yīng)用的趨勢(shì)。數(shù)據(jù)挖掘雖然要通過(guò)一定的人力物力還需要一定的時(shí)間才能應(yīng)用起來(lái)的,不能一蹴而成,但是數(shù)據(jù)挖掘在實(shí)際應(yīng)用中能充分發(fā)揮數(shù)據(jù)庫(kù)在各個(gè)領(lǐng)域的作用,所以在實(shí)際應(yīng)用中數(shù)據(jù)挖掘技術(shù)應(yīng)該得到重視,并且在理論和實(shí)踐相互融合的過(guò)程中,得以不斷發(fā)展和進(jìn)步,發(fā)揮其在計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境維護(hù)方面的作用。
[1] 劉健.數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)入侵檢測(cè)中的應(yīng)用[J].計(jì)算機(jī)光盤軟件與應(yīng)用. 2013(02)
[2] 潘大勝.數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)入侵檢測(cè)中的應(yīng)用[J].湖北科技學(xué)院學(xué)報(bào). 2012(12)
[3] 蔣敘,倪崢.計(jì)算機(jī)病毒的網(wǎng)絡(luò)傳播及自動(dòng)化防御[J].重慶文理學(xué)院學(xué)報(bào)(自然科學(xué)版). 2012(02)
Application of data mining techniques in computer network defense of virus
Lv Rui
(Zhengzhou University of Light Industry, National vocational college,450000)
With the popularization of computers,they have become more and more important in our daily life .However even though they play a role in improving our way of work and life,they also cause trouble to us due to the unsafe network environment.This article advocate the application of the data mining technology to the field of computer network virus and precautions which ensure the safe network environment.
Data mining technology;Computer network virus;Virus defense
呂睿 (1979-),男(漢族),河南鄭州市人,碩士,北京郵電大學(xué),主要研究方向:計(jì)算機(jī)網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)、電子商務(wù)。