邢翀
[摘 要]隨著社會(huì)的發(fā)展和信息技術(shù)的進(jìn)步,在這個(gè)信息化的時(shí)代下,計(jì)算機(jī)的應(yīng)用頻率越來(lái)越高。伴隨計(jì)算機(jī)應(yīng)用產(chǎn)生的各種軟件也都不盡相同,計(jì)算機(jī)和網(wǎng)絡(luò)的出現(xiàn)改變了人們傳統(tǒng)的交流方式,人們可以不需要通過(guò)面對(duì)面的方式也可以實(shí)現(xiàn)在虛擬網(wǎng)絡(luò)中的交流。信息化時(shí)代的到來(lái)催生了電商平臺(tái)的發(fā)展,人們可以通過(guò)網(wǎng)上購(gòu)物、付款的方式,實(shí)現(xiàn)方便快捷的線(xiàn)上購(gòu)物。雖然網(wǎng)絡(luò)豐富方便了我們的生活,但是網(wǎng)絡(luò)安全漏洞問(wèn)題同時(shí)會(huì)危及我們的信息、財(cái)產(chǎn)安全,提升網(wǎng)絡(luò)環(huán)境的安全性,創(chuàng)造干凈、安全的網(wǎng)絡(luò)空間,已經(jīng)成為信息化時(shí)代下我們信息工作者的重要任務(wù),解決網(wǎng)絡(luò)安全問(wèn)題刻不容緩。本文首先介紹了計(jì)算機(jī)文本挖掘技術(shù)和網(wǎng)絡(luò)安全問(wèn)題的相關(guān)概念和現(xiàn)狀,其次分析了計(jì)算機(jī)文本挖掘技術(shù)的工作原理,最后闡述了計(jì)算機(jī)文本挖掘技術(shù)在解決網(wǎng)絡(luò)安全問(wèn)題中的應(yīng)用。通過(guò)計(jì)算機(jī)文本挖掘技術(shù),完善計(jì)算機(jī)漏洞自動(dòng)分類(lèi)技術(shù),打造一個(gè)無(wú)垃圾信息的網(wǎng)絡(luò)環(huán)境,大大提升了網(wǎng)絡(luò)空間的安全性。
[關(guān)鍵詞]計(jì)算機(jī)文本挖掘技術(shù);計(jì)算機(jī)漏洞;總動(dòng)分類(lèi)技術(shù);研究
[中圖分類(lèi)號(hào)]TP393.08 [文獻(xiàn)標(biāo)識(shí)碼]A
1 計(jì)算機(jī)漏洞
1.1 計(jì)算機(jī)漏洞的概述
計(jì)算機(jī)漏洞是指在系統(tǒng)設(shè)計(jì)、實(shí)現(xiàn)、維護(hù)或者運(yùn)營(yíng)過(guò)程中造成的可被非授權(quán)人員非法利用的軟硬件缺陷。計(jì)算機(jī)漏洞的出現(xiàn)很容易導(dǎo)致網(wǎng)絡(luò)系統(tǒng)被攻擊,造成各種各樣的網(wǎng)絡(luò)安全事故,是眾多信息安全事故的罪魁禍?zhǔn)?,?jì)算機(jī)漏洞的出現(xiàn)和快速繁殖是由于黑客的盛行,黑客主要是通過(guò)對(duì)網(wǎng)絡(luò)系統(tǒng)的薄弱環(huán)節(jié)進(jìn)行攻擊,攻克系統(tǒng)后會(huì)形成幾個(gè)少量的計(jì)算機(jī)漏洞,然后黑客又通過(guò)這幾個(gè)少量的漏洞之間進(jìn)行相互滲透,達(dá)到通過(guò)非法手段獲得操作權(quán)限的目的,從而逐漸實(shí)現(xiàn)對(duì)目標(biāo)系統(tǒng)的攻陷,非法地對(duì)操作系統(tǒng)進(jìn)行控制,甚至是對(duì)系統(tǒng)目標(biāo)的完整性進(jìn)行破壞。計(jì)算機(jī)漏洞問(wèn)題的出現(xiàn)歷史已經(jīng)較為久遠(yuǎn)了,應(yīng)該說(shuō)是計(jì)算計(jì)漏洞是伴隨著網(wǎng)絡(luò)的出現(xiàn)而產(chǎn)生的,有網(wǎng)絡(luò)的地方不可避免的就會(huì)出現(xiàn)計(jì)算機(jī)漏洞,計(jì)算機(jī)漏洞并不可怕,可怕的沒(méi)有及時(shí)發(fā)現(xiàn)計(jì)算機(jī)漏洞,缺乏對(duì)計(jì)算漏洞的及時(shí)、有效管理,因此,為了防范網(wǎng)絡(luò)風(fēng)險(xiǎn),保護(hù)個(gè)人隱私和財(cái)產(chǎn)安全,及時(shí)防范和及時(shí)補(bǔ)救計(jì)算機(jī)漏洞的工作是不可或缺的。
1.2 解決計(jì)算機(jī)漏洞問(wèn)題的必要性
計(jì)算機(jī)漏洞的出現(xiàn)已經(jīng)是在很久之前了,在過(guò)去的十幾年前,就已經(jīng)發(fā)現(xiàn)計(jì)算機(jī)漏洞的出現(xiàn),一旦漏洞出現(xiàn),在此后的十幾年中會(huì)以極其迅猛的速度發(fā)展,可以說(shuō)計(jì)算機(jī)漏洞問(wèn)題已經(jīng)成了計(jì)算機(jī)用戶(hù)界的災(zāi)難。有具體數(shù)據(jù)指出,截止到今年年底,全世界被公布的漏洞數(shù)量已經(jīng)53526個(gè)。由于計(jì)算機(jī)信息化的發(fā)展程度越來(lái)越深化,用戶(hù)對(duì)計(jì)算機(jī)的智能化、人工化要求的增加,導(dǎo)致計(jì)算機(jī)漏洞發(fā)展更加迅速,據(jù)不完全統(tǒng)計(jì),目前計(jì)算機(jī)漏洞的出現(xiàn)個(gè)數(shù)每天甚至能夠達(dá)到20個(gè)之多。因此,解決計(jì)算機(jī)漏洞問(wèn)題,保護(hù)用戶(hù)信息隱私和財(cái)產(chǎn)安全已經(jīng)成為當(dāng)務(wù)之急。
1.3 計(jì)算機(jī)漏洞處理工作的復(fù)雜性
“紙上得來(lái)終覺(jué)淺,絕知此事要躬行”,計(jì)算機(jī)漏洞補(bǔ)救工作是一項(xiàng)非常艱巨的任務(wù),工作的艱巨性體現(xiàn)在兩個(gè)方面,一是計(jì)算機(jī)漏洞補(bǔ)救工作需要耗費(fèi)大量的人力、物力、財(cái)力,后期的維護(hù)成本也相對(duì)較高,是一項(xiàng)資源消耗量巨大的工作,計(jì)算機(jī)漏洞技術(shù)作為一項(xiàng)高端的網(wǎng)絡(luò)操作技術(shù),對(duì)操作人員的要求非常高,操作人員不僅要有善于及時(shí)發(fā)現(xiàn)計(jì)算機(jī)漏洞的敏銳性,而且還應(yīng)該具有及時(shí)修補(bǔ)漏洞的技術(shù),不具備專(zhuān)業(yè)的網(wǎng)絡(luò)技術(shù),就算已經(jīng)進(jìn)行了修復(fù)措施,還是無(wú)濟(jì)于事,甚至非官方的漏洞補(bǔ)丁還會(huì)增加其他計(jì)算機(jī)漏洞的風(fēng)險(xiǎn),等等。同時(shí),還要求工作人員最好有預(yù)測(cè)漏洞的能力,做到防范風(fēng)險(xiǎn)于未然,定期檢查系統(tǒng)防御較為薄弱的部分,及時(shí)找到安全的官方補(bǔ)丁。另外,在對(duì)網(wǎng)絡(luò)連續(xù)性要求較高的大企業(yè)、公司等等,由于計(jì)算機(jī)漏洞的出現(xiàn)需要進(jìn)行修復(fù),修復(fù)的過(guò)程造成了計(jì)算機(jī)工作的不連續(xù)性,極易導(dǎo)致公司數(shù)據(jù)的丟失或損壞,在修復(fù)階段還會(huì)暫停工作,可見(jiàn)漏洞修補(bǔ)的時(shí)間成本也較為高昂。
1.4 計(jì)算機(jī)漏洞產(chǎn)生的原因
計(jì)算機(jī)漏洞的出現(xiàn)很容易導(dǎo)致網(wǎng)絡(luò)系統(tǒng)被攻擊,造成各種各樣的網(wǎng)絡(luò)安全事故,是眾多信息安全事故的罪魁禍?zhǔn)祝?jì)算機(jī)漏洞的出現(xiàn)和快速繁殖是由于黑客的盛行。為了防范網(wǎng)絡(luò)風(fēng)險(xiǎn),保護(hù)個(gè)人隱私和財(cái)產(chǎn)安全,及時(shí)防范和及時(shí)補(bǔ)救計(jì)算機(jī)漏洞的工作是不可或缺的,因此,為了實(shí)現(xiàn)對(duì)計(jì)算機(jī)漏洞的控制,首先我們來(lái)了解一下計(jì)算機(jī)漏洞產(chǎn)生的原因:
1.4.1 系統(tǒng)復(fù)雜性
首先系統(tǒng)漏洞的誘發(fā)原因最主要的就是系統(tǒng)的復(fù)雜性造成的,由于網(wǎng)絡(luò)系統(tǒng)的復(fù)雜性,造成難以全面地掌控系統(tǒng)安全,極易產(chǎn)生系統(tǒng)的風(fēng)險(xiǎn)性。通過(guò)復(fù)雜的系統(tǒng),計(jì)算機(jī)病毒極易入侵系統(tǒng),造成大規(guī)模的系統(tǒng)漏洞。因此,系統(tǒng)的復(fù)雜性是導(dǎo)致計(jì)算機(jī)漏洞產(chǎn)生的原因之一。
1.4.2 基礎(chǔ)操作系統(tǒng)的設(shè)計(jì)缺陷
操作系統(tǒng)是硬件系統(tǒng)的靈魂,是所有應(yīng)用軟件的基礎(chǔ)環(huán)境,操作系統(tǒng)在計(jì)算機(jī)系統(tǒng)中扮演著重要的角色,因此操作系統(tǒng)的設(shè)計(jì)缺陷極容易造成計(jì)算機(jī)漏洞的出現(xiàn),例如對(duì)操作系統(tǒng)的設(shè)計(jì)有缺陷,會(huì)造成操作系統(tǒng)管理員權(quán)限的失控,當(dāng)系統(tǒng)漏洞出現(xiàn)時(shí),會(huì)出現(xiàn)管理員權(quán)限被非法侵入等一系列的系統(tǒng)漏洞。
1.4.3 用戶(hù)的使用與配置錯(cuò)誤
用戶(hù)的使用也很容易造成系統(tǒng)漏洞的出現(xiàn),如用戶(hù)對(duì)計(jì)算機(jī)系統(tǒng)的陌生,輕易地點(diǎn)擊帶有木馬病毒的陌生鏈接或者是設(shè)置用戶(hù)密碼的內(nèi)容較為簡(jiǎn)單,極易破解,等等,這些缺少防范意識(shí)的操作很容易導(dǎo)致計(jì)算機(jī)漏洞的出現(xiàn)。
1.4.4 常見(jiàn)的代碼
常見(jiàn)的代碼設(shè)計(jì)是最初的漏洞產(chǎn)生的原因以及定義范圍,這一原因同基礎(chǔ)操作系統(tǒng)的設(shè)計(jì)缺陷原因類(lèi)似,都是由于前期的系統(tǒng)設(shè)計(jì)問(wèn)題遺留的隱患,如不能有效地避免這些設(shè)計(jì)缺陷,會(huì)加大后期計(jì)算機(jī)使用過(guò)程中的漏洞出現(xiàn)概率。如在代碼的設(shè)計(jì)時(shí),設(shè)計(jì)過(guò)程較為簡(jiǎn)單,缺少針對(duì)用戶(hù)登錄時(shí)的有效驗(yàn)證:不對(duì)用戶(hù)輸入進(jìn)行全面有效的驗(yàn)證,可能會(huì)被攻擊者利用來(lái)執(zhí)行惡意代碼,最常見(jiàn)的緩沖區(qū)溢出、注入都是利用這一方式。
1.4.5 設(shè)備熟知度
設(shè)備的熟知度也是導(dǎo)致計(jì)算機(jī)漏洞出現(xiàn)幾率較大的一個(gè)因素,由于在系統(tǒng)設(shè)計(jì)過(guò)程中,程序員運(yùn)用了較為簡(jiǎn)單常見(jiàn)的通用代碼或者是軟件,一個(gè)完全陌生的設(shè)備與一個(gè)在日常使用中比較常見(jiàn)的軟件相比,產(chǎn)生計(jì)算機(jī)漏洞的概率較高的一方一目了然,在系統(tǒng)設(shè)計(jì)時(shí),采用簡(jiǎn)單常見(jiàn)的設(shè)備極容易造成系統(tǒng)密碼被破譯,產(chǎn)生系統(tǒng)漏洞的結(jié)果。
有網(wǎng)絡(luò)的地方不可避免的就會(huì)出現(xiàn)計(jì)算機(jī)漏洞,計(jì)算機(jī)漏洞的出現(xiàn)是不可避免的,只要及時(shí)防范和及時(shí)補(bǔ)救計(jì)算機(jī)漏洞的工作到位,就可以規(guī)避風(fēng)險(xiǎn)把損失降到最小。只有充分研究造成計(jì)算機(jī)漏洞的原因,才能從源頭上把握計(jì)算機(jī)漏洞的補(bǔ)救原理,以不變應(yīng)萬(wàn)變。
2 計(jì)算機(jī)文本挖掘技術(shù)的概述
2.1 計(jì)算機(jī)文本挖掘技術(shù)的概念
計(jì)算機(jī)文本挖掘技術(shù)簡(jiǎn)單來(lái)說(shuō)就是對(duì)計(jì)算機(jī)中文本信息的處理,因此,文本挖掘技術(shù)的主要操作對(duì)象即計(jì)算機(jī)中的文本信息,這一技術(shù)在計(jì)算機(jī)的數(shù)據(jù)處理中處于非常重要的位置。詳細(xì)來(lái)說(shuō),計(jì)算機(jī)文本挖掘技術(shù)就是從海量的文本信息中挖掘、識(shí)別有用的信息,是從抽象內(nèi)容提取出具體、可理解信息的過(guò)程,在文本挖掘這個(gè)核心階段中,挖掘結(jié)果最終體現(xiàn)為文本分類(lèi)、文本聚類(lèi)、關(guān)聯(lián)分析、趨勢(shì)預(yù)測(cè)等,其中海量的信息包括各類(lèi)文本信息,如期刊中的文本信息、網(wǎng)頁(yè)中的文本信息、基于文本信息構(gòu)建的數(shù)據(jù)庫(kù),等等。這些文本信息應(yīng)該在計(jì)算機(jī)執(zhí)行文本挖掘技術(shù)之前進(jìn)行人工處理,如對(duì)文本信息的去噪處理、分詞處理、停詞處理、特征表示、特征提取等等,這樣在執(zhí)行文本挖掘技術(shù)時(shí),會(huì)降低處理難度,提升處理的準(zhǔn)確性和效率。
2.2 計(jì)算機(jī)文本挖掘技術(shù)的重要意義
通過(guò)計(jì)算機(jī)文本挖掘技術(shù),挖掘網(wǎng)絡(luò)中有價(jià)值、安全的信息,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)信息垃圾的分類(lèi)并攔截,打造一個(gè)無(wú)垃圾信息的網(wǎng)絡(luò)環(huán)境,大大提升了網(wǎng)絡(luò)空間的安全性。
3 基于文本挖掘的計(jì)算機(jī)漏洞自動(dòng)分類(lèi)技術(shù)
3.1 RISOS分類(lèi)法
該種分類(lèi)方法主要是從漏洞產(chǎn)生,是從攻擊的角度進(jìn)行的漏洞分類(lèi),出現(xiàn)的年代已經(jīng)較為久遠(yuǎn),無(wú)法識(shí)別到最近出現(xiàn)的一些較為新型的計(jì)算機(jī)漏洞,對(duì)于后面出現(xiàn)的新類(lèi)型的漏洞已經(jīng)不適用于此種分類(lèi)方法了,屬于較為傳統(tǒng)的計(jì)算機(jī)漏洞自動(dòng)分類(lèi)技術(shù)。
3.2 PA分類(lèi)法
該分類(lèi)法是由美國(guó)提出的,該種分類(lèi)方法是對(duì)傳統(tǒng)的、僅包含操作系統(tǒng)漏洞的分類(lèi)法的改進(jìn)和綜合,是在原有的傳統(tǒng)分類(lèi)法基礎(chǔ)上又加入了對(duì)操作系統(tǒng)中應(yīng)用程序漏洞的分類(lèi),改進(jìn)后的分類(lèi)法按照漏洞產(chǎn)生的原因?qū)⒙┒捶譃樗念?lèi):域名錯(cuò)誤、校驗(yàn)錯(cuò)誤、命名錯(cuò)誤、串行化錯(cuò)誤。
3.3 SIAM分類(lèi)法
第三種分類(lèi)方法較之前兩種都比較先進(jìn),出現(xiàn)的時(shí)間相對(duì)較晚,該分類(lèi)方法主要是對(duì)平臺(tái)上軟件執(zhí)行級(jí)漏洞的詳細(xì)信息進(jìn)行歸納和分類(lèi)。其優(yōu)點(diǎn)顯而易見(jiàn)就是適用對(duì)象更加廣泛,適用面更加寬廣,但缺點(diǎn)是仍屬于一種較為初級(jí)的分類(lèi)方法,不涉及高層軟件設(shè)計(jì)相關(guān)的漏洞和缺陷,應(yīng)用面還停留在初級(jí)平臺(tái)上。
3.4 venter分類(lèi)法
該種分類(lèi)方法共包含個(gè)不同的類(lèi)別:密碼破解與嗅探、網(wǎng)絡(luò)系統(tǒng)信息收集、后門(mén)、特洛伊木馬與遠(yuǎn)程控制、遠(yuǎn)程連接與服務(wù)的非授權(quán)訪(fǎng)問(wèn)、用戶(hù)權(quán)限提升、電子欺騙與冒充、配置錯(cuò)誤、拒絕服務(wù)與緩沖區(qū)溢出、病毒與蠕蟲(chóng)、硬件細(xì)節(jié)、軟件細(xì)節(jié)與升級(jí)以及安全政策違反。
3.5 Anday Gray分類(lèi)法
該分類(lèi)方法是在吸取前人工作成果的基礎(chǔ)上提出的,包括十個(gè)類(lèi)別的漏洞分類(lèi)體系,在分類(lèi)過(guò)程中考慮了漏洞起源、引入時(shí)間、位置、執(zhí)行環(huán)境、質(zhì)量影響、發(fā)現(xiàn)方法、滲透場(chǎng)景、修復(fù)步驟等因素。該分類(lèi)法的優(yōu)點(diǎn)在于其具體實(shí)現(xiàn)為了滿(mǎn)足不同的人在不同的環(huán)境下的分類(lèi)要求,會(huì)針對(duì)不同的漏洞分析需求而改變。
3.6 Eric Knight分類(lèi)法
該分類(lèi)方法首次提出從軟件設(shè)計(jì)、協(xié)議實(shí)現(xiàn)、系統(tǒng)脆弱性和人為因素等多個(gè)方面對(duì)系統(tǒng)安全漏洞進(jìn)行分類(lèi)和評(píng)估,改變了傳統(tǒng)漏洞分類(lèi)方法僅僅考慮某一單一因素的思路,大大增加了分類(lèi)方法的涵蓋范圍,使得大部分漏洞都可以在這個(gè)分類(lèi)機(jī)制下進(jìn)行分類(lèi),對(duì)每個(gè)類(lèi)別之間的區(qū)別進(jìn)行了詳細(xì)的定義,因此在實(shí)際應(yīng)用具有較大的意義。
隨著經(jīng)濟(jì)的發(fā)展和社會(huì)的進(jìn)步,人類(lèi)已步入信息社會(huì)時(shí)代,計(jì)算機(jī)廣泛地應(yīng)用于人們生活的各個(gè)方面。為了適應(yīng)現(xiàn)代網(wǎng)絡(luò)安全問(wèn)題的要求,計(jì)算機(jī)文本挖掘技術(shù)的掌握工作顯得尤為重要。計(jì)算機(jī)漏洞的出現(xiàn)是導(dǎo)致網(wǎng)絡(luò)安全問(wèn)題的首要原因,通過(guò)對(duì)漏洞的自動(dòng)分類(lèi)技術(shù)研究,一方面可以維護(hù)網(wǎng)絡(luò)環(huán)境的安全穩(wěn)定,另一方面可以有效打擊網(wǎng)絡(luò)犯罪,保護(hù)人民的個(gè)人隱私和財(cái)產(chǎn)的安全。因此,應(yīng)將基于文本挖掘的計(jì)算機(jī)漏洞自動(dòng)分類(lèi)技術(shù)作為首要任務(wù),通過(guò)計(jì)算機(jī)漏洞自動(dòng)分類(lèi)技術(shù),大大提升網(wǎng)絡(luò)空間的安全性。
[參考文獻(xiàn)]
[1] 文翰.面向信息檢索的 Web 文本挖掘方法研究[D].廣州:華南理工大學(xué),2012.
[2] 劉智勇.基于云計(jì)算的文本挖掘算法研究[D].成都:電子科技大學(xué),2011.
[3] 范并思.社會(huì)科學(xué)信息分析中的文本挖掘[J].圖書(shū)情報(bào)工作,2012(08).
[4] 周雪忠,吳朝暉.文本知識(shí)發(fā)現(xiàn):基于信息抽取的文本挖掘[J].計(jì)算機(jī)科學(xué),2003(01).
[5] 鄭雙怡.文本挖掘及其在知識(shí)管理中的應(yīng)用[J].中南民族大學(xué)學(xué)報(bào),2005(04).
[6] 韓客松,王永成.文本挖掘、數(shù)據(jù)挖掘和知識(shí)管理——二十一世紀(jì)的智能信息處理[J].情報(bào)學(xué)報(bào),2001(01).