張玎一 蘇其剛
摘要:隨著當(dāng)代信息技術(shù)的飛速發(fā)展,互聯(lián)網(wǎng)的應(yīng)用越來越普遍,而以網(wǎng)絡(luò)作為媒介傳遞的信息產(chǎn)出量和需求量都呈爆炸式增長(zhǎng)趨勢(shì),21世紀(jì)逐步邁入大數(shù)據(jù)時(shí)代,海量的數(shù)據(jù)信息成為極具價(jià)值的財(cái)富,由此可見,針對(duì)網(wǎng)絡(luò)信息的安全防范極為必要,此時(shí)Web數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,它將數(shù)據(jù)挖掘與Web進(jìn)行結(jié)合,是一種更新更具優(yōu)勢(shì)的技術(shù),本文從信息安全防范的角度出發(fā),以Web數(shù)據(jù)挖掘技術(shù)為中心,對(duì)兩者的整合進(jìn)行深入探討。
關(guān)鍵詞:安全防范;信息技術(shù);網(wǎng)絡(luò)安全;Web數(shù)據(jù)挖掘
中圖分類號(hào):TP311.13;TP393.08 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2019)03-0205-02
互聯(lián)網(wǎng)已然滲透到各行各業(yè),網(wǎng)絡(luò)信息技術(shù)應(yīng)用需求量增大的同時(shí),各種網(wǎng)絡(luò)安全問題也層出不窮,導(dǎo)致以其作為容器進(jìn)行傳播的數(shù)據(jù)信息時(shí)刻面臨各種危險(xiǎn),使得人們?cè)谑褂镁W(wǎng)絡(luò)時(shí)不得不考慮其安全性,鑒于此,如何利用好Web數(shù)據(jù)挖掘技術(shù)對(duì)網(wǎng)絡(luò)信息進(jìn)行安全防范成為當(dāng)今時(shí)代迫切需要思考的問題[1]。
1 網(wǎng)絡(luò)信息安全
信息安全是為建立安全的信息防護(hù)系統(tǒng)而采取的一系列科學(xué)技術(shù)和有效的管理措施,而網(wǎng)絡(luò)信息安全則是基于網(wǎng)絡(luò)的信息保護(hù)技術(shù),它保證了大量數(shù)據(jù)信息的私密性、可靠性、可用性。在當(dāng)今信息時(shí)代,保護(hù)信息的安全性無疑是必要的,它保證了信息交流過程的正常進(jìn)行。
1.1 網(wǎng)絡(luò)信息安全的內(nèi)容
網(wǎng)絡(luò)信息安全包括軟、硬件安全,服務(wù)運(yùn)行安全、數(shù)據(jù)安全等等。硬件安全指保護(hù)構(gòu)成網(wǎng)絡(luò)環(huán)境的硬件不受損壞,硬件的正常運(yùn)行是健康網(wǎng)絡(luò)環(huán)境構(gòu)建的基礎(chǔ),軟件安全則是保護(hù)計(jì)算機(jī)或網(wǎng)絡(luò)中運(yùn)行的軟件不被惡意篡改、刪除或是利用,從而保證網(wǎng)絡(luò)環(huán)境的可靠性,其中,數(shù)據(jù)安全尤為重要,數(shù)據(jù)安全的本質(zhì)即保證以網(wǎng)絡(luò)作為媒介流通于其中的數(shù)據(jù)信息的安全[2]。
1.2 網(wǎng)絡(luò)信息安全的目標(biāo)
網(wǎng)絡(luò)信息安全的目標(biāo)通常強(qiáng)調(diào)保密性、完整性、可用性,即CIA三元組的目標(biāo) ,它遵循信息技術(shù)安全評(píng)估標(biāo)準(zhǔn),同時(shí)也是信息安全的基本元素和建設(shè)安全網(wǎng)絡(luò)環(huán)境所應(yīng)遵循的基本原則。保密性:確保數(shù)據(jù)在傳遞、使用或是存儲(chǔ)過程中只接受針對(duì)授權(quán)用戶的開放式傳遞,而對(duì)非授權(quán)用戶不可見。完整性:保證數(shù)據(jù)在傳遞過程中的時(shí)刻一致性,不會(huì)因?yàn)楦鞣N外界不確定因素而丟失、變更或被非授權(quán)用戶篡改等等??捎眯裕横槍?duì)于授權(quán)用戶,信息始終具有能夠被使用的性質(zhì)而不會(huì)被異常拒絕。
2 Web數(shù)據(jù)挖掘的技術(shù)方法
2.1 關(guān)聯(lián)規(guī)則
數(shù)據(jù)挖掘的基礎(chǔ)算法—關(guān)聯(lián)規(guī)則,常被用來作用于交易數(shù)據(jù)、關(guān)系數(shù)據(jù)的深入分析,利用該算法規(guī)則去發(fā)掘數(shù)據(jù)的有機(jī)集合體中所隱含的規(guī)律。
主要來說利用關(guān)聯(lián)規(guī)則挖掘數(shù)據(jù)分為兩步,首先搜尋出數(shù)據(jù)庫中的大于其他事務(wù)支持度的數(shù)據(jù)頻繁集,而后從這些頻繁集中生成所需要的關(guān)聯(lián)規(guī)則,再通過與最小置信度以及最小支持度的比較得出強(qiáng)關(guān)聯(lián)規(guī)則。
2.2 聚類分析
顧名思義,聚類分析就是聚合了含有相似或者差異性的數(shù)據(jù)組合,將一組數(shù)據(jù)集對(duì)象進(jìn)行劃分,具有相似性質(zhì)的劃分到同一簇下,則不同簇之間的數(shù)據(jù)對(duì)象具有差異性,相同簇之間的數(shù)據(jù)對(duì)象具有較大的相似性。
這樣的分類過程簡(jiǎn)化了數(shù)據(jù)的結(jié)構(gòu),明晰了繁雜的數(shù)據(jù)之間潛藏的規(guī)律,使得數(shù)據(jù)的觀察者能夠更好地從這些有序集合中較快分析出規(guī)律,簡(jiǎn)化了分析數(shù)據(jù)的過程和步驟,同時(shí)使得數(shù)據(jù)分析結(jié)果的有效性提高[3]。
2.3 異類分析
異類分析又稱孤立點(diǎn)分析,該方法主要針對(duì)于相較主體數(shù)據(jù)存在明顯偏差的數(shù)據(jù),他們無法被歸集,也無法被分類,但他們的存在又具有一定的分析價(jià)值,我們把針對(duì)于這類數(shù)據(jù)的挖掘和分析稱為孤立點(diǎn)分析,通過實(shí)踐表明,孤立點(diǎn)分析技術(shù)充分利用和挖掘了數(shù)據(jù)的價(jià)值,其中的信息價(jià)值還可應(yīng)用于網(wǎng)絡(luò)信息安全管理,并且已經(jīng)取得了一定的成效。
2.4 路徑分析
路徑分析是常用的Web數(shù)據(jù)挖掘方法之一,它的原理是對(duì)Web資源進(jìn)行探查,得出其中最頻繁訪問的路徑,路徑分析屬于Web數(shù)據(jù)挖掘技術(shù)中的內(nèi)容挖掘,也就是對(duì)挖掘出的路徑內(nèi)容進(jìn)行分析,根據(jù)一系列變量的數(shù)據(jù)得出其中的聯(lián)系,例如,支付寶第五代智能風(fēng)控系統(tǒng)“Alpharisk”,運(yùn)用路徑分析這一Web數(shù)據(jù)挖掘方法,對(duì)用戶的Web資源進(jìn)行分析,提前識(shí)別或判斷用戶支付過程中的風(fēng)險(xiǎn),提升了該系統(tǒng)的風(fēng)險(xiǎn)識(shí)別能力,降低了用戶信息數(shù)據(jù)受損的可能性[4]。
3 網(wǎng)絡(luò)信息安全防范模型的應(yīng)用
網(wǎng)絡(luò)信息安全防范模型的建立是以明確網(wǎng)絡(luò)信息安全為目標(biāo),Web挖掘技術(shù)為主體,而建立的特定的數(shù)據(jù)模型[5]。
防范模型的應(yīng)用首先是圍繞信息安全防范為主要目標(biāo)收集數(shù)據(jù)源,數(shù)據(jù)源主要來自Web服務(wù)器數(shù)據(jù)、用戶錄入信息、代理服務(wù)器數(shù)據(jù)、業(yè)務(wù)操作往來數(shù)據(jù)等等,數(shù)據(jù)挖掘的過程和結(jié)果將取決于這些資源,數(shù)據(jù)源的收集完成后,針對(duì)數(shù)據(jù)源對(duì)數(shù)據(jù)進(jìn)行分類、整合、挖掘,將數(shù)據(jù)轉(zhuǎn)化為適合安全防范模型的數(shù)據(jù)內(nèi)容及格式,而后建立規(guī)則庫,用于存儲(chǔ)信息系統(tǒng)風(fēng)險(xiǎn)特征或是網(wǎng)絡(luò)信息安全威脅連接特征一類的規(guī)則集,往后模型的建立需要依賴于這些規(guī)則集的產(chǎn)生,同時(shí)網(wǎng)絡(luò)信息安全防范所用到的數(shù)據(jù)挖掘模型需要以合適的數(shù)據(jù)挖掘方法作為支持,利用數(shù)據(jù)挖掘方法各異的特性對(duì)數(shù)據(jù)進(jìn)行選擇分析,從數(shù)據(jù)源中提取出有價(jià)值的數(shù)據(jù)或是信息,最后結(jié)合防范模型調(diào)整數(shù)據(jù)挖掘模型,最大限度的保證數(shù)據(jù)結(jié)果的可用性和可靠性,最后將數(shù)據(jù)挖掘的有效結(jié)果與規(guī)則集進(jìn)行智能匹配生成最終的網(wǎng)絡(luò)信息安全防范模型,作用于網(wǎng)絡(luò)信息安全的防護(hù)。
4 結(jié)語
綜上所述,將網(wǎng)絡(luò)信息安全防范與Web數(shù)據(jù)挖掘技術(shù)進(jìn)行整合是很有必要的,它有效解決了網(wǎng)絡(luò)信息安全問題,保證了網(wǎng)絡(luò)信息傳遞過程的連續(xù)性、可靠性、安全性,使得網(wǎng)絡(luò)生態(tài)環(huán)境更為優(yōu)良,有利于網(wǎng)絡(luò)技術(shù)的可持續(xù)發(fā)展,從而為這個(gè)時(shí)代的廣大使用者帶去更多便利,為信息技術(shù)的進(jìn)一步發(fā)展添磚加瓦。
參考文獻(xiàn)
[1] 鄭卓遠(yuǎn),周婭.數(shù)據(jù)挖掘?qū)π畔踩挠绊慬J].現(xiàn)代計(jì)算機(jī),2018(09):40-41.
[2] 涂乘勝,魯羽明,陸玉昌.Web數(shù)據(jù)挖掘研究綜述[J].計(jì)算機(jī)工程與應(yīng)用,2017(17):161-163.
[3] 柴文光,周寧.網(wǎng)絡(luò)信息安全防范與Web數(shù)據(jù)挖掘技術(shù)的整合研究[J].情報(bào)理論與實(shí)踐,2018(03):97-99.
[4] 丘世杰.基于網(wǎng)絡(luò)信息安全防范與Web數(shù)據(jù)挖掘技術(shù)整合的研究[J].中國(guó)城市金融,2017(15):133-1.
[5] 閻真希.整合Web數(shù)據(jù)挖掘技術(shù)與網(wǎng)絡(luò)信息安全防范技術(shù)的相關(guān)分析[J].金融發(fā)展評(píng)論,2017(04):145-158.
Integration of Network Information Technology
Security Prevention and Web Data Mining Technology
ZHANG Ding-yi,SU Qi-gang
(Yunnan Power Grid Co LtdLincang Power Supply Bureau Lincang, Lincang Yunnan 677000)
Abstract:With the rapid development of modern information technology, the application of the Internet is becoming more and more popular, and the output and demand of information transmitted by the network as a medium are increasing explosively. In the 21st century, a large amount of data information has gradually entered the era of big data, and become a valuable wealth. Thus, it can be seen that the security of network information is extremely necessary. At this time, Web data mining is essential. Mining technology emerges as the times require. It combines data mining with Web. It is a newer and more advantageous technology. From the perspective of information security, this paper takes Web data mining technology as the center, and discusses the integration of the two.
Key words:security prevention; information technology; network security; Web data mining