隆文超 湖南司法警官職業(yè)學院
大數(shù)據(jù)挖掘下的網(wǎng)絡安全預警,是一個新的概念,是指將一些零散的、不能形成系統(tǒng)的網(wǎng)絡數(shù)據(jù)和信息安全系統(tǒng)進行有效的融合,形成數(shù)據(jù)共享體系,通過智能算法分析數(shù)據(jù)量化后存在的網(wǎng)絡應用工具和系統(tǒng)的漏洞和潛在風險,給網(wǎng)絡安全提供事前預防。
(一)網(wǎng)絡安全管理問題。隨著大數(shù)據(jù)技術的發(fā)展,互聯(lián)網(wǎng)的普及,“網(wǎng)警”這一網(wǎng)絡安全管理職業(yè)由此誕生。網(wǎng)警的出現(xiàn),在一定程度上對網(wǎng)絡安全的管理起到了一定的作用,通過對網(wǎng)絡違法犯罪活動的打擊,凈化了網(wǎng)絡環(huán)境,給網(wǎng)民一個安全的上網(wǎng)環(huán)境。但是由于很多企業(yè)和單位對網(wǎng)絡管理工作不太重視,缺乏一定的網(wǎng)絡管理制度,企業(yè)內(nèi)部人員缺乏安全使用計算機網(wǎng)絡的意識,導致很多網(wǎng)絡黑客對企業(yè)的公共網(wǎng)絡進行攻擊和信息竊取,企業(yè)卻難以追究責任。由于對計算機網(wǎng)絡缺乏相應的系統(tǒng)化管理,很多網(wǎng)絡安全問題得不到切實的解決。
(二)個人信息的保護。在大數(shù)據(jù)時代,個人信息安全面臨三大問題:
1.公民個人信息遭泄露。以訂票網(wǎng)站泄露公民隱私,導致黑客撞庫事例為典型,大數(shù)據(jù)環(huán)境下,公民的姓名、身份證號、手機號等信息遭泄露,很多黑客利用“撞庫”獲取用戶密碼,獲得非法牟利。
2.個人網(wǎng)絡消費信息安全面臨危機。大數(shù)據(jù)時代,人們在利用微信、淘寶進行支付,用微博進行轉發(fā)的過程中,個人信息被商家用大數(shù)據(jù)分析工具截獲。大數(shù)據(jù)時代,每個人都是數(shù)據(jù)的貢獻者,在貢獻數(shù)據(jù)過程中,個人信息的網(wǎng)絡安全面臨著威脅。
3.個人信息遭濫用。在大數(shù)據(jù)信息的收集過程中,有很多未經(jīng)授權的個人信息被濫用,還有的個人信息數(shù)據(jù)經(jīng)過企業(yè)合法收集之后,用于一些非法用途,還有的是黑客轉賣給第三家。
(三)系統(tǒng)面臨的安全問題
1.大數(shù)據(jù)平臺依托于互聯(lián)網(wǎng)面向政府和社會大眾服務,網(wǎng)絡基礎設施和軟硬件系統(tǒng)受制于人,企業(yè)系統(tǒng)管理具有不可控因素。
2.網(wǎng)站應用漏洞百出,這是大數(shù)據(jù)環(huán)境下,企業(yè)系統(tǒng)平臺面臨的最大威脅之一,雖然有些企業(yè)采用了第三方數(shù)據(jù)庫或者中間件,但是系統(tǒng)的穩(wěn)定性不容樂觀,還是存在運行風險和漏洞。
3.黑客利用終端惡意軟件、代碼攻擊大數(shù)據(jù)平臺、竊取企業(yè)重要數(shù)據(jù)。隨著網(wǎng)絡攻擊的方式越來越先進,企業(yè)的軟硬件系統(tǒng)不夠強大,雖然一些網(wǎng)絡防火墻和殺毒軟件起到了防護作用,但是在企業(yè)互聯(lián)網(wǎng)系統(tǒng)運行當中,還是會產(chǎn)生很多漏洞和安全問題。
(一)大數(shù)據(jù)時代網(wǎng)絡安全及時性的需要。大數(shù)據(jù)挖掘的網(wǎng)絡安全預警,通過各種算法構建一個自動化網(wǎng)絡安全預警模式,可以有效的提高網(wǎng)絡安全應急系統(tǒng)的及時性,降低網(wǎng)絡應用系統(tǒng)遭受攻擊、篡改、木馬等安全問題,不斷提升網(wǎng)絡安全能力。
(二)大數(shù)據(jù)時代網(wǎng)絡安全主動防御的需要。網(wǎng)絡安全預警以主動防御為主要特征,其主要功能包括:網(wǎng)絡數(shù)據(jù)采集、網(wǎng)絡事件和行為評測、網(wǎng)絡異常數(shù)據(jù)檢測、網(wǎng)絡協(xié)議分析和網(wǎng)絡內(nèi)容檢測等。通過對網(wǎng)絡數(shù)據(jù)的收集,可以實時分析數(shù)據(jù)設備運行中的日志數(shù)據(jù)和網(wǎng)絡數(shù)據(jù)。利用大數(shù)據(jù)發(fā)掘技術對網(wǎng)絡數(shù)據(jù)、行為、協(xié)議等進行分析,檢測網(wǎng)絡中是否存在異?;蛘邼撛陲L險,并將其反饋到安全防御系統(tǒng)。
(三)大數(shù)據(jù)時代網(wǎng)絡提高安全管理的效率的需要。隨著信息系統(tǒng)大集中模式的不斷發(fā)展,網(wǎng)絡信息環(huán)境變得越來越復雜,隨著網(wǎng)絡數(shù)據(jù)輸出的規(guī)模越來越大,網(wǎng)絡安全問題也受到更多的重視。網(wǎng)絡信息在運行和傳播過程中產(chǎn)生大量的安全問題。針對這些龐大的數(shù)據(jù)問題,網(wǎng)絡管理員顯得束手無策,不能及時發(fā)現(xiàn)安全隱患,降低了網(wǎng)絡信息安全的工作效率。在這種情況下,急需一種有效的自動化網(wǎng)絡管理模式,來提高網(wǎng)絡安全管理工作的效率。
基于網(wǎng)絡安全預警模式分析數(shù)據(jù)量龐大的特點,人工分析模式不能滿足其實時性和快速性的需求,利用大數(shù)據(jù)挖掘技術,通過遺傳神經(jīng)網(wǎng)絡的算法,實現(xiàn)數(shù)據(jù)分析的自動化和智能化,能夠很好地節(jié)省人工成本,節(jié)約時間,快速的從海量的網(wǎng)絡數(shù)據(jù)中提取異常數(shù)據(jù),并進行風險評測,對網(wǎng)絡數(shù)據(jù)中存在的安全問題提前預警。
(一)通過系統(tǒng)自動采集網(wǎng)絡數(shù)據(jù),包括應用數(shù)據(jù)、系統(tǒng)數(shù)據(jù)、網(wǎng)絡設備數(shù)據(jù)等。通過將這些數(shù)據(jù)進行分類存儲和集中管理,整合分布式系統(tǒng)、關系數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)庫集群等,建立混合型數(shù)據(jù)庫,實現(xiàn)對結構化、半結構化、非結構化的數(shù)據(jù)的存儲;
(二)根據(jù)遺傳神經(jīng)系統(tǒng)的特點,對采集和存儲的數(shù)據(jù)建模,目的是將這些網(wǎng)絡數(shù)據(jù)包轉換為能夠被神經(jīng)系統(tǒng)識別的數(shù)據(jù)向量。初始化遺傳神將網(wǎng)絡的訓練樣本、期望輸出、算法、訓練次數(shù)等;
(三)根據(jù)已知的、達到理想狀態(tài)的數(shù)據(jù)訓練神經(jīng)網(wǎng)絡。首先,對網(wǎng)絡實行離線訓練,對存儲在數(shù)據(jù)庫中的數(shù)據(jù)進行反復的挖掘、計算,實現(xiàn)重復利用,這樣能夠獲取較好的訓練效果,保證訓練結果的可靠性和實用性,進而將其應用到網(wǎng)絡安全預警系統(tǒng)中。遺傳神經(jīng)網(wǎng)絡系統(tǒng)過程是學習的過程,通過特定的學習樣本庫和期望輸出數(shù)據(jù),為遺傳神經(jīng)網(wǎng)絡節(jié)點輸入數(shù)據(jù),學習樣本的選擇要滿足以下特點:一是要包括正常的網(wǎng)絡數(shù)據(jù);一是要含有典型的帶有攻擊行為特征的典型樣本數(shù)據(jù)。BP 神經(jīng)網(wǎng)絡訓練完成之后,將輸出結果和期望結果進行比對,如果輸出結果大于期望值,就要再重復學習過程,指導輸出結果小于期望值以后,才符合網(wǎng)絡安全預警系統(tǒng)模式的要求;
(四)遺傳神經(jīng)系統(tǒng)網(wǎng)絡訓練結束以后,就可以用權值的形式保存起來了。可以將其用于對網(wǎng)絡數(shù)據(jù)的檢測,通過在大數(shù)據(jù)環(huán)境下對網(wǎng)絡數(shù)據(jù)進行檢測,遺傳神經(jīng)系統(tǒng)充分發(fā)揮它檢測數(shù)據(jù)的優(yōu)勢,快速的完成數(shù)據(jù)檢測以后,將處理結果保存到數(shù)據(jù)庫中;
(五)更新遺傳神經(jīng)網(wǎng)絡算法,具體要重復執(zhí)行(三)和(四)步驟的操作,進化神經(jīng)網(wǎng)絡算法,進行更準確、及時的網(wǎng)絡安全數(shù)據(jù)分析;
(六)網(wǎng)絡安全響應。在系統(tǒng)發(fā)現(xiàn)網(wǎng)絡中的攻擊行為之后,會將其反饋給網(wǎng)絡安全防御系統(tǒng),對網(wǎng)絡中的不安全因素進行排除,保證網(wǎng)絡安全的正常運行。
綜上所述,大數(shù)據(jù)環(huán)境下的網(wǎng)絡安全形勢越來越嚴峻,通過遺傳神將網(wǎng)絡這種大數(shù)據(jù)分析技術的應用,可以在訓練之后形成網(wǎng)絡安全預警模型,及時發(fā)現(xiàn)網(wǎng)絡數(shù)據(jù)中潛在的危險,并反饋給安全防御系統(tǒng),不斷提高網(wǎng)絡安全。