馮曉輝
【摘要】當前網(wǎng)絡(luò)技術(shù)的發(fā)展使得人們的可以通過電子郵件的形式進行交流,這也給人們的交流和溝通,但是在給人們的溝通和交流提供方便的同時也造成了一定的困擾,其中垃圾郵件就是一個非常常見的現(xiàn)象,而當前針對垃圾郵件也已經(jīng)有了一些識別技術(shù)。本文主要分析了基于行為識別的反垃圾郵件技術(shù),以供參考和借鑒。
【關(guān)鍵詞】行為識別;反垃圾郵件技術(shù);探討
計算機是當前辦公過程中非常常見的一種設(shè)備,同時電子郵件也逐漸成為人們工作生活中的一個重要的工具,它也成為了人們交流和溝通的載體,它給人們創(chuàng)造了一定的便利,同時它也給人們帶來了一些煩惱,煩惱的主要來源就是垃圾郵件,而以行為識別為基礎(chǔ)為基礎(chǔ)的反垃圾郵件技術(shù)就成了當前比較重要的一項技術(shù),其應(yīng)用也越來越廣泛。
1、垃圾郵件概述
1.1垃圾郵件的概念
Spam就是將內(nèi)容完全相同的電子郵件在沒有收到收信人同意的情況下就轉(zhuǎn)發(fā)給很多人,這些郵件內(nèi)容很多都是沒有實際用途的商業(yè)廣告,因為在一段時間之內(nèi)轉(zhuǎn)發(fā)了大量的郵件,系統(tǒng)本身就必須要承受非常大的負擔,同時收信人還需要在收這些垃圾郵件的時候支付相應(yīng)的費用。
通?;ヂ?lián)網(wǎng)上的垃圾郵件主要分成兩個大類,一個是合法的市場營銷類商業(yè)信函,這樣的郵件內(nèi)容并不涉及非法問題,我們要做的就是要對其進行統(tǒng)一的規(guī)范,這樣就可以很好的對其行為進行限制和束縛。另外一種是真正的垃圾郵件,這類郵件也被一些人叫做流氓郵件,所以發(fā)送這種郵件的人就叫做是違法人員或者是犯罪分子,這些郵件當中充斥著反社會、煩人輪、甚至是色情暴力活動等。
1.2垃圾郵件的危害
發(fā)送垃圾郵件的成本是非常低廉的,一般都是通過多種方式進行群發(fā)或者是轉(zhuǎn)發(fā),但是對E-mail運營商和使用用戶而言,卻會造成非常大的損失,其危害主要體現(xiàn)在以下幾個方面。
首先是垃圾郵件會隊互聯(lián)網(wǎng)的健康發(fā)展起到嚴重的抑制作用。網(wǎng)絡(luò)資源是相對有限的,如果網(wǎng)絡(luò)資源上分布著大量的垃圾郵件的時候,網(wǎng)絡(luò)的使用效率就受到了非常不利的影響。而對于郵件的服務(wù)器而言也如果收到了大量的垃圾郵件會占用服務(wù)器的大量空間,如果垃圾郵件得不到有效的控制,用戶就會停止使用該郵箱,這樣也就迫使服務(wù)的提供商必須要停止所有的服務(wù)項目,這樣一來,企業(yè)不僅失去了大量的經(jīng)濟收益,同時也會在一定程度上影響到企業(yè)的社會效益。
其次是垃圾郵件影響到了用戶自身的利益、如果網(wǎng)絡(luò)用戶每一天都要花費大量的時間去刪除垃圾郵件,其有效使用的時間就會相應(yīng)的減少,同時也嚴重影響到了人們正常的工作和生活。時間是非常寶貴的,所以浪費時間是十分不明智的,相關(guān)調(diào)查顯示,網(wǎng)民們每天都需要花7分鐘的時間對垃圾郵件進行處理,下載垃圾郵件所花費的費用就已經(jīng)超過了94億美元。
最后是垃圾郵件污染了社會環(huán)境。一些垃圾郵件內(nèi)容充斥著色情和暴力等各種不利于社會和諧的信息,這樣一來,社會環(huán)境就會變得更加的混亂。黑客們在使用電子郵件系統(tǒng)發(fā)送很多的垃圾郵件的時候會對攻擊的目標進行破壞,這樣也使得其逐漸處于癱瘓的狀態(tài),此外,它還能夠成為傳播病毒的一個非常重要的途徑和載體。
2、基于行為識別的反垃圾郵件技術(shù)
2.1反垃圾郵件技術(shù)現(xiàn)狀
當前比較主流的反垃圾郵件產(chǎn)品所采用的技術(shù)是過濾技術(shù),這些技術(shù)在當前還是存在著一定的局限,同時在應(yīng)用的過程中還是使用獨立性過強的詞語對其進行匹配,這樣也使得語言的重要特征—連貫性受到了非常明顯的破壞,這樣也就無法對郵件的內(nèi)容和類別進行判斷,所以也出現(xiàn)了很多的失誤。此外這些技術(shù)還是需要很多的匹配運算,其對CPU和內(nèi)存的影響非常大,所以這也使得處理更加的困難,通過技術(shù)人員的分析和計算,對模型也進行了一定的歸納和總結(jié)。行為模式當中包含了很多的因素,這樣就可以根據(jù)這些因素對郵件是否為垃圾郵件進行判別,不用對郵件所有的內(nèi)容進行三秒,這樣就使得郵件判別的效率得到了顯著的提升,此外也使得整個過程的準確性有了十分顯著的提高。
2.2反垃圾郵件行為的技術(shù)原理
SMTP可以有效的對網(wǎng)上的處理機之間的電子郵件進行傳輸,但是整個協(xié)議請求的關(guān)鍵字等都是可以通過一定的手段進行偽造,他們通??梢酝ㄟ^非法的形式傳遞一些垃圾郵件,這種行為和正常發(fā)送郵件的行為是有著明顯的差異的。垃圾郵件行為模式識別模型在理論上有著較高的區(qū)分性,在實際的的分析中也有一定的道理。所以針對這樣的情況,我們完全可以通過一定的方法對正常的郵件和垃圾郵件進行有效的辨別,這樣就可以在垃圾郵件發(fā)送之前就對異常郵件形式發(fā)送拒收請求,這樣也就使得郵件一直都能處在可以控制的狀態(tài)當中,防止了垃圾郵件對網(wǎng)絡(luò)環(huán)境的影響,使得網(wǎng)絡(luò)郵件無法鉆孔子,這樣也就形成了反垃圾郵件的模型。
2.3反垃圾郵件系統(tǒng)模塊的需求
1)實時性:分類器模塊在對郵件處理時,應(yīng)采取較為高效的算法,盡量使對郵件處理的時延足夠小,而不至于出現(xiàn)郵件傳輸瓶頸,影響郵件系統(tǒng)的使用和功能的減弱。
2)正確率:這是郵件分類器最重要的衡量標準,主要體現(xiàn)在正確分類率和錯誤分類率。正確分類率是指把正常的郵件歸類到正常郵件,Spam歸類到Spam情況時占整個判別郵件總數(shù)的比率。而錯誤分類率則是指把正常的郵件歸類到Spam,Spam歸類到正常郵件情況時占整個判別郵件總數(shù)的比率。然而,把少量的Spam歸類到正常郵件是可接受的,把正常郵件歸類到Spam則是不容許的。
3)易用性:該模塊應(yīng)用在系統(tǒng)中時安裝、配置、維護應(yīng)該簡單方便,具有良好的擴展接口。
4)可擴展性:當系統(tǒng)要求增加分類功能時,如對真?zhèn)蔚腗AC判斷時,該模塊能添加相關(guān)功能。
5)穩(wěn)定性:當系統(tǒng)功能的處理能力到達較大負荷時,仍能正常工作,而不會丟棄郵件或郵件正確分類率不會有明顯下降。
3、結(jié)語
當前,反垃圾郵件的問題已經(jīng)收到了相關(guān)人員的高度關(guān)注和重視,同時在國際上也開始以研討會的形式去探討這一問題,要想更加徹底的去解決這一問題,就必須要在實際的工作中必須從其產(chǎn)生的原理作為突破口,從而將垃圾郵件徹底的根除,降低垃圾郵件對網(wǎng)絡(luò)資源的消耗。
參考文獻
[1]闞曉初.電子商務(wù)安全中的數(shù)據(jù)加密技術(shù)[J].計算機教育,2007(18).
[2]何建昭,梁曉誠,郭紅賓.基于行為模式識別的反垃圾郵件技術(shù)[J].電腦知識與技術(shù)(學術(shù)交流),2007(04).
[3]藍炳偉.SPF技術(shù)在郵件服務(wù)系統(tǒng)中的應(yīng)用[J].計算機系統(tǒng)應(yīng)用,2006(10).