位子輝 李雷雷
摘 要:隨著互聯(lián)網(wǎng)普及和發(fā)展,網(wǎng)絡(luò)詐騙和電信詐騙等頻繁出現(xiàn)在公眾的視野中,面對(duì)如此紛繁復(fù)雜和高科技詐騙手法,僅僅靠人的力量控制顯得力不從心,開發(fā)基于深度學(xué)習(xí)的反詐騙軟件是發(fā)展趨勢(shì)。
關(guān)鍵詞:深度學(xué)習(xí) 人工智能 反詐騙軟件 網(wǎng)絡(luò)詐騙 電信詐騙
0 緒論
21世紀(jì)以來(lái)通信和網(wǎng)絡(luò)科技迅速發(fā)展,一些不法分子開發(fā)技術(shù)工具進(jìn)行電信詐騙,手機(jī)、固話、網(wǎng)絡(luò)等通信工具最為常見(jiàn),經(jīng)常有人冒充公檢法、商家、政府機(jī)構(gòu)人員等。網(wǎng)絡(luò)詐騙常見(jiàn)的手段有:虛假咨詢信息、上網(wǎng)服務(wù)騙局、網(wǎng)上成人服務(wù)、購(gòu)置電腦軟件、信用卡申請(qǐng)等。電信詐騙和網(wǎng)絡(luò)詐騙的特點(diǎn)是范圍大、蔓延快、手段翻新快、團(tuán)伙作案、場(chǎng)景虛擬、團(tuán)伙作案。
詐騙分子通常是利用了用戶疏于防范的心理,常見(jiàn)反詐騙手段有:警察通告、社區(qū)宣傳、通訊號(hào)碼實(shí)名制等,更大范圍和效果的應(yīng)該是通過(guò)人工智能手段進(jìn)行反詐騙,其中深度學(xué)習(xí)是開發(fā)反詐騙軟件的一個(gè)研究方向[1]。
1 深度學(xué)習(xí)理論
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域中的一個(gè)較新的研究方向,是機(jī)器學(xué)習(xí)的一種,而機(jī)器學(xué)習(xí)是實(shí)現(xiàn)人工智能的必經(jīng)路徑[2,3]。在工業(yè)互聯(lián)網(wǎng)和大數(shù)據(jù)發(fā)展的大環(huán)境下,深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)等多個(gè)領(lǐng)域都獲得了比較重大的進(jìn)展,各種軟件、應(yīng)用、程序都開始涉及到人深度學(xué)習(xí),該方法已經(jīng)開始在軟件工程領(lǐng)域起到重要作用[4]。
深度學(xué)習(xí)在網(wǎng)絡(luò)空間安全方面的研究一直在進(jìn)行,在反詐騙方面主要應(yīng)用于惡意軟件檢測(cè)和入侵檢測(cè)。鑒于人力對(duì)反詐騙處理的有限性和計(jì)算機(jī)技術(shù)的高效性,基于深度學(xué)習(xí)的反詐騙軟件開發(fā)是減少電信詐騙案件的重要手段之一。
2 深度學(xué)習(xí)反詐騙可行性
近年來(lái)銀行卡和信用卡的普及和發(fā)展十分迅速,刷卡是我國(guó)目前支付手段中較為重要的方式之一。信用卡用戶增多的同時(shí),交易欺詐案件也顯著增加,詐騙手段層出不窮,給銀行結(jié)構(gòu)和信用卡用戶都造成了重大資金損失,嚴(yán)重影響了社會(huì)金融秩序。如何進(jìn)行有效防范金融詐騙和交易欺詐是銀行機(jī)構(gòu)及人民群眾面臨的問(wèn)題。
信用卡交易反欺詐的目的是將欺詐風(fēng)險(xiǎn)較高的交易檢驗(yàn)出來(lái),常用的是數(shù)據(jù)挖掘方法、神經(jīng)網(wǎng)絡(luò)等技術(shù),并取得了一定的效果。但是神經(jīng)網(wǎng)絡(luò)技術(shù)中的梯度彌散問(wèn)題、淺層網(wǎng)絡(luò)訓(xùn)練等缺陷問(wèn)題導(dǎo)致反詐騙效果不是很理想。
理論上深度學(xué)習(xí)能解決神經(jīng)網(wǎng)絡(luò)的淺層缺陷,建立多層非線性關(guān)系,目前深度學(xué)習(xí)在圖像識(shí)別等方面都獲得巨大進(jìn)展。眾多專家學(xué)者經(jīng)過(guò)建模和驗(yàn)證,證明深度學(xué)習(xí)模型在信用卡、銀行卡交易欺詐檢驗(yàn)和預(yù)防比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)更準(zhǔn)確、更高效[5,6]。
3 深度學(xué)習(xí)用于反詐騙軟件實(shí)例
學(xué)者采用Auto-Encoder方法建模對(duì)信用交易反詐騙進(jìn)行實(shí)戰(zhàn)研究,使用互聯(lián)網(wǎng)上公開的German Credit數(shù)據(jù)集為試驗(yàn)數(shù)據(jù),涵蓋包含信用歷史、交易金額、職業(yè)等20個(gè)特征、1000 個(gè)樣本。Auto-Encoder基本方法見(jiàn)圖1。
輸入數(shù)據(jù)先通過(guò)encode過(guò)程處理得出code值,再通過(guò)decode程序過(guò)程處理得出輸出值??刂芿ncode的輸出維數(shù)過(guò)程其實(shí)就相當(dāng)于強(qiáng)迫encode過(guò)程以低維參數(shù)形式進(jìn)行學(xué)習(xí)高維特征。Auto-Encoder目的是使輸入x值和輸出的x'值差距縮小,每次輸出值以后都要進(jìn)行誤差反向傳播,不斷優(yōu)化整個(gè)網(wǎng)絡(luò)參數(shù)。
使用Keras訓(xùn)練一個(gè)Auto-Encoder神經(jīng)網(wǎng)絡(luò),通過(guò)深度學(xué)習(xí)方法可以識(shí)別信用卡交易中的異常行為,具體步驟如下:裝載數(shù)據(jù)、探索數(shù)據(jù)、準(zhǔn)備數(shù)據(jù)、建立模型、評(píng)估模型。
對(duì)Credit Amount等數(shù)值型特征通過(guò)scikit’s StandardScaler做標(biāo)準(zhǔn)化處理,對(duì)Purpose等分類型特征做one-hot encoding處理。
在有很多正常交易樣本的條件下想通過(guò)異常檢測(cè)來(lái)識(shí)別可能會(huì)出現(xiàn)的欺詐交易,在訓(xùn)練Auto-Encoder時(shí)只對(duì)正常交易的樣本進(jìn)行訓(xùn)練,再使用測(cè)試集里的樣本進(jìn)行評(píng)估驗(yàn)證。
可以建立4層連接層神經(jīng)元的Auto-Encoder模型。前2層作為encoder過(guò)程,后兩層作為decoder過(guò)程。過(guò)程中使用100個(gè)Epoch,按每次32個(gè)樣本輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。實(shí)驗(yàn)結(jié)果reconstruction error曲線下降幅度不大且沒(méi)有穩(wěn)定收斂趨勢(shì),說(shuō)明該模型欠擬合需要更大的訓(xùn)練的樣本量進(jìn)一步提升。
使用Auto-Encoder訓(xùn)練后的模型也不能用于預(yù)測(cè)新樣本,若要判斷新樣本是正?;蚱墼p,需要先計(jì)算reconstruction error,若error大于預(yù)設(shè)閾值則判斷為欺詐。閾值根據(jù)實(shí)際建模結(jié)果設(shè)定,如果不知道標(biāo)簽的正類負(fù)類,就要計(jì)算整體樣本的reconstruction error的分位數(shù)來(lái)設(shè)定。
4 結(jié)束語(yǔ)
(1)電信詐騙和網(wǎng)絡(luò)詐騙對(duì)國(guó)家和人民群眾的危害十分巨大,反詐騙軟件開發(fā)迫在眉睫,深度學(xué)習(xí)在網(wǎng)絡(luò)空間安全和反詐騙方面理論上十分可行[7]。
(2)通過(guò)Auto-Encoder對(duì)German Credit數(shù)據(jù)集進(jìn)行深度學(xué)習(xí)的模型取得一定效果,但仍需進(jìn)一步完善。
(3)深度學(xué)習(xí)實(shí)用中應(yīng)該注意:處理好神經(jīng)網(wǎng)絡(luò)的復(fù)雜度和訓(xùn)練集樣本數(shù),保證訓(xùn)練過(guò)程擬合趨近性;對(duì)輸入特征如相關(guān)性去重、去噪等操等進(jìn)行預(yù)處理。
參考文獻(xiàn)
[1] 孫瑩. 一份來(lái)自安全軟件企業(yè)的報(bào)告[J]. 法庭內(nèi)外, 2017(8):12-14.
[2] 陳先昌. 基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法與應(yīng)用研究[D]. 浙江工商大學(xué), 2014.
[3] 韋堅(jiān), 劉愛(ài)娟, 唐劍文. 基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)技術(shù)的數(shù)字電視監(jiān)測(cè)平臺(tái)告警模型的研究[J]. 有線電視技術(shù), 2017(7).
[4] 張獻(xiàn), 賁可榮. 深度學(xué)習(xí)方法在軟件分析中的應(yīng)用[J]. 計(jì)算機(jī)工程與科學(xué), 2017(12):2260-2268.
[5] 竇路路, 石秀金. 基于深度學(xué)習(xí)的銀行卡交易反欺詐技術(shù)研究[J]. 智能計(jì)算機(jī)與應(yīng)用, 2018, v.8(04):90-92+96.
[6] 丁衛(wèi)星. 基于深度學(xué)習(xí)技術(shù)的信用卡交易欺詐偵測(cè)研究[D].
[7] 張玉清, 董穎, 柳彩云, et al. 深度學(xué)習(xí)應(yīng)用于網(wǎng)絡(luò)空間安全的現(xiàn)狀、趨勢(shì)與展望[J]. 計(jì)算機(jī)研究與發(fā)展, 2018, v.55(06):3-28.