• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于銀行賬戶親密度網(wǎng)絡(luò)推理的團(tuán)伙預(yù)測(cè)研究

    2019-12-13 00:56:30呂芳陸海博王巍黃俊恒王佰玲
    關(guān)鍵詞:團(tuán)伙賬戶交易

    呂芳,陸海博,王巍,黃俊恒,王佰玲

    基于銀行賬戶親密度網(wǎng)絡(luò)推理的團(tuán)伙預(yù)測(cè)研究

    呂芳,陸海博,王巍,黃俊恒,王佰玲

    (哈爾濱工業(yè)大學(xué)(威海)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,山東 威海 264209)

    近年來,針對(duì)涉眾型非法金融活動(dòng)在資金交易規(guī)律的研究引起了研究者的高度關(guān)注。為解決利用銀行交易數(shù)據(jù)進(jìn)行異常賬戶犯罪團(tuán)伙主動(dòng)發(fā)現(xiàn)的問題,提出一種基于銀行賬戶非對(duì)稱親密度網(wǎng)絡(luò)的團(tuán)伙預(yù)測(cè)方法。首先,建立銀行賬戶交易通用網(wǎng)絡(luò)模型,將時(shí)序交易數(shù)據(jù)嵌入網(wǎng)絡(luò)結(jié)構(gòu)中。然后,利用節(jié)點(diǎn)的直接和間接交易關(guān)系信息,提出一種賬戶非對(duì)稱親密度計(jì)算方法。最終,利用節(jié)點(diǎn)在親密度網(wǎng)絡(luò)上的非對(duì)稱交互信息,得到節(jié)點(diǎn)的異常傾向性指標(biāo)。在包含傳銷團(tuán)伙的真實(shí)數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果表明,基于親密度網(wǎng)絡(luò)的團(tuán)伙預(yù)測(cè)方法能有效發(fā)現(xiàn)潛在傳銷人員。

    銀行賬戶交易網(wǎng)絡(luò);親密度網(wǎng)絡(luò);直接親密度;間接親密度;團(tuán)伙預(yù)測(cè)

    1 引言

    涉眾型非法金融犯罪活動(dòng)呈現(xiàn)涉案人數(shù)多、涉案資金量大的特點(diǎn),嚴(yán)重影響國(guó)家經(jīng)濟(jì)和人民的財(cái)產(chǎn)安全。在金融犯罪活動(dòng)中,犯罪分子需要利用銀行等金融機(jī)構(gòu),將非法所得的資金經(jīng)過一次或多次交易,匯聚到最終賬戶中。圖1為非法傳銷和非法洗錢金融犯罪活動(dòng)的交易關(guān)系示例。此類犯罪活動(dòng)組織中成員的角色分工呈類金字塔形或紡錘形等結(jié)構(gòu),相應(yīng)賬戶的資金交易由其扮演的角色驅(qū)動(dòng)產(chǎn)生,使犯罪關(guān)系極其隱蔽。目前,銀行部門使用的反洗錢等金融安全系統(tǒng)能夠根據(jù)交易規(guī)則發(fā)現(xiàn)存在異常交易的單個(gè)賬戶,但對(duì)上述多賬戶協(xié)作實(shí)施非法金融活動(dòng)的行為束手無策。例如,非法傳銷活動(dòng),它是一種由一組人員操縱的以上線發(fā)展下線、吸納下線會(huì)員費(fèi)為欺詐方式的涉眾型金融犯罪活動(dòng)。如圖1(a)所示,其資金交易關(guān)系具有明顯的金字塔層級(jí)結(jié)構(gòu),底層為會(huì)員節(jié)點(diǎn),中間層為初級(jí)上線節(jié)點(diǎn),頂層為操縱節(jié)點(diǎn)。會(huì)員節(jié)點(diǎn)通過繳納會(huì)費(fèi)加入組織,初級(jí)上線節(jié)點(diǎn)從下線會(huì)員的會(huì)費(fèi)抽取提成獲得收益,剩余資金全部沉淀入操縱節(jié)點(diǎn)的賬戶中??梢?,在非法傳銷活動(dòng)中,資金從受騙群眾流向底層小頭目,再匯集到重要頭目。對(duì)于線下傳銷而言,這種資金的轉(zhuǎn)移過程大部分是通過銀行賬戶交易完成的。

    涉眾型非法金融活動(dòng)的交易關(guān)系復(fù)雜,交易規(guī)模較大,增加了犯罪行為的隱蔽性,使偵查人員全面打擊犯罪組織的任務(wù)越來越棘手。已知部分涉案成員,利用成員之間關(guān)系的緊密程度主動(dòng)發(fā)現(xiàn)嫌疑賬戶,能有效解決犯罪團(tuán)伙成員預(yù)測(cè)問題。

    圖1 涉眾型非法金融活動(dòng)交易關(guān)系示例

    近年來,在金融安全領(lǐng)域,通過構(gòu)建金融網(wǎng)絡(luò)模型,利用社交網(wǎng)絡(luò)分析技術(shù)挖掘犯罪信息的研究引起了研究者的重視。陳鵬等[1]采用網(wǎng)絡(luò)建模的方法研究不同類型犯罪組織的結(jié)構(gòu)特性,基于復(fù)雜網(wǎng)絡(luò)建模的方法建立具有層次特征的犯罪組織網(wǎng)絡(luò),考察了層次組織結(jié)構(gòu)的運(yùn)行效率和安全性。在金融網(wǎng)絡(luò)的構(gòu)建方面,為了分析資金網(wǎng)絡(luò)的內(nèi)部拓?fù)浣Y(jié)構(gòu),劉晉霞等[2]分別定義了賬戶節(jié)點(diǎn)和資金賬戶關(guān)系,進(jìn)而提出一種有向加權(quán)的資金融通網(wǎng)絡(luò)構(gòu)建方法。韓華等[3]基于隨機(jī)矩陣?yán)碚摚倪M(jìn)金融網(wǎng)絡(luò)相關(guān)系數(shù)矩陣生成方法,構(gòu)建了金融網(wǎng)絡(luò)模型,獲得了更加緊密的網(wǎng)絡(luò)結(jié)構(gòu)。在反洗錢的應(yīng)用研究中,為了解決需要兼顧時(shí)間、成本、流量、風(fēng)險(xiǎn)等多因素的多目標(biāo)優(yōu)化問題,李瓊婕等[4]提出了基于最小費(fèi)用最大流的擴(kuò)展模型??傮w來說,當(dāng)前的研究集中在利用各種類型的歷史數(shù)據(jù)構(gòu)建犯罪網(wǎng)絡(luò),將組織關(guān)系嵌入網(wǎng)絡(luò)結(jié)構(gòu)中。但是,上述網(wǎng)絡(luò)構(gòu)建方法多針對(duì)特定應(yīng)用且依賴多種信息源,可擴(kuò)展性較弱。此外,量化網(wǎng)絡(luò)節(jié)點(diǎn)關(guān)系的信息粒度過粗,導(dǎo)致用于同伙關(guān)系預(yù)測(cè)時(shí)的準(zhǔn)確性較低。本文研究如何利用銀行賬戶的交易日志數(shù)據(jù)量化賬戶之間的關(guān)系強(qiáng)度,實(shí)現(xiàn)同伙預(yù)測(cè)的方法。

    本文使用的賬戶交易日志數(shù)據(jù)如圖2(a)所示,包含交易時(shí)間、交易對(duì)手、交易金額及交易方向等信息。因此,可據(jù)此構(gòu)建賬戶的有向、加權(quán)交易網(wǎng)絡(luò),其中節(jié)點(diǎn)的局部拓?fù)浣Y(jié)構(gòu)如圖2(b)所示。

    圖2 銀行賬戶交易數(shù)據(jù)示例

    可見,賬戶之間資金的往來是評(píng)判實(shí)體之間關(guān)系程度的重要標(biāo)準(zhǔn)。顯然,日志數(shù)據(jù)中賬戶之間交易的金額、頻率、周期性、交易網(wǎng)交集等信息是這種關(guān)系的具體體現(xiàn)。賬戶之間關(guān)系的緊密程度(本文稱作賬戶親密度)是評(píng)估賬戶所關(guān)聯(lián)實(shí)體親密程度的重要標(biāo)準(zhǔn)之一。

    本文首先建立資金交易網(wǎng)絡(luò)模型,將時(shí)序交易數(shù)據(jù)嵌入網(wǎng)絡(luò)結(jié)構(gòu)及網(wǎng)絡(luò)關(guān)系中。由上述分析可知,網(wǎng)絡(luò)中節(jié)點(diǎn)間的關(guān)系強(qiáng)度與節(jié)點(diǎn)的交易信息和局部拓?fù)浣Y(jié)構(gòu)緊密相關(guān)。本文首先定義了單向信任度,從資金交易的角度計(jì)算節(jié)點(diǎn)間的直接親密程度;然后從局部拓?fù)浣Y(jié)構(gòu)的角度,將節(jié)點(diǎn)間的間接交易關(guān)系進(jìn)行分類,提出一種節(jié)點(diǎn)間的間接親密度計(jì)算方法。綜合上述兩種親密度指標(biāo),本文計(jì)算任意節(jié)點(diǎn)對(duì)的綜合親密度,構(gòu)建得到一個(gè)非對(duì)稱親密度網(wǎng)絡(luò)。親密度網(wǎng)絡(luò)中的節(jié)點(diǎn)為銀行賬戶集合,有向邊表示節(jié)點(diǎn)的單向關(guān)系,邊的權(quán)重為單向關(guān)系的綜合親密度?;谏鲜鋈B通、非對(duì)稱的親密度網(wǎng)絡(luò),在已知部分嫌疑節(jié)點(diǎn)的前提下,本文提出一種犯罪團(tuán)伙預(yù)測(cè)方法。在包含傳銷團(tuán)伙的銀行賬戶交易數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果,證明了該方法發(fā)現(xiàn)潛在傳銷賬戶的有效性。

    2 相關(guān)工作

    銀行賬戶親密度計(jì)算可以歸類為網(wǎng)絡(luò)中的節(jié)點(diǎn)相似性計(jì)算,這方面的研究基本上可以分為以下兩類。

    1) 基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的節(jié)點(diǎn)相似性計(jì)算。該類算法根據(jù)考慮的節(jié)點(diǎn)信息種類的差異可分為3種。第一種算法只考慮直接鄰居信息、同時(shí)考慮間接鄰居信息及另外考慮路徑信息。節(jié)點(diǎn)的直接鄰居信息主要包括共同鄰居的數(shù)量、節(jié)點(diǎn)度數(shù)、節(jié)點(diǎn)之間的連接程度[5-6],具有計(jì)算復(fù)雜度較低、適用范圍廣的特點(diǎn)。第二種算法同時(shí)計(jì)算了直接和間接鄰居對(duì)節(jié)點(diǎn)關(guān)系的影響,其中參與計(jì)算的因素包括一階鄰居信息、二階鄰居信息以及多階鄰居信息[7-8]。隨著考慮鄰居節(jié)點(diǎn)層數(shù)的增加,算法的計(jì)算復(fù)雜性逐次增大。第三種算法在鄰居信息的基礎(chǔ)上,結(jié)合了路徑強(qiáng)度、連通程度等信息[9]。這種方式時(shí)間復(fù)雜性高,在大規(guī)模網(wǎng)絡(luò)上應(yīng)用時(shí)間開銷很大。

    2) 網(wǎng)絡(luò)表示學(xué)習(xí)節(jié)點(diǎn)相似性計(jì)算。近年來,受自然語言中詞向量生成技術(shù)的啟發(fā),網(wǎng)絡(luò)節(jié)點(diǎn)向量生成技術(shù)的研究引起了學(xué)者的重視。Perozzi 等[10]提出DeepWalk算法,首次將網(wǎng)絡(luò)表示學(xué)習(xí)技術(shù)引入網(wǎng)絡(luò)分析領(lǐng)域。隨后,針對(duì)大規(guī)模有向帶權(quán)圖的網(wǎng)絡(luò)表示學(xué)習(xí)問題,Tang等[11]提出一種對(duì)所有一步和二步鄰居節(jié)點(diǎn)進(jìn)行概率建模的LINE方法。Wang等[12]提出SDNE方法使用深層神經(jīng)網(wǎng)絡(luò)對(duì)節(jié)點(diǎn)間的非線性建模。為學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的相似性,Donnat等[13]提出一種名為GraphWave的可擴(kuò)展無監(jiān)督網(wǎng)絡(luò)表示學(xué)習(xí)方法。

    以上兩類節(jié)點(diǎn)相似性計(jì)算方法利用的僅為網(wǎng)絡(luò)節(jié)點(diǎn)的局部拓?fù)浣Y(jié)構(gòu)信息。不同于傳統(tǒng)網(wǎng)絡(luò),金融網(wǎng)絡(luò)中,賬戶節(jié)點(diǎn)之間豐富的時(shí)序交互信息對(duì)量化賬戶的親密度尤其重要?;诖?,本文在局部拓?fù)浣Y(jié)構(gòu)信息的基礎(chǔ)上,融入節(jié)點(diǎn)交互信息,提出一種非對(duì)稱親密度網(wǎng)絡(luò)構(gòu)建方法。

    在涉眾型金融犯罪活動(dòng)中,根據(jù)已知犯罪線索、犯罪嫌疑人預(yù)測(cè)犯罪團(tuán)伙的研究,受到許多研究者的關(guān)注。在組織成員預(yù)測(cè)方面,Sun等[14]改進(jìn)了中心節(jié)點(diǎn)計(jì)算方法,利用節(jié)點(diǎn)之間的可信度,提出了一種限制連接節(jié)點(diǎn)集合的搜索空間,進(jìn)而識(shí)別協(xié)作伙伴的方法。在犯罪網(wǎng)絡(luò)應(yīng)用方面,Chen等[15]針對(duì)犯罪集團(tuán)的組織特點(diǎn),結(jié)合共犯網(wǎng)絡(luò)結(jié)構(gòu)分析和數(shù)據(jù)挖掘技術(shù),對(duì)組織犯罪集團(tuán)進(jìn)行系統(tǒng)分析和挖掘研究。針對(duì)組織成員的上下級(jí)支配關(guān)系,楊莉莉等[16]提出了一種犯罪組織成員關(guān)系挖掘方法;高建強(qiáng)等[17]結(jié)合聚類分析與社會(huì)團(tuán)伙技術(shù),提出一種組織成員發(fā)現(xiàn)模型。李萬彪等人[18]提出了一種基于關(guān)系數(shù)據(jù)模型的犯罪網(wǎng)絡(luò)挖掘方法,該方法可以挖掘已知嫌疑人、未知嫌疑人及深層的犯罪團(tuán)伙關(guān)系。在解決從歷史犯罪案宗數(shù)據(jù)中挖掘組織成員的任務(wù)中,唐德權(quán)等[19]提出一種使用層次聚類技術(shù)進(jìn)行同組人員發(fā)現(xiàn)的方法??傮w來說,上述犯罪網(wǎng)絡(luò)的數(shù)據(jù)源類型多為歷史案宗數(shù)據(jù),與本文使用的交易日志數(shù)據(jù)不同。此外,進(jìn)行組織成員預(yù)測(cè)時(shí),主要依據(jù)關(guān)聯(lián)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)信息。本文在親密度網(wǎng)絡(luò)的基礎(chǔ)上,綜合考慮節(jié)點(diǎn)對(duì)的非對(duì)稱親密度和局部交易關(guān)系,得到了節(jié)點(diǎn)的異常傾向性指標(biāo),進(jìn)而實(shí)現(xiàn)犯罪團(tuán)伙預(yù)測(cè)。

    3 銀行賬戶交易網(wǎng)絡(luò)數(shù)學(xué)模型

    銀行賬戶交易網(wǎng)絡(luò)是一種超大型且動(dòng)態(tài)變化的復(fù)雜網(wǎng)絡(luò)。賬戶間的交易具有有向、有序、金額和頻度等屬性,上述交易特點(diǎn)導(dǎo)致賬戶間具有復(fù)雜的關(guān)聯(lián)關(guān)系?;谫~戶間的關(guān)系特點(diǎn),本文建立了銀行賬戶交易網(wǎng)絡(luò)數(shù)學(xué)模型。銀行賬戶用網(wǎng)絡(luò)節(jié)點(diǎn)表示,賬戶間的交易關(guān)系用節(jié)點(diǎn)之間的有向邊表示,有向邊的權(quán)重表示交易時(shí)間、金額、次數(shù)等信息。銀行賬戶交易網(wǎng)絡(luò)數(shù)學(xué)模型見定義1。

    定義1 一個(gè)銀行賬戶交易網(wǎng)絡(luò)可表示為= (),其中={1,2, … ,v}為賬戶集合,= {e} ?×, 1≤,≤為邊集合,vv之間存在有向邊當(dāng)且僅當(dāng)v對(duì)v至少進(jìn)行了一次交易,該有向邊記作e= <v,v>。= {w},∈(R),w= ((1),(2), … ,()), 其中,(),N分別表示節(jié)點(diǎn)vv間第次交易的金額和總交易次數(shù)。

    4 非對(duì)稱親密度網(wǎng)絡(luò)

    在定義1中的銀行賬戶交易網(wǎng)絡(luò)中,節(jié)點(diǎn)之間的有向邊權(quán)重W包含了賬戶之間交易信息,這些信息隱含了賬戶之間的親密程度。本文基于兩點(diǎn)之間的交易信息和局部拓?fù)浣Y(jié)構(gòu),提出了賬戶親密度計(jì)算方法,構(gòu)建了銀行賬戶的非對(duì)稱親密度網(wǎng)絡(luò)。

    4.1 信任度

    在現(xiàn)實(shí)生活中,甲轉(zhuǎn)給乙一筆錢,顯然甲在一定程度上信任乙,隨著甲對(duì)乙交易次數(shù)和金額的增加,表明甲對(duì)乙的信任程度逐漸增加。在資金交易中的信任度是單向的,簡(jiǎn)單來說,甲給乙錢,表明甲信任乙,反之并不成立。甲對(duì)乙的信任程度主要隨兩個(gè)因素變化。1)交易金額:甲對(duì)乙的交易金額越大,說明甲對(duì)乙的信任度越高。2)交易次數(shù):甲對(duì)乙的交易次數(shù)越多,說明甲對(duì)乙的信任度越高。基于這兩點(diǎn),本文提出了賬戶對(duì)賬戶的信任度計(jì)算方法。

    設(shè)m是賬戶對(duì)賬戶的交易資金總額,n是對(duì)的交易次數(shù),那么對(duì)的信任度可以表示為mn的函數(shù)。本文提出式(1)用于計(jì)算對(duì)的信任度。

    同理:設(shè)m是對(duì)的交易資金總額, n是對(duì)的交易次數(shù),那么對(duì)的信任度由式(2)計(jì)算。

    4.2 直接親密度計(jì)算

    式(1)和式(2)分別計(jì)算了對(duì)的信任度和對(duì)的信任度,雙方互信程度的均值體現(xiàn)了雙方的親密程度,本文稱為直接親密度。和的直接親密度可用式(3)計(jì)算。

    4.3 間接親密度計(jì)算

    在資金交易網(wǎng)絡(luò)中,尤其在犯罪團(tuán)伙之間,賬戶之間除直接交易外還可能存在多種不同的間接交易。所以,在親密度的計(jì)算中,雖然直接交易的影響占主導(dǎo)地位,但某些間接交易對(duì)賬戶的親密度也有較大的影響。間接交易信息反應(yīng)在賬戶在交易網(wǎng)絡(luò)上的局部拓?fù)浣Y(jié)構(gòu)中?;诖?,除直接親密度外,本文考慮賬戶之間的間接親密度。

    在金融網(wǎng)絡(luò)中,節(jié)點(diǎn)之間往往具有復(fù)雜的交易關(guān)系。例如,在圖3中,節(jié)點(diǎn)、之間不但具有直接的交易關(guān)系,同時(shí)由于各自節(jié)點(diǎn)局部拓?fù)浣Y(jié)構(gòu)的交集,產(chǎn)生了間接交易關(guān)系。這些復(fù)雜的間接交易關(guān)系同樣體現(xiàn)了和的親密性。本文將間接交易情況簡(jiǎn)化為兩類。第一類如、、之間的交易關(guān)系,即交易給,交易給,因此可以理解為是和之間的媒介,與的親密性也因?yàn)榈拇嬖诙兴黾?。第二類?個(gè)賬戶具有共同的轉(zhuǎn)賬鄰居。如圖3所示,和都有轉(zhuǎn)賬給的情況;或者,具有轉(zhuǎn)賬給和的情況,可以理解為和擁有共同的朋友。隨著共同朋友數(shù)量的增多以及二者與共同朋友的親密程度的增加,和的親密程度也在增強(qiáng)?;谝陨戏治觯疚奶岢隽速~戶之間的間接親密度計(jì)算方法。

    圖3 賬戶交易示意

    節(jié)點(diǎn)與節(jié)點(diǎn)的間接親密度可由式(4)計(jì)算。

    4.4 綜合親密度

    綜合直接親密度和間接親密度,本文提出了賬戶之間的綜合親密度(以下簡(jiǎn)稱親密度)計(jì)算方法,如式(5)。

    其中,1, 11為直接親密度和間接親密度對(duì)親密度的貢獻(xiàn)系數(shù)。

    通過計(jì)算任意兩點(diǎn)的親密度,本文建立了銀行賬戶親密度網(wǎng)絡(luò),見定義2。

    定義2 給定銀行賬戶交易網(wǎng)絡(luò)(),對(duì)應(yīng)的非對(duì)稱親密度網(wǎng)絡(luò)為’(,,)。其中,={v,v, … ,v}為賬戶集合,= {o} ?×, 1≤,≤為邊集合,任意vv之間存在有向邊,該有向邊記作o= <v,v>。= {S},S∈[0,1] 是由節(jié)點(diǎn)到由式(5)計(jì)算的單向親密度。

    5 團(tuán)伙預(yù)測(cè)算法

    賬戶親密度網(wǎng)絡(luò)反映了賬戶之間的親密程度,如果一個(gè)待測(cè)賬戶與多個(gè)犯罪賬戶親密度值很大,則有理由相信賬戶在一定程度上是涉案賬戶。針對(duì)待測(cè)賬戶是不是涉案賬戶,本文主要考慮兩個(gè)因素:1)與已知涉案賬戶的親密度值;2)鄰居節(jié)點(diǎn)中涉案賬戶的數(shù)量。

    假設(shè)已標(biāo)記涉案賬戶集合為C,()為待測(cè)節(jié)點(diǎn)在中的鄰居集合,則賬戶的涉案程度可由式(6)計(jì)算。

    其中,𝛼,𝛽∈[0,1]為權(quán)重系數(shù)。() ∈[0,1]的大小反映了待測(cè)節(jié)點(diǎn)的涉案程度。

    6 實(shí)驗(yàn)與結(jié)果分析

    6.1 實(shí)驗(yàn)環(huán)境

    本文實(shí)驗(yàn)硬件環(huán)境為Inter(R) Core i7-7700HQ CPU@ 2.80 GHz,內(nèi)存(RAM) 16 GB。軟件環(huán)境為Python語言,Ubuntu 18.04 LTS操作系統(tǒng)。

    6.2 實(shí)驗(yàn)數(shù)據(jù)

    近幾年,筆者積極參與經(jīng)偵部門打擊非法傳銷的工作,曾參與輔助偵查多起線下傳銷案件。本文使用的兩份數(shù)據(jù)集均為包含傳銷組織的銀行賬戶交易日志數(shù)據(jù),每條日志數(shù)據(jù)包括交易雙方賬戶、交易方向、交易時(shí)間、交易次數(shù)和交易金額等屬性。數(shù)據(jù)經(jīng)過去重、去噪、脫敏等處理后,用于對(duì)本文算法的測(cè)試。數(shù)據(jù)集1中包含交易記錄349 126條,涉及8 384個(gè)銀行賬戶。其中,傳銷賬戶883個(gè),正常賬戶7 501個(gè),在資金交易網(wǎng)絡(luò)中有向邊共14 646條。數(shù)據(jù)集2中涉及5 872個(gè)銀行賬戶,其中119個(gè)傳銷賬戶。將數(shù)據(jù)集1按照4:1的比例劃分訓(xùn)練集和測(cè)試集,得到包含662個(gè)傳銷賬戶和5 626個(gè)正常賬戶的訓(xùn)練集。從數(shù)據(jù)集2選擇319個(gè)節(jié)點(diǎn)作為測(cè)試集,其中包含200個(gè)正常賬戶和119個(gè)傳銷賬戶。

    6.3 參數(shù)設(shè)定

    統(tǒng)計(jì)發(fā)現(xiàn),數(shù)據(jù)中兩個(gè)賬戶之間交易金額總和的最大值為1 836.61萬元,兩個(gè)賬戶之間的交易次數(shù)總和最大值為1 008次。通過數(shù)據(jù)分析,發(fā)現(xiàn)金額小于100元的交易,基本為水電費(fèi)等噪聲數(shù)據(jù),因此本實(shí)驗(yàn)將小于100元的數(shù)據(jù)進(jìn)行了過濾。經(jīng)過多次實(shí)驗(yàn)驗(yàn)證,標(biāo)準(zhǔn)化處理函數(shù)(),()和式(1)~式(5)的各項(xiàng)系數(shù)采用如下設(shè)置時(shí),取得較好的實(shí)驗(yàn)結(jié)果。

    表1 節(jié)點(diǎn)對(duì)的親密度指標(biāo)示例

    6.4 親密度算法分析

    為了驗(yàn)證親密度算法的準(zhǔn)確性,本文選取了9組具有親密度值的賬戶對(duì)信息(交易金額、交易次數(shù)、共同對(duì)手、間接路徑的數(shù)目)來分析間接親密度和直接親密度是否與賬戶對(duì)之間真實(shí)的緊密程度一致。實(shí)驗(yàn)結(jié)果如表1所示。

    在現(xiàn)實(shí)交易場(chǎng)景中,交易金額、交易頻次、共同交易對(duì)手、間接交易方式都會(huì)影響交易雙方的親密關(guān)系。由表1的第1、2條記錄可知,在間接屬性相近的情況下,賬戶對(duì)的交易金額、交易頻次越高,兩節(jié)點(diǎn)越親密;同理,由第6、7條記錄可知,在直接屬性相近的情況下,賬戶對(duì)的共同交易對(duì)手?jǐn)?shù)量、間接路徑條數(shù)越多,兩節(jié)點(diǎn)越親密。上述親密度結(jié)果分別證實(shí)該指標(biāo)的取值與真實(shí)交易場(chǎng)景下的親密關(guān)系一致。如第2、4條記錄所示,在間接屬性相近的情況下,交易頻次的差異引起了親密度指標(biāo)的較大變化。這種變化與現(xiàn)實(shí)場(chǎng)景中直接屬性比間接屬性更能反映節(jié)點(diǎn)對(duì)親密度的情況一致。因此,本文的綜合親密度計(jì)算方法能夠相對(duì)準(zhǔn)確地反應(yīng)賬戶之間的親密關(guān)系。

    6.5 團(tuán)伙預(yù)測(cè)結(jié)果分析

    在數(shù)據(jù)集1進(jìn)行訓(xùn)練得到()(見式(6))的最優(yōu)參數(shù)取值。經(jīng)過50次實(shí)驗(yàn)的平均結(jié)果發(fā)現(xiàn),當(dāng)()的系數(shù)采用=1,=0.018 7時(shí),算法在測(cè)試集上取得最好的團(tuán)伙預(yù)測(cè)效果。測(cè)試集上的實(shí)驗(yàn)結(jié)果如圖4~7所示。

    如圖4所示,算法的準(zhǔn)確率隨取值的增加呈增大趨勢(shì),且當(dāng)()的取值大于0.4時(shí),準(zhǔn)確率趨于穩(wěn)定,最高達(dá)到95.3%。反之,算法的召回率(如圖3所示)隨著值的增大呈逐漸降低的趨勢(shì)。可見準(zhǔn)確率和召回率呈負(fù)相關(guān),兩者的關(guān)系如圖6所示。隨著值的增加,算法的1值呈先急劇增大后平穩(wěn)下降的趨勢(shì),且當(dāng)值取0.1附近值時(shí),1值達(dá)到最優(yōu)。

    圖4 準(zhǔn)確率隨H值變化

    圖5 召回率隨H值變化

    圖6 準(zhǔn)確率和召回率的關(guān)系

    圖7 F1值隨H值變化

    當(dāng)()的參數(shù)選擇最優(yōu)的情況下,在數(shù)據(jù)集2上進(jìn)行算法準(zhǔn)確性測(cè)試。實(shí)驗(yàn)結(jié)果如混淆矩陣所示。隨機(jī)選擇119個(gè)傳銷賬戶中的69個(gè)作為已知標(biāo)記數(shù)據(jù),對(duì)剩余賬戶的標(biāo)簽進(jìn)行預(yù)測(cè)。在該數(shù)據(jù)集上的準(zhǔn)確率達(dá)到85.6%,此時(shí)的混淆矩陣如圖8所示。

    6.6 團(tuán)伙預(yù)測(cè)對(duì)比分析

    本文分別選取交易金額、交易頻次、直接親密度的預(yù)測(cè)算法作為同伙預(yù)測(cè)的單因素依據(jù),與本文提出的基于綜合親密度的同伙預(yù)測(cè)方法進(jìn)行對(duì)比分析。在數(shù)據(jù)集1上的團(tuán)伙預(yù)測(cè)性能實(shí)驗(yàn)結(jié)果如表2所示。

    表2 預(yù)測(cè)算法對(duì)比分析

    如表2所示,本文基于綜合親密度的團(tuán)伙預(yù)測(cè)方法取得了最優(yōu)的準(zhǔn)確率、召回率和1值。基于直接親密度的算法同時(shí)包含交易金額、頻次信息,取得了優(yōu)于單因素的預(yù)測(cè)性能,證明了兩種交易信息存在互補(bǔ)關(guān)系。本文算法在直接親密度基礎(chǔ)上結(jié)合節(jié)點(diǎn)的局部拓?fù)湫畔?,進(jìn)一步提高了預(yù)測(cè)性能,證明了交易關(guān)系信息對(duì)預(yù)測(cè)傳銷團(tuán)伙的必要性。上述4種算法的ROC曲線如圖9所示。

    圖9 4種算法的ROC曲線

    可見,本文方法持續(xù)優(yōu)于另外3種方法。該實(shí)驗(yàn)結(jié)果,再一次驗(yàn)證了共同使用直接親密度和間接親密度進(jìn)行同伙預(yù)測(cè)算法的有效性。

    7 結(jié)束語

    本文利用銀行賬戶交易數(shù)據(jù),在犯罪團(tuán)伙預(yù)測(cè)方面進(jìn)行了嘗試。在建立了銀行賬戶交易網(wǎng)絡(luò)模型的基礎(chǔ)上,提出一種非對(duì)稱親密度網(wǎng)絡(luò)構(gòu)建方法。本文同時(shí)考慮了賬戶節(jié)點(diǎn)的直接交易信息和局部拓?fù)潢P(guān)系信息,量化生成任意節(jié)點(diǎn)對(duì)的單向綜合親密度。進(jìn)而,利用節(jié)點(diǎn)在銀行賬戶交易網(wǎng)絡(luò)中的關(guān)系子圖和親密度網(wǎng)絡(luò)與異常節(jié)點(diǎn)的親密程度,進(jìn)行節(jié)點(diǎn)的同伙預(yù)測(cè)。在包含傳銷異常賬戶的真實(shí)資金交易數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果,驗(yàn)證了本文定義的親密度指標(biāo)能夠準(zhǔn)確描述團(tuán)伙資金交易的特點(diǎn),提出的團(tuán)伙預(yù)測(cè)方法能有效發(fā)現(xiàn)潛在犯罪嫌疑人。

    在實(shí)驗(yàn)中發(fā)現(xiàn),由于交易環(huán)境復(fù)雜,賬戶對(duì)之間的交易信息浮動(dòng)較大,如交易次數(shù)從0到1 000,交易金額從100元到1000多萬元。因此,如何平衡交易次數(shù)和交易金額對(duì)親密度的影響、如何平衡各種鄰居節(jié)點(diǎn)對(duì)親密度的貢獻(xiàn)、如何平衡直接親密度和間接親密度的權(quán)重,需要大量數(shù)據(jù)的支撐。由于本實(shí)驗(yàn)數(shù)據(jù)的局限性,實(shí)驗(yàn)獲得的平衡系數(shù)可能存在偏差。這是下一步本團(tuán)隊(duì)需要改進(jìn)和繼續(xù)研究的工作。

    另外,采用網(wǎng)絡(luò)表示學(xué)習(xí)方法,把節(jié)點(diǎn)進(jìn)行量化處理,然后度量節(jié)點(diǎn)關(guān)系和拓?fù)浣Y(jié)構(gòu)挖掘的研究逐漸引起研究者的重視。利用這種機(jī)器學(xué)習(xí)的方法進(jìn)行親密度計(jì)算和犯罪團(tuán)伙預(yù)測(cè)的研究也是下一步工作的重點(diǎn)之一。

    [1] 陳鵬, 袁宏永. 犯罪組織結(jié)構(gòu)的社會(huì)網(wǎng)絡(luò)分析[J]. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2011, 51(8): 1097-1101.

    CHEN P, YUAN H Y. Social network analysis of crime organization structures[J]. Journal of Tsinghua University (Science and Technology), 2011, 51(8): 1097-1101.

    [2] LIU J X. The research on detecting community structure of complex networks and its application in financial Networks[D]. Lanzhou: Lanzhou University of Technology, 2013.

    [3] 韓華, 吳翎燕, 宋寧寧. 基于隨機(jī)矩陣的金融網(wǎng)絡(luò)模型[J]. 物理學(xué)報(bào),2014, 63(13): 431-440.

    HAN H, WU L Y, SONG N N. Financial networks model based on random matrix[J]. Acta Physica Sinica, 2014, 63(13): 431-440, 2014.

    [4] 李瓊婕, 薛耀文. 最小費(fèi)用最大流維度拓展及其在反洗錢中的應(yīng)用研究[J]. 山西師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2014, 28(1): 28-32.

    LI Q J, XUE Y W. Dimension-expansion of minimum cost and maximum flow theory and its application research in anti-money laundering[J]. Journal of Shanxi Normal University (Science and Technology), 2014, 28(1): 28-32.

    [5] ADAMIC L A, ADAR E. Friends and neighbors on the Web[J]. Social Networks, 2003, 25(3): 211-230.

    [6] WU Z H, LIN Y F. Link prediction with node clustering coefficient[J]. Physica A: Statistical Mechanics and Its Applications, 2016, 452: 1-8.

    [7] ZHOUT, LYU LY, ZHANG YC. Predicting missing links via local information[J]. The European Physical Journal B, 2009, 71(4): 623-630.

    [8] LEICHT E A, HOLME P, NEWMAN M E J. Vertex similarity in networks[J]. Physical Review E Statistical Nonlinear and Soft Matter Physics, 2006, 73(2): 1-10.

    [9] ZHU X Z, TIAN H, CAI S M. Predicting missing links via effective paths[J]. Physica A: Statistical Mechanics and Its Applications, 2014, 413(11): 515-522.

    [10] PEROZZI B, RAMI A R, SKIENA S. DeepWalk: anline learning of social representations[C]//ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD’14). 2014, 701-710.

    [11] TANG J, QU M, WANG M, et al. LINE: large-scale information network embedding[C]//International Conference on World Wide Web (WWW’15).2015:1067-1077.

    [12] WANG D X, CUI P, ZHU W W. Structural deep network embedding[C]//ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD’16).2016:1225-1234.

    [13] DONNAT C, MARINKA Z, HALLAC D, et al. Learning structural node embeddings via diffusion wavelets[C]//ACM SIGKDD InternationalConference on Knowledge Discovery and Data Mining (SIGKDD’18). 2018.

    [14] SUN Y, TAN W N, LI L X, et al. A new method to identify collaborative partners in social service provider networks[J]. Information Systems Frontiers, 2016, 18(3).

    [15] CHEN H, CHUNG W, XU J J, et al. Crime data mining: a general framework and some examples[J]. Computer, 2004, 37(4): 50-56.

    [16] 楊莉莉, 楊永川. 基于社會(huì)網(wǎng)絡(luò)的犯罪組織關(guān)系挖掘[J].計(jì)算機(jī)工程, 2009, 35(15): 91-93.

    YANG L L, YANG Y C. Crime organization relation mining based on social network[J]. Computer Engineering, 2009, 35(15): 91-93.

    [17] 高建強(qiáng), 譚劍, 崔永發(fā). 一種基于通訊痕跡的社會(huì)網(wǎng)絡(luò)團(tuán)伙分析模型[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2012, 29(3): 206-208.

    GAO J Q, TAN J, CUI Y F. One social network clique analysis model based on communication trace[J]. Computer Applications and Software, 2012, 29(3): 206-208.

    [18] 李萬彪, 余志, 龔峻峰, 等. 基于關(guān)系數(shù)據(jù)模型的犯罪網(wǎng)絡(luò)挖掘研究[J]. 中山大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014, 53(5): 1-7.

    LI W B,YU Z, GONG J F, et al. An approach of crime network analysis based on association data model[J]. Acta Scientiarum Anturalium Universitatis Sunyatseni, 2014, 53(5): 1-7.

    [19] 唐德權(quán), 史偉奇, 凌志剛. 有組織犯罪集團(tuán)挖掘算法[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2015, 24(9): 196-200.

    TANG D Q, SHI W Q, LING Z G. Algorithm for mining organized crime[J]. Computer Systems & Applications, 2015, 24(9): 196-200.

    Reasoning method for predicting crime partner by using intimacy network of bank accounts

    LYU Fang, LU Haibo, WANG Wei, HUANG Junheng, WANG Bailing

    (School of Computer Science and Technology, Harbin Institute of Technology, Weihai 264209, China)

    In recent years, research on the law of capital transactions in the case of stakeholder-type illegal financial activities has attracted the attention of researchers. In order to solve the problem of using the bank transaction data to actively discover the abnormal account criminal crime partners, a crime partner prediction method based on the asymmetric intimacy network of the bank accounts was proposed. Firstly, a general network model for bank account transactions was established to embed time-series transaction data into the network structure. Then, using the direct and indirect transaction relationship information of the node, an account asymmetric intimacy calculation method was proposed. Finally, using the asymmetric interaction information of the nodes on the intimate network, the abnormal tendency index of the nodes is obtained. The experimental results on the actual data of the multi-level marketing group show that the crime partner prediction method based on the intimacy network can effectively find potential pyramid shelling members.

    transaction network of bank accounts, intimacy network, direct intimacy, indirect intimacy, crime partner prediction

    s:The National Key Research and Development Program of China (No.2018YFB2004201, No.2017YFB0801804), Frontier Science and Technology in Notation of China (No.2016QY05X1002-2),National Regional Innovation Center Science and Technology Special Project of China (No.2017QYCX14), Key Research and Development Program of Shandong Province (No.2017CXGC0706), the Fundamental Research Funds for the Central Universities (No.HIT.NSRIF.2020098), 2017 University Co-construction Project in Weihai City

    TP391.4

    A

    10.11959/j.issn.2096?109x.2019062

    呂芳(1990? ),女,山東陽谷人,哈爾濱工業(yè)大學(xué)(威海)博士生,主要研究方向?yàn)閺?fù)雜網(wǎng)絡(luò)、信息內(nèi)容安全、數(shù)據(jù)掘。

    陸海博(1998? ),男,甘肅酒泉人,主要研究方向?yàn)榻鹑诎踩?/p>

    王?。?975? ),女,黑龍江齊齊哈爾人,博士,哈爾濱工業(yè)大學(xué)(威海)講師、碩士生導(dǎo)師,主要研究方向?yàn)榻鹑诎踩?shù)據(jù)挖掘、自然語言處理。

    黃俊恒(1966? ),男,河南新鄉(xiāng)人,哈爾濱工業(yè)大學(xué)(威海)副教授,主要研究方向?yàn)閿?shù)據(jù)挖掘、人工智能。

    王佰玲(1978?),男,黑龍江哈爾濱人,哈爾濱工業(yè)大學(xué)(威海)教授、博士生導(dǎo)師,主要研究方向?yàn)樾畔?duì)抗、信息安全、信息搜索、移動(dòng)網(wǎng)絡(luò)、金融安全。

    2019?02?19;

    2019?05?14

    王佰玲,wbl@hit.edu.cn

    國(guó)家重點(diǎn)研發(fā)計(jì)劃基金資助項(xiàng)目(No.2018YFB2004201,No.2017YFB0801804);國(guó)家前沿科技創(chuàng)新專項(xiàng)(No. 2016QY05X1002-2);國(guó)家區(qū)域創(chuàng)新中心科技專項(xiàng)(No.2017QYCX14);山東省重點(diǎn)研發(fā)計(jì)劃基金資助項(xiàng)目(No.2017CXGC0706);中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金資助 (No.HIT.NSRIF.2020098);2017威海市大學(xué)共建基金資助項(xiàng)目

    論文引用格式:呂芳, 陸海博, 王巍, 等. 基于銀行賬戶親密度網(wǎng)絡(luò)推理的團(tuán)伙預(yù)測(cè)研究[J]. 網(wǎng)絡(luò)與信息安全學(xué)報(bào), 2019, 5(6): 95-104.

    LYU F, LU H B, WANG W, et al. Reasoning method for predicting crime partner by using intimacy network of bank accounts[J]. Chinese Journal of Network and Information Security, 2019, 5(6): 95-104.

    猜你喜歡
    團(tuán)伙賬戶交易
    警惕團(tuán)伙作案 遠(yuǎn)離非法薦股圈套
    探索自由貿(mào)易賬戶體系創(chuàng)新應(yīng)用
    外匯賬戶相關(guān)業(yè)務(wù)
    父親的股票賬戶
    特別健康(2018年4期)2018-07-03 00:38:20
    找出8名盜賊
    “團(tuán)伙”威力強(qiáng)過“團(tuán)隊(duì)”
    特別文摘(2017年1期)2017-01-24 18:15:10
    交易流轉(zhuǎn)應(yīng)有新規(guī)
    大宗交易
    《吃飯的交易》
    驚人的交易
    宁南县| 尉氏县| 萨嘎县| 皋兰县| 廊坊市| 汉源县| 安化县| 安顺市| 资中县| 新化县| 山阴县| 龙泉市| 临湘市| 额济纳旗| 图片| 武城县| 黄陵县| 于田县| 德清县| 沁阳市| 敦煌市| 奉贤区| 黄陵县| 沂源县| 策勒县| 盐源县| 雷山县| 天长市| 红桥区| 田林县| 岗巴县| 铁力市| 从化市| 延边| 乐山市| 体育| 井冈山市| 特克斯县| 蛟河市| 贵溪市| 武陟县|