• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于圖卷積神經(jīng)網(wǎng)絡(luò)的洗錢(qián)行為識(shí)別研究

    2022-03-17 05:30:08高赫
    中國(guó)科技縱橫 2022年2期
    關(guān)鍵詞:格蘭杰賬戶關(guān)聯(lián)

    高赫

    (北京金融安全產(chǎn)業(yè)園,北京 100005)

    0.引言

    經(jīng)濟(jì)全球化不斷深入,為各參與方帶來(lái)顯著收益,中國(guó)近幾十年的發(fā)展成就便是極好例證。但與此同時(shí),洗錢(qián)犯罪等負(fù)面效應(yīng)也日漸顯現(xiàn),不僅影響到金融業(yè)健康發(fā)展,也嚴(yán)重破壞經(jīng)濟(jì)秩序。銀行體系作為洗錢(qián)犯罪的常見(jiàn)領(lǐng)域,應(yīng)得到尤其重視。當(dāng)前,常見(jiàn)的反洗錢(qián)手段仍是依據(jù)既有案例,手動(dòng)篩查疑似交易,耗時(shí)耗力。

    隨著大數(shù)據(jù)和AI技術(shù)的發(fā)展,銀行數(shù)據(jù)資產(chǎn)價(jià)值日益凸顯,將大數(shù)據(jù)和AI相結(jié)合,完善補(bǔ)充現(xiàn)有反洗錢(qián)規(guī)則,縮小審查范圍,降低審查成本,是極為有益的嘗試。本次研究致力于探索在構(gòu)造關(guān)聯(lián)網(wǎng)絡(luò)的基礎(chǔ)上,應(yīng)用圖卷積神經(jīng)網(wǎng)絡(luò)(Graph Convolutional Network,GCN),建立反洗錢(qián)模型。

    1.洗錢(qián)犯罪的概念與反洗錢(qián)工作的現(xiàn)狀

    洗錢(qián)是通過(guò)隱瞞、掩飾非法資金的來(lái)源和性質(zhì),通過(guò)某種手法把它變成看似合法資金的行為和過(guò)程?!吨腥A人民共和國(guó)反洗錢(qián)法》第二條規(guī)定:反洗錢(qián)是指為了預(yù)防通過(guò)各種方式掩飾、隱瞞毒品犯罪、黑社會(huì)性質(zhì)的組織犯罪、恐怖活動(dòng)犯罪、走私犯罪、貪污賄賂犯罪、破壞金融管理秩序犯罪、金融詐騙犯罪所得及其收益的來(lái)源和性質(zhì)的洗錢(qián)活動(dòng),依法采取相關(guān)措施的行為。

    反洗錢(qián)風(fēng)險(xiǎn)監(jiān)測(cè)方法的演進(jìn)大致經(jīng)歷了四個(gè)階段,即純?nèi)斯づ袛?、?guī)則策略引擎、量化指標(biāo)引擎,以及本文討論的人工智能引擎。當(dāng)前,傳統(tǒng)金融機(jī)構(gòu)大多處于量化指標(biāo)引擎向人工智能引擎過(guò)渡階段,仍有較為明顯的局限性,無(wú)法覆蓋全部業(yè)務(wù)場(chǎng)景和各類(lèi)洗錢(qián)手段。而洗錢(qián)團(tuán)伙通過(guò)有針對(duì)性地偽裝,可有效規(guī)避既有規(guī)則,甚至人為操控關(guān)鍵量化指標(biāo),對(duì)金融機(jī)構(gòu)造成誤導(dǎo),成為反洗錢(qián)工作的一大挑戰(zhàn)。

    2.工作目標(biāo)設(shè)定及技術(shù)路徑選擇

    本次研究基于賬戶歷史交易數(shù)據(jù),構(gòu)建洗錢(qián)行為識(shí)別模型,對(duì)疑似案件及時(shí)預(yù)警。

    在反洗錢(qián)應(yīng)用領(lǐng)域,KNN、SVM、RF、GBDT、XgBoost等有監(jiān)督機(jī)器學(xué)習(xí)模型,是以專(zhuān)家打好標(biāo)簽的歷史樣本為基礎(chǔ)進(jìn)行學(xué)習(xí),包括客戶的年齡、性別、交易方式、交易額等,最終得到一個(gè)分類(lèi)器,將嫌疑交易和正常交易分離。而K-means、Apriori、FP-Growth、DBSCAN等無(wú)監(jiān)督模型,則不依賴(lài)任何標(biāo)簽信息,而是根據(jù)數(shù)據(jù)點(diǎn)特征,歸納關(guān)聯(lián)關(guān)系,或?qū)ふ耶惓|c(diǎn)。半監(jiān)督學(xué)習(xí)綜合上述兩類(lèi)模型的優(yōu)勢(shì),將少量專(zhuān)家標(biāo)注樣本與大量無(wú)標(biāo)簽數(shù)據(jù)結(jié)合,訓(xùn)練出更具強(qiáng)泛化能力的模型,GCN則是近期較為流行的一種基于圖數(shù)據(jù)結(jié)構(gòu)的半監(jiān)督學(xué)習(xí)方法。

    洗錢(qián)通常依賴(lài)團(tuán)伙協(xié)作,樣本之間關(guān)聯(lián)度高,且樣本間的關(guān)聯(lián)又含有重要風(fēng)險(xiǎn)信息。針對(duì)此類(lèi)場(chǎng)景,可將樣本間關(guān)聯(lián)信息組成復(fù)雜網(wǎng)絡(luò),再使用GCN模型處理。

    主要技術(shù)實(shí)現(xiàn)步驟如下:

    (1)數(shù)據(jù)處理:數(shù)據(jù)樣本大小為7185萬(wàn),來(lái)自合作金融機(jī)構(gòu)近18個(gè)月發(fā)生的交易,訓(xùn)練集為前15個(gè)月,測(cè)試集為后3個(gè)月。通過(guò)數(shù)據(jù)預(yù)處理將多源異構(gòu)數(shù)據(jù)轉(zhuǎn)為模型可識(shí)別的數(shù)據(jù)結(jié)構(gòu)。

    (2)特征工程:將原始數(shù)據(jù)轉(zhuǎn)為可更好表示業(yè)務(wù)邏輯的特征,便于算法模型直接使用,以提高機(jī)器學(xué)習(xí)性能。

    (3)模型構(gòu)建:基于上述數(shù)據(jù)源,綜合運(yùn)用關(guān)聯(lián)網(wǎng)絡(luò)和GCN模型進(jìn)行學(xué)習(xí)建模,最終訓(xùn)練出穩(wěn)定且符合預(yù)期的識(shí)別模型。

    3.數(shù)據(jù)處理

    原始數(shù)據(jù)包含經(jīng)脫敏的賬戶基礎(chǔ)信息、交易信息、主案例表、可疑案例表等。

    數(shù)據(jù)處理主要包括數(shù)據(jù)的提取、轉(zhuǎn)換及加載(Extract-Transform-Load,ETL),清除重復(fù)部分,修正/移除錯(cuò)誤數(shù)據(jù),補(bǔ)充缺失數(shù)據(jù),為后續(xù)建模環(huán)節(jié)做準(zhǔn)備。本次處理工作主要涉及3部分:缺失值、異常值和噪音[1]。

    3.1 缺失值處理

    缺失值主要包含兩類(lèi):數(shù)值型和字符型。數(shù)值型變量缺失值可以通過(guò)總體均值填充、類(lèi)均值填充、回歸預(yù)測(cè)填充等方法實(shí)現(xiàn)。本次研究采用總體均值結(jié)合業(yè)務(wù)實(shí)際進(jìn)行填充。字符型變量缺失值則一律設(shè)為空值。

    3.2 異常值處理

    異常值即取值較極端或出現(xiàn)頻率極低的變量點(diǎn)。處理方法如下:

    (1)統(tǒng)計(jì)量計(jì)算:通過(guò)計(jì)算樣本數(shù)據(jù)的統(tǒng)計(jì)量,判斷異常值的取值是否超出了合理的取值范圍,如客戶年齡為負(fù)值,或超出常見(jiàn)平均壽命等。

    (2)業(yè)務(wù)邏輯判定:對(duì)于具有業(yè)務(wù)實(shí)際意義的數(shù)值變量,根據(jù)業(yè)務(wù)邏輯處理;字符型變量則基于樣本分布,結(jié)合業(yè)務(wù)邏輯處理。

    3.3 噪音處理

    噪音指樣本中的錯(cuò)誤或異常數(shù)據(jù),無(wú)實(shí)際意義,且會(huì)對(duì)數(shù)據(jù)分析造成干擾。有2種處理方法:

    (1)分箱法:考察噪音數(shù)據(jù)的臨近值來(lái)排除干擾。按照屬性值劃分子區(qū)間,將相同屬性值放入對(duì)應(yīng)子區(qū)間(“箱子”)內(nèi),并考察每個(gè)箱子中的數(shù)據(jù),分別對(duì)各箱中數(shù)據(jù)進(jìn)行局部光滑。常見(jiàn)的有均值光滑、中位數(shù)光滑或邊界值光滑。

    (2)回歸法:用函數(shù)擬合數(shù)據(jù)實(shí)現(xiàn)噪聲點(diǎn)光滑,即通過(guò)回歸得到合適的表達(dá)式,從而消除噪聲。

    4.特征工程

    特征工程主要從客戶畫(huà)像、賬戶狀態(tài)、交易動(dòng)態(tài)三大維度進(jìn)行分析。

    4.1 客戶

    主要考察:賬戶類(lèi)型(個(gè)人、公司)、個(gè)人賬戶是否“三地一致”(開(kāi)戶地、身份證歸屬地、手機(jī)號(hào)碼歸屬地),對(duì)公賬戶注冊(cè)資金額度,是否外籍開(kāi)戶人姓名異常,開(kāi)戶人年齡,是否為離岸賬戶,是否外籍客戶來(lái)自高風(fēng)險(xiǎn)國(guó)家,外籍個(gè)人客戶英文名稱(chēng)類(lèi)似公司名稱(chēng),開(kāi)戶日期距離案例天數(shù)以及洗錢(qián)風(fēng)險(xiǎn)等級(jí)等。

    4.2 賬戶

    主要考察:交易量是否存在激增,是否涉及多類(lèi)幣種,是否存在外幣大額高頻提現(xiàn)(如頻率大于5次/周且額度大于等值10000美元),是否存在大額轉(zhuǎn)入分次轉(zhuǎn)出(如小額POS消費(fèi)),是否余額頻繁降至10元以下等。

    4.3 交易

    4.3.1 交易金額

    主要考察:是否交易金額有特殊性(如為千元或萬(wàn)元整數(shù)倍、折合美元為千元或萬(wàn)元整數(shù)倍、特定金額的整數(shù)倍或接近倍數(shù)、個(gè)人賬戶貸方特定金額占比高、個(gè)人賬戶借方特定金額占比高等),特殊金額段轉(zhuǎn)入、轉(zhuǎn)出金額及在總額中占比多少,小額試探的筆數(shù)及占比多少,轉(zhuǎn)入、轉(zhuǎn)出金額的統(tǒng)計(jì)特征,相鄰交易額差值、絕對(duì)差值的統(tǒng)計(jì)特征等。

    4.3.2 交易筆數(shù)

    主要考察:轉(zhuǎn)入、轉(zhuǎn)出筆數(shù)及在總筆數(shù)中的占比,是否存在單日等額特定金額存取各1筆,是否存在同網(wǎng)點(diǎn)單日多賬戶存取各一筆,跨境交易筆數(shù)及占比,跨境交易金額及占比,是否存在個(gè)人客戶外幣多筆大額交易,是否存在公職人員多筆大額交易,是否存在個(gè)人貸方多筆大額交易等。

    4.3.3 交易時(shí)間差

    主要考察:相鄰交易時(shí)間間隔的統(tǒng)計(jì)特征。

    4.3.4 交易對(duì)手

    主要考察:是否交易對(duì)手眾多且涉及多省,單個(gè)賬戶的對(duì)手個(gè)數(shù),與特定對(duì)手連續(xù)及分散交易的次數(shù),對(duì)手中公司和個(gè)人的數(shù)量及比例等。

    常見(jiàn)的數(shù)據(jù)特征及對(duì)應(yīng)的處理方法如表1所示。

    表1 常見(jiàn)的數(shù)據(jù)特征及對(duì)應(yīng)的處理方法

    5.模型構(gòu)建

    5.1 賬戶關(guān)聯(lián)網(wǎng)絡(luò)構(gòu)建

    針對(duì)個(gè)人和公司賬戶,借助格蘭杰因果關(guān)系(Granger causality test)方法[2]構(gòu)建關(guān)聯(lián)網(wǎng)絡(luò)[3]。

    采用非參數(shù)格蘭杰因關(guān)系檢驗(yàn)方法,采用有向二值方式定義賬戶間連接數(shù),并進(jìn)行關(guān)聯(lián)檢驗(yàn)。即:

    通過(guò)循環(huán)測(cè)算連結(jié)數(shù)可判斷在不同時(shí)段各賬戶間關(guān)聯(lián)程度,并構(gòu)建下述網(wǎng)絡(luò)中心性度量和關(guān)聯(lián)網(wǎng)絡(luò)度量,以測(cè)度各賬戶間關(guān)聯(lián)水平。

    5.1.1 網(wǎng)絡(luò)中心性

    將每一賬戶視作一個(gè)節(jié)點(diǎn),從關(guān)系角度給出衡量單一賬戶網(wǎng)絡(luò)中心性的量化指標(biāo):度數(shù)中心度和中介中心度。

    前者衡量的是與單一節(jié)點(diǎn)直接相連的節(jié)點(diǎn)數(shù),賬戶的度數(shù)中心度越高,則與其直接相關(guān)聯(lián)的賬戶越多,該賬戶在網(wǎng)絡(luò)中更接近中心位置,對(duì)其余賬戶影響范圍更大。

    后者是單一節(jié)點(diǎn)在其他兩相關(guān)節(jié)點(diǎn)關(guān)聯(lián)路徑內(nèi)作為中介節(jié)點(diǎn)的個(gè)數(shù),如果某節(jié)點(diǎn)經(jīng)常出現(xiàn)在其他節(jié)點(diǎn)關(guān)聯(lián)路徑中,則中介中心度越高,該賬戶在系統(tǒng)內(nèi)更能推動(dòng)信息向其他節(jié)點(diǎn)傳播。

    5.1.2 關(guān)聯(lián)網(wǎng)絡(luò)

    根據(jù)非參數(shù)格蘭杰因果關(guān)系檢驗(yàn),可判斷非參數(shù)格蘭杰因果關(guān)聯(lián)水平(Degree of Nonparametric Granger Causality,DGC),即賬戶關(guān)聯(lián)關(guān)系緊密度,其數(shù)值越大,則關(guān)系越密切。對(duì)于N個(gè)賬戶間可能存在的最大關(guān)聯(lián)數(shù)目為N(N-1),計(jì)算公式:

    為測(cè)度單個(gè)賬戶與系統(tǒng)的連結(jié)度情況,特定義以下3個(gè)指標(biāo):

    其中,j表示第j個(gè)賬戶,s表示賬戶系統(tǒng)。Out表示系統(tǒng)中賬戶j是其他賬戶非線性格蘭杰影響原因的個(gè)數(shù),In表示其他賬戶是賬戶j的非線性格蘭杰影響原因的個(gè)數(shù)。In+Out為2個(gè)指標(biāo)之和的均值。

    為測(cè)度不同賬戶間的連結(jié)情況,特定義以下3個(gè)指標(biāo):

    其中,α,β分別代表不同類(lèi)型的賬戶。Out-to-other表示由賬戶j非線性格蘭杰影響非本類(lèi)型賬戶i的個(gè)數(shù);In-from-other表示賬戶j被非本類(lèi)型賬戶i非線性格蘭杰影響的個(gè)數(shù);In+Out-other為前2個(gè)指標(biāo)之和的均值。

    5.2 模型構(gòu)建

    在賬戶關(guān)聯(lián)網(wǎng)絡(luò)的基礎(chǔ)上應(yīng)用圖卷積神經(jīng)網(wǎng)絡(luò)算法訓(xùn)練模型[4],基本原理為:

    假設(shè)有N層網(wǎng)絡(luò),每層輸出記為H(1),H(2),…,H(N)。令A(yù)為圖的鄰接矩陣,H(0)=X,X為圖上節(jié)點(diǎn)的特征,則計(jì)算過(guò)程如下:

    其中,W為每層網(wǎng)絡(luò)權(quán)重,P為計(jì)算出的樣本標(biāo)簽分布(預(yù)測(cè)分布)。在反洗錢(qián)模型中,對(duì)P取交叉熵作為上述GCN的Loss函數(shù)。

    采用反向傳播算法對(duì)該網(wǎng)絡(luò)參數(shù)進(jìn)行學(xué)習(xí),設(shè)GCN深度為1,學(xué)習(xí)率為0.001,正則化系數(shù)為10,對(duì)關(guān)聯(lián)網(wǎng)絡(luò)中的賬戶進(jìn)行識(shí)別。

    在測(cè)試集上的部分測(cè)試結(jié)果如表2所示。

    表2 測(cè)試結(jié)果

    重復(fù)30次測(cè)試,F(xiàn)1均值為0.952,表明模型對(duì)疑似洗錢(qián)行為有較好識(shí)別力。

    6.結(jié)語(yǔ)

    本次研究采用關(guān)聯(lián)網(wǎng)絡(luò)及GCN模型,可較準(zhǔn)確識(shí)別疑似洗錢(qián)行為,有助于提升金融機(jī)構(gòu)服務(wù)能力和監(jiān)管效率。隨著更多的專(zhuān)家指標(biāo)和交易信息納入數(shù)據(jù)集,全面綜合人、交易、行為等數(shù)據(jù),持續(xù)優(yōu)化賬戶洗錢(qián)風(fēng)險(xiǎn)評(píng)估方式及可疑交易認(rèn)定方法,可進(jìn)一步提高洗錢(qián)識(shí)別的有效性,建立完善的反洗錢(qián)風(fēng)控體系,提升對(duì)監(jiān)管要求和風(fēng)險(xiǎn)監(jiān)測(cè)的精準(zhǔn)把控。

    猜你喜歡
    格蘭杰賬戶關(guān)聯(lián)
    探索自由貿(mào)易賬戶體系創(chuàng)新應(yīng)用
    “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
    外匯賬戶相關(guān)業(yè)務(wù)
    父親的股票賬戶
    特別健康(2018年4期)2018-07-03 00:38:20
    奇趣搭配
    智趣
    讀者(2017年5期)2017-02-15 18:04:18
    格蘭杰因果關(guān)系在神經(jīng)科學(xué)領(lǐng)域的發(fā)展及缺陷
    電子科技(2015年8期)2015-12-18 13:17:56
    榜單
    格蘭杰因果關(guān)系在復(fù)雜網(wǎng)絡(luò)中的應(yīng)用*
    語(yǔ)言學(xué)與修辭學(xué):關(guān)聯(lián)與互動(dòng)
    安陆市| 唐河县| 当阳市| 安国市| 房山区| 江都市| 乾安县| 柘荣县| 齐齐哈尔市| 广平县| 改则县| 海伦市| 上杭县| 多伦县| 长泰县| 吉安市| 锡林浩特市| 灵宝市| 大新县| 新和县| 泗水县| 汝城县| 准格尔旗| 巴林右旗| 东宁县| 洞头县| 云安县| 汉沽区| 伊金霍洛旗| 景德镇市| 闸北区| 长丰县| 沁阳市| 西安市| 定兴县| 宁城县| 钟祥市| 荥阳市| 云霄县| 灌南县| 仙桃市|