黃洲丹
【摘要】本文主要分析大量數(shù)據(jù)的機(jī)器學(xué)習(xí)方法以及金融服務(wù)領(lǐng)域內(nèi)的機(jī)器學(xué)習(xí)方法的應(yīng)用,介紹機(jī)器學(xué)習(xí)的背景和機(jī)器學(xué)習(xí)方法的概述,對機(jī)器學(xué)習(xí)的使用領(lǐng)域進(jìn)行探索,討論金融機(jī)構(gòu)內(nèi)的若干應(yīng)用案例:信用風(fēng)險模型,信用卡欺詐和洗錢檢測以及監(jiān)控金融機(jī)構(gòu)違反行為標(biāo)準(zhǔn)的行為。
【關(guān)鍵詞】機(jī)器學(xué)習(xí) 深度學(xué)習(xí) 信用風(fēng)險與收益模型 信用卡欺詐 反洗錢
一、前言
機(jī)器學(xué)習(xí)是一個人工智能領(lǐng)域,它使用算法,允許計算機(jī)無需編程即可學(xué)習(xí)。機(jī)器學(xué)習(xí)有兩種形式:監(jiān)督和無監(jiān)督。在有監(jiān)督的機(jī)器學(xué)習(xí)中,建立統(tǒng)計模型以便基于特定輸入預(yù)測結(jié)果(例如,基于各種宏觀經(jīng)濟(jì)變量的輸入預(yù)測GDP增長);在無監(jiān)督的機(jī)器學(xué)習(xí)中,執(zhí)行數(shù)據(jù)分析以識別模式而不估計因變量。
機(jī)器學(xué)習(xí)很重要,因為它可以分析數(shù)據(jù)樣本,以便識別數(shù)據(jù)中的模式和關(guān)系,并可以進(jìn)行樣本外預(yù)測,然后對模型進(jìn)行數(shù)千或數(shù)百萬次分析,以便模型可以提高其預(yù)測能力。在這方面,機(jī)器學(xué)習(xí)與“大數(shù)據(jù)”革命密切相關(guān)。有監(jiān)督的機(jī)器學(xué)習(xí)還可以分析非參數(shù)和非線性關(guān)系,這些關(guān)系可以適合任何給定的模型并對依賴變量和自變量進(jìn)行推斷。
機(jī)器學(xué)習(xí)主要應(yīng)用于三大類統(tǒng)計問題:回歸,分類和聚類?;貧w和分類都可以通過有監(jiān)督的機(jī)器學(xué)習(xí)來解決,而聚類則遵循無監(jiān)督的方法?;貧w問題可以預(yù)測定量的連續(xù)變量,包括通貨膨脹和GDP增長;分類問題對離散的因變量進(jìn)行預(yù)測,例如過濾垃圾郵件和血液類型;聚類涉及觀察輸入變量而不包括因變量,例子包括反洗錢分析。
二、深度學(xué)習(xí)
深度學(xué)習(xí)方法遠(yuǎn)離我們迄今為止討論的“經(jīng)典”模型方法,經(jīng)典模型專注于定義明確的結(jié)構(gòu)化數(shù)據(jù)集,而深度學(xué)習(xí)則通過在學(xué)習(xí)過程中應(yīng)用多層算法并轉(zhuǎn)換原始數(shù)據(jù)來識別復(fù)雜模式,從根本上模仿人類大腦。每種算法都關(guān)注數(shù)據(jù)的特定特征(稱為表示),并且這些表示的分層允許模型包含各種輸入,包括低質(zhì)量或非結(jié)構(gòu)化數(shù)據(jù)。重要的是,這些層不是由工程師設(shè)計的,而是由模型從各種數(shù)據(jù)中學(xué)習(xí)的。
例如,深度學(xué)習(xí)已被用于面部識別和自然語言學(xué)習(xí)模型,模型已足夠復(fù)雜,不僅能夠?qū)τ懻撝黝}進(jìn)行分類,還能夠?qū)λ嫒藛T的情緒進(jìn)行分類。然而,深度學(xué)習(xí)模型非常復(fù)雜,通常需要數(shù)百萬或數(shù)億個數(shù)據(jù)集。
三、機(jī)器學(xué)習(xí)的應(yīng)用
金融機(jī)構(gòu)處理他們需要分析的大量數(shù)據(jù),這需要復(fù)雜的分析工具。為響應(yīng)新的法規(guī)和合規(guī)措施,在2007 - 2009金融危機(jī)之后,金融機(jī)構(gòu)需要報告更全面的資產(chǎn)負(fù)債表指標(biāo)和業(yè)務(wù)模式細(xì)節(jié),進(jìn)行壓力測試以及流動性測量,對資本和抵押品進(jìn)行報告。
金融機(jī)構(gòu)還面臨著來自消費者應(yīng)用程序,社交媒體供稿和各種系統(tǒng)元數(shù)據(jù)輸出的大量低質(zhì)量,非結(jié)構(gòu)化數(shù)據(jù)(稱為大數(shù)據(jù))。機(jī)構(gòu)能夠有效地分析這些大量數(shù)據(jù)變得越來越重要,包括使用傳統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)以及更復(fù)雜的深度學(xué)習(xí)技術(shù)。金融機(jī)構(gòu)應(yīng)使用傳統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)來挖掘高質(zhì)量的結(jié)構(gòu)化監(jiān)管數(shù)據(jù),深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)應(yīng)該用于低質(zhì)量,高頻率,“大數(shù)據(jù)”類型的源。
(一)信用風(fēng)險與收益模型
金融機(jī)構(gòu)最近采用機(jī)器學(xué)習(xí)方法和傳統(tǒng)模式來提高他們預(yù)測金融風(fēng)險的能力,他們逐漸擺脫了不那么復(fù)雜的傳統(tǒng)線性信用風(fēng)險模型回歸。但是,機(jī)器學(xué)習(xí)模型往往不適合成功地納入金融機(jī)構(gòu)的持續(xù)風(fēng)險監(jiān)控,機(jī)器學(xué)習(xí)模型可能過于復(fù)雜并且對過度擬合數(shù)據(jù)敏感。它們的(通常是極端的)復(fù)雜性使得難以應(yīng)用管轄一致的數(shù)據(jù)定義,并且模型對于監(jiān)管目的而言過于復(fù)雜,包括基于巴塞爾內(nèi)部評級(IRB)方法的內(nèi)部模型也是如此,審計員很難了解他們。盡管存在缺點,但機(jī)器學(xué)習(xí)模型可以成功地用于優(yōu)化具有監(jiān)管功能的現(xiàn)有模型。例如,線性和較不復(fù)雜的非線性機(jī)器學(xué)習(xí)模型都可以應(yīng)用于現(xiàn)有的監(jiān)管和收益預(yù)測模型。
(二)欺詐
銀行已成功將機(jī)器學(xué)習(xí)用于檢測信用卡欺詐,信用卡欺詐可以比其他風(fēng)險領(lǐng)域更有用地結(jié)合機(jī)器學(xué)習(xí),因為模型的培訓(xùn),回測和驗證需要大量的信用卡交易。模型還可以通過無監(jiān)督的學(xué)習(xí)方法(如聚類)成功地用于反洗錢或打擊資助恐怖主義活動,但難以僅使用歷史數(shù)據(jù)來訓(xùn)練洗錢檢測算法以檢測欺詐活動。
(三)交易中行為和市場濫用的監(jiān)督
對交易者違規(guī)行為的監(jiān)控是另一個不斷增長的領(lǐng)域,其中機(jī)器學(xué)習(xí)越來越多地用于檢測流氓交易,內(nèi)幕交易和基準(zhǔn)操縱活動。金融機(jī)構(gòu)發(fā)現(xiàn)這些違規(guī)行為的早期發(fā)現(xiàn)很重要,因為它們可能對機(jī)構(gòu)造成重大的財務(wù)和聲譽損害。
金融機(jī)構(gòu)成功應(yīng)用機(jī)器學(xué)習(xí)所面臨的挑戰(zhàn)之一包括與開發(fā)人員共享過去違規(guī)信息的法律復(fù)雜性。此外,系統(tǒng)需要是可審計的,但由于機(jī)器學(xué)習(xí)模型旨在不斷從數(shù)據(jù)中學(xué)習(xí),因此很難向合規(guī)官員解釋為什么某個行為會引發(fā)警報。作為對這些問題的補(bǔ)救,可以設(shè)計系統(tǒng)以將機(jī)器學(xué)習(xí)與人類決策相結(jié)合。通過將人類決策與機(jī)器學(xué)習(xí)相結(jié)合,系統(tǒng)數(shù)據(jù)可用于了解有關(guān)交易者的全面信息,并創(chuàng)建一個不太復(fù)雜且更適合審計和監(jiān)管目的的系統(tǒng)。
四、小結(jié)
如今,機(jī)器學(xué)習(xí)和人工智能是金融服務(wù)領(lǐng)域的重要課題。金融機(jī)構(gòu)正在尋求更強(qiáng)大的分析方法,以便管理和挖掘越來越多的監(jiān)管報告數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),用于合規(guī)和風(fēng)險管理或為了與其他金融機(jī)構(gòu)和金融科技公司有效競爭。
機(jī)器學(xué)習(xí)方法具備分析大量數(shù)據(jù)的能力,同時提供深度的預(yù)測分析,可以提高金融機(jī)構(gòu)中風(fēng)險管理和合規(guī)領(lǐng)域的分析能力。例如,檢測付費系統(tǒng)中復(fù)雜的非法交易模式以及更準(zhǔn)確的信用風(fēng)險建模。機(jī)器學(xué)習(xí)方法在金融服務(wù)領(lǐng)域的應(yīng)用高度依賴于環(huán)境,金融機(jī)構(gòu)并不總是提供用于培訓(xùn)或分析的高質(zhì)量數(shù)據(jù)。更重要的是,幾種方法的分析的預(yù)測能力可能以增加模型復(fù)雜性和缺乏解釋性洞察力為代價,這是需要改進(jìn)的地方。
參考文獻(xiàn):
[1] Van Liebergen, Bart,“Machine Learning:A Revolution in RiskManagement and Compliance" Institute of International Finance,April 2017.
[2]彼得·哈靈頓著.李銳,李鵬,曲亞東,王斌,譯.機(jī)器學(xué)習(xí)實戰(zhàn)[M].北京:人民郵電出版社,2013.
[3]賀建清.金融科技:發(fā)展,影響與監(jiān)管[J].金融發(fā)展研究,2017(06).