• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Lasso-Logistic模型的P2P網(wǎng)絡(luò)借貸信用風(fēng)險度量

      2018-04-27 00:42:45鄒明芮
      長春大學(xué)學(xué)報 2018年3期
      關(guān)鍵詞:借款人信用風(fēng)險網(wǎng)貸

      鄒明芮

      (廣東外語外貿(mào)大學(xué) 金融學(xué)院,廣州510000)

      伴隨著P2P行業(yè)的快速發(fā)展,借款人的信用風(fēng)險度量是P2P網(wǎng)貸平臺亟待解決的問題之一。國內(nèi)外學(xué)者對P2P網(wǎng)絡(luò)借貸信用風(fēng)險的度量做了諸多研究。但是,目前我國還存在以下兩方面問題:一是P2P網(wǎng)貸平臺還沿用傳統(tǒng)的信用評價方法,方法過于簡單,不能準(zhǔn)確反映個人的信用風(fēng)險;二是影響信用風(fēng)險的因素眾多,如何選取影響因素對信用風(fēng)險進(jìn)行度量至關(guān)重要。本文在Logistic模型的基礎(chǔ)上,引入Lasso算法來建立P2P網(wǎng)貸的信用風(fēng)險度量模型,從眾多的影響因素中科學(xué)地選出度量指標(biāo),以期更為準(zhǔn)確地度量出借款人的信用風(fēng)險,為P2P網(wǎng)貸平臺信用風(fēng)險防范提供參考。

      1 文獻(xiàn)綜述

      孫英雋、蘇顏芹主要研究了P2P借貸過程中的信息不對稱和逆向選擇問題,認(rèn)為在此平臺上虛假信息是不可避免的,這是由網(wǎng)貸平臺信息認(rèn)證方式的不確定性和不可靠性造成的[1]。陳霄、丁曉裕、王貝芬采用Logitic模型并利用網(wǎng)貸平臺借貸數(shù)據(jù)進(jìn)行實證分析,研究影響信用風(fēng)險的各因素[2]。宋麗平、張利坤、徐瑋采用BP神經(jīng)網(wǎng)絡(luò)模型,利用“人人貸”的借貸數(shù)據(jù)對借款人的信用風(fēng)險進(jìn)行評估,為出借人的投資提供一定的參考[3]。于曉虹、樓文高利用隨機(jī)森林的方法,從有效樣本中抽樣得到不同的樣本集,并分別利用決策樹模型對P2P借款人的違約風(fēng)險進(jìn)行度量,發(fā)現(xiàn)借款金額、期限、違約次數(shù)、年收入對違約有很大影響,為投資者進(jìn)行投資決策提供參考[4]。孫同陽、謝朝陽通過抓取P2P網(wǎng)貸平臺的借貸數(shù)據(jù),建立決策樹模型,以信用等級作為其輸出變量,得到了很好的預(yù)測效果[5]。方匡南、章貴軍、張惠穎在Logistic模型的基礎(chǔ)上引入Lasso算法,利用銀行數(shù)據(jù)對影響個人信用風(fēng)險的因素進(jìn)行了實證研究,發(fā)現(xiàn)模型能夠抓住主要的影響因素且預(yù)測的準(zhǔn)確性更高[6]。

      從文獻(xiàn)整理來看,國內(nèi)學(xué)者大多利用網(wǎng)貸平臺上公布的借款信息篩選指標(biāo)對信用風(fēng)險進(jìn)行度量。但是, 大多數(shù)學(xué)者沒有考慮過多變量之間可能存在共線性,以及無關(guān)變量對模型準(zhǔn)確性的干擾。因此,本文將在Logistic模型的基礎(chǔ)上引入Lasso算法,實現(xiàn)對變量的篩選,使所建立的信用風(fēng)險度量模型更簡潔,預(yù)測更準(zhǔn)確。

      2 借款人信用風(fēng)險影響因素

      投資人根據(jù)網(wǎng)站公布的借款信息進(jìn)行判斷投資,從網(wǎng)貸平臺上可獲得的信息主要分為4類:借款標(biāo)的信息、借款人基本信息、借款人收入及資產(chǎn)負(fù)債信息、借款人歷史表現(xiàn)及信用信息。

      (1)借款標(biāo)的信息包括借款的金額、借款利率、借款期限。一般借款金額越大,借款人的還款壓力越大,違約風(fēng)險越大;借款的利率越高,表明還款所支付的成本越高,還款壓力越大,違約的風(fēng)險越大;借款的期限越長,還款期間的不確定性越大,可能造成還款違約的風(fēng)險越大。

      (2)借款人基本信息包括借款人的年齡、性別、受教育程度、婚姻狀況、所在地、工作類型、工作年限。年齡和性別一般會影響借款人的風(fēng)險偏好或是道德觀念;受教育程度可能影響借款人的還款能力和道德觀念,一般來說學(xué)歷高的人,工作待遇較好,還款能力強(qiáng),且法律觀念強(qiáng),對自己的信用更在乎;婚姻狀況可能影響借款人的責(zé)任感和還款能力;工作類型和工作年限也會影響到借款人的還款能力、風(fēng)險偏好和責(zé)任感。上述因素都會影響到借款人的信用風(fēng)險。

      (3)借款人收入及資產(chǎn)負(fù)債信息包括借款人的收入、月還本息收入比、是否擁有房產(chǎn)和車產(chǎn)、是否擔(dān)負(fù)房貸和車貸。這些信息都能反映借款人的還款能力,進(jìn)而影響借款人的信用風(fēng)險。一般擁有較高收入的人還款能力強(qiáng),違約可能性較低。但是,如果高收入者對自己有較高的還款預(yù)期,而大量借款且投資高風(fēng)險項目,一旦投資失敗且還款金額較大,也很可能發(fā)生違約的情況。

      (4)信款人歷史表現(xiàn)及信用信息包括借款人的逾期次數(shù)、申請借款次數(shù)、成功借款次數(shù)、信用等級。雖然網(wǎng)貸平臺會對借款人進(jìn)行信用評估,給出相應(yīng)的信用等級,但這一信用等級是根據(jù)借款人提供的認(rèn)證信息的多少以及以往的交易記錄而得出的,不能完全反映借款人的信用風(fēng)險。其他的歷史表現(xiàn)能夠反映出借款人的借貸習(xí)慣,對借款人的信用風(fēng)險有一定的預(yù)測能力。

      3 P2P網(wǎng)貸信用風(fēng)險度量實證分析

      3.1 Lasso-Logistic模型介紹

      Lasso估計是由Tibshirani提出的一種壓縮估計方法,通過構(gòu)造一個懲罰函數(shù),使得系數(shù)被壓縮,是一種處理多重共線性的有偏估計。Lasso的基本思想是在回歸系數(shù)的絕對值之和小于一個常數(shù)的約束條件下,使殘差平方和最小,從而能夠產(chǎn)生某些嚴(yán)格等于零的回歸系數(shù),得到可以解釋的模型。

      假設(shè)有獨(dú)立同分布的觀測值(X,yi),自變量為X=xij為n×p的矩陣,因變量yi為二元離散變量,即yi∈{0,1},則Logistic線性模型可寫為:

      (1)

      (2)

      其中l(wèi)(β)為對數(shù)似然函數(shù),則式(2)中的l(β)可寫成如下形式:

      (3)

      (4)

      通過對調(diào)和參數(shù)λ的控制,可以實現(xiàn)對變量的篩選。

      3.2 數(shù)據(jù)來源及處理

      本文數(shù)據(jù)均來自于“人人貸”平臺。在“人人貸”網(wǎng)站上,每一筆借款都有一個頁面來公布借款標(biāo)的及借款人的詳細(xì)信息。筆者通過設(shè)計爬蟲軟件來獲取貸款數(shù)據(jù)。所抓取的借款信息存在5種狀態(tài),分別是“已還清”“已流標(biāo)”“還款中”“逾期中”“已墊付”。為確保分析的有效性,將未成功借款的“已流標(biāo)”以及信息不全的貸款剔除掉。由于“還款中”和“逾期中”的借款在未來還款期間存在不確定性,也將其剔除。再在剩余貸款中,將重復(fù)用戶的貸款剔除掉,最后剩余32260組用戶數(shù)據(jù)。將借款狀態(tài)顯示“已墊付”的用戶定義為“違約用戶”,“已還清”用戶定義為“正常用戶”。其中,違約用戶數(shù)據(jù)1465組,正常用戶數(shù)據(jù)30795組。違約率約為4.5%?!叭巳速J”上的借款總共分成3種類型,分別是實地認(rèn)證標(biāo)、機(jī)構(gòu)擔(dān)保標(biāo)和信用認(rèn)證標(biāo)。實地認(rèn)證標(biāo)是相對信用認(rèn)證標(biāo)增添了友信或友信合作機(jī)構(gòu)的認(rèn)證審核的借款標(biāo);機(jī)構(gòu)擔(dān)保標(biāo)是指“人人貸”的合作伙伴為相應(yīng)的借款承擔(dān)連帶保證責(zé)任的借款標(biāo);信用認(rèn)證標(biāo)是對借款用戶的個人信用資質(zhì)進(jìn)行全面審核后,推薦并代理用戶在平臺發(fā)布的借款標(biāo)。通過觀察所收集到的借款標(biāo)數(shù)據(jù)發(fā)現(xiàn),實地認(rèn)證標(biāo)和機(jī)構(gòu)擔(dān)保標(biāo)不存在違約的情況。由于本文是針對建立信用風(fēng)險度量模型,所以主要對信用認(rèn)證標(biāo)進(jìn)行探究,剔除其余兩種標(biāo)后,剩余6146組數(shù)據(jù),其中違約用戶1465組,正常用戶4681組。同時,本文從這6146組數(shù)據(jù)中隨機(jī)抽取600組數(shù)據(jù)作為測試組,其中違約用戶128組,正常用戶472組,

      剩余的5546組數(shù)據(jù)為實驗組用于建模。

      3.3 變量介紹

      影響個人信用風(fēng)險的變量如表1所示。

      表1 信用風(fēng)險變量介紹

      3.4 實證分析

      本文利用Lasso-Logistic模型回歸。

      首先,畫出Lasso系數(shù)解的路徑圖(見圖1),橫坐標(biāo)為Lambda的對數(shù),縱坐標(biāo)為系數(shù)值,最上面的數(shù)字為不同Lambda所對應(yīng)的篩選出的變量的個數(shù)。隨著Lambda的增大,越來越多的變量的系數(shù)趨向于0,對Lambda的選擇可實現(xiàn)對變量的篩選。

      其次,利用交叉檢驗的方法,得到最優(yōu)的協(xié)調(diào)參數(shù)λ的值(見圖2),CV誤差曲線圖表示的是不同的Lambda的值所對應(yīng)的模型誤差,橫軸是Lambda值的對數(shù),縱軸對應(yīng)的是模型誤差,最上面的數(shù)字表示不同Lambda所篩選出的變量個數(shù)。

      圖1 系數(shù)解路徑圖

      圖2 CV誤差曲線圖

      由圖2可以看出,隨著Lambda取值的逐漸增大,壓縮程度增大,所選入模型的變量個數(shù)越少。左邊的虛線表示Lambda.min取值的位置,右側(cè)的虛線是Lambda.lse取值的位置,對應(yīng)著一倍標(biāo)準(zhǔn)誤差內(nèi)更簡潔的模型。Tibshirani認(rèn)為,模型變動偏差在兩虛線之間變動較小,Lambda應(yīng)在此區(qū)間內(nèi)取值,一般建議選取Lambda.lse,使模型相對簡潔。所以,本文選取Lambda.1se進(jìn)行變量篩選。基于Lambda的取值,可以得到篩選出的變量參數(shù)估計值如表2所示。

      表2中的9個變量分別為:信用等級、年齡、受教育程度、逾期次數(shù)、月平均收入、房貸、車產(chǎn)、工作年限以及成功借款筆數(shù)。從回歸結(jié)果可以看出,信用等級越低的人越容易違約,而信用等級高低主要根據(jù)出借人提供的信息認(rèn)證的多少以及以往的交易記錄的綜合情況來確定。一般來說,信息認(rèn)證提供得越多,則信息的真實性越強(qiáng),交易情況好的出借人違約率較低。身負(fù)房貸和擁有車產(chǎn)的借款人違約率較低。身負(fù)房貸說明借款者能夠從銀行貸到款,通過了國家征信體系認(rèn)證,具有較好的信用。擁有車產(chǎn)說明家庭的經(jīng)濟(jì)基礎(chǔ)較好,具有較強(qiáng)的還債能力。工作年限對違約率有正向的影響,可能工作時間比較短的借款人越注重自己的信用。

      表2 參數(shù)估計

      3.5 模型的準(zhǔn)確性檢驗

      基于前文的實證分析,風(fēng)險度量模型已經(jīng)確定。為了檢驗?zāi)P皖A(yù)測的準(zhǔn)確性,本文利用模型對測試組進(jìn)行預(yù)測,并將預(yù)測的結(jié)果與實際發(fā)生的結(jié)果進(jìn)行對比。詳情如表3所示。從表3可以算出,測試組的預(yù)測準(zhǔn)確率為90.33%。

      表3 測試組的預(yù)測分類表

      ROC(Receiver Operating Characteristic)曲線常被用來判斷一個二值分類器的優(yōu)劣,可以直觀地通過構(gòu)圖來顯示模型的準(zhǔn)確性。測試組的ROC曲線如圖3所示。

      圖3 測試組的ROC曲線

      利用該曲線與45度線的偏離程度來判斷模型的擬合程度,同時與ROC曲線一起判斷的還有一個指標(biāo)AUC(Area Under Curve),即ROC曲線下面的面積。AUC的取值一般在0.5~1之間,越接近1說明模型判斷越準(zhǔn)確。AUC值位于0.7~0.8時,認(rèn)為該模型有一定的區(qū)分能力;AUC值位于0.8~0.9時,模型區(qū)分能力良好;AUC值大于0.9時,區(qū)分能力非常好。根據(jù)圖3所示的測試組的ROC曲線,AUC值為0.946,說明所建立的風(fēng)險度量模型對信用風(fēng)險具有非常好的判斷能力。

      4 政策建議

      第一,健全平臺信用征信體系,完善信息認(rèn)證模式。信息的不對稱極易造成道德風(fēng)險,對個人的信用違約有極大的影響。P2P網(wǎng)貸平臺應(yīng)加大對個人信息的審核力度,擴(kuò)充新的信息認(rèn)證方式,如可通過信用卡認(rèn)證、水電煤氣賬單認(rèn)證、微信認(rèn)證等方式來確認(rèn)借款人的真實信息和信用狀況。

      第二,建立科學(xué)全面的信用風(fēng)險評估體系,提高平臺內(nèi)部工作人員的專業(yè)水平。對借款人事先進(jìn)行專業(yè)的評估,控制信用風(fēng)險的發(fā)生。針對不同信用風(fēng)險的借款人,平臺應(yīng)制定不同的個性化的借款合同來控制風(fēng)險的發(fā)生。

      第三,設(shè)立統(tǒng)一的評分標(biāo)準(zhǔn),實現(xiàn)網(wǎng)貸平臺間的信息共享。由于各P2P平臺的信息不共享,使得一些借款人在一個平臺上違約了,又跑到另一個平臺上繼續(xù)借款。實現(xiàn)平臺間的信息共享,能夠有效地減少個人的多平臺借款違約行為,而且通過借助其他平臺上借款人的信息,可以更加全面準(zhǔn)確地度量出借款人的信用風(fēng)險情況。

      第四,增加違約成本,提高對違約行為的懲罰力度,如增加違約罰金等。將借款人在網(wǎng)貸平臺上的信用記錄與其生活相聯(lián)系,使其信用記錄像銀行貸款違約一樣,影響今后的買房、買車貸款,迫使借款人及時還款,降低信用風(fēng)險。

      第五,健全相關(guān)法律法規(guī),完善監(jiān)管機(jī)制。政府及相關(guān)部門應(yīng)該加強(qiáng)對網(wǎng)貸平臺的監(jiān)管,制定統(tǒng)一的規(guī)章制度及平臺準(zhǔn)入機(jī)制,全面披露行業(yè)的有關(guān)數(shù)據(jù),明確監(jiān)管部門、網(wǎng)貸平臺、借款人和出借人各方的權(quán)利和義務(wù)。

      參考文獻(xiàn):

      [1] 孫英雋,蘇顏芹. 微金融的發(fā)展趨勢:網(wǎng)絡(luò)借貸[J]. 科技與管理,2012(1): 92-95.

      [2] 陳霄,丁曉裕,王貝芬. 民間借貸逾期行為的研究:基于P2P網(wǎng)絡(luò)借貸的實證分析[J]. 金融論壇,2013(11): 65-72.

      [3] 宋麗平,張利坤,徐瑋. P2P網(wǎng)絡(luò)借貸個人信用風(fēng)險評估[J]. 財會月刊,2015(12): 94-96.

      [4] 于曉虹,樓文高. 基于隨機(jī)森林的P2P網(wǎng)貸信用風(fēng)險評價、預(yù)警與實證研究[J]. 金融理論與實踐,2016(2): 53-58.

      [5] 孫同陽,謝朝陽. 基于決策樹的P2P網(wǎng)貸信用風(fēng)險評價[J]. 商業(yè)經(jīng)濟(jì)研究,2015(2): 81-82.

      [6] 方匡南,張貴軍,張惠穎. 基于Lasso-Logistic模型的個人信用風(fēng)險預(yù)警方法[J]. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2014(2): 125-136.

      猜你喜歡
      借款人信用風(fēng)險網(wǎng)貸
      P2P網(wǎng)貸中的消費(fèi)者權(quán)益保護(hù)
      中國外匯(2019年10期)2019-08-27 01:58:18
      鄉(xiāng)城流動借款人信用風(fēng)險與空間收入差異決定
      小微企業(yè)借款人
      網(wǎng)貸平臺未來亟需轉(zhuǎn)型
      商周刊(2017年17期)2017-09-08 13:08:58
      網(wǎng)貸十年:迎來“去偽存真” 時代
      商周刊(2017年17期)2017-09-08 13:08:58
      淺析我國商業(yè)銀行信用風(fēng)險管理
      京東商城電子商務(wù)信用風(fēng)險防范策略
      商業(yè)銀行對借貸人貸后監(jiān)控與風(fēng)險治理
      個人信用風(fēng)險評分的指標(biāo)選擇研究
      中國網(wǎng)貸地圖
      东阳市| 高唐县| 峡江县| 莱西市| 陆丰市| 茂名市| 南开区| 兰西县| 沙湾县| 杨浦区| 鸡泽县| 崇义县| 清苑县| 长白| 禄劝| 安丘市| 玛沁县| 玉山县| 鄯善县| 黄骅市| 民乐县| 南江县| 璧山县| 高安市| 萨迦县| 晋城| 汉沽区| 长阳| 贵州省| 临武县| 绍兴县| 休宁县| 三原县| 德江县| 衡阳市| 通道| 香港 | 贵溪市| 双峰县| 汕尾市| 百色市|