• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      P2P平臺出借人投資決策研究

      2017-07-12 18:04:08王辛未姜睿思
      上海管理科學 2017年3期
      關鍵詞:借款人網貸信用

      王辛未, 姜睿思

      (上海交通大學 安泰經濟與管理學院,上海 200030)

      ?

      P2P平臺出借人投資決策研究

      王辛未, 姜睿思

      (上海交通大學 安泰經濟與管理學院,上海 200030)

      隨著P2P網貸平臺的迅速發(fā)展,一個關鍵的問題是投資者如何評估借款人的信用風險并有效投資。本文從網貸平臺的真實貸款數據出發(fā),分別用邏輯回歸和隨機森林預測貸款的違約概率,并通過距離度量模型與核權重相結合評估出新貸款需求的收益和風險。由于P2P網貸平臺對放、貸款金額的限制,本文同時解決了一個有約束的投資組合問題。數據結果顯示,與傳統(tǒng)的信用分級相比,本文的方法提高了貸款收益率預測的準確度,選擇出的投資組合收益率更高。

      P2P網貸; 隨機森林; 核權重; 投資組合

      本文對P2P平臺上每一筆新增貸款需求進行了一個更詳細的信用評估,通過歷史貸款數據核加權的方法評估出每一筆新貸款所能帶來的風險和收益,有助于個人投資者能基于此評估結果分配自己的投資,實現(xiàn)更好的投資決策。

      1 國內外文獻綜述

      P2P作為新興的金融事務,吸引了眾多研究者的關注。目前,國內外的研究主要集中在網貸平臺的運營模式、平臺監(jiān)管、借款人違約風險評估、投資者出借意愿等領域。

      Hulme等[1]根據研究英國的P2P平臺zopa得出P2P的出現(xiàn)是應對信息時代金融市場需求誕生的新型借貸款者關系。在研究信息不對稱問題時,劉峙廷[2]指出,對于網貸平臺的投資者來說,在判斷借款人的可信度時,他們希望知曉借款人更多的“軟信息”和“硬信息”,且兩者處于同等重要的地位。軟信息指的是不能通過準確且具體的數值或者指標來表示的信息,與此相對應的,硬信息一般指的是可以準確具體表示的信息。Freedman等[3]利用Prosper 平臺提供的數據,研究了在P2P網貸中的信息不對稱問題。由于在Prosper上提出貸款申請的很有可能是信用較低、在線下銀行難以獲得貸款的借款人,而投資者很多時候難以獲得完整的資料去判斷,這種信息不對稱很容易就產生逆向選擇和道德風險問題。他們提出可以利用借款人在社交網絡中的個人信息,進而在某種程度上幫助貸款者去辨別借款者的違約風險。Dongyu等[4]從社會資源和借款人性格的角度去研究影響投資者對借款者信任的因素,數據顯示,社交網絡資源越豐富的借款人更容易得到投資者的信任因而更獲得貸款。與此同時,借款人的性格與能否獲得貸款也有較為明顯的聯(lián)系。Lin[5]研究社會關系在借款者違約風險上的影響時發(fā)現(xiàn),擁有穩(wěn)定的朋友關系的借款人,尤其是擁有那些信用認證更高的優(yōu)質朋友的借款人的違約概率能大幅降低,作者認為利用軟信息去研究借款者信用是一個很有效的方向。Lee等[6]研究網貸平臺上投資者行為,由于網貸平臺上的投資者大多數并不是專業(yè)投資者,對借款者的信用狀況缺乏理性的的評判,故他們很容易將資金投放在已經擁有較多其他投資者投資的借款項目上,P2P平臺存在著“羊群行為”問題。雒春雨[7]根據P2P網絡借貸的一些特點,將投資者行為信息和借貸者的信用信息相結合進行挖掘,分別從投資者的構成、借貸者信用風險及多信息源3個角度進行綜合的分析考量,并量化貸款評估及投資決策模型,幫助投資者進行投資決策。

      近年來,數據挖掘人工智能方法在信用評估方面應用廣泛。HaSH[8]構建了一個由Kohonen神經網絡模型和Cox比例風險回歸模型組合的的混合模型,Kohonen神經網絡模型用來聚類,將信貸違約者分為幾個同質組,Cox比例風險回歸模型用來分析每組違約者的還款模式,綜合來評估還款違約可能發(fā)生的階段。研究結果,表明該模型能夠取得較好的預測結果。對于銀行來說,不良貸款數目過多嚴重影響銀行的運營狀況,Mandala等[9]對某家農村銀行進行信用風險分析,以減少不良貸款數目為目標,通過利用決策樹模型的C5.0算法對貸款進行信用評估,結果顯示該評估方法能有效對不良貸款進行預警,可使不良貸款率從之前的11.99%下降到低于5%。熊志斌[10]借鑒傳統(tǒng)PCA方法中的序數主成分概念,提出了基于順序自聯(lián)想神經網絡的非線性主成分分析法,結果顯示該方法能提取更少的主成分表示出原始數據中更多的信息,并分別結合神經網絡和邏輯回歸模型,通過實證研究表明在相同的PCA方法處理數據下,結合神經網絡模型的預測效果比邏輯回歸要好。楊勝剛等[11]研究德國某商業(yè)銀行的真實客戶信用數據,將決策樹應用于變量的篩選過程,并將其與BP神經網絡相結合構建了一個兩階段的組合模型。研究表明,和單一的BP神經網絡模型相比,基于決策樹和神經網絡構建的個人信用評估組合模型能夠提高分類預測的精度。姚瀟[12]利用兩個公開的信用數據集實證研究發(fā)現(xiàn),與其他的模型相比,所提出的模糊近似支持向量機能夠顯著地提高信用風險分類精度,具有較高的實用價值。Harris[13]運用集群支持向量機(CSVM)進行信用風險評估,并且和傳統(tǒng)的非線性支持向量機(SVM)比較得出集群支持向量機(CSVM)能夠實現(xiàn)更好的分類效果。

      2 模型建立

      2.1 違約概率估計

      借款人未來還款情況有兩種,履約或者違約,我們可以通過借款人的一些信息變量比如貸款金額、貸款原因以及貸款人信用卡情況等個人信息進行分類預測,判斷出借款人的違約概率。機器學習中常用的進行分類預測的方法有邏輯回歸、貝葉斯法、神經網絡法、支持向量機法、隨機森林法等,根據需求本文選擇邏輯回歸和隨機森林這兩種方法進行違約概率預測。

      隨機森林分為分類和回歸兩種技術,本文研究的是貸款是否會發(fā)生違約,屬于分類預測,所以這里我們主要介紹隨機森林的分類。Breiman[14]把分類樹組合成隨機森林,即通過隨機抽取變量(列)和樣本數據(行),生成很多分類樹,再匯總分類樹的結果,即成為隨機森林算法。所謂的隨機森林分類方法就是由許多決策樹分類模型{h(X,θk),k=1,…}組成的組合分類模型,其中{θk}是相互獨立同分布的隨機變量,在給定的自變量X下,每個決策樹分類模型均有一票投票權一起決策最優(yōu)的分類結果。

      其中:H(x)表示組合分類模型結果;hi(x)是單個決策樹分類模型結果;Y為因變量;I(·)為示性函數。

      邏輯回歸是對定性變量的回歸分析,是二分類因變量常用的統(tǒng)計方法。用邏輯回歸根據貸款者的相關信息預測貸款在違約情況時,借款人違約可以表示為1,借款人沒有違約表示為0。假設借款人i的相關信息即自變量為n個,即xi1,xi2,…,xin,由借款人的相關變量評估該貸款者違約概率為pi,違約發(fā)生的概率與影響因素之間的關系可以表示為

      b0,b1,…,bn是回歸系數,di表示變量疊加后的線性權重之和,di值越高,違約概率越高。

      2.2 距離度量模型

      根據歷史數據去預測未來在很多領域應用很廣泛,但是在P2P平臺上,對于每一個借款人來說,記錄下來的相關歷史數據條目很少,因而對于同一個借款人很難通過其過去表現(xiàn)來評估該借款人未來的還款表現(xiàn)。本文提出利用與某一給定借款人具有相似信息的其他借款人的貸款表現(xiàn)去評估該借款人的方法,根據違約概率的絕對距離去判斷借款人相似度。

      (2)

      由貸款收益進而可得出貸款i的風險為:

      (3)

      2.3 核權重的確定

      為了通過距離度量得到權重系數,本文引入了核回歸的方法。非參數回歸方法的一般模型為Yi=m(xi)+εi(4),通過已知估計出回歸函數,其中Yi為從觀測點xi得到的觀測值,m(xi)是未知回歸函數,εi是獨立同分布的零均值噪聲。常見的非參數回歸方法一般有局部和正交回歸,局部回歸又可以分為核回歸、局部多項式回歸、近鄰回歸和穩(wěn)健回歸。核回歸中有N-W估計,P-C估計,G-M估計。

      本文采用的是核回歸(N-W估計),N-W估計為一種簡單的加權平均估計。假設每個觀測值通過兩個維度進行評估,預測變量x和響應變量y,根據n個歷史觀測值{(xj,yj)|j=1,2,…,n},可以預測給定某一預測變量x下響應變量y的值,即

      (5)

      對于貸款評估,需要評估的貸款i違約概率pi即為預測變量,對應的收益率ui是響應變量,根據n個歷史貸款觀測值{(pj,Rj),j=1,2,…,n}預測貸款i可能帶來的收益為

      (6)

      通過這樣的方法,和貸款i距離近的歷史貸款觀測值被賦予更高的權重,距離遠的賦予更低的權重:

      (7)

      參數h(h>0)被稱為帶寬,為全局光滑參數,最優(yōu)的參數h可以通過訓練集得到,它的選取要滿足非參數估計法中的缺一交叉驗證方法,通過求出下式最小值找出對應的h。

      (8)

      其中,

      (9)

      在基于違約概率間距離的收益評估模型中,可將式子重新表示為

      (10)

      2.4 投資組合選擇

      3 實證分析

      本文的研究選取了美國網貸平臺lending club公司2015年1月1日到2015年12月1日的借款人公開數據,從中選擇出還款狀況為“Fully Paid”“Charged Off”“Default”的貸款,即“履約”“違約”狀況共計33 283條。為了滿足實驗的需求,對上述數據進行了預處理,主要經過數據抽取、缺失值處理、屬性構造等過程。選出如表1所示共計15類屬性用于貸款者違約概率的評估。實驗運算通過R軟件和Matlab進行。

      表1 預測收益精確度比較

      將數據以7∶3的比例分為訓練集和測試集,基于訓練集數據得出邏輯回歸和隨機森林的模型參數,進而預測出訓練集和測試集中各貸款的違約概率。由于本文側重點在于距離度量模型和核回歸部分,則在邏輯回歸和隨機森林預測違約概率的具體步驟和結果就不一一展示了。通過距離度量模型,計算出測試集中各貸款和訓練集中貸款的相似度,通過求核權重的方法,從訓練集中用缺一交叉驗證方法得到最優(yōu)帶寬即找(10)式最小值,CV(h)和h的關系如圖1所示,R軟件運算結果顯示最優(yōu)帶寬h=0.35h0。

      由于訓練集中的貸款收益率都是已知的,通過式(6)、(7)對訓練集中的貸款通過核權重加權得出測試集中每筆貸款的收益,進而由式(3)得到方差。分別用隨機森林、邏輯回歸和信用分級3種方法預測貸款的收益值以及方差值,對于傳統(tǒng)信用分級方式,處于同一個信用級別的貸款被認為具有相同的風險和收益值,收益與貸款違約概率的關系如圖2所示,方差與違約概率的關系如圖3所示。由于本文研究的理性投資者一般不會選擇違約概率很高、極易發(fā)生違約的貸款,故圖2、3中展示的關系選擇出的貸款違約概率以0.4為分界。圖中顯示隨著貸款違約概率的增長,貸款的風險增大,收益減少,從曲線可以看出,同評級方法相比,邏輯回歸和隨機森林預測出的收益和方差更加平滑,不同貸款之間有區(qū)分度,方便更精確地判斷投資組合。

      圖1 核權重最優(yōu)參數h選擇

      圖2 預測收益和違約概率的關系

      圖3 預測風險和違約概率的關系

      由于有測試集貸款的真實收益值,故可以將預測收益和真實收益數據進行比較算出各模型預測收益的歐氏距離,如表2所示。結果顯示,與傳統(tǒng)的信用分級方法相比,隨機森林和邏輯回歸在預測準確度上有所提高,且隨機森林預測效果更好。

      表2 預測收益精確度比較

      在測試集中每個貸款可能實現(xiàn)的收益和風險已被評估出來的情況下,通過有約束的投資組合選擇求解出最優(yōu)的資產配置,即投資者投分配給各借款人的比例,結合測試集中的各貸款的真實收益值、比較信用分級、邏輯回歸以及隨機森林這3種方法選出的投資組合的真實收益狀況,即比較哪種方法的投資收益率更高、夏普率更低。為了驗證模型的適用性,將數據分成8組按照上面所述方法進行測試,由于網貸平臺借款的平均還款期限相對較短,故選取15年美國三年期的國債到期平均收益率作為無風險利率即r=1.05%。由于lending club上的最小投資額為25,即模型中的m=25。假設投資者想要實現(xiàn)的目標收益率R*=0.07,投資金額M為5 000,通過Matlab運算得出每組數據下各項貸款的投資比例,并結合每個貸款的真實收益率數據,得到模型選擇的投資組合所能實現(xiàn)的真實收益率。結果顯示,隨機森林判斷出的投資組合收益率、夏普率最高,其次是邏輯回歸方法,都優(yōu)于基于信用分級的方法。8組結果如表3所示。

      表3 投資組合收益比較

      4 結論與建議

      本文研究中提出了一個通過P2P網貸平臺各貸款違約概率的距離去度量貸款間的相似關系,進而用相似的歷史貸款去評估新進的貸款需求,為投資者提供了更詳細的貸款收益風險信息,幫助投資者有效地提高了投資組合的收益率。本文的研究方法有以下的優(yōu)勢:首先,相比于傳統(tǒng)方法,提出的隨機森林方法能夠更精確的預測貸款的違約風險;其次,在沒有同一借款人的之前的貸款信息的情況下,提出的距離度量模型可以利用與其相似的借款人的歷史貸款數據信息去評估新貸款需求的收益風險狀況。此外,歷史貸款的權重使用核權重,能夠在不需要太多統(tǒng)計假設的情況下保證結果的有效性。8組數據測試結果顯示,通過上述方法選擇出來的投資組合比傳統(tǒng)的根據借款人信用分級方法選擇出的投資組合收益率更高,為P2P平臺的投資者進行投資決策提供了更有效更明確的方法,進而實現(xiàn)更高收益,使投資者更有積極性地將資金應用到網貸平臺,有助于網貸平臺更健康地發(fā)展。由于國內網貸平臺數據尚未公開,故本文選擇了美國網貸平臺的數據進行實證分析,由于本文模型的相對普適性,故研究內容對投資人投資決策有很重要的參考意義。隨著國內網貸平臺數據漸漸公開,之后的工作將基于國內的真實數據展開更進一步的研究。

      [1] Hulme M K, Wright C. Internet based social lending: Past, present and future[J]. Social Futures Observatory, 2006, 115

      [2] 劉峙廷. 我國p2p網絡信貸風險評估研究[D].廣西:廣西大學,2013

      [3] Freedman S M, Jin G Z. Learning by doing with asymmetric information: Evidence from prosper. com[R]. New York:National Bureau of Economic Research, 2011

      [4] Dongyu C, Gezhi C, Jie D,etal. Antecedents of initial trust in the online peer-to-peer lending marketplace[C]//ICSSSM11. IEEE, 2011: 1-4

      [5] Lin M, Prabhala N R, Viswanathan S. Judging borrowers by the company they keep: Friendship networks and information asymmetry in online peer-to-peer lending[J]. Management Science, 2013, 59(1): 17-35

      [6] Lee E, Lee B. Herding behavior in online P2P lending: An empirical investigation[J]. Electronic Commerce Research and Applications, 2012, 11(5): 495-503

      [7] 雒春雨.P2P網絡借貸中的投資決策模型研究[D].大連:大連理工大學,2012

      [8] HaSH. Behavioral assessment of recoverable credit of retailer’s customers[J]. Information Sciences, 2010, 180(19): 3703-3717

      [9] Mandala I G N N, Nawangpalupi C B, Praktikto F R. Assessing credit risk: an application of data mining in a rural bank[J]. Procedia Economics and Finance, 2012, 4: 406-412

      [10] 熊志斌. 基于非線性主成分分析的信用評估模型研究[J].數量經濟技術經濟研究,2013,30(10):138-150

      [11] 楊勝剛,朱琦,成程.個人信用評估組合模型的構建—基于決策樹—神經網絡的研究[J].金融論壇,2013(2):57-67

      [12] 姚瀟,余樂安. 模糊近似支持向量機模型及其在信用風險評估中的應用[J].系統(tǒng)工程理論與實踐,2012,32(3):549-554

      [13] Louveau A, Smirnov I, Keyes T J,etal. Structural and functional features of central nervous system lymphatic vessels[J]. Nature, 2015,523:337-341

      [14] Breiman L. Random forests[J]. Machine learning, 2001, 45(1): 5-32

      [15] Silverman B W. Density estimation for statistics and data analysis[M]. Boca Raton:CRC press, 1986

      Research on Loan Investment Decision-Making on P2P Platform

      WANGXinwei,JIANGRuisi

      (Antai College of Economics & Management, Shanghai Jiao Tong University, Shanghai 200030, China)

      Along with the rapid development of P2P platform, one of the key question is how investors assess the borrowers’ credit risk and get effective investment. This paper use the real loan data from a P2P platform, respectively, using logistic regression and random forest to predict the default probability of the loan, then combine the distance measurement model and the kernel regression to evaluate the return and risk of new demand for loans. Due to the amount limit to both the investors and the lenders on P2P platform, this paper also solved a constrained portfolio problem. Data shows that compared with traditional credit rating, the method in this paper improves the loans’ yield prediction accuracy and can choose portfolios with higher return.

      P2P platform; random forest; kernel regression; portfolio selection

      2016-11-21

      國家自然科學基金資助項目(71531010)

      王辛未(1992-),女,碩士研究生,研究方向:互聯(lián)網金融,數據挖掘。Email:lamb_wxw@sina.com。 姜睿思,男,博士研究生,研究方向:運營管理、大數據與商務智能。

      1005-9679(2017)03-0111-06

      F 224

      A

      猜你喜歡
      借款人網貸信用
      為食品安全加把“信用鎖”
      P2P網貸中的消費者權益保護
      中國外匯(2019年10期)2019-08-27 01:58:18
      信用收縮是否結束
      中國外匯(2019年9期)2019-07-13 05:46:30
      鄉(xiāng)城流動借款人信用風險與空間收入差異決定
      小微企業(yè)借款人
      網貸平臺未來亟需轉型
      商周刊(2017年17期)2017-09-08 13:08:58
      網貸十年:迎來“去偽存真” 時代
      商周刊(2017年17期)2017-09-08 13:08:58
      信用中國網
      信用消費有多爽?
      商業(yè)銀行對借貸人貸后監(jiān)控與風險治理
      如东县| 东乡县| 靖远县| 万荣县| 余姚市| 日土县| 金门县| 万年县| 新平| 镇平县| 西林县| 大荔县| 濉溪县| 洮南市| 永胜县| 霍州市| 岳普湖县| 秭归县| 缙云县| 高清| 甘谷县| 工布江达县| 塔河县| 蒲城县| 德安县| 池州市| 吴江市| 虎林市| 合山市| 崇文区| 正宁县| 天长市| 黔西县| 缙云县| 博罗县| 信丰县| 左云县| 扬中市| 文安县| 峡江县| 东方市|