伍思雨 馮驥
摘? 要:近年來,P2P網絡貸款業(yè)務發(fā)展迅猛,因而需要更為高效準確的風險分析和金融監(jiān)管。基于上述問題,結合聚類算法與因子分析的優(yōu)點,提出了一種用于P2P網貸平臺風險等級劃分的評估方法。該方法能夠針對公共網站獲取網貸公司相關數據,將網絡平臺按照其潛在風險進行準確的劃分。實驗結果表明,該方法具有很強的準確性和可解釋性,所得到的結論符合網貸數據所對應公司產品的實際情況,能夠評估和預測網貸平臺的風險,并提供決策支持。
關鍵詞:P2P網貸平臺;K-means聚類算法;因子分析;風險識別模型
中圖分類號:TP311.1? ? ? ?文獻標識碼:A 文章編號:2096-4706(2020)05-0032-04
Analysis of P2P Network Loan Platform Based on Less Parameter Clustering Method
WU Siyu,F(xiàn)ENG Ji
(Chongqing Normal University,Chongqing? 401331,China)
Abstract:In recent years,the rapid development of Peer-to-Peer lending platform business requires more efficient and accurate risk analysis and financial supervision. Based on this problem,combined with the advantages of clustering algorithm and factor analysis,an evaluation method for risk classification of Peer-to-Peer lending platform was proposed. This method can accurately divide the network platform according to the relevant data of online loan companies obtained from public websites. Experimental results show that the method is highly accurate and interpretable. The conclusions obtained are consistent with the actual situation of the companys products corresponding to the online loan data,and it can evaluate and predict the risks of the lending platform and provide decision support.
Keywords:P2P(Peer-to-Peer) network loan platform;K-means clustering algorithm;factor analysis;risk identification model
0? 引? 言
隨著我國總體經濟實力的不斷發(fā)展,金融業(yè)已經成為國家經濟的重要支柱。也正因為金融業(yè)的繁榮,以及互聯(lián)網經濟對金融業(yè)的賦能與升級,P2P網絡貸款在短短幾年中獲得了飛速的發(fā)展。截至2018年6月底,P2P網絡貸款行業(yè)歷史累計成交量達到了73 341.87億元,正常運營平臺數量高達1 842家[1]。隨著規(guī)模的擴大,P2P貸款也引發(fā)了大量的社會問題,特別是在高校領域,雖然國家已經嚴令禁止貸款業(yè)務在大學生之間的展開,仍然有大量的P2P網貸商家從各種渠道介入并吸引大學生辦理貸款,這也引起了業(yè)界廣泛的擔憂。面對上述問題,傳統(tǒng)的金融監(jiān)管和教育手段往往很難直接解決,其主要原因就在于P2P網絡貸款的特殊性。這種新興產業(yè)同時結合互聯(lián)網產業(yè)和金融貸款產業(yè)的特點,其發(fā)展速度快、變化多、傳播廣且隱蔽性強,很難通過人工監(jiān)管一一處理。而一旦產生嚴重的后果,追責也無法改變已經造成的損失,因此急需一種能夠在問題產生前進行精準預測的高效方法,以期在惡意網貸問題發(fā)生前及時地進行預測和防治。
1? P2P網貸平臺研究概述
1.1? 研究意義
近年來,許多大學生因為網貸陷阱導致其學習、生活被嚴重影響,甚至部分極端的學生因為無法還清網貸而選擇結束自己生命。然而針對P2P網絡貸款,目前并沒有科學有效的風險識別方法。特別是這類貸款往往會根據現(xiàn)有的政策進行快速升級與轉型,在規(guī)避金融法規(guī)監(jiān)管的同時,針對學生用戶提出更多更具誘惑性的組合策略,針對大部分學生不具有較高的風險識別能力這一點,在面對網貸平臺和網貸產品周期短、類別多、變化快等特點時,學生群體常常容易受到低門檻的引誘,并且因為無法對風險進行有效預估落入貸款陷阱中。因此,在面對惡性網貸所產生的負面事件時,建立高效的網貸風險分析模型具有十分重要的意義?;谏鲜鰡栴},本文嘗試將聚類算法與因子分析相互結合,提出一種評估P2P網貸平臺的風險評估方法,運用到提取網貸相關數據并刻畫網貸預警的模型中,一方面對網貸相關數據進行獨立聚類分析,另一方面通過因子分析找出網貸中最有代表的因子,并結合兩者的結果相互印證,將因子分析的因子數量作為K-means所需的k值,用K-means最終的結果來印證因子分析的正確性,并且將實驗所得結果與官網所給數據進行對比實驗,最終完成針對網貸特點的多角度風險識別與防控預警。
1.2? 研究現(xiàn)狀
通過上述研究,表明將因子分析運用到P2P網貸平臺的研究中效果較好,達到了想要的結果,并且也說明在未來制定防范和化解平臺風險的有效措施時,我們應該考慮注重經營狀況因子的影響。
最后根據三個因子的方差貢獻率計算出165家網貸平臺的風險管理得分,模型如下:
根據以上公式計算出所有平臺的綜合得分,并列舉出得分最高的前20個網貸平臺:陸金服(4.429)、玖富普惠(1.705)、宜人貸(1.626)、愛錢進(1.545)、拍拍貸(1.392)、人人貸(1.047)、PPmoney網貸(1.03551)、人品(0.087)、微貸網(0.816)、金信網(0.756)、有利網(0.664)、你我貸(0.659)、恒易融(0.594)、紅嶺創(chuàng)投(0.589)、小牛在線(0.533)、小贏網金(0.470)、輕易貸(0.399)、挖財才米(0.319)、翼龍貸(0.271)、鋸寶盆(0.270)。
2.2? 結合K-means聚類分析
本文將收集到的網貸平臺原始數據利用數據屬性篩選、缺失數據補齊等方法,進行數據處理。對收集的數據進行歸一化處理之后,綜合七維數據,將其降到兩維,使展現(xiàn)結果更加直觀、清晰,并對其用K-means聚類算法進行聚類,為使兩種算法相輔相成、互相印證,將上述因子分析結果所劃分的類別作為K-means所需的k值,進行聚類分析,結果如圖1所示。
由圖1所示,不同的顏色代表不同的類別,那么當判斷出某個網貸平臺風險較高時,我們就可以預估與其在一類中的平臺具有相同的性質,由此可通過聚類結果進行風險預警。本文運用K-means聚類分析與因子分析相互結合、相互印證,從圖中可以看到聚類結果將網貸平臺分為了3類,結合因子分析的結果,即綜合得分,可以看出,網貸平臺的得分呈現(xiàn)斷層式分布,最好的網貸平臺得分為4分左右,一般的網貸平臺得分為0分~2分,差的網貸平臺得分低于0分,并且低于0分的網貸平臺占比最大,這跟降維后的聚類結果相吻合,即圖1右下角孤立點為得分最高的陸金服,淺色的點為得分在0分~2分的網貸平臺,深色為0分以下的網貸平臺。
綜上所述,本文提出的方法將所研究的165個網貸平臺進行劃分,主要分為3類:
(1)穩(wěn)定平臺:陸金服;
(2)一般平臺:玖富普惠、宜人貸、愛錢進、拍拍貸……
(3)危險平臺:創(chuàng)客金融、微銀易貸、生菜金融、博金貸……
K-means算法與因子分析通過相互印證,在網貸平臺的風險防治研究中得到了理想的結果,且算法獲取的類別信息可以作為評估網貸平臺風險的重要參考依據,對提高校園網貸的防控能力具有一定的指導意義。
2.3? 對比實驗
從網貸天眼官方網站查詢到官方運用回歸分析方法對2019年3月網貸平臺綜合評價的綜合得分排名,根據其所提出的網貸平臺,從本文在實驗中抽取進行對比,本文共分析了165個網貸平臺,找出與官網相同的網貸平臺,進行綜合評分對比,官網的平臺綜合指數如下。
陸金服(96.97)、人人貸(94.76)……洋錢罐(80.00)、撈財寶(79.59)、投哪網(78.84)……E融所(74.22)、網利寶(73.43)、首E家(72.84)、紅嶺創(chuàng)投(72.18)、民貸天下(71.22)、融貝網(70.34)、首金網(68.80)、拓道金服(68.22)、博金貸(66.11)、掌眾財富(63.98)、達人貸(63.12)、嘉石榴(62.82)、厚本金融(62.35)、錢香(62.10)……
通過本文提出的方法計算得到的綜合指數為:陸金服(4.429)、人人貸(1.047)……洋錢罐(-0.099)、撈財寶(-0.022)、投哪網(0.091)……E融所(-0.105)、網利寶(-0.065)、首E家(-0.141)、紅嶺創(chuàng)投(0.589)、民貸天下(-0.111)、融貝網(-0.171)、首金網(-0.151)、拓道金服(-0.113)、博金貸(-0.138)、掌眾財富(-0.115)、達人貸(-0.161)、嘉石榴(-0.166)、厚本金融(-0.141)、錢香(-0.162)。
上述結果對比中,下劃線的網貸平臺為官網所給的極其危險的平臺,現(xiàn)警方已經介入調查。從本文所用的因子分析方法給出的綜合評分,并根據K-means算法綜合評價后,已經在上述標出的平臺中,除了紅嶺創(chuàng)投外,其余在本實驗中得分低于0分,都被列為了危險平臺,所以本文將因子分析與K-means算法相結合,并對其實驗的結果與官網所給真實數據進行對比,吻合度為85.7%,得到了較為滿意的結果。
3? 結? 論
本文提出了一種新的P2P網貸平臺分析思路,結合因子分析及聚類算法對網貸平臺所給出的真實數據對平臺進行風險預測及等級劃分。通過與官方所給的數據結果進行對比實驗得知,本文所提出的方法得到的分析結果與官方吻合度為85.7%,具有較強的理論與實際意義。
本文通過計算相關指標綜合三大因子,然后結合聚類算法對網貸平臺進行了準確的等級劃分,并且結合網站給出的官方信息進行實驗對比,最終所得的結果與真實結果有較高的吻合度,因此本文所提出的方法具有一定可行性,能夠加強對網貸平臺的監(jiān)管和風險程序的分析,能夠為學生提供一個可參考的指標,從而減少因借貸而發(fā)生的悲劇,對提高校園網貸的防控與監(jiān)管具有一定的指導意義。
參考文獻:
[1] 錢貸網.2018年6月P2P網貸市場重要事件 [EB/OL].(2018-07-02).https://m.sohu.com/a/238891619_327646.
[2] 郭海鳳,陳霄.P2P網貸平臺綜合競爭力評價研究 [J].金融論壇,2015,20(2):12-23.
[3] 張巧良,張黎.P2P網貸平臺風險評價指標研究——基于層次分析法 [J].南京審計學院學報,2015,12(6):85-94.
[4] 王丹,張洪潮.P2P網貸平臺信用風險評級模型構建 [J].財會月刊,2016(9):76-80.
[5] 蔡炎宏,劉淳,張春霞.P2P網貸平臺的定價策略研究——基于壟斷條件下的建模分析 [J].投資研究,2014,33(4):4-15.
[6] 韓景倜,陳群.不確定條件下P2P網貸平臺運營與政府監(jiān)管演化博弈穩(wěn)定性分析 [J].商業(yè)研究,2016(3):36-44.
[7] 姜琪.中國P2P網貸平臺效率差異及成交量影響因素研究 [J].數量經濟技術經濟研究,2018,35(6):60-77.
[8] 董梁,胡明雅.基于Logistic回歸模型的P2P網貸平臺新進借款人信用風險研究 [J].江蘇科技大學學報(社會科學版),2016,16(3):102-108.
[9] Gonzalez L,Komarova Loureiro Y.When can a photo increase credit? The impact of lender and borrower profiles on online peer-to-peer loans [J].Journal of Behavioral and Experimental Finance,2016(2):44-58.
[10] 李敏芳,田晨君.基于因子分析法的我國P2P網貸平臺評級研究 [J].湖北經濟學院學報(人文社會科學版),2015,12(6):37-40.
作者簡介:伍思雨(1999-),女,漢族,重慶人,本科,主要研究方向:數據挖掘、聚類分析。
收稿日期:2020-02-05
基金項目:教育部人文社會科學研究項目(1 8XJC880002);重慶市教委科技項目(KJQN20180 0539);重慶師范大學基金項目(17XLB003)