石勇,孟凡
1. 中國科學院大數(shù)據(jù)挖掘與知識管理重點實驗室,北京 100190;2. 中國科學院虛擬經(jīng)濟與數(shù)據(jù)科學研究中心,北京 100190;3. 中國科學院大學經(jīng)濟與管理學院,北京 100190
信用評分基本理論及其應(yīng)用
石勇1,2,3,孟凡1,2,3
1. 中國科學院大數(shù)據(jù)挖掘與知識管理重點實驗室,北京 100190;2. 中國科學院虛擬經(jīng)濟與數(shù)據(jù)科學研究中心,北京 100190;3. 中國科學院大學經(jīng)濟與管理學院,北京 100190
信用評分是市場交易的基礎(chǔ),以大數(shù)據(jù)分析與挖掘為支撐的現(xiàn)代信用評分系統(tǒng)在當今全球經(jīng)濟發(fā)展中起著不可估量的作用。各行業(yè)與領(lǐng)域的信用評分系統(tǒng)將成為實現(xiàn)我國“十三五”規(guī)劃中國家大數(shù)據(jù)戰(zhàn)略的首要目標。主要介紹了金融信用評分系統(tǒng)的發(fā)展、相關(guān)技術(shù)、應(yīng)用案例,并對大數(shù)據(jù)信用評分的發(fā)展進行了展望。
信用評分系統(tǒng);數(shù)據(jù)挖掘;大數(shù)據(jù)評分
對于現(xiàn)代市場交易環(huán)境而言,信用(credit)是一種建立在信任基礎(chǔ)上的能力,不用立即付款就可以獲取資金、物資、服務(wù)的能力。接受信任的一方(受信方)與授予信任的一方(授信方)達成約定:在約定的時間期限內(nèi),受信方為獲得的資金、物資、服務(wù)向授信方付款。信用的存在與踐行,為市場經(jīng)濟帶來了秩序,促使市場經(jīng)濟健康發(fā)展。在一個社會信用體系健全的國家,公正、權(quán)威的信用產(chǎn)品和信用服務(wù)已全面普及,信用交易已成為其市場經(jīng)濟的主要交易手段,企業(yè)和個人的信用意識強烈,注重維護信用,有著明確的信用市場需求;在信用體系的保障下,市場參與者更加理性,行為更加規(guī)范,市場效率得到了大幅提高。
作為信用體系的重要組成部分,信用評分系統(tǒng)的發(fā)展對整體信用評分體系的進步起到關(guān)鍵作用,隨著大數(shù)據(jù)技術(shù)的快速發(fā)展和普及,基于大數(shù)據(jù)的信用評分受到了廣泛的關(guān)注,并產(chǎn)生了一系列基于大數(shù)據(jù)的信用評分應(yīng)用。首先介紹信用評分系統(tǒng)的發(fā)展歷史,明確信用評分系統(tǒng)的重要性;隨后介紹在信用評分系統(tǒng)中常用的技術(shù);接著介紹信用評分的案例,特別是近年來出現(xiàn)的基于大數(shù)據(jù)的信用評分案例;最后,對基于大數(shù)據(jù)技術(shù)的信用評分的前景進行展望。
信用評分系統(tǒng)的出現(xiàn),最早可以追溯到1801年英國布魯林克成立的征信局,經(jīng)過200多年的發(fā)展,征信行業(yè)已經(jīng)相當成熟,并在社會經(jīng)濟活動中起著不可或缺的作用。經(jīng)典的信用評分系統(tǒng)(credit scoring system)指根據(jù)借款方的借款與還債歷史、信用狀況等信息給予不同的分數(shù),用來決定是否核準貸款或進行信用額度的統(tǒng)計和評估,這一模式現(xiàn)在仍然廣泛應(yīng)用在傳統(tǒng)金融行業(yè)的信貸管理活動中。
西方發(fā)達國家的信用評估行業(yè)處于領(lǐng)先地位,從歷史的角度,以第二次世界大戰(zhàn)為界將西方發(fā)達國家的信用評估行業(yè)劃分為兩個發(fā)展階段。在第二次世界大戰(zhàn)以前,包括美國在內(nèi)的西方發(fā)達國家的資信評級行業(yè)發(fā)展緩慢。1910年的摩利斯計劃銀行率先開始提供消費信貸。1916年,一個名為Russell Sage的慈善機構(gòu)制定出“小型貸款統(tǒng)一法”,提出了第一個針對消費貸款者的信貸框架。但由于信用的價值和風險還未被深入地研究和識別,通信設(shè)施和設(shè)備未能提供有效的支持,信用銷售在當時并未能普及開來。
第二次世界大戰(zhàn)結(jié)束后,一方面,科學技術(shù)快速發(fā)展,生產(chǎn)力得到極大程度的提高,促進了消費者對產(chǎn)品、服務(wù)的需求;另一方面,計算機技術(shù)的快速發(fā)展,為信用交易提供了堅實的基礎(chǔ),信用交易成為在市場發(fā)達國家中非常重要的促銷手段,隨著信用交易額的猛增,征信公司的業(yè)務(wù)規(guī)模也迅速擴大。1970年美國頒布《公平信用報告法(Fair Credit Reporting Act)》和《平等信用機會法(Equal Credit Opportunity Act)》,隨著這兩個法案被廣泛接受,信用管理行業(yè)步入了現(xiàn)代信用管理階段,并取得了快速發(fā)展。目前,美國有3家主要的信用服務(wù)公司:Equifax、Experian和Trans Union,主要的信用風險模型生產(chǎn)公司則為Fair Issac和First Data Corporation。
由于起步較晚,我國社會信用體系發(fā)展相對于發(fā)達國家處于落后地位。中國共產(chǎn)黨第十八次全國代表大會以來,我國社會信用體系的建設(shè)進入全面推進階段。黨的第十八次全國代表大會提出“加強政務(wù)誠信、商務(wù)誠信、社會誠信和司法公信建設(shè)”,黨的第十八屆中央委員會第三次全體會議提出“建立健全社會征信體系,褒揚誠信,懲戒失信”,中共中央國務(wù)院在《關(guān)于加強和創(chuàng)新社會管理的意見》中提出“建立健全社會誠信制度”以及《中華人民共和國國民經(jīng)濟和社會發(fā)展第十二個五年規(guī)劃綱要》(以下簡稱“十二五”規(guī)劃綱要)提出“加快社會信用體系建設(shè)”的總體要求。2014年6月,國務(wù)院發(fā)布《社會信用體系建設(shè)規(guī)劃綱要(2014—2020年)》,明確了我國社會信用體系建設(shè)的指導思想、基本原則、主要目標、重點任務(wù)和保障措施。
2.1 信用的分類
根據(jù)授信人的身份,通常信用可劃分為公共信用(public credit)和私人信用(private credit)兩大類。其中,公共信用就是政府信用,是指社會為了幫助政府成功實現(xiàn)其各項職能而授予政府的信用,其核心是政府的公債。私人信用包括企業(yè)信用(business credit)和個人信用(personal credit)。企業(yè)信用也叫商業(yè)信用,個人信用也叫消費者信用。
2.2 信用評分系統(tǒng)的結(jié)構(gòu)
信用評分系統(tǒng)包括信用報告和信用評分兩部分。信用報告是指受信人的歷史信用記錄,一旦有不良記錄,在7年之內(nèi)無法從信用記錄中抹去。它在法律允許的范圍內(nèi),可以有償?shù)靥峁┙o銀行、公司等授信方。授信方可以根據(jù)此報告來決定是否向受款人提供貸款及貸款額度。信用評分是將有關(guān)個人信用的信息轉(zhuǎn)換成信用評分數(shù)的過程。它包括授信方的兩部分行為:準確地預(yù)測個人有關(guān)的信用風險;產(chǎn)生相對應(yīng)的商業(yè)決策。
在建立信用評分系統(tǒng)時,考慮5個方面的前提:一是評分系統(tǒng)考慮各種信用信息,而不是單一的因素;二是每個因素的重要性取決于所有其他因素的相關(guān)性;三是評分的信息直接來源于個人信用歷史報表;四是評分同時考慮正面和負面的信息;五是評分不考慮人種、宗教、性別、婚姻狀況和國籍。
基于過去大量的信用歷史數(shù)據(jù),數(shù)據(jù)分析公司運用數(shù)據(jù)挖掘技術(shù)建立可靠的評分系統(tǒng)。評分系統(tǒng)將信用卡顧客分為不同的模式(如“好”與“壞”)。在評分系統(tǒng)應(yīng)用時,給定一個顧客作為評判對象,評分系統(tǒng)將根據(jù)該顧客的信用歷史計算起評分。其基本原則是制造“黑名單”,盡可能地尋找將要發(fā)生壞賬記錄的嫌疑者。
2.3 信用評分系統(tǒng)的重要性
信用評分系統(tǒng)不僅能為授信人(銀行)帶來巨大的價值,同時也對受信人(顧客)和社會有著重要的作用。具體而言,對于授信人,信用評分系統(tǒng)可以用來確定市場和開拓新顧客,使授信人更加懂得顧客的消費行為和購買力,有利于與顧客建立良好信譽關(guān)系,促進內(nèi)部金融管理質(zhì)量的提高。對于受信人(顧客),信用評分系統(tǒng)可以使得受信人能夠更快地申請到應(yīng)有的貸款,評分將促使其改進償債能力,進一步提高被選為“自動信用批準”的機率。對社會而言,信用評分系統(tǒng)可以降低借款方申請成本,出借方信用利息下降,整個社會的貸款利息(包括住房貸款率)將下降,經(jīng)濟效率將提高。
在已掌握的數(shù)據(jù)的基礎(chǔ)上,設(shè)計出準確、高效、有較強拓展能力的模型一直是信用評分領(lǐng)域的研究熱點。最早的信用評分采用的是打分卡的方式;隨著數(shù)據(jù)的不斷積累和應(yīng)用,到20世紀90年代,判別分析、邏輯回歸等方法開始被應(yīng)用于信用評分領(lǐng)域;此后,計算機技術(shù)和數(shù)據(jù)挖掘得到迅速發(fā)展,相關(guān)進展也在信用評分領(lǐng)域得到了廣泛的應(yīng)用,尤其以支持向量機、決策樹、多目標數(shù)學規(guī)劃為代表的數(shù)據(jù)挖掘算法取得了很好的評分效果。本節(jié)對信用評分系統(tǒng)采用的主要技術(shù)進行總結(jié)和梳理。
3.1 傳統(tǒng)信用評分技術(shù)
傳統(tǒng)信用評分技術(shù)主要包括信用評分卡、判別分析和邏輯回歸等,這些技術(shù)便于實現(xiàn)和推廣,提高了信用評分的科學性和可靠性,在早期的信用評分應(yīng)用中起到了重要作用。直到現(xiàn)在,這些模型仍然被廣泛應(yīng)用在眾多現(xiàn)代信用評分系統(tǒng)中。
信用評分卡是最傳統(tǒng)的信用評分方法,其主要實現(xiàn)方式為,以業(yè)務(wù)理解為基礎(chǔ)提出描述用戶行為的指標,根據(jù)各個指標具體評分細則進行評分,依據(jù)預(yù)先設(shè)定好的指標權(quán)重進行加權(quán)匯總,得到最終的信用評分。信用評分卡的發(fā)展主要經(jīng)歷了3個階段[1]:第一階段,以對客戶細分和對客戶行為的刻畫為主要目的構(gòu)建分析方法;第二階段,以預(yù)測用戶行為為目的構(gòu)建模型;第三階段,根據(jù)業(yè)務(wù)細分和應(yīng)用場景的不同,信用評分卡進一步細分,并最終形成面向決策支持的信用評分卡??傮w上,根據(jù)對數(shù)據(jù)的依賴程度不同,可以分為專家型數(shù)據(jù)評分卡、數(shù)據(jù)型信用評分卡和混合型信用評分卡。在應(yīng)用時應(yīng)考慮具體的數(shù)據(jù)條件進行選擇和構(gòu)建。
判別分析是早期就被引入信用評分的統(tǒng)計模型,從統(tǒng)計的角度,判別分析的原則是在判斷“好人”“壞人”的過程中,使第Ⅰ類錯誤和第Ⅱ類錯誤帶來的總損失最小[2]。在信用評分問題中,第Ⅰ類錯誤是指將不會違約的申請者判斷為違約者,這類錯誤將降低貸款機構(gòu)的業(yè)務(wù)規(guī)模;第Ⅱ類錯誤是指將會違約的申請者判斷為非違約者,這類錯誤將帶來壞賬率的提高。判別模型有很多種具體的方法,包括貝葉斯判別、費舍爾判別等,在信用評分領(lǐng)域應(yīng)用最為廣泛的是貝葉斯判別。貝葉斯判別對特征的獨立性有著較強的假設(shè),但這些假設(shè)在實際數(shù)據(jù)中往往難以保證,因而貝葉斯判別模型在應(yīng)用中的實際效果會受到一定的限制。
邏輯回歸模型最早于1970年被應(yīng)用于信用評分[3],該模型的形式與線性回歸模型相似,區(qū)別在于在線性模型的輸出上,增加了一步Logit變換,將實數(shù)域上的輸出映射到了[0,1]上,由此便能進行分類和概率的預(yù)測。該模型形式簡潔,便于求解,而且具有很強的可解釋性,因而被廣泛應(yīng)用在信用評分模型中。
3.2 數(shù)據(jù)挖掘技術(shù)
決策樹(decision tree)作為一種經(jīng)典的數(shù)據(jù)挖掘方法,以一種自動生成判斷規(guī)則的方式進行建模。目前較為流行的決策樹算法主要包括使用信息增益進行劃分準則的ID3、使用信息增益率進行節(jié)點劃分的C4.5以及以Gini指數(shù)作為節(jié)點純度度量的分類回歸樹(classification and regression tree,CART)。這些算法都能應(yīng)用于信用評分系統(tǒng),并能產(chǎn)生容易理解和直接應(yīng)用的判別規(guī)則。但是由于容易產(chǎn)生過擬合、變量增多后規(guī)則復雜、穩(wěn)健性較低等問題,決策樹并沒有在信用評分領(lǐng)域得到廣泛的應(yīng)用。
支持向量機(support vector machine, SVM)[4]由Vapnik提出,它是一種分類算法,通過尋求結(jié)構(gòu)化風險最小來提高學習機泛化能力,實現(xiàn)經(jīng)驗風險和置信范圍的最小化,從而達到在統(tǒng)計樣本量較少的情況下,也能獲得良好統(tǒng)計規(guī)律的目的。具體地講,它是一種二分類模型,其基本模型定義為特征空間上間隔最大的線性分類器,即支持向量機的學習策略便是間隔最大化,最終可轉(zhuǎn)化為一個凸二次規(guī)劃問題的求解。支持向量機具有良好的學習能力,并成功應(yīng)用于信用評分領(lǐng)域[5-7]。與此同時,各種改進的SVM模型也在信用評分領(lǐng)域進行了嘗試,并取得了成功,其中有代表性的成果為最小二乘支持向量機[8,9]。
多目標線性規(guī)劃(multiple-criteria linear programming,MCLP)模型[10,11]也在信用評分領(lǐng)域取得了一定的競爭力[12]。該模型給定一組類別和一組評價變量,用一些相關(guān)的邊界變量區(qū)分類別。最簡單的多目標描述為既求分類重疊的最小化,又求類別之間距離的最大化,其結(jié)果為最滿意解。在此模型框架下開發(fā)出的多目標二次規(guī)劃(multiple-criteria quadratic programming,MCQP)等模型也取得了較好結(jié)果[13]。MCLP模型和MCQP模型在中國人民銀行信用評分中取得了很好的效果,并被應(yīng)用于最終的評分模型中,創(chuàng)造了巨大的商業(yè)價值。
基于數(shù)據(jù)挖掘方法的信用評分模型,通常能夠取得較為準確的預(yù)測結(jié)果,但是由于多數(shù)模型(SVM、神經(jīng)網(wǎng)絡(luò)等)的黑箱的性質(zhì),模型的可解釋性不強,在進行決策支持和客戶管理的時候,往往難以得到更具體細致的分析結(jié)果。這些劣勢在一定程度上影響了數(shù)據(jù)挖掘技術(shù)在具體業(yè)務(wù)場景下的應(yīng)用。
隨著大數(shù)據(jù)時代的到來,大數(shù)據(jù)技術(shù)為信用評分帶來了新的機遇。傳統(tǒng)信用評分系統(tǒng)利用的數(shù)據(jù)主要包括客戶向金融機構(gòu)提交的個人申請信息、金融機構(gòu)內(nèi)部積累的客戶歷史數(shù)據(jù)、中國人民銀行征信中心等外部機構(gòu)提供的數(shù)據(jù)。這些數(shù)據(jù)價值密度高、維度相對較低、質(zhì)量相對較高。而基于大數(shù)據(jù)的信用評分會考察更加多元化的客戶信息數(shù)據(jù),主要包括各互聯(lián)網(wǎng)金融機構(gòu)掌控的生態(tài)體系內(nèi)積累的客戶信息以及通過外部各種渠道采集的客戶信息。以互聯(lián)網(wǎng)交易數(shù)據(jù)以及社交網(wǎng)絡(luò)的數(shù)據(jù)為代表,互聯(lián)網(wǎng)數(shù)據(jù)往往較為稀疏、價值密度較低、單變量區(qū)分能力較弱,但覆蓋范圍廣泛。因而在基于大數(shù)據(jù)的信用評分系統(tǒng)中,需要采用先進的數(shù)據(jù)挖掘工具進行更加復雜的信用評分。
目前國內(nèi)外已經(jīng)出現(xiàn)眾多成功的信用評分案例,在國外最具代表性的信用評分包括基于傳統(tǒng)評分方法的FICO評分①http://www. fico.com/、基于手機數(shù)據(jù)源的First Access評分②http://www. firstaccessmarket. com/、基于豐富數(shù)據(jù)源的YODLEE③https://www. yodlee.com/、利用心理學分析VisualDNA④https://www. visualdna.com/、將非結(jié)構(gòu)化數(shù)據(jù)融入模型的ZestFinance⑤https://www. zestfinance.com/。國內(nèi)互聯(lián)網(wǎng)金融和大數(shù)據(jù)征信發(fā)展迅速,芝麻信用、騰訊信用、聚立信、51信用卡、Wecash閃銀等眾多公司已經(jīng)基于所能獲取的數(shù)據(jù),開發(fā)出大數(shù)據(jù)信用評分模型,并成功應(yīng)用于眾多互聯(lián)網(wǎng)金融的各個領(lǐng)域。
中國科學院虛擬經(jīng)濟與數(shù)據(jù)科學研究中心、中國科學院大數(shù)據(jù)挖掘與知識管理重點實驗室作為國內(nèi)信用評分的先驅(qū),在近10年中與業(yè)界合作,在信用評分領(lǐng)域取得了多項成功的案例,具有代表性的項目包括:國內(nèi)第一個全國個人信用評分決策系統(tǒng)——中國人民銀行信用評分、1號店在線信用評分模型、考拉征信小微商戶信用評分。
4.1 中國人民銀行信用評分
2003—2006年,中國人民銀行征信中心積累了全國各大金融機構(gòu)的所有個人信貸賬戶的信息,活躍自然人數(shù)超過1億,已經(jīng)具備了研制和開發(fā)信用局風險評分的條件。中國科學院虛擬經(jīng)濟與數(shù)據(jù)科學研究中心與中國人民銀行正式合作,2006—2009年開展了《中國人民銀行個人信用局評分項目》科研,建立了中國評分(China score)。
該項目運用先進的數(shù)據(jù)挖掘和統(tǒng)計分析技術(shù),利用中國人民銀行征信中心全國各大金融機構(gòu)的消費者的住房貸款、汽車貸款、信用卡等歷史信息,通過對消費者的人口特征、信用歷史記錄、行為記錄、交易記錄等大量數(shù)據(jù)進行系統(tǒng)的分析,挖掘出蘊含在數(shù)據(jù)中的行為模式,找出歷史信息與未來信用表現(xiàn)之間的關(guān)系,建立預(yù)測性的模型,預(yù)測出每個自然人在未來某個時期內(nèi)發(fā)生“信貸違約”的概率,并以一個分數(shù)來表示,這個分數(shù)將對各信貸機構(gòu)的各項信貸決策有重大的指導意義。在評分系統(tǒng)的建立過程中,選取了MCLP、MCQP、邏輯回歸模型、SVM、神經(jīng)網(wǎng)絡(luò)、線性回歸、決策分析、判別分析等大量模型進行細致的分析和對比,最終發(fā)現(xiàn)MCLP、MCQP、邏輯回歸模型能夠取得較好的結(jié)果,其中MCLP和MCQP是筆者獨創(chuàng)的基于最優(yōu)化的數(shù)據(jù)挖掘方法。采用該模型得到的信用評分分布展現(xiàn)出和美國、澳大利亞等國家信用評分分布相似的模式。前中國人民銀行副行長、國際貨幣基金組織副主席朱民博士對模型結(jié)果給予了高度評價,認為“項目所開發(fā)的全國個人信用評分系統(tǒng)遠遠超過國際水平”⑥http://www. chinanews. com/gn/ news/2010/02-25/2137072.shtml。
以上幾種病毒除PVX外,都可通過蚜蟲及汁液摩擦傳毒。田間管理條件差,蚜蟲發(fā)生量大發(fā)病重。此外,25℃以上高溫會降低寄主對病毒的抵抗力,也有利于傳毒媒介蚜蟲的繁殖、遷飛或傳病,從而利于該病擴展,加重受害程度,故一般冷涼山區(qū)栽植的馬鈴薯發(fā)病輕。品種抗病性及栽培措施都會影響本病的發(fā)生程度。
項目完成后,最終的模型被應(yīng)用在中國人民銀行信用評分系統(tǒng)中,成為中國第一個針對全國個人的信用評分模型。從2008年起,中國所有商業(yè)銀行開始采用“中國評分”,并將其用于貸款審批發(fā)放、信用卡申請審批等經(jīng)濟金融活動中,創(chuàng)造了巨大的商業(yè)價值。比如,僅在2008年,該評分模型使得國內(nèi)7家主要商業(yè)銀行大幅降低壞賬風險,共節(jié)約1 500億元,創(chuàng)造了巨大的商業(yè)價值,并極大地推動了我國信用體系的建設(shè)和發(fā)展。
4.2 1號店在線信用評分模型
1號店作為一家規(guī)模、品類均占行業(yè)領(lǐng)先地位的B2C電子商務(wù)企業(yè),其商業(yè)鏈包括3部分:供應(yīng)商、商戶和客戶。作為國內(nèi)領(lǐng)先的電子商務(wù)企業(yè),1號店積累了海量的信息數(shù)據(jù),這些數(shù)據(jù)不僅包括自身運營過程中產(chǎn)生的業(yè)務(wù)數(shù)據(jù),還保留了大量的網(wǎng)站日志數(shù)據(jù)。流量是電商存活的關(guān)鍵,金融行業(yè)的競爭將緊緊圍繞著客戶,尤其是優(yōu)質(zhì)客戶這一稀缺資源。對用戶的價值進行評分,并以此作為客戶關(guān)系管理的重要基礎(chǔ),具有重要的商業(yè)價值。另外,依賴所掌握的交易行為的數(shù)據(jù),對商戶和客戶的信用進行建模,相關(guān)結(jié)果可以直接支持供應(yīng)鏈金融以及客戶的信用消費等方面。
2013—2014年,中國科學院虛擬經(jīng)濟與數(shù)據(jù)科學研究中心與1號店合作,共同開發(fā)針對商業(yè)的信用評分模型以及針對客戶的信用評分和價值評分模型。根據(jù)數(shù)據(jù)情況和業(yè)務(wù)需求,在具體建模過程中,通過對1號店客戶和供應(yīng)商的海量歷史數(shù)據(jù)(包括交易數(shù)據(jù)、網(wǎng)站行為數(shù)據(jù)等)以及在線數(shù)據(jù)進行分析和挖掘,最終形成相關(guān)評分。項目的成果提高了1號店的資金流動性,降低了風險,并提高了整個商業(yè)鏈的運行效率。
4.3 考拉征信小微商戶信用評分
考拉征信服務(wù)有限公司是一家第三方的信用評估及征信管理服務(wù)商,其推出的考拉信用是面向政務(wù)、商務(wù)、社會、法務(wù)全方位的信用服務(wù)體系,運用大數(shù)據(jù)及云計算技術(shù)客觀呈現(xiàn)機構(gòu)和個人的信用狀況。2015年中國科學院大數(shù)據(jù)挖掘與知識管理重點實驗室與考拉征信服務(wù)有限公司正式合作,建立聯(lián)合實驗室“考拉征信·中國科學院大學征信模型實驗室”,開展大數(shù)據(jù)征信模型研究。在合作過程中,已經(jīng)成功建立了基于大數(shù)據(jù)的小微商戶信用評分模型。
小微商戶評分的應(yīng)用場景主要包括:將考拉商戶信用分嵌入“考拉征信應(yīng)用”,小微商戶可以通過考拉征信應(yīng)用查詢信用評分,方便用戶了解自己的信用,并且線上就可以申請貸款讓信用創(chuàng)造價值;與光大銀行合作推出“信盈聯(lián)名信用卡”,作為大數(shù)據(jù)征信平臺下針對小微商戶推出的專屬金融服務(wù),根據(jù)小微商戶的信用分,創(chuàng)新性地推出以“考拉商戶信用分”換取“個人信用額度”的金融模式,為小微商戶提供信貸支持;推出考拉征信的“信用借”產(chǎn)品,基于信用評分的綜合金融服務(wù)平臺,提供多款借貸產(chǎn)品、信用卡等服務(wù),為小微商戶、個人用戶和信用卡機構(gòu)、貸款公司之間搭起一座信用橋梁。目前,光大銀行、拉卡拉、卡得萬利等多家銀行及小貸機構(gòu)已將考拉商戶信用分應(yīng)用在貸款審核中,其中光大銀行累積授信額度已過億元。
經(jīng)過多年的努力與發(fā)展,信用評分模型和系統(tǒng)的科研與應(yīng)用已經(jīng)取得了巨大的進展,為信貸行業(yè)以及社會經(jīng)濟發(fā)展創(chuàng)造了巨大的價值。隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)的大體量、來源的多樣性和數(shù)據(jù)異構(gòu)性為傳統(tǒng)的信用評分技術(shù)帶來了挑戰(zhàn)。與此同時,描述用戶特征的角度越來越多,為更精確地刻畫用戶行為提供了更豐富的數(shù)據(jù)基礎(chǔ)。盡管國內(nèi)外眾多信用評分機構(gòu)都已經(jīng)在大數(shù)據(jù)信用評分領(lǐng)域取得了一定的進展,但是在實踐中采用的模型和學習方法還未能充分利用包括深度學習在內(nèi)的最先進的大數(shù)據(jù)挖掘技術(shù)。此外,各評分結(jié)構(gòu)掌握和利用的數(shù)據(jù)仍然只是大數(shù)據(jù)中的一小部分,許多數(shù)據(jù)源,特別是分散在網(wǎng)絡(luò)空間的社會數(shù)據(jù)沒有得到充分應(yīng)用。如何促進各評分結(jié)構(gòu)間的數(shù)據(jù)共享和交換,將成為大數(shù)據(jù)信用評分取得突破性進展的重要條件,這也將成為信用評分系統(tǒng)進一步發(fā)展的重要方向。
[1] 李延東,鄭小娟. 信用評分卡體系的發(fā)展及應(yīng)用[J]. 甘肅金融, 2016(3): 43-45. LI Y D, ZHENG X J. Credit scoring card system: advances and applications [J]. Gansu Finance, 2016(3): 43-45.
[2] 朱曉明, 劉治國. 信用評分模型綜述[J]. 統(tǒng)計與決策, 2007(2): 103-105. ZHU X M, LIU Z G. Reviews on credit scoring models[J]. Statistics and Decision, 2007(2): 103-105.
[3] ORGLER Y E. A credit scoring model for commercial loans [J]. Journal of Money, Credit and Banking, 1970, 2(4): 435-445. [4] VAPNIK V N. Statistical learning theory [M]. New York: Wiley, 1998.
[5] HUANG C L, CHEN M C, WANG C J. Credit scoring with a data mining approach based on support vector machines[J]. Expert Systems with Applications, 2007, 33(4): 847-856.
[6] MARTENS D, BAESENS B, GESTEL T V, et al. Comprehensible credit scoring models using rule extraction from support vector machines [J]. European Journal of Operational Research, 2007, 183(3): 1466-1476.
[7] BELLOTTI T, CROOK J. Support vector machines for credit scoring and discovery of significant features[J]. Expert Systems with Applications, 2009, 36(2): 3302-3308.
[8] ZHOU L, LAI K K, YU L. Least squares support vector machines ensemble models for credit scoring [J]. Expert Systems with Applications, 2010, 37(1): 127-133.
[9] LAI K K, YU L, ZHOU L, et al. Credit risk evaluation with least square support vector machine[C]//International Conference on Rough Sets and Knowledge Technology, July 24-26, Chongqing, China. Berlin Heidelberg: Springer, 2006: 490-495.
[10] KOU G, LIU X, PENG Y, et al. Multiple criteria linear programming approach to data mining: models, algorithm designs and software development[J]. Optimization Methods and Software, 2003, 18(4): 453-473.
[11] SHI Y, TIAN Y, KOU G, et al. Multiple criteria linear programming[M]// Optimization based data mining: theory and applications. London: Springer London, 2011: 119-132.
[12] SHI Y, PENG Y, XU W, et al. Data mining via multiple criteria linear programming: applications in credit card portfolio management [J]. International Journal of Information Technology & Decision Making, 2002, 1(1): 131-151.
[13] SHI Y, PENG Y, KOU G, et al. Classifying credit card accounts for business intelligence and decision making: a multiple-criteria quadratic programming approach [J]. International Journal of Information Technology & Decision Making, 2005, 4(4): 581-599.
Credit scoring: basic theory and applications
SHI Yong1,2,3, MENG Fan1,2,3
1. Key Laboratory of Big Data Mining and Knowledge Management, Chinese Academy of Sciences, Beijing 100190, China 2. Research Center on Fictitious Economy and Data Science, Chinese Academy of Sciences, Beijing 100190, China 3. School of Economy and Management, University of Chinese Academy of Sciences, Beijing 100190, China
Credit scoring is the foundation of market transactions all over the world. Big data analysis based credit scoring plays an immeasurable role in global economics. In the 13th Five-Year Plan of China, it has been proposed as strategic developmental goal to develop and accomplish credit scoring system in all the industries and economic departments. The development of credit scoring system, the advanced techniques in credit scoring and cases of big data based on credit scoring systems were outlined. Suggestions and prospects on big data scoring systems were concluded.
credit scoring system, data mining, big data credit
F069
A
10.11959/j.issn.2096-0271.2017003
石勇(1956-),男,中國科學院大學經(jīng)濟管理學院教授、博士生導師,發(fā)展中國家科學院院士,國務(wù)院參事,中國科學院虛擬經(jīng)濟與數(shù)據(jù)科學研究中心主任,中國科學院大數(shù)據(jù)挖掘與知識管理重點實驗室主任。被列為Elsevier發(fā)布2014/2015中國高被引學者榜單之一、入選湯普生路透(Thomson Reuters)2016全球高被引作者(計算機科學領(lǐng)域)。現(xiàn)在擔任《國際信息技術(shù)和決策雜志(IJITDM)》《國際數(shù)據(jù)科學年鑒(Annals of Data Science)》創(chuàng)立主編。先后榮獲以集合論創(chuàng)始人命名的康拓學術(shù)獎、中國復旦管理學杰出貢獻獎、教育部自然科學獎一等獎(2012年、2016年)。中國科學院百人計劃學者、國家杰出青年科學基金獲得者。
孟凡(1989-),男,中國科學院大學經(jīng)濟與管理學院、中國科學院大數(shù)據(jù)挖掘與知識管理重點實驗室博士生,主要研究方向為大數(shù)據(jù)信用評分、量化投資、大數(shù)據(jù)圖像挖掘、弱標簽學習問題等。
2016-12-22
國家自然科學基金資助項目(No.91546201,No.71331005,No. 71110107026)
Foundation Items:The National Natural Science Foundation of China(No.91546201,No.71331005,No. 71110107026)