姜明輝,許 佩,任 瀟,車 凱
(1.哈爾濱工業(yè)大學(xué) 管理學(xué)院,150001哈爾濱;2.哈爾濱工業(yè)大學(xué)計算機科學(xué)與技術(shù)學(xué)院,150001哈爾濱)
個人信貸作為銀行的主要資產(chǎn)業(yè)務(wù)之一,其風(fēng)險水平的控制關(guān)系到商業(yè)銀行對于經(jīng)濟資本的整體要求.因此,能否對個人信用風(fēng)險進行有效的識別與計量,成為商業(yè)銀行能否合理控制風(fēng)險的關(guān)鍵因素.隨著我國個人信貸規(guī)模和涉及領(lǐng)域日益擴大,自90年代后期開始,個人信用評分方法開始引起國內(nèi)的關(guān)注.近年來隨著我國經(jīng)濟的高速發(fā)展,個人住房抵押貸款逐年增加,房地產(chǎn)市場出現(xiàn)過熱現(xiàn)象,個人信用貸款的風(fēng)險也隨之增加.因此,在后金融危機時代,研究我國個人信用評分,對有效識別信用風(fēng)險、規(guī)避金融危機的不利影響以及保持我國信貸和金融市場的正常運轉(zhuǎn),甚至對維持國民經(jīng)濟的持續(xù)穩(wěn)定增長都具有重大的理論和現(xiàn)實意義.
文獻[1]指出,金融機構(gòu)的傳統(tǒng)做法是由專家基于自身經(jīng)驗對個人信用進行判斷,并由此形成了“5C”評價法.由于過度依賴于專家的經(jīng)驗,存在著訓(xùn)練成本高,主觀性和隨意性強等問題.正是為了解決這些問題,個人信用評分模型應(yīng)運而生,其實質(zhì)是基于客觀的數(shù)學(xué)模型,根據(jù)已掌握的客戶的相關(guān)信息對客戶將來可能的信用情況進行判斷.模型通過對客戶特定個人信息的輸入,將客戶分為“好客戶”(能夠按時還本付息)和“壞客戶”(會出現(xiàn)違約情況)兩類.
隨著國內(nèi)外對信用評分研究的不斷深入,個人信用評分模型也經(jīng)歷了由統(tǒng)計學(xué)方法到非參數(shù)方法、運籌學(xué)方法再到人工智能方法的演變,同時由單一模型到組合模型逐漸演進.但是,已有的個人信用評分模型在我國的實際應(yīng)用中仍存在諸如樣本的有效性及完整性、指標(biāo)體系的適用性、模型選擇的可解釋性等問題.鑒于此,本文提出采用通過對已有樣本的規(guī)則提取實現(xiàn)異常數(shù)據(jù)的預(yù)警,結(jié)合樣本有效性及完整性的改進,選取解釋能力強的單一模型對信用評分的指標(biāo)體系進行顯著性排序,選取適用的指標(biāo)顯著性權(quán)重并綜合考慮整體的準(zhǔn)確率、兩類誤判率和差異性,對現(xiàn)有模型進行優(yōu)化.
判別分析(discriminant analysis,DA)源于對3種鳶尾屬植物的分類實驗并被文獻[2]首次用來區(qū)分信用客戶的好壞.判別分析的主要思想是基于某些分類方法來使同類之間距離最小,異類之間距離最大,通過建立一個或多個判別方程,來判斷某一變量的類別歸屬.文獻[3]認(rèn)為當(dāng)變量服從多元橢球面分布(多元正態(tài)分布是其特例)時,線性判別無疑是最優(yōu)的選擇(忽略樣本抽樣偏差).此后,隨著著名的 FICO(fair isaac corporation)信用評分系統(tǒng)的建立,作為FICO系統(tǒng)的核心方法——判別分析在個人信用評分領(lǐng)域得到了廣泛運用.近年來,文獻[4]將最新的判別分析方法——SNDA、STDA、SDA、Sparse DA、FDA、MDA分別應(yīng)用于個人信用評分,以總精確度及錯分率為判別指標(biāo),指出 SNDA、STDA和SDA在個人信用評分領(lǐng)域表現(xiàn)良好.
回歸分析法(regression analysis,RA)是起源于遺傳學(xué)研究的經(jīng)典統(tǒng)計學(xué)方法之一.回歸分析法是在大量已知數(shù)據(jù)的基礎(chǔ)上,來探究一種變量(自變量)對另外一種變量(因變量)的影響,并建立描述二者間相關(guān)關(guān)系的回歸方程,根據(jù)已知的自變量的值對因變量的值進行預(yù)測.在回歸分析法中,應(yīng)用較為廣泛的有Logistic回歸分析、Probit回歸分析及多元線性回歸.與判別分析相比,回歸分析的魯棒性較低,但回歸分析對數(shù)據(jù)分布的要求相對寬松,而且能夠提供客戶的違約概率,因此獲得了大多數(shù)學(xué)者和銀行業(yè)的青睞.目前為止,Logistic回歸已經(jīng)成為最成功且最常用的統(tǒng)計方法之一.文獻[5]得出Logistic回歸在分類效果上要優(yōu)于判別分析的結(jié)論.
最近鄰法(nearest neighbors,NNs)是首先被用于分類問題的標(biāo)準(zhǔn)非參數(shù)方法,最早由紐約銀行應(yīng)用于信用評分領(lǐng)域.最近鄰法中最常用的是KNN模型,KNN模型能夠很好的解決概率密度函數(shù)的分類和估計問題,在個人信用評分研究中取得了較好的效果.KNN模型的基本原理是通過計算尋找與待判樣本點距離最近的k個信用樣本,再根據(jù)k個樣本的表現(xiàn),以投票的方式確定待判樣本的信用情況.文獻[6-7]均指出由于最近鄰法不用提前學(xué)習(xí)和訓(xùn)練模型,允許動態(tài)的更改客戶信息,從而能很好的解決人口漂移問題.有關(guān)KNN模型較近的應(yīng)用研究主要關(guān)注了“維數(shù)禍根”(curse of dimensionality)問題,指出最近鄰法在應(yīng)用于高維數(shù)據(jù)時,即使樣本量很大,散落在高維空間內(nèi)的樣本點仍十分稀疏,難以找到相鄰的樣本.針對該問題,文獻[8]提出可以通過非線性的數(shù)據(jù)投影法來降低數(shù)據(jù)維度;文獻[9]提出可以對最近鄰法進行改進,使用基于排序的最近鄰法來解決這一問題.
決策樹法(decision tree,DT)是近年來被引入信用評分領(lǐng)域的主要非參數(shù)方法之一.決策樹法以違約的可能上同質(zhì)性更強為劃分標(biāo)準(zhǔn),將信用申請者劃分為兩個子類,每個子類再次劃分為同質(zhì)性更強的子類,整個遞歸過程直到子類達到預(yù)設(shè)的終止條件為止.決策樹算法支持多個參數(shù),會對所生成的挖掘模型的性能和準(zhǔn)確性產(chǎn)生影響.文獻[10]首次將決策樹用于個人信用評估方法中.考慮到樣本屬性中包括了數(shù)值型數(shù)據(jù)及非數(shù)值型數(shù)據(jù),文獻[11]將Boosting算法技術(shù)嵌入決策樹中,該嘗試取得了更好的判別效果.
數(shù)據(jù)包絡(luò)分析法(data envelopment analysis,DEA)是在相對效率評價基礎(chǔ)上發(fā)展的系統(tǒng)分析方法.它是以相對效率概念為基礎(chǔ),根據(jù)多指標(biāo)投入和多指標(biāo)產(chǎn)出對相同類型的單位進行相對有效性或效益評價的一種新方法.將數(shù)據(jù)包絡(luò)分析法應(yīng)用于個人信用評估,可將客戶的特征向量視為投入指標(biāo),客戶的信用情況視為產(chǎn)出指標(biāo)進行分類.數(shù)據(jù)包絡(luò)分析法的優(yōu)點在于能夠有效的避免主觀因素,減少誤差,且建立模型前無須對數(shù)據(jù)進行量綱一的處理,與個人信用指標(biāo)的特征一致.文獻[12]將DEA模型應(yīng)用于私人融資計劃中借款人的信用評分,指出DEA有著能夠自動生成相對權(quán)重等優(yōu)點.
在個人信用評分中應(yīng)用的運籌學(xué)方法主要是線性規(guī)劃法(linear programming,LP).早在1965年,線性規(guī)劃法即被應(yīng)用于分類問題.但是直到1981年,文獻[13]闡明線性規(guī)劃在判別及分類上的應(yīng)用及實現(xiàn)之后,該方法才引起了更多學(xué)者的關(guān)注.線性規(guī)劃模型通過找到一組權(quán)重值,在給定的臨界值的條件下,使得所有好客戶的得分都在該臨界值之上,而所有壞客戶的得分都在這個臨界值之下從而實現(xiàn)個人信用樣本的分類.在線性規(guī)劃方法應(yīng)用于個人信用評分的基礎(chǔ)上,學(xué)者們更關(guān)注于與統(tǒng)計學(xué)方法在應(yīng)用效果上的差異,文獻[14]通過研究指出統(tǒng)計學(xué)方法要優(yōu)于線性規(guī)劃的方法.
專家系統(tǒng)(expert system),作為人工智能方法應(yīng)用于個人信用評分最成功的嘗試,其核心思想為通過一個包含某特定領(lǐng)域知識的數(shù)據(jù)庫和對信息進行遞推的規(guī)則,分析新情況并給出專家級的解決方案.文獻[15]介紹了CLUES專家系統(tǒng)的構(gòu)建,該系統(tǒng)可以決策是否批準(zhǔn)住房抵押貸款申請,后被美全國金融公司采用.
神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANNs)作為最具有代表性的人工智能方法之一,其原理是通過對變量進行線性組合和非線性變化,然后循環(huán)修正,進而模擬人類大腦的決策過程,利用神經(jīng)元相互觸發(fā),建立一種學(xué)習(xí)機制.文獻[16]在信用風(fēng)險評測中引入神經(jīng)網(wǎng)絡(luò)的方法.2000年,Moody's公司公布了一套上市公司的信用風(fēng)險評估模型,這套模型的主要方法為神經(jīng)網(wǎng)絡(luò).至此,研究者和實踐者開始廣泛關(guān)注神經(jīng)網(wǎng)絡(luò)這一方法,文獻[17]將傳統(tǒng)的參數(shù)和非參數(shù)方法和5種不同的神經(jīng)網(wǎng)絡(luò)算法(包括混合專家系統(tǒng)、失真適應(yīng)響應(yīng)和多層感知器等)進行了比較分析,其結(jié)果是神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性較好.
支持向量機(support vector machine,SVM)的核心思想是通過某種事先選擇的非線性映射將輸入向量映射到一個高維特征空間,在此空間中根據(jù)區(qū)域中的樣本計算該區(qū)域的決策曲面,由此確定該區(qū)域中未知樣本的類別.SVM的出現(xiàn)解決了以往學(xué)習(xí)方法中存在的小樣本、非線性、過學(xué)習(xí)、高維數(shù)、局部極小等實際問題,在個人信用評分中,支持向量機方法評分精度較高,預(yù)測能力強,且受變量限制少,具有很強的泛化能力,因此支持向量機不僅在手寫數(shù)字識別、文本分類、語音辨識等問題上得到了廣泛應(yīng)用,在個人信用評分領(lǐng)域也成為了研究的熱點.文獻[18]指出SVM算法能夠更好的捕捉變量間的非線性關(guān)系,并在SVM的基礎(chǔ)上提出了混合支持向量機算法,通過實證驗證了混合支持向量機算法有著更高的精確度,并有效降低了第2誤判率.
正是考慮到上述的單一信用評分方法各有優(yōu)勢,由此引發(fā)了學(xué)者們對組合方法的嘗試.文獻[19]總結(jié)不同領(lǐng)域的大量相關(guān)研究,得出組合模型能夠取得更高預(yù)測精度的結(jié)論,成為組合預(yù)測研究的一個里程碑.受此影響,同年《預(yù)測雜志》出版了一期組合預(yù)測的專刊,進一步激發(fā)了學(xué)者們對組合方法的熱情.組合方法主要分為線性組合和非線性組合.其中權(quán)重的確定是問題的關(guān)鍵,權(quán)重的確定可分為固定權(quán)重和可變權(quán)重.到目前為止,比較常用的方法有簡單平均法、勝出法、最優(yōu)法和回歸法.
近年來國內(nèi)在個人信用評分組合方法的研究上也取得了不少成果.文獻[20]提出基于貝葉斯算法的投票式組合模型的思想,選擇Logistic回歸、聚類分析和神經(jīng)網(wǎng)絡(luò)進行組合,既發(fā)揮了這些具有代表性的單一模型優(yōu)勢,同時減少了由于權(quán)重確定產(chǎn)生的誤差.文獻[21]指出現(xiàn)有信用評級中存在的問題,基于粗糙集算法對兩個混合模型FA-RS和MEPA-RS模型進行了深入研究.
在實際應(yīng)用中,個人信用評分模型選擇的決定因素往往來自于多個方面,如線性統(tǒng)計學(xué)模型常被有一定歷史的評分機構(gòu)所應(yīng)用,因為已有的技術(shù)比較根深蒂固,而且這些機構(gòu)也傾向于使用那些已經(jīng)被使用并通過實踐檢驗的方法.Logistic回歸多被新建機構(gòu)采用,那些為了防止嚴(yán)重的假設(shè)條件違背,或需要違約概率估計的借貸者(尤其是簽訂新巴塞爾協(xié)議的銀行)也對其更加青睞.
樣本有效性是國外成熟的評分模型在我國信用數(shù)據(jù)中進行應(yīng)用面對的首要問題.由于我國消費信用貸款業(yè)務(wù)發(fā)展較晚,信用體系尚未完善,現(xiàn)有的信用數(shù)據(jù)相當(dāng)有限,且由于信用信息的提交和紕漏仍不規(guī)范,灰色收入等的存在,造成信用樣本數(shù)據(jù)的權(quán)威性和有效性面臨挑戰(zhàn).對于商業(yè)銀行而言,無法對每一位貸款的個體進行數(shù)據(jù)真實性考察,如何及時的發(fā)現(xiàn)信貸業(yè)務(wù)中存在的“異常數(shù)據(jù)”,摒棄冗雜的干擾數(shù)據(jù),是目前個人信用評分領(lǐng)域需要研究的問題之一.
在信用樣本的完整性上,已有的個人信用評分模型都面對著一個不可忽視的數(shù)據(jù)問題——樣本偏差(biased sample).樣本偏差來自于非隨機性的樣本獲取過程,表現(xiàn)為樣本和總體分布的非一致性,其本質(zhì)是一種樣本選擇問題(sample selection).在個人信用評分上,樣本偏差表現(xiàn)為拒絕推論(reject inference).拒絕推論就是指在個人信用評分的過程中,銀行的評估模型是建立在已接受的信用樣本之上,而缺少那些申請被拒絕的樣本(拒絕樣本)的相應(yīng)數(shù)據(jù).這就導(dǎo)致了銀行的信用評分模型所用數(shù)據(jù)不是隨機樣本,不能代表整個申請者的“入門總體”(through-the-door population),從而導(dǎo)致評估的偏差.個人信用評分模型的準(zhǔn)確性與模型采用的訓(xùn)練數(shù)據(jù)有著密切的關(guān)系,拒絕推論問題的存在也降低了評分模型的價值與精度.
常用的解決樣本偏差的方法有外推法(extrapolation)、賦權(quán)法(enlargement)和重新賦權(quán)法(Re-weighting).外推法是利用已接受的樣本建立初始信用評分模型,并用于被拒絕樣本的判別,最后利用所有樣本建立最終的評分模型.重新賦權(quán)法通常與增補法共同使用,通過對已接受的樣本重新賦予權(quán)重來代表被拒絕的樣本.但是,文獻[22]認(rèn)為以上方法都是針對隨機性的樣本缺失,在解決非隨機性的拒絕推論問題時,效果并不理想.
信用評分指標(biāo)體系的確定是個人信用評分的第一步,對整個信用評分的精確性及信用風(fēng)險的有效識別至關(guān)重要.目前商業(yè)銀行在個人信用評分中應(yīng)用的指標(biāo)有限且彼此不同.國內(nèi)學(xué)者又偏向于對模型的優(yōu)化與改進,對指標(biāo)體系的研究較少,導(dǎo)致我國尚未建立有效、權(quán)威的指標(biāo)體系.而我國的文化習(xí)慣和道德標(biāo)準(zhǔn)與國外相差較大,國內(nèi)不同地區(qū)間經(jīng)濟發(fā)展水平、人口結(jié)構(gòu)和生活方式,各民族間文化及道德標(biāo)準(zhǔn)也有著較大差異,這就導(dǎo)致同一指標(biāo)在不同的實際應(yīng)用中顯著性有著較大的變化,因此針對不同的數(shù)據(jù)樣本,對指標(biāo)體系中的特征變量及變量的權(quán)重有所調(diào)整,充分適應(yīng)實際業(yè)務(wù)需求十分必要.目前優(yōu)化信用指標(biāo)體系的方法主要是屬性約簡法,文獻[23]通過SVM等方法對指標(biāo)進行篩選,保留比較重要的指標(biāo),構(gòu)建新的指標(biāo)體系.但是屬性約簡的方法在個人信用評分中的應(yīng)用效果并不理想,因為個人信用評分指標(biāo)體系中的指標(biāo)數(shù)量較少,約簡后所得的指標(biāo)體系其有效性和代表性仍有待考證.
目前,無論是學(xué)術(shù)研究還是商業(yè)銀行的實踐都致力于提高個人信用評分模型的精確性、穩(wěn)定性及解釋性,以便有效地進行風(fēng)險識別并降低信用風(fēng)險.但已有的模型各具優(yōu)缺點.如判別分析法對數(shù)據(jù)有著較為苛刻的要求,要求信用樣本數(shù)據(jù)服從正態(tài)分布,且要求自變量與因變量間存在線性相關(guān)關(guān)系,但它通過不同的變量組合來探求最小化的特定分離程度,具有良好的解釋性;最近鄰法不用提前學(xué)習(xí)和訓(xùn)練模型,從而允許動態(tài)的更改客戶信息,在解決人口漂移問題上具有優(yōu)勢,如何選擇距離公式和確定k個相近樣本投票權(quán)重卻是應(yīng)用中的難點,且對于高維數(shù)據(jù),其在樣本空間中分布較為稀疏,絕大多數(shù)點附近根本沒有樣本點,導(dǎo)致方法很難使用;決策樹法的優(yōu)點在于能夠充分的利用先驗信息,受異常數(shù)據(jù)點影響較小,具有較高的分類精度,缺點則在于對特征屬性的權(quán)重缺乏判斷;傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型具有較高的預(yù)測精度但無法處理非數(shù)值型數(shù)據(jù),而且對初始中心的選取及異常值十分敏感,訓(xùn)練中易于出現(xiàn)過度擬合.同時神經(jīng)網(wǎng)絡(luò)“黑箱”化特征決定了其不具解釋性.綜上所述,統(tǒng)計學(xué)模型可以提供假設(shè)檢驗,具有一定的解釋性,但與人工智能方法相比,其精確度不高,對數(shù)據(jù)的要求比較嚴(yán)格;而人工智能方法則正好相反,精確度較高但解釋性差.在實際應(yīng)用的過程中,商業(yè)銀行的信貸政策也在不斷調(diào)整,如何根據(jù)商業(yè)銀行的政策及業(yè)務(wù)需要進行模型選擇是目前個人信用評分所面對的一個難題.針對該問題,文獻[24]指出,在個人信用評分中應(yīng)將對模型的研究與對信用評分實際應(yīng)用的研究進行有效結(jié)合;文獻[25]認(rèn)為可以引入商業(yè)銀行個人信用評分的錯分代價(misclassification cost)作為模型選擇的標(biāo)準(zhǔn).
針對上述個人信用評分研究中的問題,本文從樣本有效性及完整性、指標(biāo)體系的合理性及模型的適用性3個方面對個人信用評分模型進行優(yōu)化.
針對信用樣本有效性及完整性問題,本文提出通過對已有的樣本進行相關(guān)性分析,提取樣本各特征變量間的相關(guān)關(guān)系,作為預(yù)警規(guī)則,對新加入的樣本進行識別,實現(xiàn)對異常數(shù)據(jù)的預(yù)警,并通過蒙特卡洛模型生成模擬樣本,根據(jù)規(guī)則進行樣本篩選,選取其中的“壞客戶”樣本進行樣本補足.
針對指標(biāo)體系合理性問題,由于統(tǒng)計學(xué)模型理論基礎(chǔ)豐富,解釋能力強,穩(wěn)健性良好,采用統(tǒng)計學(xué)模型能夠輸出個人信用評分指標(biāo)的顯著性,更有效的剖析影響個人信用的相關(guān)因素,因此,本文選取了Fisher判別分析、Logistic回歸、Probit回歸、多元線性回歸4種常用的統(tǒng)計學(xué)模型,結(jié)合投票器的方法對影響個人信用的特征向量進行顯著性排序;又由于人工智能方法的判別精度較高,能夠有效的識別不良數(shù)據(jù),因此,在顯著性權(quán)重的計算上,采用步長遍歷算法,以BP神經(jīng)網(wǎng)絡(luò)和支持向量機兩種精度較高的個人信用評分模型的平均精度為判別標(biāo)準(zhǔn),輸出顯著性權(quán)重,對個人信用評分指標(biāo)體系進行顯著性加權(quán),提高指標(biāo)體系的合理性和科學(xué)性.
針對模型的選擇及適用性問題,本文設(shè)計模型選擇器,選擇器中包括目前個人信用評分中最具有代表性的5個模型:Logistic回歸、分類樹、Bayes網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)和支持向量機,輸出每個模型的精確度、穩(wěn)健性、第1誤判率、第2誤判率及差異性作為模型選擇的指標(biāo),根據(jù)實際應(yīng)用的具體需求,輸出適用的單一模型、同類別加強組合模型及差異性組合模型,具體算法設(shè)計如圖1所示.
圖1 優(yōu)化算法技術(shù)路線
1)對個人信用評分模型的發(fā)展進行了梳理總結(jié),闡明了個人信用評分模型由統(tǒng)計學(xué)方法到非參數(shù)方法、運籌學(xué)方法再到人工智能方法的演變,同時由單一模型到組合模型的演進過程,指出了各種個人信用評分模型在實際應(yīng)用中的優(yōu)勢及局限性.
2)結(jié)合個人信用評分模型的發(fā)展及最新動態(tài),指出個人信用評分研究中仍存在樣本有效性及完整性差、指標(biāo)體系合理性有待提高、模型適用性不明確、難以選擇等問題.
3)針對樣本的有效性及完整性問題,本文以提升樣本有效性及完整性、指標(biāo)體系合理性及模型適用性為目標(biāo),通過規(guī)則提取及模擬樣本的加入實現(xiàn)對我國個人信貸業(yè)務(wù)中存在的“異常數(shù)據(jù)”預(yù)警,在豐富樣本集的同時使樣本結(jié)構(gòu)更接近于實際情況,優(yōu)化樣本結(jié)構(gòu);針對信用指標(biāo)的合理性問題,本文選取解釋性好的統(tǒng)計學(xué)模型,結(jié)合投票器和步長遍歷算法對信用評分指標(biāo)體系進行顯著性加權(quán),避免指標(biāo)減少的同時充分體現(xiàn)重要的樣本屬性在評分中的作用;針對模型的選擇與適用性問題,通過模型選擇器的設(shè)計,分別設(shè)定不同的標(biāo)準(zhǔn)進行模型的組合,比較單一模型與組合模型,旨在為商業(yè)銀行基于信貸政策目標(biāo)選擇最適用模型.
[1]THOMAS L C.A surveyofcreditand behavioural scoring:forecasting financial risk of lending to consumers[J].International Journal of Forecasting,2000,16(2):149-172.
[2]DURAND D.Appendix B:Application of the Method of DiscriminantFunctions to the Good-and Bad-Loan Samples[M].Cambridge,MA:NBER(Risk Elements in Consumer Instalment Financing,Technical Edition),1941:125-142.
[3]HAND D J,HENLEY W E. Statistical classification methods in consumer credit scoring:a review[J].Journal of the Royal Statistical Society:Series A,1997,160(3):523-541.
[4]CHEN H, CHEN Y. A comparative study of discrimination methods for credit scoring[C]//Proceedings of the 2010 40th International Conference on Computers and Industrial Engineering (CIE).Piscataway,NJ:IEEE,2010:1-5.
[5]SRINIVASAN V,KIM Y H. Creditgranting:a comparative analysis of classification procedures[J].Journal of Finance,1987,42(3):665-683.
[6]姜明輝,王雅林,趙欣,等.k-近鄰判別分析法在個人信用評估中的應(yīng)用[J].數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究,2004,(2):143-147.
[7]HAR-PELED S,INDYK P,MOTWANI R.Approximate nearestneighbor:towards removing the curse of dimensionality[J].Theory of Computing,2012,8(1):321-350.
[8]VERLEYSEN M, FRAN?OIS D. The Curse of Dimensionality in Data Mining and Time Series Prediction[M]. Berlin Heidelberg Springer:Computational Intelligence and Bioinspired Systems,2005.
[9] HOULE M E,KRIEGEL H P,KR?GER P,et al.Can shared-neighbor distances defeat the curse of dimensionality?[C]//Proceedings of the 22nd International Conference,SSDBM.Berlin Heidelberg:Springer,2010:482-500.
[10]PORTER B W,BAREISS R,HOLTE R C.Concept learning and heuristic classification in weak-theory domains[J].Artificial Intelligence,1990,45(1):229-263.
[11]龐素琳,鞏吉璋.C5.0分類算法及在銀行個人信用評級中的應(yīng)用[J].系統(tǒng)工程理論與實踐,2009,29(12):94-104.
[12]CHENG E W L,CHIANG Y H,TANG B S.Alternative approach to creditscoring by DEA:evaluating borrowers with respect to PFI projects[J].Building and Environment,2007,42(4):1752-1760.
[13]FREED N,GLOVER F.Applications and Implementation[J].Decision Sciences,1981,12(1):68-74.
[14]NATH R,JACKSON W M,JONES T W.A comparison of the classical and the linear programming approaches to the classification problem in discriminant analysis[J].Journal of statistical computation and simulation,1992,41(1/2):73-93.
[15]TALEBZADEH H,MANDUTIANU S,WINNER C F.Countrywide loan-underwriting expert system[J].AI magazine,1995,16(1):51-64.
[16]WOLPERT D H.Stacked generalization[J].Neural networks,1992,5(2):241-259.
[17]ZHANG R Q,HUANG Z S.Statistical inference on parametric part for partially linear single-index model[J].Science in China Series A:Mathematics,2009,52(10):2227-2242.
[18]HUANG C L,CHEN M C,WANG C J.Credit scoring with a data mining approach based on support vector machines[J].Expert Systems with Applications,2007,33(4):847-856.
[19]CLEMEN R T.Combining forecasts:A review and annotated bibliography[J].International journal of forecasting,1989,5(4):559-583.
[20]王雪.投票式組合預(yù)測模型在個人信用評估中的應(yīng)用研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2011.
[21]CHEN Y S,CHENG C H.Hybrid models based on rough set classifiers for setting credit rating decision rules in the global banking industry[J].Knowledge-Based Systems,2013,39:224-239.
[22]GARCIA S,HAROU P,MONTAGNE C,et al.Models forsample selection biasin contingentvaluation:Aplication to forest biodiversity[J].Journal of Forest Economics,2009,15:59-78.
[23]BELLOTTI T,CROOK J.Support vector machines for credit scoring and discovery of significant features[J].Expert Systems with Applications,2009,36(2):3302-3308.
[24]MARTIN N.Assessing scorecard performance:A literature review and classification[J].Expert Systems with Applications,2013,40(16):6340-6350.
[25]LEE T S,CHEN I F.A two-stage hybrid credit scoring model using artificial neural networks and multivariate adaptive regression splines[J].Expert Systems with Applications,2005,28(4):743-752.