孫劍斌 魏敏
[摘? ? 要] 隨著中國市場化改革的深入,企業(yè)的信用風(fēng)險評估顯得尤為重要,金融機構(gòu)已經(jīng)將其作為評估信貸風(fēng)險、降低違約率以及增加現(xiàn)金流的關(guān)鍵途徑,因此,加強企業(yè)信用風(fēng)險評估模型的研究勢在必行。本文選取上交所555家上市公司2012-2018年的財務(wù)數(shù)據(jù)作為研究樣本,首先運用因子分析方法篩選企業(yè)信用風(fēng)險評估模型的財務(wù)指標(biāo);其次構(gòu)建基于決策樹與神經(jīng)網(wǎng)絡(luò)兩種不同算法的企業(yè)信用評估模型;最后將兩者進行比較,結(jié)果顯示,從綜合性能看神經(jīng)網(wǎng)絡(luò)比決策樹效果更好。
[關(guān)鍵詞] 決策樹;神經(jīng)網(wǎng)絡(luò);信用風(fēng)險評估;上市公司
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2021. 01. 042
[中圖分類號] F275;F276.6? ? [文獻標(biāo)識碼]? A? ? ? [文章編號]? 1673 - 0194(2021)01- 0100- 07
0? ? ? 引? ? 言
改革開放以來,我國資本市場得到了快速發(fā)展,已成為我國眾多企業(yè)籌集資金的重要場所。上市公司作為資本市場的重要主體之一,其信用狀況將對資本市場的交易活動產(chǎn)生重要的影響。因此,對上市公司信用風(fēng)險評估具有非同尋常的意義。業(yè)界及學(xué)者一直在探索和研究企業(yè)信用風(fēng)險評估方法,試圖找到企業(yè)在利潤和風(fēng)險之間的動態(tài)平衡點。同時,使用先進的技術(shù)手段建立企業(yè)信用風(fēng)險評估模型。目前,信用風(fēng)險評估模型可以分為三大類:第一類是傳統(tǒng)信用風(fēng)險度量模型,主要包括專家制度模型、Z值評分模型、ZETA模型等;第二類是現(xiàn)代信用風(fēng)險度量模型,主要有KMV預(yù)約違約率模型、信用度量術(shù)模型、信用風(fēng)險附加模型、信貸組合觀點模型、死亡率模型等;第三類是以大數(shù)據(jù)、人工智能為主的信息技術(shù)信用風(fēng)險評估模型。由于信息技術(shù)的快速發(fā)展,將大數(shù)據(jù)、人工智能等方法引入信用風(fēng)險評估,取得了較好的效果。本文選用的是機器學(xué)習(xí)方法,主要采用神經(jīng)網(wǎng)絡(luò)與決策樹,對于給定的數(shù)據(jù),兩個模型都單獨給出訓(xùn)練與測試值,然后將兩個模型進行綜合比較,從而選出更優(yōu)模型,這種方法一方面能夠比較有效地提升單個分類模型的準確率,另一方面具有比較好的穩(wěn)定性。
1? ? ? 文獻綜述
1.1? ?信用風(fēng)險評估模型發(fā)展歷程
隨著資本市場對信用風(fēng)險評估的重視,企業(yè)信用風(fēng)險評估的研究成果越來越豐富。信用風(fēng)險評估也由最初的經(jīng)驗評估演變?yōu)榱炕u估。Altman(1968)創(chuàng)建了Z值評分模型,這種模型首先運用加權(quán)財務(wù)比率來計算企業(yè)信用風(fēng)險的得分,其次將該得分和臨界值比較的結(jié)果來評價企業(yè)信用風(fēng)險;摩根銀行在1997年創(chuàng)建了Credit-metrics模型,此種模型是采用企業(yè)的信用評級、信用評級轉(zhuǎn)換矩陣這些信息來對企業(yè)的信用風(fēng)險進行測量,但是這種方法不適用我國的企業(yè)信用風(fēng)險測度,主要是因為我國還沒有建立長期的信用評級數(shù)據(jù)庫。李海洪、王穎琦(2010)等人利用5C分析法,既根據(jù)自身的經(jīng)驗以及申貸企業(yè)的資本能力等因素對企業(yè)的信用進行評估,但是該方法具有很大的主觀性,評估的結(jié)果令人難以信服。帥青紅、方玲(2013)等人將Logistic模型與決策樹模型進行比較,觀察二者哪一個更適用于上市公司的信用風(fēng)險評估。
有些學(xué)者將KMV模型應(yīng)用到企業(yè)的信用風(fēng)險測量當(dāng)中,楊秀云(2016)通過比較不同產(chǎn)業(yè)和地區(qū)之間的企業(yè)信用差別創(chuàng)建了KMV模型;李晟、張宇航(2016)在KMV模型的基礎(chǔ)上,比較了國有銀行和非國有銀行之間的信用差異。伴隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,數(shù)據(jù)挖掘的技術(shù)也逐漸被運用到企業(yè)的信用評估當(dāng)中,其為信用風(fēng)險識別、評級、評價等提供了更加精確的風(fēng)險判別方法與更加科學(xué)的變量選取方法,盛夏、李斌(2016)等人使用數(shù)據(jù)挖掘技術(shù)對信用評估變動進行預(yù)測;蔣翠清、梁坤(2017)在改進的 Adaboost 模型基礎(chǔ)之上,建立了網(wǎng)絡(luò)借貸信用預(yù)測模型,該模型具有比較高的分類精度。雖然現(xiàn)如今的模型對于信用風(fēng)險評估效果顯著,但是仍需采用更新的技術(shù)不斷地加強與完善,研究者需要深入地了解、探討、分析企業(yè)信用真實狀況與其影響因素,同時及時更新相關(guān)信用信息,促進形成理論發(fā)現(xiàn),從而進行理論實踐。
總體來說,企業(yè)信用評價模型在建立使用過程中仍有一些方面需要完善:(1)不用的信用風(fēng)險評估模型對于同一個企業(yè)的信用狀況評估結(jié)果往往是不一致的,因此,企業(yè)在選擇評估模型時應(yīng)該考慮選擇適用于自身發(fā)展現(xiàn)狀的模型。(2)在個人信用評估時,會使用用戶畫像、神經(jīng)網(wǎng)絡(luò)模型、決策樹、隨機森林以及多分類器組合等方式來提升個人信用風(fēng)險評價的精確度。同樣,在對企業(yè)信用進行評估時,也可以采用大數(shù)據(jù)的技術(shù),繪制出企業(yè)畫像,從而有利于金融機構(gòu)更加快捷,方便,清晰地了解企業(yè)。(3)一些企業(yè),尤其是中小微企業(yè)的數(shù)據(jù)存在類分布不均衡、噪聲多以及數(shù)據(jù)缺失等現(xiàn)象,我國對于處理這種現(xiàn)象的研究較少。張景肖(2012)將好客戶這一大眾事件與壞客戶這一稀有事件組成不平衡數(shù)據(jù),借鑒機器學(xué)習(xí)領(lǐng)域處理不平衡數(shù)據(jù)的方法,對稀有事件做特殊采樣處理之后進行再建??梢杂行岣咝庞迷u分模型準確性;張巖(2016)對我國中小銀行信用風(fēng)險數(shù)據(jù)缺陷的處理方法進行研究,得到針對不同類型缺陷,擬合自舉法、均值法以及分布法分別最優(yōu)的結(jié)論。學(xué)者們應(yīng)該借鑒銀行對于個人信用評級的方式,通過數(shù)據(jù)挖掘技術(shù)、大數(shù)據(jù)處理信息等方法來解決此問題。
1.2? ?信用風(fēng)險評估指標(biāo)的構(gòu)建
迄今為止,確定企業(yè)信用評估指標(biāo)基本上還是參考有關(guān)機構(gòu)的建議,美國鄧白氏、標(biāo)普以及穆迪三個信用評級機構(gòu)對于企業(yè)信用風(fēng)險的評估具有較高的權(quán)威,除此之外,還有很多的國內(nèi)外學(xué)者一直在對企業(yè)信用風(fēng)險評估指標(biāo)體系進行不斷地構(gòu)建和完善。信用風(fēng)險評估指標(biāo)創(chuàng)建的初期是從盈利能力、償債能力、經(jīng)營能力等方面選取財務(wù)指標(biāo),Altman(1968)創(chuàng)建的指標(biāo)體系使用到了總資產(chǎn)周轉(zhuǎn)率、息稅前利潤等比率類型的財務(wù)指標(biāo);張新紅(2011)發(fā)現(xiàn)現(xiàn)金流量指標(biāo)能夠比較準確的展現(xiàn)出企業(yè)的盈利質(zhì)量,并且可以快速的提示企業(yè)存在的信用風(fēng)險;鄧晶(2013)將盈余管理指標(biāo)引入到影響企業(yè)信用風(fēng)險評估的指標(biāo)當(dāng)中。
隨著信用風(fēng)險研究的加深,單純的財務(wù)指標(biāo)已經(jīng)不足以反映企業(yè)的信用風(fēng)險情況,學(xué)者們開始將非財務(wù)指標(biāo)添加到企業(yè)信用風(fēng)險的評估當(dāng)中。侯昊鵬(2012)將經(jīng)營者的素質(zhì)以及產(chǎn)品的競爭力兩種非財務(wù)指標(biāo)用于企業(yè)的信用風(fēng)險評估指標(biāo)體系中,新建的指標(biāo)體系只含有三個方面,抓住了影響信用狀況的主要因素,在很大程度上精簡了現(xiàn)有的指標(biāo)體系;舒歆(2015)認為法人治理情況對于小微企業(yè)信用評級具有重要的作用;趙亞(2017)在使用隨機森林技術(shù)評估企業(yè)信用風(fēng)險的過程中使用到了股東、董事會、高管、企業(yè)誠信情況以及外部環(huán)境因素等財務(wù)指標(biāo),通過對比發(fā)現(xiàn)增加非財務(wù)指標(biāo)的評估效果高于只有財務(wù)指標(biāo)的評估效果。隨著大數(shù)據(jù)的發(fā)展,企業(yè)信用風(fēng)險評估指標(biāo)的建立過程中收集與處理數(shù)據(jù)變得更加容易、有效,同時指標(biāo)特征選擇方法也更加可靠,比如胡心瀚、葉五一(2012)使用非參數(shù)的方法對變量進行選擇。
雖然,企業(yè)信用風(fēng)險評估指標(biāo)發(fā)展很豐富,但是也存在一些缺陷,例如:(1)許多學(xué)者對于指標(biāo)的選取一般都是通過問卷法和專家打分法,此種方法存在很大的主觀性,從而導(dǎo)致其適用范圍有限。霍海濤(2012)針對此種現(xiàn)象總結(jié)了前人的研究成果,結(jié)合我國自身的發(fā)展特點,建立了適用于高科技中小型企業(yè)的信用風(fēng)險評估指標(biāo)體系。(2)我國企業(yè)信用風(fēng)險評估指標(biāo)體系基本上都是參照國外的企業(yè),然而本國的發(fā)展環(huán)境與國外存在很大區(qū)別,導(dǎo)致企業(yè)的信用風(fēng)險評估指標(biāo)無法完全適用于本國,例如,范柏乃、朱文斌(2003)就是在分析國外企業(yè)信用評價指標(biāo)的基礎(chǔ)上,從六個層面篩選了28個財務(wù)指標(biāo)來構(gòu)建我國的中小企業(yè)信用評價體系。(3)非財務(wù)指標(biāo)包含企業(yè)管理水平、企業(yè)信用、公司資產(chǎn)規(guī)模、行業(yè)情況、國家經(jīng)濟環(huán)境等,很多學(xué)者都只是通過規(guī)范分析來導(dǎo)入非財務(wù)指標(biāo),很少有人將其量化同時進行實證研究,希望學(xué)者們以后加強這方面的研究。
2? ? ? 研究方法
決策樹就是對數(shù)據(jù)進行梳理分類,同時發(fā)現(xiàn)數(shù)據(jù)當(dāng)中存在的規(guī)律并挖掘出有效信息的一種機器學(xué)習(xí)方法,該方法能夠輔助決策者做出正確的決策。決策樹最根本的思想就是把所有的樣本看作是一棵樹的樹根,然后將數(shù)據(jù)進行分類,分出的每一個類別如同大樹的枝干,數(shù)據(jù)逐層進行細化,最后形成一棵決策樹。決策樹根據(jù)數(shù)據(jù)的邏輯推理分類,對于研究樣本的拆分每一個決策都需要各組之間差異性能夠最大化,從而能夠比較直觀地看到每個要素指標(biāo)對于最后測評結(jié)果影響程度,同時可以容易地分辨出研究樣本分類的要素,如果研究者有需要還可以將不必要的要素進行修剪或者剔除。決策樹的種類很多,早期著名的決策樹算法是在信息熵ID3算法基礎(chǔ)上發(fā)展起來的,緊接著又提出了CART、SLIQ、ID4、C5.0、CHAID等算法。本文選取的就是CHAID算法,該方法以目標(biāo)最優(yōu)為依據(jù), 對于序次等級以及分類分析比較適用, 它是一種擁有選擇目標(biāo)、聚類以及量篩選功能的可靠分析方法。
決策樹模型的優(yōu)點:(1)決策樹算法比較簡單,很適用于處理不是數(shù)值類型的研究樣本數(shù)據(jù),并且對于數(shù)據(jù)外的知識不需要過多的了解,因此,使用人員沒有必要了解很多的背景知識。(2)決策樹的分類規(guī)則比較清晰,因為其分類原則是根據(jù)信息熵增益率的選擇方法,該模型具有較強的可解釋性,可以比較清楚地展現(xiàn)出各個屬性指標(biāo)的重要程度。(3)決策樹穩(wěn)定性比較高,其對于樣本分類預(yù)測的精確度也比較高。(4)決策樹比較適合處理規(guī)模大的數(shù)據(jù),因為其計算量小,分類的效率高,并且建立模型的速度比較快。缺點:決策樹在實際使用的過程中,如果數(shù)據(jù)樣本屬性很多,最終輸出的結(jié)果很有可能是一個很大的決策樹,如果數(shù)據(jù)樣本不夠均勻或者屬性發(fā)生丟失,會導(dǎo)致最終輸出的結(jié)果準確率變低,算法的效率也會變低。
神經(jīng)網(wǎng)絡(luò)是一種擁有較強學(xué)習(xí)能力、自適應(yīng)性以及自組織性的智能化信息處理技術(shù),其是對人腦加工信息過程的一種模仿,能夠充分地發(fā)揮出計算機的快速運算能力,針對某一個問題不斷地進行反饋,從而在很短的時間內(nèi)發(fā)現(xiàn)優(yōu)化解。神經(jīng)網(wǎng)絡(luò)已經(jīng)成為信用評估領(lǐng)域中預(yù)測精確度很好的評估方法,該模型的類型比較多,至今為止已經(jīng)有幾十種,本文使用其中的一種:BP神經(jīng)網(wǎng)絡(luò)。該模型用于信用評估問題的原理是:首先對線性組合后的特征變量進行非線性變換;其次利用非線性變換以及循環(huán)性組合的方法充分逼近任意復(fù)雜的非線性關(guān)系。
神經(jīng)網(wǎng)絡(luò)的優(yōu)點:(1)使用人工神經(jīng)網(wǎng)絡(luò)其中的反饋網(wǎng)絡(luò)能夠?qū)崿F(xiàn)聯(lián)想儲存的功能。(2)神經(jīng)網(wǎng)絡(luò)具有能夠快速的尋找到比較優(yōu)化的解。(3)神經(jīng)網(wǎng)絡(luò)擁有一種自我學(xué)習(xí)的能力,就比如研究者想要對圖片進行識別,事先可以把很多種不同類別的圖片以及其對應(yīng)的識別結(jié)果導(dǎo)入神經(jīng)網(wǎng)絡(luò)當(dāng)中,該網(wǎng)絡(luò)則會根據(jù)導(dǎo)入的內(nèi)容慢慢地進行自學(xué)習(xí),當(dāng)再次導(dǎo)入需要識別的類似圖片時該模型就能識別出來。缺點:模型有時會出現(xiàn)過度訓(xùn)練的情況,這在一定程度上會導(dǎo)致最終的預(yù)測結(jié)果并不是很好。
3? ? ? 建立信用風(fēng)險評估模型
3.1? ?樣本來源及數(shù)據(jù)的選取
本文選取的財務(wù)數(shù)據(jù)均來自于RESSET數(shù)據(jù)庫,選取了上海證券交易所700多家上市公司的2012年至2018年財務(wù)數(shù)據(jù)作為研究樣本,其中包含上海證券交易所的所有ST和*ST公司,根據(jù)公司的股票是否被冠以ST的頭銜,是否有退市預(yù)警,是否受到處罰以及公司的年度財務(wù)報告判斷每個年度信用狀況。對于正常運營的企業(yè)當(dāng)數(shù)據(jù)缺失時則將其直接踢出,對于ST和*ST公司當(dāng)數(shù)據(jù)缺失時則選擇將其他年份平均值補充空缺的數(shù)據(jù),主要是因為ST和*ST公司出現(xiàn)財務(wù)狀況的年份較少,為了使最后訓(xùn)練和測試信用風(fēng)險較差的企業(yè)結(jié)果比較準確,所以選擇不直接剔除而是補充完整,通過多次篩選最終留下555家上市公司作為研究樣本。
3.2? ?初選評估指標(biāo)
通過閱讀相關(guān)文獻,從企業(yè)的每股指標(biāo)、盈利能力、償債能力、成長能力、營運能力以及資本結(jié)構(gòu)等六個方面,一共選取了25個財務(wù)指標(biāo)。通過每股指標(biāo)可以看出企業(yè)的股票收益、營利情況以及市場波動情況,股票市場穩(wěn)定股票收益高的企業(yè)自然是信用風(fēng)險較低的企業(yè);通過盈利能力可以看出企業(yè)獲得利潤的能力,獲得利潤的能力越強說明企業(yè)信用風(fēng)險越低;通過償債能力可以看出企業(yè)現(xiàn)金支付能力的大小,現(xiàn)金支付能力越強企業(yè)信用風(fēng)險越低,該指標(biāo)能夠直觀地反映企業(yè)的信用狀況;通過成長能力可以看出企業(yè)是否具有發(fā)展空間,具有發(fā)展前景的企業(yè)信用風(fēng)險會低一些;通過營運能力可以看出企業(yè)的經(jīng)營狀況,能夠客觀地表現(xiàn)出企業(yè)資產(chǎn)的使用效率和效益,越是經(jīng)營穩(wěn)定的企業(yè)其信用風(fēng)險就越低;通過資本結(jié)構(gòu)可以看出企業(yè)各種資本構(gòu)成的比例關(guān)系,負債比例高的企業(yè)其信用風(fēng)險也會高。具體指標(biāo)的選取情況如表1所示。
3.3? 財務(wù)指標(biāo)降維處理
由于本文選取了555家上市公司2012年至2018年的財務(wù)數(shù)據(jù),數(shù)據(jù)量足夠龐大,如果輸入到BP神經(jīng)網(wǎng)絡(luò)的變量過多就會導(dǎo)致該神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)特別復(fù)雜,從而導(dǎo)致該網(wǎng)絡(luò)訓(xùn)練以及測試的速度變慢。同樣的道理,輸入決策樹的數(shù)據(jù)過多會導(dǎo)致該決策樹的子節(jié)點過多,最后形成的樹會過于龐大,訓(xùn)練和測試的速度也會下降。所以,本文將采取因子分析的方法對選取的財務(wù)指標(biāo)進行降維處理,以獲取更為有效的財務(wù)指標(biāo)。通過KMO和Bartlett檢驗結(jié)果(如表2)可以看出,KMO的值為0.701,理論上該數(shù)值越接近1表示測試的變量之間相關(guān)性越強,當(dāng)大于0.5時就適合進行因子分析;Bartlett檢測結(jié)果為0.000,理論上該數(shù)值越接近0越適合進行因子分析。綜上所述,本文選取的財務(wù)指標(biāo)之間具有較強的相關(guān)性,比較適合通過因子分析來進行降維。
本文運用SPSS 21數(shù)據(jù)分析軟件對選取的財務(wù)數(shù)據(jù)進行分析,采取最大方差法對因子進行旋轉(zhuǎn),發(fā)現(xiàn)可以提取8個公共因子,該公共因子的累計貢獻率可達66.441%,提取的這8個公共因子基本上可以覆蓋上市公司信用風(fēng)險的絕大部分信息,通過具有 Kaiser 標(biāo)準化的正交旋轉(zhuǎn)法,旋轉(zhuǎn)在5次迭代后收斂,最后得出的旋轉(zhuǎn)成分矩陣如表3所示。公共因子D1命名為盈利能力因子,其在n6資產(chǎn)報酬率、n7資產(chǎn)凈利率、n9銷售凈利率 、n10息稅前利潤四個指標(biāo)載荷量較大,分別為:0.857、0.858、0.932、0.927;公共因子D2命名為每股情況因子,其在n1每股收益、 n2每股凈資產(chǎn)、n3每股營業(yè)利潤、n4每股留存收益四個指標(biāo)上載荷量較大,分別為:0.771、0.894、0.841、0.920;公共因子 D3命名為償債能力因子,其在n11流動比率、n12速動比率、n13超速動比率三個指標(biāo)載荷量比較大,分別為:0.956、0.968、0.944;公共因子D4命名為運營能力因子,其在n22流動資產(chǎn)周轉(zhuǎn)率、n23總資產(chǎn)周轉(zhuǎn)率兩個指標(biāo)載荷量較大,分別為:0.776、0.891;公共因子D5命名為資產(chǎn)流動能力因子,其在n15現(xiàn)金流動負債比、n25流動資產(chǎn)/總資產(chǎn)兩個指標(biāo)具有較大載荷量,分別為:0.519、0.842;公共因子D6命名為凈資產(chǎn)收益及產(chǎn)權(quán)因子,其在n5凈資產(chǎn)收益率、n14產(chǎn)權(quán)比例兩個指標(biāo)的載荷量較大,分別為:0.673、0.738;公共因子D7命名為成長能力因子,其在n17營業(yè)利潤增長率、n18利潤總額增長率、n19凈利潤增長率三個指標(biāo)載荷量較大,分別為:0.643、0.555、0.559;公共因子D8命名為營業(yè)收入及存貨周轉(zhuǎn)能力因子,其在n16營業(yè)收入增長率、n20存貨周轉(zhuǎn)率兩個指標(biāo)載荷量較大,分別為:0.637、0.605。本文將選取的8個公共因子作為變量導(dǎo)入神經(jīng)網(wǎng)絡(luò)與決策樹中。
3.4? ?模型構(gòu)成及預(yù)測
3.4.1? ?CHAID決策樹模型
3.4.1.1? ?決策樹模型設(shè)計
本文采用的是CHAID決策樹模型,該模型處理數(shù)據(jù)的基本原理:決策樹的根節(jié)點就是因變量,文中分為信用狀況較差(0)、信用狀況良好(1)兩個根節(jié)點,目標(biāo)變量就是自我分層的樹狀結(jié)構(gòu),預(yù)測變量會依據(jù)卡方顯著性的大小不停地生成子節(jié)點和父節(jié)點,越先形成的預(yù)測根節(jié)點其顯著性就越高,程序會主動歸集預(yù)測變量的不同類型,從而使其具有卡方顯著性,當(dāng)達到事先設(shè)定的樹狀水平數(shù)時該程序就會停止。文中將CHAID決策樹模型最大深度設(shè)為3,采用拆分樣本的方式進行驗證,父節(jié)點中最小的個案數(shù)為100,子節(jié)點中最小的個案數(shù)為50。最后結(jié)果中的決策樹節(jié)點數(shù)為12,終端節(jié)點數(shù)為8。CHAID決策樹預(yù)測模型結(jié)構(gòu)如圖1所示。
3.4.1.2? ?決策樹模型訓(xùn)練及檢驗
將上文已經(jīng)進行降維處理的數(shù)據(jù),8個公共因子作為分析樣本導(dǎo)入SPSS 21軟件當(dāng)中,其中70%的部分用來作為訓(xùn)練基,訓(xùn)練CHAID決策樹,30%的部分作為檢測基用來對決策樹上市公司的樣本進行檢測。如果判定的結(jié)果和初始的數(shù)據(jù)樣本判定結(jié)果一致,則是正確的檢出,如果判定的結(jié)果與初始樣本數(shù)據(jù)判定的結(jié)果不一致,則是有誤的檢出。訓(xùn)練及檢測結(jié)果如表4所示,通過訓(xùn)練基能夠觀察出本次上市公司信用風(fēng)險評估模型整體訓(xùn)練準確率為96.3%,該準確率比較高基本上可以檢測出信用風(fēng)險較大的個案,其中對于信用狀況較差預(yù)測正確率為59.5%,對于信用狀況良好的預(yù)測準確率為99.1%。檢測基的整體正確率為97.4%,其中對于信用狀況較差的預(yù)測正確率為64.4%,對于信用狀況良好的預(yù)測正確率為99.1%。無論是訓(xùn)練還是測試都可以看出對于信用狀況良好的正確判斷率高于信用狀況較差的正確率,這其中除了一些系統(tǒng)上的誤差,還有樣本本身一些限制的原因,出現(xiàn)信用問題的企業(yè)比較少,信用狀況較差的樣本較少導(dǎo)致CHAID決策樹無法得到充分的訓(xùn)練以及學(xué)習(xí),從而影響到最后研究訓(xùn)練以及測試的準確率。
3.4.2? ?BP神經(jīng)網(wǎng)絡(luò)模型
3.4.2.1? ?神經(jīng)網(wǎng)絡(luò)模型設(shè)計
BP神經(jīng)網(wǎng)絡(luò)模型其主要組成部分分為三層:輸入層、隱藏層以及輸出層。當(dāng)網(wǎng)絡(luò)層次增加時可以在一定程度上降低誤差,加強網(wǎng)絡(luò)的表現(xiàn)力,然而過于龐大的網(wǎng)絡(luò)結(jié)構(gòu)也會使訓(xùn)練的時間變長。在一般情況下,三個層次的BP神經(jīng)網(wǎng)絡(luò)能夠得到比較精確的結(jié)果,訓(xùn)練時間也適中,所以綜合考慮之后,文中選取由一個輸入層,一個隱藏層和一個輸入層組成的BP神經(jīng)網(wǎng)絡(luò)模型。BP神經(jīng)網(wǎng)絡(luò)的預(yù)測模型結(jié)構(gòu)如圖2所示。
輸入層設(shè)計:神經(jīng)網(wǎng)絡(luò)的輸入的數(shù)據(jù)應(yīng)該是全面描述我國上市公司信用風(fēng)險的指標(biāo),上文已經(jīng)通過因子分析法對信用風(fēng)險的預(yù)測指標(biāo)進行了篩選,不同信用風(fēng)險財務(wù)指標(biāo)形成不同的節(jié)點數(shù)從而對應(yīng)不同的網(wǎng)絡(luò)模型,上文篩選的20個信用風(fēng)險財務(wù)指標(biāo)的個數(shù)其實也就是輸入節(jié)點的個數(shù)。因為評價體系當(dāng)中數(shù)據(jù)單位不一致,所以為了使所有數(shù)據(jù)在系統(tǒng)中具有可比性,就在輸入前對選取的指標(biāo)數(shù)據(jù)進行標(biāo)準化的處理。
隱藏層設(shè)計:隱藏層節(jié)點的本質(zhì)作用就是將大樣本數(shù)據(jù)當(dāng)中存在的規(guī)律挖掘出來,同時把這種規(guī)律進行保存。當(dāng)隱藏層的節(jié)點比較少的時候,有可能會導(dǎo)致神經(jīng)網(wǎng)絡(luò)從大樣本數(shù)據(jù)當(dāng)中挖掘的信息數(shù)據(jù)不能夠體現(xiàn)以及概括其中的規(guī)律;然而當(dāng)隱藏層的節(jié)點比較多時,神經(jīng)網(wǎng)絡(luò)容易把大樣本數(shù)據(jù)當(dāng)中本身不存在規(guī)律的東西記下來,從而導(dǎo)致最后網(wǎng)絡(luò)的訓(xùn)練效率比較低,學(xué)習(xí)的時間過長,泛化的能力下降等。因此合適的隱藏節(jié)點數(shù)對于處理數(shù)據(jù)挖掘信息至關(guān)重要,本文在結(jié)合上市公司實際經(jīng)營的情況,對數(shù)據(jù)進行多次訓(xùn)練后發(fā)現(xiàn)節(jié)點數(shù)為6時收斂速度最快,所以,最后本文確定的隱藏層節(jié)點數(shù)為6個,其激活函數(shù)為雙曲正切函數(shù)(tansig函數(shù))。
輸出層設(shè)計:本文將上市公司的信用風(fēng)險狀況劃分為信用3.5? ?模型結(jié)果比較
將CHAID決策樹模型與BP神經(jīng)網(wǎng)絡(luò)對于上市公司信用風(fēng)險評估結(jié)果進行比較,發(fā)現(xiàn)兩者整體預(yù)測正確率水平也基本持平,CHAID決策樹的平均預(yù)測正確率為96.85%,BP神經(jīng)網(wǎng)絡(luò)的平均預(yù)測正確率為97%,CHAID決策樹比BP神經(jīng)網(wǎng)絡(luò)預(yù)測準確率低0.15個百分點,同時對信用狀況良好的數(shù)據(jù)預(yù)測結(jié)果正確率也基本相當(dāng),CHAID決策樹的平均預(yù)測正確率為99.1%,BP神經(jīng)網(wǎng)絡(luò)的平均預(yù)測正確率為98.55%,CHAID決策樹比BP神經(jīng)網(wǎng)絡(luò)預(yù)測準確率高出0.55個百分點,但是對于信用狀況較差的企業(yè)BP神經(jīng)網(wǎng)絡(luò)預(yù)測正確率明顯高于CHAID決策樹模型,CHAID決策樹的平均預(yù)測正確率為61.95%,BP神經(jīng)網(wǎng)絡(luò)的平均預(yù)測正確率為74.5%,CHAID決策樹比BP神經(jīng)網(wǎng)絡(luò)預(yù)測準確率低12.55個百分點,因此,從綜合性能角度看BP神經(jīng)網(wǎng)絡(luò)模型對于上市公司信用風(fēng)險評估比CHAID決策樹更好。
4? ? ? 結(jié)? ? 論
本文通過采用上交所555家上市公司2012年至2018年的財務(wù)數(shù)據(jù),建立CHAID決策樹以及BP神經(jīng)網(wǎng)絡(luò)模型成功地對上市公司信用風(fēng)險進行評估,預(yù)測結(jié)果的綜合正確率分別為:97.4%、97.3%,預(yù)測準確度比較高,能夠為上市公司提供比較精確可靠的信息。通過比較分析,對于上市公司的信用風(fēng)險評估中BP神經(jīng)網(wǎng)絡(luò)預(yù)測的準確度比CHAID決策樹更高。使用計算機算法技術(shù)處理數(shù)據(jù)非常快捷方便,能夠在一定程度上減少人為因素的影響,這種方法可以保障處理結(jié)果的真實性,減少運算過程中的誤差,增加客觀性,擁有動態(tài)跟蹤比較的優(yōu)勢。文中建立的兩種模型都能夠成為評估上市公司信用風(fēng)險狀況的可靠依據(jù)和科學(xué)手段,有效的信用風(fēng)險評估模型可以為投資者、銀行以及金融機構(gòu)提供巨大的幫助,在一定程度上減少他們面臨的風(fēng)險。
本文存在的不足之處:(1)在選取的555家公司當(dāng)中信用風(fēng)險狀況較差的數(shù)據(jù)比較少,并且有些年份數(shù)據(jù)缺失,只是采用簡單的平均值進行填補,從而導(dǎo)致信用風(fēng)險狀況較差的預(yù)測結(jié)果不夠準確。(2)考慮到數(shù)據(jù)的可獲得性,信用風(fēng)險評估指標(biāo)體系中只采用了財務(wù)風(fēng)險指標(biāo),沒有采用非財務(wù)風(fēng)險指標(biāo)。(3)導(dǎo)致上市公司的信用風(fēng)險評估的因素會隨著時間的變化而發(fā)生變化,在對財務(wù)指標(biāo)選取完成后應(yīng)該進行顯著性分析,然而本文只進行了因子分析。(4)對于信用風(fēng)險的評估可以采用決策樹與神經(jīng)網(wǎng)絡(luò)兩種模型建成組合模型,評估結(jié)果可能會更加有效,本文只是進行了簡單的比較。在今后的研究當(dāng)中,要加強完善不足的方面,為上市公司的信用風(fēng)險評估提供重要參考。
主要參考文獻
[1]Edward I. Altman. Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy[J]. Journal of Finance, 1968, 23(4):589-609.
[2]范柏乃,朱文斌.中小企業(yè)信用評價指標(biāo)的理論遴選與實證分析[J].科研管理,2003(6):83-88.
[3]李海洪,王穎琦,郭俊祥,王永.信用風(fēng)險管理理論與評價模型[J].山西財經(jīng)大學(xué)學(xué)報,2010,32(z2): 325-326.
[4]張新紅,王瑞曉.我國上市公司信用風(fēng)險預(yù)警研究[J].宏觀經(jīng)濟研究,2011(1):50-54.
[5]侯昊鵬.國內(nèi)外企業(yè)信用評級指標(biāo)體系研究的新關(guān)注[J].經(jīng)濟學(xué)家,2012(5):88-97.
[6]胡心瀚,葉五一,繆柏其.上市公司信用風(fēng)險分析模型中的變量選擇[J].數(shù)理統(tǒng)計與管理,2012,31(6):1117-1124.
[7]張景肖,魏秋萍,張波.信用評分模型中稀有事件特殊采樣處理方法探討[J].統(tǒng)計與信息論壇,2012,27(11):15-19.
[8]霍海濤.高科技中小企業(yè)信用風(fēng)險指標(biāo)體系及其評價方法[J].北京理工大學(xué)學(xué)報:社會科學(xué)版,2012,14(1):60-65.
[9]帥青紅,方玲,匡遠競.基于決策樹與Logistic的上市公司信用評估比較研究[J].西南民族大學(xué)學(xué)報:人文社會科學(xué)版,2013,34(5):135-140.
[10]楊勝剛,朱琦,成程.個人信用評估組合模型的構(gòu)建——基于決策樹——神經(jīng)網(wǎng)絡(luò)的研究[J].金融論壇,2013,18(2):57-61,67.
[11]鄧晶,秦濤,黃珊.基于Logistic模型的我國上市公司信用風(fēng)險預(yù)警研究[J].金融理論與實踐,2013(2):22-26.
[12]舒歆.小微企業(yè)信用評級指標(biāo)體系構(gòu)建研究[J].金融理論與實踐,2015(5):105-108.
[13]楊秀云,蔣園園,段珍珍. KMV模型在我國商業(yè)銀行信用風(fēng)險管理中的適用性分析及實證檢驗 [J].財經(jīng)理論與實踐,2016,37(1):34-40.
[14]李晟,張宇航.中國上市商業(yè)銀行信用風(fēng)險分析及比較:基于KMV模型及面板數(shù)據(jù)[J].中央財經(jīng)大學(xué)學(xué)報,2016(10):31-38.
[15]盛夏,李斌,張迪.基于數(shù)據(jù)挖掘的上市公司信用評級變動預(yù)測[J].統(tǒng)計與決策,2016(15):159-162.
[16]張巖,王智茂.我國中小銀行信用風(fēng)險基礎(chǔ)數(shù)據(jù)缺陷處理方法研究[J].數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究,2016,33(12):129-143.
[17]肖斌卿,柏巍,姚瑤,李心丹.基于LS-SVM的小微企業(yè)信用評估研究[J].審計與經(jīng)濟研究,2016,31(6):102-111.
[18]趙亞,李田,苑澤明.基于隨機森林的企業(yè)信用風(fēng)險評估模型研究[J].財會通訊,2017(29):110-114,129.
[19]蔣翠清,梁坤,丁勇,等.基于改進Adaboost的信用評價方法[J].運籌與管理,2017,26(2):135-139.
[20]韓嵩,李曉俊.大數(shù)據(jù)背景下我國企業(yè)信用研究綜述——基于CSSCI檢索論文的分析[J].金融理論與實踐,2018(10):107-113.