荘芳芳
(昆明市交通技工學(xué)校,財務(wù)科,云南,昆明 650000)
企業(yè)的財務(wù)狀態(tài)不僅決定了企業(yè)的發(fā)展,而且還影響著整體經(jīng)濟走勢[1]?;谄髽I(yè)歷史及當(dāng)期財務(wù)數(shù)據(jù)預(yù)測財務(wù)危機具有十分重要的現(xiàn)實意義,已經(jīng)成為判定企業(yè)經(jīng)營狀況,調(diào)制投資策略的重要依據(jù)[2-3]。
企業(yè)財務(wù)危機的預(yù)測是一個二分類問題,即將企業(yè)狀態(tài)劃分為正常財務(wù)或危機財務(wù),研究人員已經(jīng)提出多種企業(yè)財務(wù)危機預(yù)測方法[4]。文獻(xiàn)[5]在COX模型的基礎(chǔ)上,通過引入懲罰組變量選擇CMCP方法,篩選出了對企業(yè)財務(wù)危機預(yù)測關(guān)鍵財務(wù)指標(biāo)。文獻(xiàn)[6]提出了一種基于粒子群優(yōu)化算法與核極限學(xué)習(xí)機的企業(yè)財務(wù)危機預(yù)測方法,降低了財務(wù)預(yù)測過程中參數(shù)優(yōu)化與特征選擇之間的矛盾。文獻(xiàn)[7]提出了基于靜態(tài)財務(wù)指標(biāo)的動態(tài)財務(wù)指標(biāo),并構(gòu)建了深度神經(jīng)網(wǎng)絡(luò)框架財務(wù)危機預(yù)測模型。
本文提出一種集成財務(wù)危機預(yù)測模型。該模型首先采用自組織映射(SOM)聚類處理初始財務(wù)數(shù)據(jù),根據(jù)財務(wù)數(shù)據(jù)狀態(tài)將企業(yè)劃分為不同的組;然后針對不同財務(wù)狀態(tài),基于寬度學(xué)習(xí)系統(tǒng)構(gòu)建基分類器,訓(xùn)練完成后采用逐步向前集成方法搭建集成分類器,預(yù)測企業(yè)財務(wù)狀態(tài)。實證分析結(jié)果驗證該模型的有效性和準(zhǔn)確性。
圖1給出了SOM映射網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),整個網(wǎng)絡(luò)包括2部分:輸入層和競爭層(又稱輸出層)[8]。網(wǎng)絡(luò)輸入層由N個節(jié)點神經(jīng)元組成,負(fù)責(zé)接收輸入數(shù)據(jù);網(wǎng)絡(luò)競爭層由一個排列成R行C列的神經(jīng)元矩陣構(gòu)成。網(wǎng)絡(luò)運行過程中,競爭層中的神經(jīng)元每個時刻僅有一個被激活,在相互競爭中獲得優(yōu)先激活權(quán),被激活的神經(jīng)元表示了對當(dāng)前輸入數(shù)據(jù)的分類結(jié)果。
圖1 SOM聚類結(jié)構(gòu)
為了更加精準(zhǔn)地獲取財務(wù)數(shù)據(jù)在短期內(nèi)的波動特征,首先將財務(wù)數(shù)據(jù)轉(zhuǎn)化為時間序列,即各個時刻t對應(yīng)的財務(wù)數(shù)據(jù)為x(t)∈RN,其中N表示財務(wù)危機預(yù)測中輸入樣本數(shù)據(jù)的特征維數(shù),然后利用SOM聚類處理輸入財務(wù)數(shù)據(jù)。根據(jù)SOM聚類原理,如果不同時間段的歷史財務(wù)數(shù)據(jù)與未來的變動趨勢具有較大差異,就會被劃分至不同的SOM聚類中,后續(xù)將采用不同的預(yù)測模型以更好地匹配其變化趨勢。
針對財務(wù)數(shù)據(jù)聚類分析問題,SOM聚類步驟如下。
步驟1:參數(shù)初始化。設(shè)置最大聚類迭代次數(shù)K,并令k=1,隨機化競爭層中神經(jīng)元之間的權(quán)值向量ωi∈RN。輸入數(shù)據(jù)與權(quán)值向量歸一化,將輸入樣本x∈RN和競爭層權(quán)值向量進(jìn)行歸一化處理。
步驟2:神經(jīng)元競爭。采用歐氏距離比較競爭層中所有神經(jīng)元對應(yīng)的權(quán)值向量ωi與輸入層的輸入向量x,將與輸入向量距離最近的神經(jīng)元作為競爭獲勝神經(jīng)元,獲勝神經(jīng)元權(quán)值向量權(quán)值向量記為ωc,神經(jīng)元競爭過程可以表示為
(1)
步驟3:調(diào)整競爭層權(quán)值向量。對獲勝神經(jīng)元的近鄰神經(jīng)元的權(quán)值向量進(jìn)行調(diào)整,目的是使其靠攏輸入向量,調(diào)整過程可以表示為
(2)
(3)
其中,α(k)和σ(k)分別表示網(wǎng)絡(luò)學(xué)習(xí)率和神經(jīng)元的影響半徑,隨著k的增加,這2個參數(shù)均逐漸減小。
步驟4:更新數(shù)據(jù)向量。將新的數(shù)據(jù)樣本數(shù)據(jù)導(dǎo)入SOM聚類網(wǎng)絡(luò),返回步驟2繼續(xù)調(diào)整競爭層權(quán)值向量,直至所有數(shù)據(jù)樣本均完成聚類訓(xùn)練。
步驟5:算法收斂判定。如果相鄰兩次迭代的權(quán)值向量誤差小于預(yù)設(shè)門限值或者迭代次數(shù)等于K,則聚類過程結(jié)束;否則令k=k+1,并返回步驟2。
上述SOM聚類過程表明,網(wǎng)絡(luò)競爭層中的神經(jīng)元與其鄰近神經(jīng)元互相促進(jìn)學(xué)習(xí),經(jīng)過訓(xùn)練后鄰近神經(jīng)元具有相似的權(quán)值向量,因此輸入特征相似的樣本數(shù)據(jù)將被映射至鄰近神經(jīng)元節(jié)點上。通過SOM對企業(yè)財務(wù)數(shù)據(jù)進(jìn)行聚類后,針對不同類型的財務(wù)數(shù)據(jù)會形成各自的基分類器,更好地實現(xiàn)對企業(yè)財務(wù)數(shù)據(jù)的擬合,提高后續(xù)財務(wù)危機的預(yù)測精度。
寬度學(xué)習(xí)系統(tǒng)是在隨機向量函數(shù)鏈接神經(jīng)網(wǎng)絡(luò)(RVFLNN)基礎(chǔ)上得出的一種新的學(xué)習(xí)算法[9]。RVFLNN的學(xué)習(xí)思想將初始數(shù)據(jù)以及初始數(shù)據(jù)的簡單映射結(jié)果共同作為網(wǎng)絡(luò)模型的輸入,然后訓(xùn)練網(wǎng)絡(luò)模型獲取最終輸出。寬度學(xué)習(xí)系統(tǒng)包括3層結(jié)構(gòu),即輸入層、隱藏層和輸出層,其中隱藏層由增強特征節(jié)點層和映射特征節(jié)點層構(gòu)成,系統(tǒng)結(jié)構(gòu)如圖2所示。寬度學(xué)習(xí)系統(tǒng)的學(xué)習(xí)過程主要包括映射節(jié)點組、增強節(jié)點與系統(tǒng)輸出。首先,構(gòu)建映射特征組,構(gòu)建方法是將初始數(shù)據(jù)經(jīng)過線性特征映射函數(shù)變換后,利用稀疏自編碼器生成;然后,生成增強節(jié)點層,即將映射特征組分別進(jìn)行線性映射與非線性激活,得出增強節(jié)點;最后,計算系統(tǒng)輸出,將映射節(jié)點與增強節(jié)點導(dǎo)入到輸出權(quán)值矩陣,經(jīng)過回歸廣義逆計算得出系統(tǒng)輸出。
圖2 寬度學(xué)習(xí)系統(tǒng)結(jié)構(gòu)
寬度學(xué)習(xí)系統(tǒng)的輸入數(shù)據(jù)可以表示為X∈Ra×b,其中a和b分別表示輸入數(shù)據(jù)的數(shù)量和特征維度;輸出數(shù)據(jù)可以表示為Y∈Ra×c,其中a和b分別表示模型輸出的a個c維數(shù)據(jù),則系統(tǒng)的第i組映射特征可以表示為
(4)
其中,φi(·)表示網(wǎng)絡(luò)的特征映射函數(shù),Wei和βei分別表示由稀疏編碼器生成的第i個最佳權(quán)值向量和與該權(quán)值向量對應(yīng)的偏置向量。由式(4)可知,映射特征組的節(jié)點數(shù)取決于權(quán)值向量Wei的維數(shù)。
將映射特征組導(dǎo)入映射函數(shù)變換后即可生成增強節(jié)點組,則第j個增強節(jié)點組[10]可以表示為
Hj=ξj(Whj·Zn+βhj),j=1,2,…,n
(5)
其中,ξj表示映射模型的激活函數(shù),通常非線性函數(shù),Whj和βhj分別表示特征特點映射至增強節(jié)點的權(quán)值向量和偏置向量。此時d個增強節(jié)點組構(gòu)成的集合可以表示為
Hd=[H1,H2,…,Hd]
(6)
寬度學(xué)習(xí)系統(tǒng)的輸出為映射特征節(jié)點與增強特征節(jié)點共同生成的,可以表示為
Y=[Zn|Hd]W=[Z1,Z2,…,Zn|H1,H2,…,Hd]W
(7)
式中,[Zn|Hd]表示寬度學(xué)習(xí)系統(tǒng)的輸入,W表示從特征節(jié)點到增強節(jié)點再到系統(tǒng)輸出的權(quán)值矩陣,Y表示系統(tǒng)輸出,表示財務(wù)危機的預(yù)測值。
訓(xùn)練過程中,模型初始化過程中隨機生成的權(quán)值向量Wei和Whj、偏置向量βei和βhj將保持不變,因此寬度學(xué)習(xí)系統(tǒng)的訓(xùn)練過程就是搜尋使得線性系統(tǒng)輸出的最小二乘解,即
(8)
根據(jù)寬度學(xué)習(xí)系統(tǒng)訓(xùn)練過程可知,系統(tǒng)無須進(jìn)行權(quán)值向量的梯度下降學(xué)習(xí),因此具有較快的訓(xùn)練速度,且訓(xùn)練過程降低了系統(tǒng)陷入局部最優(yōu)值的概率。對于企業(yè)財務(wù)危機預(yù)測問題,歷史數(shù)據(jù)時間長,訓(xùn)練數(shù)據(jù)集規(guī)模很大,因此適合于訓(xùn)練效率較高的寬度學(xué)習(xí)系統(tǒng)。并且,每個時刻企業(yè)財務(wù)狀態(tài)數(shù)據(jù)均對應(yīng)著多種財務(wù)數(shù)據(jù),數(shù)據(jù)維度非常高,對應(yīng)需要構(gòu)建高維度的輸入層,因此財務(wù)危機預(yù)測模型采用單隱藏層結(jié)構(gòu),能夠在確保財務(wù)數(shù)據(jù)擬合精度的前提下提升模型的訓(xùn)練效率。
對于財務(wù)危機預(yù)測問題,預(yù)測模型性能不僅體現(xiàn)在財務(wù)危機預(yù)測精確性上,還體現(xiàn)在提前預(yù)測能力上。因此,雖然選擇t-1或t-2年度數(shù)據(jù)預(yù)測t年度會使得預(yù)測精確度有所提升,但預(yù)測超前性不足,預(yù)測結(jié)果不足以為企業(yè)預(yù)留出充足時間調(diào)整決策。為此,綜合前3個年度財務(wù)數(shù)據(jù)構(gòu)建預(yù)測模型,以平衡財務(wù)危機預(yù)測精度和超前性的矛盾。
利用寬度學(xué)習(xí)系統(tǒng)扁平化特點,構(gòu)造具備多輸出功能的神經(jīng)網(wǎng)絡(luò),預(yù)測企業(yè)當(dāng)前年度的財務(wù)狀態(tài)。借鑒已有財務(wù)危機預(yù)測研究成果,文中從盈利能力、營運能力、償債能力、每股比例以及成長能力等5個方面選取了30個財務(wù)指標(biāo)作為樣本特征,具體如表1所示。
表1 財務(wù)危機預(yù)測指標(biāo)
構(gòu)建集成財務(wù)危機預(yù)測模型,模型框架如圖3所示。
圖3 財務(wù)危機預(yù)測框架
首先,利用SOM聚類對財務(wù)數(shù)據(jù)進(jìn)行精細(xì)化處理,將特征相似度高的樣本劃分為一類,聚類后的各個類簇分別代表一類公司的財務(wù)狀態(tài);然后,采用寬度學(xué)習(xí)系統(tǒng)分別構(gòu)建各個財務(wù)狀態(tài)的危機預(yù)測模型;最后,通過集成分類實現(xiàn)對企業(yè)財務(wù)數(shù)據(jù)的精準(zhǔn)分析。模型預(yù)測過程如下。
假設(shè)SOM模糊聚類將數(shù)據(jù)集劃分為P個數(shù)據(jù)子集,則每個數(shù)據(jù)子集均代表了一類公司的財務(wù)狀態(tài)。P個數(shù)據(jù)子集有效描述了從健康財務(wù)狀態(tài)空間到危機財務(wù)狀態(tài)空間的全序列描述。利用分類后的財務(wù)數(shù)據(jù)進(jìn)行寬度學(xué)習(xí)系統(tǒng)訓(xùn)練后,就能夠得出滿足后續(xù)分類器集成層需要的基分類器。
最后是分類器集成,目的是尋找最合適的基分類器,采用預(yù)測性能優(yōu)秀的逐步向前集成方法。該方法的分類器選擇思路是先對基分類器的預(yù)測性能進(jìn)行排序,然后逐步實現(xiàn)分類器的選擇與集成。具體的方法為,如果某一個基分類器加入集成分類器后,集成分類器的分類性能得到提升,則該基分類器被選擇值集成分類器中,直至所有的基分類器均不能使集成分類器性能得到提升,則分類器集成結(jié)束。通過基分類器集成,能夠確保整體財務(wù)預(yù)測模型的性能最佳。
主要研究內(nèi)容是設(shè)計了一個基于SOM聚類和寬度學(xué)習(xí)系統(tǒng)的兩層集成分類器的財務(wù)危機預(yù)測模型。為此實證分析首先需要驗證SOM聚類分析引入的不同企業(yè)財務(wù)狀態(tài)空間對解決財務(wù)危機預(yù)測問題的性能,然后驗證寬帶學(xué)習(xí)系統(tǒng)對預(yù)測財務(wù)危機的有效性。選用了2017年至2019年被特殊處理的329個上市公司財務(wù)數(shù)據(jù),為均衡樣本,增加了368個財務(wù)健康的企業(yè)數(shù)據(jù)作為正樣本。
為驗證SOM聚類對財務(wù)數(shù)據(jù)集空間劃分的性能,將其與高斯核函數(shù)模糊聚類(GFCM)和支持向量聚類(SVM)進(jìn)行對比測試。3種聚類模型對企業(yè)財務(wù)數(shù)據(jù)狀態(tài)空間的劃分結(jié)果如表2所示,表中給出了資產(chǎn)收益率、資產(chǎn)總增長率和資產(chǎn)負(fù)債率這3個最能代表企業(yè)盈利能力、成長能力和償債能力的指標(biāo)聚類后各組均值。
表2 3種方法聚類后指標(biāo)均值
實證結(jié)果表明,財務(wù)指標(biāo)能夠有效反應(yīng)企業(yè)的財務(wù)狀態(tài)。對于SOM聚類結(jié)果,資產(chǎn)收益率和總資產(chǎn)增長率從分組1到分組4均呈現(xiàn)下降趨勢,而資產(chǎn)負(fù)債率從分組1到分組4均呈現(xiàn)上升趨勢。對于GFCM和SVM,不同分組的財務(wù)指標(biāo)趨勢相同。經(jīng)過聚類后,分組1中均為具有很強盈利能力的財務(wù)健康企業(yè)構(gòu)成,而分組4中均為財務(wù)狀態(tài)欠佳、盈利能力低的企業(yè)構(gòu)成。測試結(jié)果說明,通過對企業(yè)財務(wù)數(shù)據(jù)進(jìn)行聚類預(yù)處理,能夠有效識別出不同財務(wù)狀態(tài)的企業(yè),為后續(xù)有針對性地訓(xùn)練基分類器提供數(shù)據(jù)支撐。對比3種財務(wù)數(shù)據(jù)聚類方法結(jié)果可知,SOM聚類結(jié)果中不同分組的組內(nèi)相似度和組間差異度性能優(yōu)于GFCM和SVM方法,說明SOM聚類對企業(yè)財務(wù)數(shù)據(jù)具有良好的適用性。
寬度學(xué)習(xí)系統(tǒng)(BLS)是采用的基分類器模型,為驗證其對企業(yè)財務(wù)危機的預(yù)測能力,將其與核函數(shù)支持向量機(FSVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)和Logistic回歸分類器進(jìn)行對比測試,企業(yè)財務(wù)數(shù)據(jù)聚類分析方法分別采用SOM、GFCM和SVM方法。4種基分類器在測試集上的預(yù)測準(zhǔn)確率如表3所示。
表3 4種基分類器,3種方法聚類后指標(biāo)均值
表3結(jié)果表明,4種基分類器中,寬度學(xué)習(xí)系統(tǒng)和SOM聚類算法的組合預(yù)測模型對健康企業(yè)、危機企業(yè)以及全部企業(yè)的財務(wù)狀態(tài)預(yù)測結(jié)果最佳,分別為91.24%、96.09%和93.29%,預(yù)測結(jié)果最差為人工神經(jīng)網(wǎng)絡(luò)與支持向量聚類組合的預(yù)測模型,分別為59.42%、58.04%和58.98%。對比在SOM聚類條件下的4種基分類器模型預(yù)測結(jié)果可知,寬度學(xué)習(xí)系統(tǒng)更適合于對企業(yè)財務(wù)危機狀態(tài)進(jìn)行預(yù)測,這是因為寬度學(xué)習(xí)系統(tǒng)能夠準(zhǔn)確提取輸入財務(wù)數(shù)據(jù)的特征,并高精度擬合高維財務(wù)數(shù)據(jù)與財務(wù)狀態(tài)之間的關(guān)系,因此其預(yù)測性能優(yōu)于其他分類器。
研究了企業(yè)財務(wù)危機預(yù)測問題,提出了一種基于SOM聚類和寬度學(xué)習(xí)的集成預(yù)測方法。實證分析結(jié)果表明,該方法能夠?qū)Σ煌攧?wù)狀態(tài)的企業(yè)進(jìn)行分類,高精度地提取并擬合高維財務(wù)數(shù)據(jù)與企業(yè)財務(wù)狀態(tài)之間的關(guān)系,提升了財務(wù)危機預(yù)測性能。研究內(nèi)容為預(yù)測企業(yè)財務(wù)危機提供了一種新方法。