摘要:在過(guò)去的幾十年中,人們一直在深入研究企業(yè)危機(jī)預(yù)測(cè)問(wèn)題。從傳統(tǒng)的統(tǒng)計(jì)模型到智能的機(jī)器學(xué)習(xí)模型,已經(jīng)構(gòu)建各種預(yù)測(cè)模型應(yīng)用于不同數(shù)據(jù)集,尤其是人工智能技術(shù)的發(fā)展為該類問(wèn)題提供了更多方法,因此本文首先以電子商務(wù)環(huán)境下的ST公司為研究樣本,構(gòu)建基于卷積神經(jīng)網(wǎng)絡(luò)的財(cái)務(wù)危機(jī)預(yù)測(cè)模型,對(duì)電子商務(wù)企業(yè)財(cái)務(wù)狀態(tài)分類進(jìn)行實(shí)證研究。研究結(jié)果表明,相比于傳統(tǒng)類預(yù)測(cè)方法,基于CNN的分類模型對(duì)ST公司的預(yù)測(cè)準(zhǔn)確率明顯高于其他幾種模型,具有較好的預(yù)測(cè)性能。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);財(cái)務(wù)危機(jī);電子商務(wù);ST公司
引言
風(fēng)險(xiǎn)水平是銀行和投資者進(jìn)行投資決策的主要關(guān)注點(diǎn),它可以衡量公司經(jīng)營(yíng)狀況的潛在不確定性并評(píng)價(jià)日常的經(jīng)營(yíng)活動(dòng)。因此,非常需要能夠預(yù)測(cè)投資者愿意投資的公司破產(chǎn)的可能性。電子商務(wù)企業(yè)財(cái)務(wù)危機(jī)是指企業(yè)運(yùn)營(yíng)管理失效,致使企業(yè)無(wú)法適應(yīng)經(jīng)營(yíng)環(huán)境的變化和做出管理策略的改變,出現(xiàn)到期不能清償債務(wù)的情況,最終使得企業(yè)生存發(fā)展陷入困境。根據(jù)中國(guó)證券市場(chǎng)的規(guī)定,一般將財(cái)務(wù)報(bào)表中連續(xù)兩年出現(xiàn)負(fù)盈利的的企業(yè)做出警示,在企業(yè)名稱前添加“ST”標(biāo)記,從企業(yè)的角度來(lái)看對(duì)未來(lái)經(jīng)營(yíng)、投融資活動(dòng)會(huì)產(chǎn)生不利的影響,為了避免這種情況需要提前識(shí)別財(cái)務(wù)風(fēng)險(xiǎn),積極采取措施解決問(wèn)題。
1、文獻(xiàn)綜述
通過(guò)國(guó)內(nèi)外財(cái)務(wù)危機(jī)研究的梳理,主要的關(guān)注點(diǎn)是預(yù)測(cè)變量選擇和預(yù)測(cè)模型構(gòu)建。徐安(2016)認(rèn)為應(yīng)該減少變量的個(gè)數(shù),一是太多變量會(huì)導(dǎo)致數(shù)據(jù)不完整。二是如果有很多變量,很難解釋變量與分類結(jié)果之間的關(guān)系。Tadaaki Hosaka(2018)認(rèn)為從模型性能角度看減少變量個(gè)數(shù)會(huì)使得信息丟失,降低預(yù)測(cè)的準(zhǔn)確性。因此結(jié)合主成分分析對(duì)數(shù)據(jù)預(yù)處理提高效率,既可以減少輸入變量個(gè)數(shù),又最大限度保證了數(shù)據(jù)量。危機(jī)預(yù)測(cè)問(wèn)題關(guān)鍵是衡量公司償債能力,初始模型主要是基于統(tǒng)計(jì)學(xué),F(xiàn)itzpatrick最早構(gòu)建單變量模型,Altman引入多變量產(chǎn)生經(jīng)典Z分?jǐn)?shù)模型,Meyer等(1970)在前者的研究基礎(chǔ)上引入邏輯回歸預(yù)測(cè)財(cái)務(wù)危機(jī)發(fā)生的概率,包括logistic和probit模型。
雖然這些模型已廣泛應(yīng)用于學(xué)術(shù)界和工業(yè)界,但統(tǒng)計(jì)模型在提高預(yù)測(cè)能力方面受到限制,為了克服統(tǒng)計(jì)模型的局限性,在機(jī)器學(xué)習(xí)領(lǐng)域積極開(kāi)發(fā)了使用模式識(shí)別方法的研究,如支持向量機(jī)(SVM),遺傳算法、神經(jīng)網(wǎng)絡(luò)(NN)和Adboost模型之類的機(jī)器學(xué)習(xí)技術(shù)方法,研究表明確實(shí)比傳統(tǒng)的統(tǒng)計(jì)方法有更高的準(zhǔn)確率。趙冠華(2009)的研究結(jié)論表明,遺傳算法能自動(dòng)尋優(yōu)到最佳參數(shù),顯著提高了模型預(yù)測(cè)的正確率。Bredart(2014)研究神經(jīng)網(wǎng)絡(luò)與Logistic的預(yù)測(cè)效率表明前者有更高的準(zhǔn)確性。Flavio Barboza等(2017)使用新的變量,例如以經(jīng)營(yíng)利潤(rùn)率、股本回報(bào)率、銷售收入、資產(chǎn)、員工數(shù)量相關(guān)的增長(zhǎng)指標(biāo)作為預(yù)測(cè)變量。結(jié)果表明與傳統(tǒng)模型相比,機(jī)器學(xué)習(xí)模型平均顯示出超過(guò)10%的準(zhǔn)確度。將所提出模型與所有預(yù)測(cè)變量進(jìn)行比較,與隨機(jī)森林相關(guān)的機(jī)器學(xué)習(xí)技術(shù)貢獻(xiàn)87%的準(zhǔn)確度,而邏輯回歸和線性判別分析在測(cè)試樣本中分別產(chǎn)生69%和50%的準(zhǔn)確率。Marcantonio M等(2014)基于遺傳算法和Gregorio(2016)基于案例推理而建立的財(cái)務(wù)危機(jī)預(yù)測(cè)模型,已被應(yīng)用于獲得決策破產(chǎn)規(guī)則。A.Chaudhuri,K.DeFuzzy (2012)應(yīng)用模糊SVM來(lái)解決破產(chǎn)分類問(wèn)題。這種增強(qiáng)的方法結(jié)合了機(jī)器學(xué)習(xí)和模糊集的優(yōu)點(diǎn),在聚類能力方面優(yōu)于概率神經(jīng)網(wǎng)絡(luò)。
最近的研究表明,卷積神經(jīng)網(wǎng)絡(luò)正被應(yīng)用于各種領(lǐng)域的識(shí)別問(wèn)題,某些領(lǐng)域已有的研究顯示出它有比于統(tǒng)計(jì)模型具有更高的識(shí)別精度和更低的誤差頻率,這為電子商務(wù)環(huán)境下的企業(yè)財(cái)務(wù)危機(jī)預(yù)測(cè)研究開(kāi)闊了新的思路,提供了新的理論和技術(shù)支持。
2、實(shí)證研究
2.1 樣本選擇
互聯(lián)網(wǎng)電子商務(wù)的發(fā)展是從1999年B2C網(wǎng)站開(kāi)通,網(wǎng)上在線納稅、教育、購(gòu)物等應(yīng)用開(kāi)始,伴隨互聯(lián)網(wǎng)技術(shù)的發(fā)展和移動(dòng)通信工具的普及應(yīng)運(yùn)而生,電子商務(wù)利用信息網(wǎng)絡(luò)技術(shù),在互聯(lián)網(wǎng)、局部網(wǎng)和增值網(wǎng)上以電子交易方式進(jìn)行交易行為和相關(guān)服務(wù)的活動(dòng),現(xiàn)如今互聯(lián)網(wǎng)行業(yè)產(chǎn)值已超5000千億,對(duì)該領(lǐng)域中的財(cái)務(wù)危機(jī)研究具有重要意義。因此從軟件和信息技術(shù)服務(wù)業(yè)和電子商務(wù)中心2018年公布的500強(qiáng)電商企業(yè)中選取120家公司做為研究樣本。
2.2 數(shù)據(jù)收集與預(yù)處理
電子商務(wù)ST企業(yè)樣本的財(cái)務(wù)指標(biāo)數(shù)據(jù)來(lái)源于深圳國(guó)泰安數(shù)據(jù)庫(kù)、金融數(shù)據(jù)庫(kù)以及各類財(cái)經(jīng)數(shù)據(jù)網(wǎng)站,按照1:2的比例選取了2016-2019年電子商務(wù)行業(yè)中120家首次被ST與財(cái)務(wù)健康的A股公司。并按照時(shí)間將樣本分為訓(xùn)練組和測(cè)試組,訓(xùn)練樣本由2016-2018年75家財(cái)務(wù)異常和財(cái)務(wù)正常公司組成,作為訓(xùn)練樣本用來(lái)訓(xùn)練模型,其中財(cái)務(wù)異常的公司有25家,由0,1編碼區(qū)分兩組變量類別,ST公司所屬類別的變量被定義為1,財(cái)務(wù)健康的企業(yè)被定義為變量0,剩下的2019年45家以1:2對(duì)比的財(cái)務(wù)異常和財(cái)務(wù)正常公司作為測(cè)試樣本用來(lái)檢驗(yàn)?zāi)P偷木_度。
2.3 財(cái)務(wù)危機(jī)預(yù)測(cè)指標(biāo)
財(cái)務(wù)危機(jī)預(yù)測(cè)領(lǐng)域?qū)τ谪?cái)務(wù)指標(biāo)選取的研究還沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),但大部分研究集中是從財(cái)務(wù)指標(biāo)角度出發(fā),因此為了使本文研究結(jié)果與一般方法具有可比性,財(cái)務(wù)危機(jī)預(yù)測(cè)領(lǐng)域?qū)τ谪?cái)務(wù)指標(biāo)選取的研究還沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),但大部分研究集中是從財(cái)務(wù)指標(biāo)角度出發(fā),因此為了使本文研究結(jié)果與一般方法具有可比性,初步選取由盈利能力、創(chuàng)新成長(zhǎng)能力、營(yíng)運(yùn)能力、償債能力組成的12個(gè)財(cái)務(wù)指標(biāo),其中盈利能力包括總資產(chǎn)、主營(yíng)業(yè)務(wù)利潤(rùn)率、凈資產(chǎn)收益率,銷售成長(zhǎng)能力包括收入、凈資產(chǎn)增長(zhǎng)率和研發(fā)人員占比,營(yíng)運(yùn)能力包括應(yīng)收帳款、總資產(chǎn)、股東權(quán)益周轉(zhuǎn)率;償債能力包括流動(dòng)、速動(dòng)比率和資產(chǎn)負(fù)債率。運(yùn)用SPSS對(duì)數(shù)據(jù)進(jìn)行主成分分析。結(jié)果如表1。
表1是利用SPSS對(duì)總體樣本進(jìn)行描述性統(tǒng)計(jì)的結(jié)果,其中營(yíng)收賬款周轉(zhuǎn)率、存貨周轉(zhuǎn)率和產(chǎn)權(quán)比率的均值和標(biāo)準(zhǔn)差數(shù)值偏大,沒(méi)有通過(guò)三倍標(biāo)準(zhǔn)差交叉檢驗(yàn),于是在PCA分析中,選取剩余的12個(gè)指標(biāo)作為自變量,確定5個(gè)主成分因子并保存為變量,結(jié)合旋轉(zhuǎn)成份矩陣將變量命名為盈利能力、償債能力、成長(zhǎng)能力、財(cái)務(wù)杠桿、經(jīng)營(yíng)能力,做為卷積神經(jīng)網(wǎng)絡(luò)的輸入。
2.4 基于卷積神經(jīng)網(wǎng)絡(luò)的分類預(yù)測(cè)
卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括2個(gè)卷積層、2個(gè)池化層和一個(gè)完全連接層,主要結(jié)構(gòu)如圖1下。
如圖2所示,它是由PCA確定的5個(gè)變量在卷積神經(jīng)網(wǎng)絡(luò)上的實(shí)驗(yàn)結(jié)果。圖中training acc表示訓(xùn)練準(zhǔn)確率,train loss表示訓(xùn)練損失函數(shù),val acc為測(cè)試準(zhǔn)確率,val loss為測(cè)試損失函數(shù)。在實(shí)驗(yàn)中,輸入數(shù)據(jù)的大小為9000×1,樣本個(gè)數(shù)為45個(gè)。
通過(guò)不斷訓(xùn)練和調(diào)整參數(shù)可知,當(dāng)epoch為100時(shí),準(zhǔn)確率和損失值的震蕩幅度最小。由圖3觀察可知,測(cè)試樣本上的損失值普遍要比訓(xùn)練樣本中小,而準(zhǔn)確率普遍要高,其中測(cè)試準(zhǔn)確率和損失值曲線的波動(dòng)度要比訓(xùn)練樣本強(qiáng)烈,這代表訓(xùn)練樣本的學(xué)習(xí)率和擬合度比較高。測(cè)試準(zhǔn)確率曲線中準(zhǔn)確率主要在0.7~0.9之間,其中最高值為89.31%,最小值為74.24%,平均準(zhǔn)確率大概為85%。損失值函數(shù)曲線是紅色曲線,變動(dòng)范圍在0.3至0.5之間,平均值為45%。統(tǒng)計(jì)結(jié)果如表2。
卷積網(wǎng)絡(luò)財(cái)務(wù)危機(jī)預(yù)測(cè)模型的實(shí)證研究統(tǒng)計(jì)結(jié)果如表4所示,在對(duì)財(cái)務(wù)指標(biāo)的研究中可知,判斷正確率達(dá)到91.67%。其中,在對(duì)檢測(cè)樣本的統(tǒng)計(jì)結(jié)果中,財(cái)務(wù)危機(jī)公司誤判成健康公司的個(gè)數(shù)為4;而將健康公司誤判成財(cái)務(wù)危機(jī)公司的個(gè)數(shù)是2。這顯示了卷積神經(jīng)網(wǎng)絡(luò)在分類預(yù)警中的優(yōu)勢(shì),降低了將危機(jī)公司判斷成健康公司的概率。
3、結(jié)論
以電子商務(wù)環(huán)境下上市公司的財(cái)務(wù)危機(jī)具有持續(xù)性和累積性為出發(fā)點(diǎn),綜合運(yùn)用卷積神經(jīng)、財(cái)務(wù)危機(jī)預(yù)測(cè)理論以及SPSS和Python編程技術(shù),構(gòu)建了以盈利能力、償債能力、成長(zhǎng)能力、財(cái)務(wù)杠桿、經(jīng)營(yíng)能力為主的指標(biāo)體系,提出了基于卷積神經(jīng)網(wǎng)絡(luò)的財(cái)務(wù)危機(jī)預(yù)測(cè)模型,通過(guò)對(duì)120家樣本公司的實(shí)證研究表明該方法在誤差率和識(shí)別正確率上顯示了優(yōu)越的性能,研究顯示預(yù)測(cè)準(zhǔn)確率達(dá)到91%,相比于統(tǒng)計(jì)類預(yù)測(cè)模型有很大的改善。這對(duì)于財(cái)務(wù)危機(jī)預(yù)測(cè)模型是一個(gè)巨大的進(jìn)步,具有廣闊的應(yīng)用前景。
參考文獻(xiàn):
[1] Tadaaki Hosaka.Bankruptcy prediction using imaged financial ratios and convolutional neural networks[J]. Expert Systems with Applications ,2019.117(1):287-299.
[2] A.Chaudhuri,K.DeFuzzy.support vector machine for bankruptcy prediction[J].Appl.Soft Comput,2012(2): 2472-2486.
[3] Marcantonio M D,Dellepiane U,Laghi E. Bankruptcy Prediction Using Support Vector Machines and Feature Selection During the Recent Financial Crisis[J]. International Journal of Economics and Finance,2015, 7(8):182-195.
作者簡(jiǎn)介:黃麗霞,研究生,上海工程技術(shù)大學(xué)會(huì)計(jì)學(xué)專業(yè)。