淦 艷 魏 延 楊 有
(重慶師范大學(xué)計(jì)算機(jī)與信息科學(xué)學(xué)院, 重慶 401331)
自20世紀(jì)90年代Vapnik等人提出支持向量機(jī)(Support Vector Machine, SVM)以來(lái),支持向量機(jī)已經(jīng)在手寫識(shí)別、語(yǔ)音識(shí)別、人臉識(shí)別和文本分類等工作中得到了廣泛應(yīng)用[1-2]。Jae Joon Ahn等人將支持向量機(jī)方法應(yīng)用于早期預(yù)警系統(tǒng),提出針對(duì)金融危機(jī)利用支持向量機(jī)開發(fā)一種早期預(yù)警系統(tǒng)的實(shí)用性[3]。Jae H Min等人將支持向量機(jī)方法用于破產(chǎn)預(yù)測(cè),提出使用支持向量機(jī)核函數(shù)參水最優(yōu)選擇的破產(chǎn)預(yù)測(cè),通過(guò)實(shí)驗(yàn)驗(yàn)證支持向量機(jī)方法的預(yù)測(cè)精度優(yōu)于多元判別分析,Logistic回歸分析和神經(jīng)網(wǎng)絡(luò)[4]。隨著社會(huì)經(jīng)濟(jì)的發(fā)展,支持向量機(jī)也在經(jīng)濟(jì)研究領(lǐng)域中得到更多應(yīng)用。但是目前SVM在財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警中的應(yīng)用遠(yuǎn)不如手寫識(shí)別、人臉識(shí)別和文本分類那么廣泛。
本文將支持向量機(jī)方法運(yùn)用于經(jīng)濟(jì)領(lǐng)域中的財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警,利用所建模型,通過(guò)中職學(xué)校的具體數(shù)據(jù)進(jìn)行實(shí)例驗(yàn)證。支持向量機(jī)方法在學(xué)校財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警中具有可行性和實(shí)用性,預(yù)測(cè)精度較高,能夠較為準(zhǔn)確地預(yù)測(cè)學(xué)校在未來(lái)某一年的財(cái)務(wù)風(fēng)險(xiǎn),從而為領(lǐng)導(dǎo)層提供決策參考。
財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警的分析需要考慮多個(gè)方面的因素。
文獻(xiàn)[5]通過(guò)資金周轉(zhuǎn)、資金分配、資金運(yùn)用和主題連帶風(fēng)險(xiǎn)等4類9個(gè)指標(biāo)研究了高等學(xué)校財(cái)務(wù)預(yù)警系統(tǒng);文獻(xiàn)[6]通過(guò)償債能力、運(yùn)營(yíng)能力和成長(zhǎng)能力3類20個(gè)指標(biāo)研究了高校財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警;文獻(xiàn)[7] 通過(guò)償債能力、盈利能力、營(yíng)運(yùn)能力、成長(zhǎng)能力、現(xiàn)金流量和規(guī)模6類25個(gè)指標(biāo)研究了上市公司財(cái)務(wù)預(yù)警;文獻(xiàn)[8] 通過(guò)償債能力、營(yíng)運(yùn)能力、獲利能力、成長(zhǎng)能力、財(cái)務(wù)結(jié)構(gòu)和現(xiàn)金流量6類15個(gè)指標(biāo)研究了上市公司財(cái)務(wù)危機(jī)預(yù)警;文獻(xiàn)[9]通過(guò)盈利能力、資產(chǎn)流動(dòng)性、負(fù)債管理能力、運(yùn)營(yíng)能力、現(xiàn)金生產(chǎn)能力、經(jīng)營(yíng)發(fā)展能力、資本市場(chǎng)表現(xiàn)和風(fēng)險(xiǎn)水平8類28個(gè)指標(biāo)研究了中國(guó)醫(yī)藥制造企業(yè)財(cái)務(wù)危機(jī)預(yù)警;文獻(xiàn)[10] 通過(guò)從短期償債能力、長(zhǎng)期償債能力、資本結(jié)構(gòu)、營(yíng)運(yùn)能力、獲利能力、投資報(bào)酬能力、成長(zhǎng)能力和現(xiàn)金流量8類38個(gè)指標(biāo)研究了財(cái)務(wù)危機(jī)預(yù)警;文獻(xiàn)[11]通過(guò)償債能力、營(yíng)運(yùn)能力和發(fā)展?jié)摿?類9個(gè)指標(biāo)研究了高等院校財(cái)務(wù)風(fēng)險(xiǎn)管理。本次研究受文獻(xiàn)[5] — [11]提出的評(píng)價(jià)指標(biāo)的啟發(fā),結(jié)合中職學(xué)校自身的特點(diǎn),主要從償債能力、營(yíng)運(yùn)能力、成長(zhǎng)能力和發(fā)展?jié)摿?大類22個(gè)評(píng)價(jià)指標(biāo)去分析,判斷學(xué)校是否存在財(cái)務(wù)風(fēng)險(xiǎn)。
通過(guò)對(duì)文獻(xiàn)[5] — [11]的研究,發(fā)現(xiàn)現(xiàn)實(shí)支付能力、潛在支付能力、資產(chǎn)負(fù)債率、收入負(fù)債率、流動(dòng)比率、收入支出比率、凈資產(chǎn)收入比率、學(xué)校債務(wù)率、總資產(chǎn)周轉(zhuǎn)率、收入支出平衡比率、凈增長(zhǎng)率、資產(chǎn)增長(zhǎng)率、自有資金余額占年末貨幣資金的比重、自有資金凈余額占年末貨幣資金的比重、非自有資金余額占年末貨幣資金的比重、總資產(chǎn)增長(zhǎng)率、資本積累率、師生比、生均事業(yè)支出、生均校舍面積、生均占地面積和教師人均科研經(jīng)費(fèi),共計(jì)22個(gè)指標(biāo)是他們所采用過(guò)的預(yù)警指標(biāo),說(shuō)明了這些指標(biāo)的重要性,因此這些指標(biāo)在我們的預(yù)警系統(tǒng)中均予以采用。同時(shí)結(jié)合學(xué)校的實(shí)際情況,本文選用上述22個(gè)指標(biāo),并分成4大類,通過(guò)指標(biāo)變化評(píng)價(jià)某中職學(xué)校是否存在財(cái)務(wù)風(fēng)險(xiǎn)。
試驗(yàn)數(shù)據(jù)均來(lái)源于重慶某中職學(xué)校1993年到2012年間具體的財(cái)務(wù)數(shù)據(jù)和學(xué)校其他相關(guān)數(shù)據(jù)(占地面積、師生人數(shù)、校舍面積)。
企業(yè)的償債能力是指企業(yè)用其資產(chǎn)償還長(zhǎng)期債務(wù)與短期債務(wù)的能力。根據(jù)學(xué)校實(shí)際情況,提出了5個(gè)償債能力評(píng)價(jià)指標(biāo),具體評(píng)價(jià)指標(biāo)所用符號(hào)、評(píng)價(jià)指標(biāo)名稱及計(jì)算方法如表1所示。
表1 償債能力評(píng)價(jià)指標(biāo)
營(yíng)運(yùn)能力是指企業(yè)的經(jīng)營(yíng)運(yùn)行能力,即企業(yè)運(yùn)用各項(xiàng)資產(chǎn)以賺取利潤(rùn)的能力。根據(jù)學(xué)校實(shí)際情況,提出了5個(gè)營(yíng)運(yùn)能力評(píng)價(jià)指標(biāo),具體評(píng)價(jià)指標(biāo)所用符號(hào)、評(píng)價(jià)指標(biāo)名稱以及計(jì)算方法,如表2所示。
企業(yè)成長(zhǎng)能力是指企業(yè)未來(lái)發(fā)展趨勢(shì)與發(fā)展速度,包括企業(yè)規(guī)模的擴(kuò)大、利潤(rùn)和所有者權(quán)益的增加。根據(jù)學(xué)校實(shí)際情況,提出了7個(gè)成長(zhǎng)能力評(píng)價(jià)指標(biāo),具體評(píng)價(jià)指標(biāo)所用符號(hào)、評(píng)價(jià)指標(biāo)名稱及計(jì)算方法如表3所示。
發(fā)展?jié)摿κ呛饬恳粋€(gè)企業(yè)的未來(lái)是否具有發(fā)展空間,根據(jù)學(xué)校實(shí)際情況,提出了5個(gè)成長(zhǎng)能力評(píng)價(jià)指標(biāo),具體評(píng)價(jià)指標(biāo)所用符號(hào)、評(píng)價(jià)指標(biāo)名稱及計(jì)算方法如表4所示。
本文對(duì)財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警研究的方法包括主成分分析(Principal Components Analysis, PCA)和支持向量機(jī)(Support Vector Machine, SVM)。
表2 營(yíng)運(yùn)能力評(píng)價(jià)指標(biāo)
其中,主成分分析(Principal Components Analysis, PCA)是統(tǒng)計(jì)分析中一種分析、簡(jiǎn)化數(shù)據(jù)集的技術(shù)。它經(jīng)常用于減少數(shù)據(jù)集的維數(shù),同時(shí)保持?jǐn)?shù)據(jù)集對(duì)方差貢獻(xiàn)最大的特征。這是通過(guò)保留低階主成分,忽略高階主成分而實(shí)現(xiàn),這樣低階成分往往能夠保留住數(shù)據(jù)的最重要方面。該分析法由卡爾·皮爾遜于1901年提出,用于分析數(shù)據(jù)及建立數(shù)理模型,主要通過(guò)對(duì)協(xié)方差矩陣進(jìn)行特征分解,以得到數(shù)據(jù)的主成分(即特征矢量)及其權(quán)值。通過(guò)上述分析,提出了22個(gè)評(píng)價(jià)指標(biāo)。這22個(gè)評(píng)價(jià)指標(biāo)之間存在一定的耦合關(guān)系,為了降低評(píng)價(jià)指標(biāo)之間的耦合性和節(jié)約運(yùn)行時(shí)間,首先使用主成分分析(Principal Components Analysis, PCA)對(duì)輸入數(shù)據(jù)進(jìn)行處理,從而降低原來(lái)評(píng)價(jià)指標(biāo)之間存在的耦合性并減少數(shù)據(jù)維數(shù)。
表3 成長(zhǎng)能力評(píng)價(jià)指標(biāo)
表4 發(fā)展?jié)摿υu(píng)價(jià)指標(biāo)
支持向量機(jī)(SVM)法是通過(guò)一個(gè)非線性映射,將輸入映射到一個(gè)高維特征空間中,在特征空間中尋求一個(gè)最優(yōu)分類面,使得原始的非線性問(wèn)題在特征空間中線性可分。財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警實(shí)際上是一個(gè)非線性問(wèn)題,假定有n個(gè)樣本的訓(xùn)練集
T={(φ(x1),y1),(φ(x2),y2),…,
(φ(xi),yi),…,(φ(xn),yn)}
(1)
其中i=1,2,…,n,φ(xi)是xi從Rn到Hilbert空間的映射,φ(xi)∈H,H是Hilbert空間,yi∈{-1,1}。若yi=+1時(shí),代表中職學(xué)校財(cái)務(wù)狀態(tài)良好;反之,yi=-1時(shí),代表學(xué)校出現(xiàn)財(cái)務(wù)危機(jī)。在此引入松弛變量ξi目標(biāo)函數(shù):
s.t.yi((w·φ(xi))+b)≥1-ξi,ξi≥0,
i=1,2,…,n
(2)
在支持向量機(jī)中升維是通過(guò)非線性映射來(lái)實(shí)現(xiàn)。根據(jù)泛函理論,在高維特征空間中只需要進(jìn)行內(nèi)積運(yùn)算,而這種內(nèi)積運(yùn)算是可以用原空間中的函數(shù)實(shí)現(xiàn)的,不必知道變換的具體形式,即φ(xi)并不清楚其具體表達(dá)形式,φ(xi)·φ(x)無(wú)法進(jìn)行計(jì)算。為此引入核函數(shù),只要一個(gè)核函數(shù)滿足Mercer條件,它就對(duì)應(yīng)某一個(gè)變換空間的內(nèi)積,在最優(yōu)分類面中采用合適的內(nèi)積函數(shù)就可以實(shí)現(xiàn)非線性變換后的線性分類。假定核函數(shù):
K(xi,xj)=φ(xi)·φ(xj)
(3)
經(jīng)過(guò)推導(dǎo),可以得到最優(yōu)分類函數(shù)
(4)
(5)
根據(jù)上述22項(xiàng)評(píng)價(jià)指標(biāo)及重慶某中職學(xué)校的實(shí)際財(cái)務(wù)數(shù)據(jù),計(jì)算出22個(gè)評(píng)價(jià)指標(biāo)的值,運(yùn)用PCA方法處理之后作為SVM的輸入數(shù)據(jù)。運(yùn)行環(huán)境:處理器Intel(R) Core(TM) i3-2250M cpu @ 2.30GHz,內(nèi)存為4.00GB,MATLAB版本為matlab R 2012 b。
在評(píng)價(jià)指標(biāo)的選取中,其中有些評(píng)價(jià)指標(biāo)所起的作用不大,因此首先運(yùn)用主成分分析法對(duì)評(píng)價(jià)指標(biāo)進(jìn)行降維處理。選取的不同主成分個(gè)數(shù)對(duì)應(yīng)不同的累計(jì)貢獻(xiàn)率,表5給出了從1到10對(duì)應(yīng)累計(jì)貢獻(xiàn)率的大小。
表5 評(píng)價(jià)指標(biāo)主成分累計(jì)貢獻(xiàn)率
從表5清楚地看到,前7個(gè)主分量的累計(jì)貢獻(xiàn)率為0.846 9,小于文獻(xiàn)[12]、[13]中給出的最小值0.85,然而前8個(gè)主分量的累計(jì)貢獻(xiàn)率為0.891 8,已經(jīng)超過(guò)0.85,即前8個(gè)主分量在整個(gè)數(shù)據(jù)分析中占有絕對(duì)重要的比重,因此選取前8個(gè)主分量為支持向量機(jī)的輸入數(shù)據(jù),從而有效地對(duì)原來(lái)的22個(gè)評(píng)價(jià)指標(biāo)進(jìn)行降維。
libsvm工具箱是一套簡(jiǎn)單易用的SVM模式識(shí)別和回歸機(jī)軟件包,因此,在實(shí)驗(yàn)時(shí)運(yùn)用libsvm軟件,使用默認(rèn)的RBF核函數(shù),用交叉驗(yàn)證方法尋找最佳的懲罰因子C和核函數(shù)中的方差g,然后利用最佳的參數(shù)訓(xùn)練模型。
實(shí)驗(yàn)假設(shè):若用“+1”代表學(xué)校財(cái)務(wù)狀態(tài)良好,反之,用“-1”代表學(xué)校出現(xiàn)財(cái)務(wù)危機(jī)。從20組數(shù)據(jù)中隨機(jī)抽取10組數(shù)據(jù)用來(lái)做訓(xùn)練數(shù)據(jù)集,其余10組(或是用20組數(shù)據(jù)來(lái)做預(yù)測(cè))數(shù)據(jù)用來(lái)做測(cè)試集。
從表6中前4組可以得知:當(dāng)用10組做測(cè)試數(shù)據(jù)的時(shí)候,最高測(cè)試分類精度達(dá)到100%,最低測(cè)試分類精度為80%,平均測(cè)試分類精度為92.5%;當(dāng)用20組做測(cè)試數(shù)據(jù)的時(shí)候,最高的測(cè)試分類精度達(dá)到95%;就實(shí)驗(yàn)結(jié)果整體而言平均測(cè)試分類精度為93.75%。從預(yù)測(cè)學(xué)校財(cái)務(wù)風(fēng)險(xiǎn)的角度分析,有93.75%的預(yù)測(cè)精度,說(shuō)明預(yù)測(cè)能力較強(qiáng),可信度高。這些數(shù)據(jù)驗(yàn)證了本文提出的評(píng)價(jià)指標(biāo)合理性,以及主成分分析方法和支持向量機(jī)方法在財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警中的可行性。
表6 訓(xùn)練集分類精度和測(cè)試集分類精度表
支持向量機(jī)有堅(jiān)實(shí)的理論基礎(chǔ),其分類應(yīng)用十分廣泛。本次研究使用支持向量機(jī)方法,將其應(yīng)用于學(xué)校財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警中,預(yù)測(cè)學(xué)校在未來(lái)是否存在財(cái)務(wù)風(fēng)險(xiǎn)。研究中結(jié)合學(xué)校的具體情況,提出了22個(gè)評(píng)價(jià)指標(biāo),并給出了相應(yīng)的計(jì)算方法;然后利用PCA對(duì)獲得的數(shù)據(jù)進(jìn)行降維處理,最后通過(guò)實(shí)驗(yàn)得到的平均預(yù)測(cè)精度為93.75%,即對(duì)學(xué)校未來(lái)是否存在財(cái)務(wù)風(fēng)險(xiǎn)有93.75%的預(yù)測(cè)準(zhǔn)確率。驗(yàn)證了提出的評(píng)價(jià)指標(biāo)的合理性,以及主成分分析方法和支持向量機(jī)方法在財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警中的可行性和實(shí)用性。
[1] Cortes C,Vapnik V.Support-Vector Networks[J].Machine Learning,1995,20:273-297.
[2] 胡哲,鄭誠(chéng),閔鵬鵬.支持向量機(jī)及其應(yīng)用研究[J].重慶科技學(xué)院學(xué)報(bào):自然科學(xué)版,2008,10(2):121-124.
[3] Jae Joon Ahn,Kyong Joo Oh,Tae Yoon Kim,et al.Usefulness of Support Vector Machine to Develop an Early Warning System for Financial Crisis[J].Expert Systems with Applications,2011,38:2966-2973.
[4] Jae H.Min,Young-Chan Lee.Bankruptcy Prediction Using Support Vector Machine with Optimal Choice of Kernel Function Parameters[J].Expert Systems with Applications,2005,28:603-614.
[5] 汪國(guó)安.高等學(xué)校財(cái)務(wù)預(yù)警系統(tǒng)的研究[D].上海:同濟(jì)大學(xué),2006.
[6] 曹慧.基于神經(jīng)網(wǎng)絡(luò)技術(shù)的高校財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警研究[D].南京:東南大學(xué),2008.
[7] 汪金.基于支持向量機(jī)原理的上市公司財(cái)務(wù)預(yù)警模型實(shí)證研究[D].武漢:華中科技大學(xué),2007.
[8] 閻娟娟.基于支持向量機(jī)的上市公司財(cái)務(wù)危機(jī)預(yù)警研究[D]. 西安:陜西科技大學(xué),2006.
[9] 楊濤.基于SVM的中國(guó)醫(yī)藥制造企業(yè)財(cái)務(wù)危機(jī)預(yù)警研究[D].廈門:廈門大學(xué),2009.
[10] 王敏.基于粗糙集和支持向量機(jī)的財(cái)務(wù)危機(jī)預(yù)警模型研究[D].西安:西安電子科技大學(xué),2011.
[11] 甕建鵬.高等院校財(cái)務(wù)風(fēng)險(xiǎn)管理研究[D].河北:河北農(nóng)業(yè)大學(xué),2011.
[12] 陳浩文,陳勇,林海明.主成分分析應(yīng)用中應(yīng)注意的問(wèn)題[J].統(tǒng)計(jì)與決策,2009(8):140-141.
[13] 蔡波,姚澤清,張倩.主成分分析法在分析江蘇經(jīng)濟(jì)發(fā)展?fàn)顩r中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2008,38(11):7-16.