閆大波?任淑紅?王微微
基于SVM的高校財務(wù)困境預(yù)警模型是一種在小樣本數(shù)據(jù)條件下預(yù)警高校財務(wù)困境的重要方法。本文選取了教育部64所高校中的7個財務(wù)評價指標進行分析,將其劃分為三種類別,即輕警、重警與巨警,然后與誤差反向傳播( BP) 神經(jīng)網(wǎng)絡(luò)模型進行比較。經(jīng)過系統(tǒng)研究,結(jié)果顯示通過SVM預(yù)警模型可以更好地預(yù)警高校財務(wù)困境。因此,建立基于支持向量機的高校財務(wù)困境預(yù)警模型,強化高校財務(wù)困境預(yù)警管理,尤為必要。
高校財務(wù)管理由早期的無風(fēng)險管理逐漸向現(xiàn)代化的風(fēng)險管理轉(zhuǎn)變,特別在2008年爆發(fā)金融危機后,建立財務(wù)困境預(yù)警非常有必要。六十年代到九十年代中后期,在傳統(tǒng)的統(tǒng)計方法基礎(chǔ)上又形成一些財務(wù)困境預(yù)警模型。然而,受模型對樣本數(shù)量要求較高等因素限制,導(dǎo)致以上預(yù)警模型在面對小樣本數(shù)據(jù)時,無法克服自身缺陷,不能有效解決財務(wù)困境預(yù)警問題。
通過研究國內(nèi)外相關(guān)文獻,對企業(yè)財務(wù)困境領(lǐng)域研究表現(xiàn)較為突出的,當屬基于SVM的研究財務(wù)困境預(yù)警模型,上市公司在這方面的實證研究比較充分,但是關(guān)于非盈利性組織的研究較少,例如高校。本文在SVM算法基礎(chǔ)上,通過建立高校財務(wù)困境預(yù)警模型,對各種實證進行分析,以證明該模型在高校財務(wù)困境預(yù)警中具有非常高的應(yīng)用價值,值得進行大力推廣。
一、SVM的原理和算法
SVM在一定程度上與概率測度和大數(shù)定律并不涉及,傳統(tǒng)機器學(xué)習(xí)方法中存在的各種缺陷都能效解決,如維數(shù)災(zāi)難等。它可以有效發(fā)揮出自身獨特優(yōu)勢,如非線性識別、有效解決小樣本和高維模式等,如一般的回歸問題和分類問題等在此基礎(chǔ)上能夠得到充分簡化。
簡單的描述SVM機理。首先選擇最優(yōu)分類超平面的一個,保證超平面和樣本集轉(zhuǎn)化之間得到最大化的距離,在此基礎(chǔ)上最優(yōu)超平面的構(gòu)造可以將其朝著一個類似二次規(guī)劃問題的方向進行轉(zhuǎn)化。
(一)線性可分SVM
若樣本,不僅是線性的且可分,分類超平面有且只有一個,即wTx+b =0,則可以正確分類訓(xùn)練樣本且誤差為零,即
之后再將拉格郎日函數(shù)引進來,通過優(yōu)化解決二次規(guī)劃問題,可以將最優(yōu)的分類函數(shù)進一步得到。
(二)線性不可分SVM
若樣本不是線性且不可分,則需要將非負松弛變量和懲罰參數(shù)C>0引入到方程式中,懲罰錯誤的分類隨著C增大,以此便可以優(yōu)化解決廣義分類超平面問題。
(三)非線性SVM
針對非線性問題而言,只需要在一個非線性映射的基礎(chǔ)上在某一特征空間內(nèi)實現(xiàn)輸入向量的映射,之后再將最優(yōu)分類的超平面構(gòu)造起來。
通過上述分析,在非線性函數(shù)的幫助下雖然可以在高維特殊空間內(nèi)實現(xiàn)對樣本數(shù)據(jù)的映射,且能夠?qū)⒆顑?yōu)分類超平面在特征空間中構(gòu)建起來,然而在最優(yōu)化問題求解和決策函數(shù)的計算過程中只需要對核函數(shù)進行計算即可,以此類似特征空間維數(shù)災(zāi)難性的問題就能夠得到有效解決。
二、樣本選取與變量設(shè)計
(一)樣本選取
選取72所教育部直屬高校作為空間樣本,其中已知樣本空間和需要進一步進行判別所屬類別的高校分別有64所和8所,88.90%的高校參與了本次的分析判別,11.10%的高校在分類變量所能夠控制的范圍以外。
現(xiàn)將樣本高校共64所根據(jù)警戒限分為三類。一類高校共有48所,財務(wù)狀況良好,警戒限為輕警,;二類學(xué)校共有12所,財務(wù)狀況一般,警戒限為中警;三類高校共有4所,財務(wù)狀況非常差,警戒限為巨警。2.2變量設(shè)計
共劃分為三種指標體系。即償債能力指標體系、運作績效指標體系和收益能力指標體系??紤]到財務(wù)風(fēng)險的來源-負債,將償債能力指標體系作為總評價指標體系的最重要主體,再在運行績效指標體系和收益能力指標體系兩種輔助指標的補充下,初步設(shè)置原始變量。
三、建立模型
選取徑向基核函數(shù)作為SVM預(yù)測模型的內(nèi)積核函數(shù),再使用M
ATLAB工具箱將SVM預(yù)測模型建立起來并進行必要的測算。
(一)選擇核函數(shù)
建立SVM模型,對應(yīng)核函數(shù)g與懲罰參數(shù)C的選擇是其中最為關(guān)鍵的。通過合理選擇,一定程度上會對模型本身推廣能力和精度造成直接影響。當下,幾種比較常用的核函數(shù)形式如下:
1.多項式核函數(shù);
2. 徑向基核函數(shù),在一定程度上與SVM相對應(yīng),主要是徑向基函數(shù)分類器的一種;
3. Sigmoid核函數(shù)[K(xi,x)],SVM能夠建立1個具備多層感知器的神經(jīng)網(wǎng)絡(luò)模型,再在自動算法的基礎(chǔ)上確定網(wǎng)絡(luò)權(quán)值域隱層節(jié)點的數(shù)目。
參數(shù)(C,g)在很大程度上可以直接決定1個基于徑向基核函數(shù)的SVM性能,由于所選取的C與g不同,相應(yīng)的所得到的SVM也會有顯著的差異。所謂的K層交叉檢驗是將各類初始數(shù)據(jù)隨機地劃分成K組,然后選取其中1個作為檢驗集。訓(xùn)練集就是余下的K-1個。最后得到的模型共有K個,再對K個模型的最終檢驗集的平均參數(shù)當做是評價K-CV分類器性能的重要指標?;贙-CV能夠有效避免欠學(xué)習(xí)和過學(xué)習(xí)狀態(tài),比較具有說服力,因此選擇參數(shù)K-CV。計算后得知,核函數(shù)最佳參數(shù)g=0.345355,懲罰最佳參數(shù)C=45. 4825。
(二)建立模型
將自變量X[0,1],分類變量y[-1,1] ,懲罰參數(shù)C =45. 4825,核函數(shù)參數(shù)g = 0.345355,統(tǒng)一做歸一化處理,由此得到SVM 模型。再使用SVM模型,預(yù)測和分析檢驗樣本,最后得到檢驗樣本SVM 模型。
結(jié)果顯示,其具備較高的預(yù)警模型精度。當訓(xùn)練樣本數(shù)為60和檢驗樣本數(shù)為4個時,便需要預(yù)測檢驗樣本,其判別的準確率高達100.00%,錯誤率為0.00%;當訓(xùn)練樣本和檢驗樣本的數(shù)目分別為58個和6個時,便需要預(yù)測檢驗樣本,同時準確率為71.43%,錯誤率為28.57%,檢驗樣本的預(yù)測分類與實際分類不相符的數(shù)目只有1個。簡而言之,該模型能夠取得較好的預(yù)測效果。
(三)比較應(yīng)用效果
通過比較BP神經(jīng)網(wǎng)絡(luò)模型和SVM模型的判別結(jié)果,可以得出以下結(jié)果。
利用兩種方法進行判別的結(jié)果是一致的,分類正確率都比較高。其中最高的當屬SVM模型(1),檢驗樣本判別正確率在分類1的情況下可以實現(xiàn)100.00%,SVM模型(2)比BP神經(jīng)網(wǎng)絡(luò)模型高3.33%。BP神經(jīng)網(wǎng)絡(luò)模型判別正確率與SVM模型相比,準確率下降的更快。由此得知,SVM模型預(yù)測精度非常高,具備很好的推廣價值。
四、結(jié)語
經(jīng)過各項實證研究證明,基于支持向量機的高校財務(wù)困境預(yù)警模型在樣本數(shù)據(jù)比較小情況下能夠準確進行科學(xué)預(yù)測,原因如下:
1.它能擺脫掉傳統(tǒng)單元與多元判別模型方法本身的局限性,以線性函數(shù)為依據(jù),突破判別模型的限制;
2.提高有限樣本的針對性,利用BP神經(jīng)網(wǎng)絡(luò)模型和非線性函數(shù)對樣本數(shù)據(jù)進行擬和;
3.在非線性變換的幫助下,促使輸入向量朝著到高維特征空間方向轉(zhuǎn)化,進而對原空間中的非線性函數(shù)進行科學(xué)判別,以此保障模型具有良好的推廣能力;
4.在最小化樣本點誤差的基礎(chǔ)上,保證模型泛化誤差,提高模型泛化能力。
綜上所述,本文從線性可分SVM、線性不可分SVM以及非線性SVM的角度出發(fā),介紹了SVM的原理和算法,完成了樣本研究和原始變量設(shè)置、篩選。并在此基礎(chǔ)上進行深入思考,并得出重要結(jié)論:SVM模型具有較為簡單的分類面、較強的泛化能力以及較高的擬合精確度。(作者單位:沈陽農(nóng)業(yè)大學(xué))