馮 璐,周 勇
(新疆財經(jīng)大學(xué) 統(tǒng)計與數(shù)據(jù)科學(xué)學(xué)院,新疆 烏魯木齊 830012)
國務(wù)院于2015年提出的《國務(wù)院關(guān)于積極推進(jìn)“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》鼓勵市場主體利用互聯(lián)網(wǎng)進(jìn)行技術(shù)創(chuàng)新,由此互聯(lián)網(wǎng)發(fā)展的如火如荼,作為利用互聯(lián)網(wǎng)發(fā)展的代表性行業(yè)IT行業(yè)也進(jìn)入了高速發(fā)展時期.IT行業(yè)不僅是新業(yè)態(tài)、新動能的重要體現(xiàn),也是我國創(chuàng)新發(fā)展戰(zhàn)略中重要的一環(huán).IT企業(yè)的產(chǎn)品多以軟件產(chǎn)品為主,其企業(yè)的不動產(chǎn)占比較少,財務(wù)建設(shè)具有滯后性[1],開發(fā)項目受客戶關(guān)系影響較大[2],人力資本需貨幣激勵與非貨幣激勵并重[3-4]等特點,難以被納入信貸機(jī)構(gòu)現(xiàn)有的信用評級體系,導(dǎo)致IT企業(yè)在融資過程中難以得到客觀評價的信用評估報告,使得其在直接融資過程中被拒絕,不利于IT企業(yè)高質(zhì)量的發(fā)展.信用評估缺失還會使信貸相關(guān)行業(yè)壞賬和呆賬的風(fēng)險增大,信用風(fēng)險凸顯.學(xué)者對于IT企業(yè)信用評估問題采取的多是logistic算法[5-6],對于IT企業(yè)特點來說,其形成的信用評估模型難以滿足IT企業(yè)信用評估的要求.本文結(jié)合LS-SVM算法[7],構(gòu)建IT企業(yè)信用評估模型.
IT企業(yè)即信息技術(shù)產(chǎn)業(yè),是運用信息手段和技術(shù),收集、整理、儲存、傳遞信息情報,提供信息服務(wù),并提供相應(yīng)的信息手段、信息技術(shù)等服務(wù)的產(chǎn)業(yè).IT企業(yè)作為一種特殊的高科技產(chǎn)業(yè),有以下幾個基本特點:產(chǎn)品更新周期快,風(fēng)險較高,收益也較高.IT企業(yè)是隨著科技的發(fā)展而發(fā)展起來的新興產(chǎn)業(yè),現(xiàn)代科技產(chǎn)品為了獲得市場的先機(jī)與消費者的青睞,更新?lián)Q代的速度令人咋舌,因此IT企業(yè)產(chǎn)品的更新周期也比較快.IT企業(yè)的風(fēng)險來自于前期設(shè)備和人才的引用,因而IT企業(yè)也屬于資本較密集的一種產(chǎn)業(yè).IT企業(yè)最核心的競爭力為其所生產(chǎn)的各類科技軟件或者產(chǎn)品,這類產(chǎn)品往往綜合了IT企業(yè)人才的知識轉(zhuǎn)移量,但是在這個過程中,由于產(chǎn)品在市場推進(jìn)過程中受不確定因素的影響較大,因此風(fēng)險性較大;其經(jīng)營領(lǐng)域涉及面較為廣泛;經(jīng)營業(yè)務(wù)多樣,產(chǎn)品多為私人定制類型,業(yè)務(wù)受客戶資源的影響.
隨著科技的發(fā)展,數(shù)字時代的來臨,IT企業(yè)數(shù)量和質(zhì)量的提升尤為顯著,特別是當(dāng)代工業(yè)互聯(lián)網(wǎng)的發(fā)展,大大促進(jìn)了IT企業(yè)與其他企業(yè)的聯(lián)系,這兩類企業(yè)融合成了不可分割的整體,呈現(xiàn)出了全新的產(chǎn)業(yè)面貌.中國的IT產(chǎn)業(yè)發(fā)展指數(shù)(ITII)由2014年的61.5分提高到2018年的76.3分,由第二梯隊末位提升至第二梯隊中游水平,并于2018年首次超越英國和韓國位列第四位.2018年中國IT產(chǎn)業(yè)發(fā)展迅速,在產(chǎn)業(yè)結(jié)構(gòu)上優(yōu)化改進(jìn)也有了長足的進(jìn)步,核心競爭力隨著產(chǎn)品的優(yōu)質(zhì)有了長足的進(jìn)步,大幅度提升了本土IT企業(yè)的創(chuàng)新發(fā)展力.隨著互聯(lián)網(wǎng)產(chǎn)業(yè)的快速發(fā)展以及產(chǎn)業(yè)方式的轉(zhuǎn)變,IT產(chǎn)業(yè)走上了高速平穩(wěn)發(fā)展的道路,產(chǎn)業(yè)融合提升最為顯著,融合指數(shù)由50.1分升至76.5分,證明我國IT企業(yè)核心競爭力得到認(rèn)可.當(dāng)前我國IT產(chǎn)業(yè)的發(fā)展已經(jīng)形成了品牌效應(yīng),走上了國際化發(fā)展道路.
選取銳思金融數(shù)據(jù)庫若干家IT企業(yè)的財務(wù)信息,從中抽取11個財務(wù)指標(biāo)作為判斷企業(yè)信用評級的依據(jù).IT企業(yè)指標(biāo)體系見表1.
表1 IT企業(yè)信用評價體系表
將IT企業(yè)的信用數(shù)據(jù)指標(biāo)作為分類數(shù)據(jù)點,采用LS-SVM分類器確定一個由這些數(shù)據(jù)點構(gòu)成的超平面.如果用X表示數(shù)據(jù)點,用Y表示類別(Y可以取1或者-1,分別代表兩個不同的類),一個線性分類器的學(xué)習(xí)目標(biāo)便是要在n維的數(shù)據(jù)空間中找到一個超平面,這個超平面的方程可以表示為:
式(1)中,WT中的T代表轉(zhuǎn)置.在超平面確定的情況下,(1)式表示點X距離超平面的遠(yuǎn)近.通過觀察WT×X+B的符號與類別標(biāo)記Y的符號是否一致,可判斷分類是否正確.用表示類別的的正負(fù)性來判定或表示分類的正確性.函數(shù)間隔為:
超平面(W,B)是關(guān)于T中所有樣本點(Xi,Yi)的函數(shù)間隔最小值.其中,X是特征,Y是結(jié)果標(biāo)簽,i表示第i個樣本.超平面(W,B)關(guān)于訓(xùn)練數(shù)據(jù)集T的函數(shù)間隔為:
對法向量W加約束條件,引出真正定義點到超平面的距離——幾何間隔的概念:
由于這個問題的特殊結(jié)構(gòu),還可以通過拉格朗日對偶性變換到對偶變量的優(yōu)化問題,即通過求解與原問題等價的對偶問題得到原始問題的最優(yōu)解,進(jìn)而推廣到非線性分類問題,因此得到新的函數(shù)解析式:
(1)讓α固定,讓L關(guān)于W和B最小化.分別對W以及B求偏導(dǎo)數(shù),并令兩者的偏導(dǎo)數(shù)等于零.
將得到的結(jié)果帶入公式(6),可以得到
(2)求對α的極大,即是關(guān)于對偶問題的最優(yōu)化問題.從上面的式子得到:
即可求出αi.根據(jù)已有的公式可以得到兩個參數(shù)W,B的值,最終可以得到分類平面和分類決策函數(shù).利用SMO算法求解對偶問題中的拉格朗日乘子α.為了使模型在線性不可分條件下也可使用,引入松弛變量ξi,在原來的目標(biāo)函數(shù)后面加上一項,使得總和也要最小:+Cξi.其中,C是一個參數(shù),用于控制目標(biāo)函數(shù)中兩項之間的權(quán)重,得到的目標(biāo)函數(shù):
將IT行業(yè)的財務(wù)數(shù)據(jù)作為數(shù)據(jù)點帶入X中,將企業(yè)是否違約得到分類類別Y帶入到公式(11)中對參數(shù)α求解,將結(jié)果代入公式(6)中,即可得到分類平面中兩個參數(shù),從而完成對分類平面的求解.
根據(jù)從銳思金融數(shù)據(jù)庫收集到的財務(wù)指標(biāo)信息,計算出若干家IT企業(yè)11個指標(biāo)的平均值及方差,見表2.從該表中可以看到,IT企業(yè)的流動比率較高,符合流動資產(chǎn)較多的事實;IT企業(yè)流動資產(chǎn)率也處于較高的水平,解釋了其與其他行業(yè)企業(yè)的不同之處.
表2 IT企業(yè)指標(biāo)均值與方差
使用matlab軟件將數(shù)據(jù)設(shè)定種子得到80%的訓(xùn)練集和20%的測試集,用訓(xùn)練集分類預(yù)測,對測試集的準(zhǔn)確性進(jìn)行評估,衡量測試集的準(zhǔn)確率.
用confusionmat函數(shù)直接產(chǎn)生混淆矩陣,用混淆矩陣的每一列代表預(yù)測類別,行表示真實歸屬類別、預(yù)測違約和不違約類別下的企業(yè)數(shù)目.圖1為可信企業(yè)識別率和違約企業(yè)識別率.從圖1中可以看出,LS-SVM模型可以較好地擬合企業(yè)識別率曲線圖.
圖1 違約與可信企業(yè)識別率
AUC等于1時為最理想的檢查指標(biāo).從圖2可知,AUC值為0.77404,ROC圖的含義是將可信企業(yè)判定為可信企業(yè)的概率大于可信企業(yè)判定為違約企業(yè)的概率作為1,并依次累加,最終除以可信與違約企業(yè)的總數(shù),說明得到的超平面可以比較準(zhǔn)確地反映出分類的情況.
圖2 ROC曲線
構(gòu)建了一個基于LS-SVM的IT企業(yè)二分類平面評價模型,用于企業(yè)信用評級,確定企業(yè)信用等級.實證結(jié)果表明,構(gòu)建的二分類模型可以較好地對客戶的財務(wù)信息予以區(qū)分,達(dá)到了較好的分類效果.該模型可以適用于IT行業(yè)信用等級的劃分,為IT行業(yè)信用等級提供較好的參考.