王曉菲 劉繼端 詹梓雯 劉彥清 張燕玲 周燕
作者簡(jiǎn)介:王曉菲(1993— ),女,漢族,廣東廣州人。主要研究方向:企業(yè)信用管理。
摘 要:由于房地產(chǎn)企業(yè)是屬于高負(fù)債企業(yè),對(duì)財(cái)務(wù)金融杠桿的依賴(lài)性極高,具有長(zhǎng)周期性等高風(fēng)險(xiǎn)特征。再加上如今國(guó)家宏觀(guān)調(diào)控緊、地方微觀(guān)調(diào)控嚴(yán),房地產(chǎn)企業(yè)步入了資金收緊、盈利減少的階段,面臨難融資、融資少的問(wèn)題,導(dǎo)致房地產(chǎn)企業(yè)風(fēng)險(xiǎn)進(jìn)一步放大,阻礙了房地產(chǎn)企業(yè)的發(fā)展。所以,房地產(chǎn)企業(yè)要想持續(xù)發(fā)展,就要加強(qiáng)風(fēng)險(xiǎn)管控和防范。本文通過(guò)專(zhuān)業(yè)的信用管理知識(shí)將機(jī)器學(xué)習(xí)AI模型與傳統(tǒng)信用風(fēng)險(xiǎn)度量模型結(jié)合來(lái)度量房地產(chǎn)企業(yè)的信用違約風(fēng)險(xiǎn)。因?yàn)闄C(jī)器學(xué)習(xí)AI模型能夠補(bǔ)充傳統(tǒng)信用風(fēng)險(xiǎn)度量模型在財(cái)務(wù)數(shù)據(jù)方面外的空白,而傳統(tǒng)信用風(fēng)險(xiǎn)度量模型能夠通過(guò)其在金融領(lǐng)域的研究經(jīng)驗(yàn)為機(jī)器學(xué)習(xí)提供研究方向,所有將兩者進(jìn)行結(jié)合能通過(guò)多角度對(duì)房地產(chǎn)企業(yè)的信用違約風(fēng)險(xiǎn)進(jìn)行更加精準(zhǔn)的度量。
關(guān)鍵詞:機(jī)器學(xué)習(xí);房地產(chǎn);風(fēng)險(xiǎn)度量;模型融合
中國(guó)的房地產(chǎn)行業(yè)經(jīng)歷幾十年的發(fā)展,已經(jīng)成為國(guó)民經(jīng)濟(jì)和金融體系中不可或缺的一部分。房地產(chǎn)企業(yè)在這個(gè)過(guò)程中也在不斷調(diào)整和改變,但房地產(chǎn)企業(yè)高負(fù)債和長(zhǎng)周期的經(jīng)營(yíng)模式一直是房地產(chǎn)企業(yè)的一個(gè)特點(diǎn)。高負(fù)債和長(zhǎng)周期的經(jīng)營(yíng)模式不但帶來(lái)了高杠桿、高回報(bào),也帶來(lái)了高風(fēng)險(xiǎn)。而企業(yè)風(fēng)險(xiǎn)度量一直是當(dāng)前不斷探索和解決的問(wèn)題,尤其是房地產(chǎn)企業(yè)。但當(dāng)前企業(yè)使用的風(fēng)險(xiǎn)度量模型還是基于傳統(tǒng)的一些風(fēng)險(xiǎn)度量模型,比如KMV、Z模型、CreditVaR系列模型等,而傳統(tǒng)風(fēng)險(xiǎn)度量模型由于年限較長(zhǎng),再加上大部分來(lái)自于國(guó)外學(xué)者研究,對(duì)當(dāng)今復(fù)雜多變的市場(chǎng)度量信用風(fēng)險(xiǎn)時(shí),難免會(huì)有較大的偏差。本文將大數(shù)據(jù)技術(shù)和機(jī)器學(xué)習(xí)AI技術(shù)與傳統(tǒng)的風(fēng)險(xiǎn)度量模型結(jié)合,從而打破僅僅通過(guò)財(cái)務(wù)數(shù)據(jù)的單一角度來(lái)度量風(fēng)險(xiǎn)的傳統(tǒng)思維,使用更新、更多角度、更與時(shí)俱進(jìn)的方法和思維來(lái)設(shè)計(jì)和打造出適用于當(dāng)下市場(chǎng)環(huán)境的風(fēng)險(xiǎn)度量模型。
一、信用違約風(fēng)險(xiǎn)建模
本文采用的算法模型有遺傳算法、KMV模型、LGB模型、SnowNLP模型、LR回歸模型,其中遺傳算法模型負(fù)責(zé)解出最優(yōu)解;KMV模型作為傳統(tǒng)風(fēng)險(xiǎn)度量模型負(fù)責(zé)解出企業(yè)違約概率和違約距離;LGB模型和LR回歸模型負(fù)責(zé)擬合樣本數(shù)據(jù),對(duì)樣本進(jìn)行預(yù)測(cè)分類(lèi);SnowNLP模型負(fù)責(zé)對(duì)文本數(shù)據(jù)進(jìn)行情感分析。根據(jù)以上四個(gè)模型,進(jìn)行風(fēng)險(xiǎn)度量建模。
(一)遺傳算法KMV模型
首先,采用遺傳算法對(duì)全國(guó)所有行業(yè)的上市公司訓(xùn)練出適合我國(guó)國(guó)情的KMV模型,即訓(xùn)練出適合我國(guó)國(guó)情的長(zhǎng)期負(fù)債系數(shù)和短期負(fù)債系數(shù)。
在適合中國(guó)國(guó)情的KMV模型中,其短期負(fù)債系數(shù)和長(zhǎng)期負(fù)債系數(shù)分別為0.948和0.264。根據(jù)遺傳算法訓(xùn)練出來(lái)的KMV模型簡(jiǎn)稱(chēng)為“QG_KMV”模型,本文通過(guò)QG_KMV模型去度量全國(guó)109個(gè)行業(yè)的信用違約風(fēng)險(xiǎn)。
由于房地產(chǎn)行業(yè)高負(fù)債的特點(diǎn),導(dǎo)致應(yīng)用QG_KMV模型度量房地產(chǎn)行業(yè)風(fēng)險(xiǎn)時(shí),房地產(chǎn)的違約風(fēng)險(xiǎn)偏高,所以本文將放棄使用全國(guó)所有行業(yè)的上市公司去訓(xùn)練KMV模型,而改用全國(guó)所有房地產(chǎn)行業(yè)的上市公司去訓(xùn)練KMV模型,如圖1所示:
從圖 1中可知,利用全國(guó)所有房地產(chǎn)行業(yè)的上市公司訓(xùn)練KMV模型訓(xùn)練出的短期負(fù)債系數(shù)和長(zhǎng)期負(fù)債系數(shù)分別為0.0438和0.0783,本文將該模型簡(jiǎn)稱(chēng)為“FDC_KMV”模型。
通過(guò)“FDC_KMV”模型計(jì)算出各行業(yè)違約概率如下:
由圖 2中可知,相較之前的KMV模型,“FDC_KMV”模型在房地產(chǎn)企業(yè)的平均違約距離和概率大幅下降,信用等級(jí)從D上升到A,更加適用于房地產(chǎn)企業(yè),且全國(guó)地產(chǎn)的信用等級(jí)明顯優(yōu)于區(qū)域地產(chǎn)。
(二)LGB_KMV模型
同時(shí)通過(guò)將機(jī)器學(xué)習(xí)LIGHTGBM模型與KMV模型結(jié)合,采取全國(guó)3541家上市公司(其中3355家非ST公司和186家ST公司)作為訓(xùn)練數(shù)據(jù)。其中ST公司是指連續(xù)兩年虧損或者凈資產(chǎn)低于股票面值的公司,非ST則相反。但由于兩類(lèi)公司數(shù)量不一致,導(dǎo)致數(shù)據(jù)不平衡,經(jīng)過(guò)SMOTE算法進(jìn)行上采樣之后,共計(jì)6710條數(shù)據(jù)樣本,其中包含ST公司和非ST公司樣本各3355條。
圍繞著這6710條數(shù)據(jù)樣本進(jìn)行建模,將數(shù)據(jù)集以8:2的比例切分為訓(xùn)練集和測(cè)試集,采用的數(shù)據(jù)特征有流動(dòng)負(fù)債、非流動(dòng)負(fù)債、總市值、收益率波動(dòng)率、總負(fù)債,以及通過(guò)KMV模型計(jì)算得出的違約距離及違約概率。同時(shí)將樣本數(shù)據(jù)特征分為兩組,一組是加入KMV模型計(jì)算出來(lái)的違約概率和違約距離特征,稱(chēng)為L(zhǎng)GB模型;另一組是沒(méi)有加入KMV模型計(jì)算出來(lái)的違約概率和違約距離特征,稱(chēng)為L(zhǎng)GB_KMV模型。通過(guò)對(duì)兩組數(shù)據(jù)進(jìn)行建模分析。LGB_KMV模型在測(cè)試數(shù)據(jù)集中的表現(xiàn)優(yōu)于LGB模型,其中LGB_KMV模型預(yù)測(cè)的準(zhǔn)確度達(dá)88%,而LBG模型的準(zhǔn)確度為83.9%,所以融合了KMV模型之后的LGB_KMV模型比沒(méi)有融合KMV模型的LGB模型準(zhǔn)確度提高了4.1%。
(三)SNOWNLP模型
通過(guò)python的SNOWNLP自然語(yǔ)言情感分析庫(kù)對(duì)房地產(chǎn)上市公司公告進(jìn)行情感分析,對(duì)每一年中發(fā)布的每一條上市公司公告進(jìn)行打分,分值為[0-1],其中得分越接近1,說(shuō)明該公告攜帶的信息表現(xiàn)為越積極,反之,得分越接近0,說(shuō)明該公告攜帶的信息表現(xiàn)為越消極,將公告得分大于0.5分判斷為積極公告,小于0.5分判斷為消極公告,等于0.5分的判斷為中立公告。
以萬(wàn)科2020年公告做一個(gè)情感判斷為例,結(jié)果如圖 3所示:
如圖 3所示,SNOWNLP模型能夠?qū)γ織l公告信息進(jìn)行一個(gè)情感分析并且進(jìn)行情感評(píng)分。
(四)LGB_LR模型
股市是一個(gè)消息市,股票市場(chǎng)中股民會(huì)參考公司披露的公告信息來(lái)投資股票,所以上市公司的公司公告發(fā)布會(huì)對(duì)股價(jià)造成一定程度的影響,股價(jià)的變動(dòng)會(huì)影響公司的市值。正如KMV模型中通過(guò)公司的市值,從而計(jì)算出公司的價(jià)值來(lái)度量風(fēng)險(xiǎn),那么公司的股票價(jià)格的變動(dòng)就會(huì)與公司的風(fēng)險(xiǎn)相關(guān)聯(lián)。
將公告的文本信息進(jìn)行數(shù)據(jù)處理,再采用詞嵌入的方法,即應(yīng)用TF_IDF方案。TF是指單詞詞頻,即一個(gè)詞在文章中出現(xiàn)的頻率,從客觀(guān)的角度出發(fā)一些詞出現(xiàn)的頻率越高,說(shuō)明這個(gè)詞的重要性可能是比較高的。IDF是指逆文本頻率,即該詞越少越能代表該篇文章,因?yàn)橐黄恼轮锌赡苡写蠖嗟慕樵~或者代詞,這些詞都沒(méi)有特別大的意義,例如‘的、‘將、‘通過(guò)、‘你、‘我、‘他等等詞語(yǔ)。將處理后的公告信息通過(guò)LGB_LR模型進(jìn)行預(yù)測(cè)出下一天股價(jià)的變化趨勢(shì)。
二、風(fēng)險(xiǎn)量化
綜上,本文將通過(guò)定量的方法,對(duì)房地產(chǎn)行業(yè)中的10家房地產(chǎn)企業(yè)風(fēng)險(xiǎn)進(jìn)行量化處理,其中包括5家ST公司,5家非ST公司。將引入一個(gè)信用風(fēng)險(xiǎn)值,這個(gè)值涵蓋各個(gè)模型所得結(jié)果及影響因素。通過(guò)信用風(fēng)險(xiǎn)值來(lái)衡量房地產(chǎn)公司的風(fēng)險(xiǎn)大小,信用風(fēng)險(xiǎn)值與信用風(fēng)險(xiǎn)成正比關(guān)系。
信用風(fēng)險(xiǎn)值的計(jì)算公式如下:
其中和分別為KMV模型輸出的違約概率和違約距離,為L(zhǎng)GB_KMV模型的準(zhǔn)度,為L(zhǎng)GB_KMV模型預(yù)測(cè)值,為L(zhǎng)GB_LR模型的準(zhǔn)度,為L(zhǎng)GB_LR模型預(yù)測(cè)值,為SNOWNLP模型輸出的情緒值,常數(shù)項(xiàng)1.7147是違約距離的臨界值。
Sigmoid函數(shù)計(jì)算公式如下:
Sigmoid函數(shù)能夠?qū)⑦B續(xù)變量映射到(0,1)范圍內(nèi),0.5為企業(yè)違約的閾值,風(fēng)險(xiǎn)值達(dá)到0.5表明企業(yè)可能發(fā)生違約事件,風(fēng)險(xiǎn)值越接近1表明發(fā)生違約事件的可能性越高。本文中的風(fēng)險(xiǎn)等級(jí)分為低風(fēng)險(xiǎn)、中低風(fēng)險(xiǎn)、中高風(fēng)險(xiǎn)、高風(fēng)險(xiǎn)四個(gè)等級(jí),對(duì)應(yīng)的信用風(fēng)險(xiǎn)值為(0,0.25]、[0.25,0.5]、[0.5,0.75],[0.75,1)。
通過(guò)4個(gè)模型的輸出結(jié)果,進(jìn)行計(jì)算10家房地產(chǎn)企業(yè)的信用風(fēng)險(xiǎn)值的大小,如表 1所示:
如表1所示,通過(guò)對(duì)比ST和非ST兩類(lèi)企業(yè)信用風(fēng)險(xiǎn)值可知,本文的模型能夠更加具體的度量出兩類(lèi)企業(yè)的信用風(fēng)險(xiǎn)值,并且ST企業(yè)的信用風(fēng)險(xiǎn)值明顯高于非ST企業(yè)。
通過(guò)兩類(lèi)企業(yè)的對(duì)比,驗(yàn)證了本文模型在房地產(chǎn)企業(yè)的信用風(fēng)險(xiǎn)度量上的效果,證實(shí)了本文模型的可信度。
三、結(jié)語(yǔ)
本文主要研究房地產(chǎn)公司信用風(fēng)險(xiǎn)的度量,主要研究結(jié)果和結(jié)論如下所示:
(1)從度量結(jié)果可知,ST房地產(chǎn)企業(yè)的信用風(fēng)險(xiǎn)值屬于中高、高風(fēng)險(xiǎn)區(qū)域,違約可能性大,相比之下非ST房地產(chǎn)企業(yè)的信用風(fēng)險(xiǎn)值屬于中低、低風(fēng)險(xiǎn)區(qū)域,履約能力較強(qiáng)。
(2)加入傳統(tǒng)風(fēng)險(xiǎn)度量模型能夠提高機(jī)器學(xué)習(xí)預(yù)測(cè)的準(zhǔn)確率,在本文中準(zhǔn)確率提高了4.1%。
(3)傳統(tǒng)的KMV模型不適用于房地產(chǎn)行業(yè)。
(4)“全國(guó)地產(chǎn)”行業(yè)信用水平高于“區(qū)域地產(chǎn)”行業(yè)。
參考文獻(xiàn):
[1]馮雅情.基于改進(jìn)的KMV-LBGoost的信用債風(fēng)險(xiǎn)度量[D].2020.
[2]王慧,張國(guó)君.KMV模型在我國(guó)上市房地產(chǎn)企業(yè)信用風(fēng)險(xiǎn)度量中的應(yīng)用[J].經(jīng)濟(jì)問(wèn)題,2018(03):36-40.
[3]袁琦富.基于Logistic模房地產(chǎn)上市公司違約風(fēng)險(xiǎn)度量研究[D].天津財(cái)經(jīng)大學(xué),2018.
[4]潘義.我國(guó)上市公司信用風(fēng)險(xiǎn)度量研究[D].安徽工業(yè)大學(xué),2010.
[5]余佳坤.制造業(yè)上市公司信用違約風(fēng)險(xiǎn)度量[D].山東大學(xué),2020.
[6]周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016:12-16.
[7]邱偉棟.基于LightGBM模型的P2P網(wǎng)貸違約預(yù)測(cè)研究[D].江西財(cái)經(jīng)大學(xué),2020:6.
[8]羅欣.中國(guó)房地產(chǎn)市場(chǎng)融資現(xiàn)狀分析[J].現(xiàn)代商業(yè),2011(33):48-49.
[9]高國(guó)華.嚴(yán)調(diào)控趨勢(shì)下房企信用風(fēng)險(xiǎn)分析[J].債券,2017(07):61-66.
[10]劉君紅.我國(guó)房地產(chǎn)行業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)研究[D].北京交通大學(xué),2012.
[11]劉敏.基于判別分析法的房地產(chǎn)企業(yè)信用風(fēng)險(xiǎn)度量研究[J].財(cái)會(huì)通訊,2013(20):107-108.