楊揚(yáng),周一懋,周宗放
1. 西南財(cái)經(jīng)大學(xué)經(jīng)濟(jì)數(shù)學(xué)學(xué)院,四川 成都 611130;2. 江蘇匯譽(yù)通數(shù)據(jù)科技有限公司,江蘇 蘇州 215123;3. 電子科技大學(xué)經(jīng)濟(jì)與管理學(xué)院,四川 成都 611731
基于文本大數(shù)據(jù)的企業(yè)信用風(fēng)險(xiǎn)評(píng)估
楊揚(yáng)1,周一懋2,周宗放3
1. 西南財(cái)經(jīng)大學(xué)經(jīng)濟(jì)數(shù)學(xué)學(xué)院,四川 成都 611130;2. 江蘇匯譽(yù)通數(shù)據(jù)科技有限公司,江蘇 蘇州 215123;3. 電子科技大學(xué)經(jīng)濟(jì)與管理學(xué)院,四川 成都 611731
相較于個(gè)人信用風(fēng)險(xiǎn)評(píng)估,銀行關(guān)于企業(yè)信用風(fēng)險(xiǎn)評(píng)估的資料具有更多的文本信息且標(biāo)準(zhǔn)化程度更高,然而文本信息中蘊(yùn)含的大量關(guān)于企業(yè)信用風(fēng)險(xiǎn)的增量信息卻沒有得到有效利用。通過對(duì)我國(guó)上市公司年報(bào)以及網(wǎng)民評(píng)論的文本進(jìn)行分析,探索了文本大數(shù)據(jù)對(duì)企業(yè)信用風(fēng)險(xiǎn)評(píng)估的作用。研究發(fā)現(xiàn),年報(bào)管理層討論與分析的風(fēng)險(xiǎn)提示內(nèi)容、獨(dú)立董事意見中關(guān)于關(guān)聯(lián)交易的非正式感情表達(dá)以及網(wǎng)民關(guān)于公司風(fēng)險(xiǎn)的評(píng)論對(duì)于企業(yè)信用風(fēng)險(xiǎn)評(píng)估都具有明顯的增量信息。
文本;大數(shù)據(jù);信用風(fēng)險(xiǎn);評(píng)估
隨著我國(guó)市場(chǎng)化水平的不斷提升、信用金融體系的逐步形成,信用風(fēng)險(xiǎn)更加凸顯為各大金融機(jī)構(gòu)所面臨的主要風(fēng)險(xiǎn),而銀行信用風(fēng)險(xiǎn)管理也面臨著前所未有的挑戰(zhàn),這種挑戰(zhàn)在當(dāng)前經(jīng)濟(jì)下行和結(jié)構(gòu)調(diào)整深化的宏觀背景下顯得尤為突出[1]。另一方面,互聯(lián)網(wǎng)以及移動(dòng)互聯(lián)網(wǎng)的發(fā)展和普遍應(yīng)用為銀行提供了通過大數(shù)據(jù)進(jìn)行信用風(fēng)險(xiǎn)管理并挖掘新業(yè)務(wù)增長(zhǎng)點(diǎn)的重要機(jī)會(huì)。根據(jù)Syrus關(guān)于風(fēng)險(xiǎn)管理的定義,銀行信用風(fēng)險(xiǎn)管理的流程可以分為3個(gè)步驟:風(fēng)險(xiǎn)數(shù)據(jù)的收集、風(fēng)險(xiǎn)的度量和風(fēng)險(xiǎn)的模擬評(píng)估[2]。而大數(shù)據(jù)的應(yīng)用無論是對(duì)銀行信用風(fēng)險(xiǎn)數(shù)據(jù)的收集、信用風(fēng)險(xiǎn)的度量,還是對(duì)信用風(fēng)險(xiǎn)的模擬評(píng)估,都提供了嶄新的視角和方法。相較于銀行傳統(tǒng)信用風(fēng)險(xiǎn)管理手段,通過對(duì)大數(shù)據(jù)進(jìn)行整合和分析,降低了成本,提高了效率。這不但可以加強(qiáng)經(jīng)濟(jì)波動(dòng)周期下的信用風(fēng)險(xiǎn)控制,同時(shí)也提升了復(fù)雜環(huán)境下交叉風(fēng)險(xiǎn)的管理能力[3]。事實(shí)上,大多數(shù)金融機(jī)構(gòu)已經(jīng)看到了大數(shù)據(jù)產(chǎn)業(yè)化蘊(yùn)含著的商機(jī),美國(guó)花旗銀行通過對(duì)客戶信用卡大數(shù)據(jù)的分析,對(duì)客戶進(jìn)行了有效的信息推送,實(shí)現(xiàn)了二次精準(zhǔn)營(yíng)銷;美國(guó)富國(guó)銀行則通過客戶交易大數(shù)據(jù)的管理,有效識(shí)別了欺詐性交易行為,提升了自身風(fēng)險(xiǎn)控制水平;在我國(guó),阿里巴巴、騰訊等電子支付通道運(yùn)營(yíng)商也通過對(duì)客戶社交活動(dòng)的大數(shù)據(jù)分析,紛紛推出“微粒貸”等金融產(chǎn)品,不斷擠壓金融機(jī)構(gòu)終端零售市場(chǎng),同時(shí)擴(kuò)寬自身新的利益增長(zhǎng)點(diǎn)[4]。
對(duì)于大多數(shù)銀行而言,企業(yè)信用風(fēng)險(xiǎn)評(píng)估一直以來都是其核心和市場(chǎng)基點(diǎn)。大量的參考文獻(xiàn)探討了在P2P環(huán)境下大數(shù)據(jù)應(yīng)用對(duì)個(gè)人信用風(fēng)險(xiǎn)評(píng)估的影響。例如Greiner M E和艾金娣等人[5,6]對(duì)P2P個(gè)人信用風(fēng)險(xiǎn)的數(shù)據(jù)和信用風(fēng)險(xiǎn)進(jìn)行了分析;Carlos S C等人[7]考察了個(gè)人財(cái)富評(píng)級(jí)對(duì)其信用風(fēng)險(xiǎn)的影響;而Larrimore L等人[8]則對(duì)Prosper.com的數(shù)據(jù)進(jìn)一步分析指出,一些非結(jié)構(gòu)化信息的利用可以有效降低投資者面臨的信用風(fēng)險(xiǎn);周宗放等人[9]對(duì)個(gè)人信用風(fēng)險(xiǎn)評(píng)估的理論和方法進(jìn)行了拓展性研究。相較于個(gè)人信用風(fēng)險(xiǎn)的評(píng)估,一方面銀行所持有的有關(guān)企業(yè)信用風(fēng)險(xiǎn)評(píng)估的資料包含更多的文本信息(如財(cái)務(wù)報(bào)表、審計(jì)報(bào)告等),也更加標(biāo)準(zhǔn)化;另一方面,這些文本信息往往并沒有被有效利用,許多隱藏在文本中的信息被銀行忽略,這大大損失了銀行企業(yè)信用風(fēng)險(xiǎn)評(píng)估的效率。一些學(xué)者,如Yang Y等人[10]已經(jīng)注意到了充分利用文本信息能大大提高銀行對(duì)企業(yè)信用風(fēng)險(xiǎn)評(píng)估的效率,而本文則進(jìn)一步提出了文本大數(shù)據(jù)應(yīng)用于企業(yè)信用風(fēng)險(xiǎn)評(píng)估的3個(gè)基本視角,希望能借此為大數(shù)據(jù)下的企業(yè)信用風(fēng)險(xiǎn)評(píng)估提供有益啟示。
為了使文本信息更加標(biāo)準(zhǔn)化,同時(shí)考慮到數(shù)據(jù)的真實(shí)性和可獲取性,本文選取2009—2015年滬深A(yù)股被“特殊對(duì)待(special treatment,ST)”的上市公司樣本,借鑒參考文獻(xiàn)[11]的如下配對(duì)準(zhǔn)則,為這些樣本選取“非ST”上市公司的配對(duì)樣本。準(zhǔn)則如下:
● 時(shí)間一致性,即“ST”樣本和“非ST”樣本為同一年度數(shù)據(jù);
● 配對(duì)樣本行業(yè)類型相同或相近;
● 配對(duì)樣本資產(chǎn)總規(guī)模相當(dāng);
● 配對(duì)樣本上市時(shí)間接近;
● 剔除數(shù)據(jù)缺失或兩年內(nèi)被“ST”的上市公司;
● 剔除因其他異常情況被“ST”的上市公司。
為了方便研究,本文將樣本和配對(duì)樣本的文本信息進(jìn)行了梳理,將年報(bào)中“管理層討論與分析”不含“風(fēng)險(xiǎn)分析”“風(fēng)險(xiǎn)提示”的樣本刪除;進(jìn)一步,將網(wǎng)絡(luò)評(píng)論少于30條的樣本刪去。最終得到配對(duì)的“ST”樣本和“非ST”樣本,一共600對(duì)。
2.1 信用風(fēng)險(xiǎn)度量
本文選取Logistic回歸[12]作為樣本的信用風(fēng)險(xiǎn)度量。Logistic回歸是一種廣泛應(yīng)用于經(jīng)濟(jì)管理的二分類(成功或失?。┗蛘叨啻涡蚺判虻脑u(píng)估(預(yù)測(cè))方法。其核心思想是假設(shè)Xi為第i個(gè)企業(yè)的信用風(fēng)險(xiǎn)評(píng)估的變量向量,企業(yè)出現(xiàn)信用風(fēng)險(xiǎn)違約的概率Pi和Xi之間的關(guān)系如下:
其中,α和βi為L(zhǎng)ogistic回歸的系數(shù)。
通過求最大對(duì)數(shù)似然函數(shù)ln(α,β),就可以得出式(1)中的參數(shù),然后通過外生性設(shè)定臨界值來判斷企業(yè)的信用風(fēng)險(xiǎn)情況,對(duì)企業(yè)信用風(fēng)險(xiǎn)進(jìn)行評(píng)估。
本文將樣本分為訓(xùn)練樣本和檢驗(yàn)樣本,其中訓(xùn)練樣本400個(gè),檢驗(yàn)樣本200個(gè)。在利用訓(xùn)練樣本對(duì)模型進(jìn)行訓(xùn)練的過程中,當(dāng)樣本為“ST”樣本時(shí),響應(yīng)值賦值為1;當(dāng)樣本為“非ST”樣本時(shí),響應(yīng)值賦值為0。在確定了系數(shù)后,再用訓(xùn)練好的Logistic模型對(duì)檢驗(yàn)樣本的評(píng)估精準(zhǔn)性進(jìn)行檢驗(yàn)。在本文中,選取0.4作為信用風(fēng)險(xiǎn)評(píng)估的臨界值。當(dāng)式(1)中Pi<0.4時(shí),評(píng)估樣本為“非ST”樣本,而當(dāng)Pi≥0.4時(shí),評(píng)估樣本為“ST”樣本。
表1 控制變量
2.2 控制變量
財(cái)務(wù)數(shù)據(jù)是各大金融機(jī)構(gòu)現(xiàn)用于企業(yè)信用風(fēng)險(xiǎn)評(píng)估的最為重要的數(shù)據(jù)。本文借鑒已有關(guān)于企業(yè)信用風(fēng)險(xiǎn)評(píng)估、財(cái)務(wù)預(yù)警等相關(guān)文獻(xiàn)[13],選取財(cái)務(wù)變量作為控制變量??紤]到文本信息部分表征了財(cái)務(wù)數(shù)據(jù)中蘊(yùn)含的信息,因此,通過內(nèi)生性檢驗(yàn)后,本文將表1中的變量作為控制變量。
本文將考慮兩類文本(規(guī)范性文本和非規(guī)范性文本)中蘊(yùn)含的有關(guān)企業(yè)信用風(fēng)險(xiǎn)的信息增量。規(guī)范性文本來源于企業(yè)的年度財(cái)務(wù)報(bào)表和獨(dú)立董事意見。年度財(cái)務(wù)報(bào)表和獨(dú)立董事意見,特別是本文中樣本上市公司的年度財(cái)務(wù)報(bào)表和獨(dú)立董事意見具有高度的標(biāo)準(zhǔn)化特征。而非規(guī)范性的文本則來源于巨潮資訊網(wǎng)、新浪財(cái)經(jīng)網(wǎng)等廣大股民對(duì)企業(yè)的評(píng)價(jià),體現(xiàn)了文本的多樣性特征。
3.1 規(guī)范性文本
規(guī)范性文本的分析對(duì)象在本文中分為兩個(gè)部分,即企業(yè)年度財(cái)務(wù)報(bào)表和企業(yè)關(guān)于關(guān)聯(lián)交易的獨(dú)立董事意見。
第一,企業(yè)年度財(cái)務(wù)報(bào)表。財(cái)務(wù)年度報(bào)表是各大金融機(jī)構(gòu)用以對(duì)其進(jìn)行信用風(fēng)險(xiǎn)評(píng)估時(shí)最為重要的文件。然而企業(yè)的財(cái)務(wù)年度報(bào)表中除了財(cái)務(wù)數(shù)據(jù)以外,大量的文本信息并未得到有效的利用。由于本文要對(duì)企業(yè)信用風(fēng)險(xiǎn)進(jìn)行評(píng)估,因此,選取企業(yè)財(cái)務(wù)年度報(bào)表中“管理層討論與分析”的風(fēng)險(xiǎn)提示相關(guān)內(nèi)容作為文本分析的對(duì)象。這部分文本內(nèi)容大多對(duì)企業(yè)未來可能面臨的宏觀環(huán)境、行業(yè)競(jìng)爭(zhēng)以及市場(chǎng)結(jié)構(gòu)等風(fēng)險(xiǎn)進(jìn)行定性論述?;诖?,本文借鑒了Morinaga S等人[14]的詞頻分析準(zhǔn)則,并對(duì)風(fēng)險(xiǎn)提示部分相關(guān)內(nèi)容進(jìn)行了修改。
第二,企業(yè)關(guān)聯(lián)交易的獨(dú)立董事意見。關(guān)聯(lián)交易被普遍認(rèn)為是影響企業(yè)信用風(fēng)險(xiǎn)的重要因素[15],中國(guó)證券監(jiān)督管理委員會(huì)要求上市公司獨(dú)立董事針對(duì)關(guān)聯(lián)交易給出獨(dú)立意見。然而我國(guó)獨(dú)立董事受限于客戶壓力和失位風(fēng)險(xiǎn),很少發(fā)表否定性意見。盡管如此,從獨(dú)立董事意見里仍然可以找出傾向性的感情表達(dá)。例如表2中兩種不同類型的表達(dá)就帶有明顯的感情傾向[16]。
鑒于此,本文借鑒了中文文本情感分析相關(guān)方法,對(duì)樣本獨(dú)立董事關(guān)于關(guān)聯(lián)交易的意見進(jìn)行分析,將獨(dú)立董事就關(guān)聯(lián)交易的意見肯定程度分為0~5這6個(gè)標(biāo)度,并作為L(zhǎng)ogistic模型的判別變量。
表3為在企業(yè)信用風(fēng)險(xiǎn)評(píng)估的3類分析方法下的第一類錯(cuò)誤率和第二類錯(cuò)誤率以及評(píng)估的準(zhǔn)確率①第一類錯(cuò)誤率是指將信用好的樣本誤判為信用差樣本的比例;第二類錯(cuò)誤率是指將信用差的本樣誤判為信用好樣本的比率;評(píng)估準(zhǔn)確率是指正確判別的樣本占總樣本的比率??梢钥吹剑杭{入企業(yè)財(cái)務(wù)報(bào)表“風(fēng)險(xiǎn)提示”相關(guān)內(nèi)容和獨(dú)立董事意見以后,第一類和第二類錯(cuò)誤率都明顯降低,評(píng)估準(zhǔn)確率有所提高。而圖1則顯示了將檢驗(yàn)樣本分組后,隨著檢驗(yàn)樣本的增加,評(píng)估準(zhǔn)確性率變化。
由表3和圖1可知,無論是企業(yè)年度財(cái)務(wù)報(bào)表,還是獨(dú)立董事意見文本信息,均蘊(yùn)含著關(guān)于企業(yè)信用風(fēng)險(xiǎn)的信息增量。將文本分析納入企業(yè)信用風(fēng)險(xiǎn)評(píng)估能顯著提高評(píng)估的準(zhǔn)確性。此外,隨著檢驗(yàn)樣本量的增加,文本評(píng)估準(zhǔn)確性呈單調(diào)上升趨勢(shì)。相較于企業(yè)年度財(cái)務(wù)報(bào)表中“風(fēng)險(xiǎn)提示”等相關(guān)文本信息,獨(dú)立董事關(guān)于關(guān)聯(lián)交易的感情傾向更能幫助銀行分析企業(yè)的信用風(fēng)險(xiǎn)狀況。這可能是由于企業(yè)年度財(cái)務(wù)報(bào)表的“風(fēng)險(xiǎn)提示”相關(guān)文檔過分標(biāo)準(zhǔn)化,很多企業(yè)對(duì)這部分內(nèi)容的撰寫甚至前后兩年的修改程度很小,屬于“例行公事”的模版化處理,這也弱化了這部分文本信息的有效性。
3.2 非規(guī)范性文本
表2 企業(yè)關(guān)于關(guān)聯(lián)交易所發(fā)表的獨(dú)立董事意見
表3 規(guī)范性文本信用風(fēng)險(xiǎn)評(píng)估的準(zhǔn)確率
巨潮資訊網(wǎng)和新浪財(cái)經(jīng)網(wǎng)作為中國(guó)最大的財(cái)經(jīng)資訊網(wǎng),集聚了眾多網(wǎng)友針對(duì)我國(guó)上市公司各個(gè)方面發(fā)表的看法和觀點(diǎn)。這些信息具有典型的非結(jié)構(gòu)化特點(diǎn)。為了簡(jiǎn)便,在本文中,僅僅利用Python抓取了其中的純文本部分,由于不同的帖子具有不同的表達(dá)習(xí)慣,因此,本文借鑒了Tetlock P C等人和Loughran T等人[17,18]在處理社交網(wǎng)絡(luò)文本時(shí)應(yīng)用的否定詞頻表方法,并進(jìn)一步利用Chen H等人[19]的模型,結(jié)合Logistic模型對(duì)企業(yè)信用風(fēng)險(xiǎn)進(jìn)行檢驗(yàn)。表4為通過非規(guī)范性文本進(jìn)行信用風(fēng)險(xiǎn)評(píng)估的結(jié)果。
從表4可以看出,對(duì)網(wǎng)絡(luò)媒體文本信息的分析,顯著提高了企業(yè)信用風(fēng)險(xiǎn)評(píng)估的準(zhǔn)確率,甚至遠(yuǎn)遠(yuǎn)高于利用規(guī)范文本信用風(fēng)險(xiǎn)評(píng)估的準(zhǔn)確率。這說明來自網(wǎng)絡(luò)媒體的文本信息蘊(yùn)藏著更多的關(guān)于企業(yè)信用風(fēng)險(xiǎn)的增量信息。這可能一方面是由于網(wǎng)絡(luò)媒體的自適應(yīng)性,眾多發(fā)表帖子的網(wǎng)民都顯然將自己認(rèn)為“正確”的信息發(fā)表在了網(wǎng)絡(luò)媒體;而另一方面可能與網(wǎng)絡(luò)大數(shù)據(jù)有關(guān)。對(duì)于規(guī)范性文本而言,本文的文本樣本量為2 400個(gè);而對(duì)于非規(guī)范性文本而言,本文的文本樣本量增加至12 840個(gè),顯著增加的文本數(shù)據(jù)量可能大大提高了信用風(fēng)險(xiǎn)評(píng)估的準(zhǔn)確率。
圖1 規(guī)范性文本評(píng)估(預(yù)測(cè))準(zhǔn)確率
表4 非規(guī)范文本信用風(fēng)險(xiǎn)評(píng)估準(zhǔn)確率
銀行在進(jìn)行企業(yè)信用風(fēng)險(xiǎn)評(píng)估時(shí),往往都要求企業(yè)提供諸如年度財(cái)務(wù)報(bào)表、審計(jì)報(bào)告以及公司所提供抵押擔(dān)保等大量的文本材料。相較于個(gè)人信用風(fēng)險(xiǎn)評(píng)估,這些文本材料標(biāo)準(zhǔn)化程度更高。然而銀行對(duì)這些文本信息的利用效率卻并不高,大量隱藏在文本中的有關(guān)企業(yè)信用風(fēng)險(xiǎn)的增量信息都被浪費(fèi),并未能形成銀行貸款策略的決策支持。為此,本文利用我國(guó)上市公司年報(bào)標(biāo)準(zhǔn)文本數(shù)據(jù)以及在線數(shù)據(jù),從公司年報(bào)管理層討論與分析中“風(fēng)險(xiǎn)提示”的內(nèi)容、公司年報(bào)中關(guān)聯(lián)交易“獨(dú)立董事意見”的感情以及眾多網(wǎng)友網(wǎng)上回帖內(nèi)容的多樣性等方面著手,探索了文本大數(shù)據(jù)對(duì)企業(yè)信用風(fēng)險(xiǎn)評(píng)估的影響。研究發(fā)現(xiàn),現(xiàn)有企業(yè)文本信息中仍然具有大量的關(guān)于企業(yè)信用風(fēng)險(xiǎn)的增量信息沒有被銀行有效利用;進(jìn)一步利用好文本大數(shù)據(jù),從中挖掘出有益信息對(duì)銀行針對(duì)企業(yè)信用風(fēng)險(xiǎn)的評(píng)估和控制具有重要意義。
總體而言,本文嘗試了利用文本大數(shù)據(jù)對(duì)企業(yè)信用風(fēng)險(xiǎn)的評(píng)估,然而這種研究仍然是探索性的。所用的方法和對(duì)數(shù)據(jù)的處理還比較粗糙,對(duì)文本信息的利用也缺乏精細(xì)度。相信對(duì)企業(yè)文本更加細(xì)致的挖掘和分析將能更深刻地認(rèn)識(shí)企業(yè)的信用風(fēng)險(xiǎn),進(jìn)一步提高銀行關(guān)于企業(yè)信用風(fēng)險(xiǎn)評(píng)估的準(zhǔn)確度,也為銀行信用風(fēng)險(xiǎn)管控提供更多的幫助。希望本文不但能對(duì)銀行利用文本大數(shù)據(jù)進(jìn)行企業(yè)信用風(fēng)險(xiǎn)評(píng)估起到啟示作用,更能起到拋磚引玉的作用,為更多的大數(shù)據(jù)情景下銀行信用風(fēng)險(xiǎn)評(píng)估的研究提供借鑒。
[1] 龐淑娟. 大數(shù)據(jù)在銀行信用風(fēng)險(xiǎn)管理中的應(yīng)用[J]. 征信, 2005, 33(3): 12-15. PANG S J. The application of big data to bank credit risk management[J]. Credit Reference, 2005, 33(3): 12-15.
[2] DUFFIE D, SINGLETON K. Credit risk[M]. Princeton: Princeton University Press, 2003.
[3] 宋長(zhǎng)龍. 大數(shù)據(jù)背景下的銀行信用風(fēng)險(xiǎn)管理[J]. 商業(yè)經(jīng)濟(jì), 2015(10): 108-109. SONG C L. Credit risk management of banks in the circumstance of big data[J]. Business Economy, 2015(10): 108-109.
[4] 曾偉, 孔新川, 陳威, 等. 大數(shù)據(jù)發(fā)現(xiàn)銀行貸款風(fēng)險(xiǎn)[J]. 大數(shù)據(jù), 2014024. ZENG W, KONG X C, CHEN W, et al. Uncovering the risk in bank loans by big data[J]. Big Data Research, 2014024.
[5] GREINER M E, WANG H. The role of social capital in people-to-people lending market place[C]// The 2009 International Conference on Information Systems, December 15-18, 2009, Arizona, USA. [S.l.:s.n.], 2009: 1-17.
[6] 艾金娣. P2P網(wǎng)絡(luò)借貸平臺(tái)風(fēng)險(xiǎn)防范[J]. 中國(guó)金融, 2012(14): 79-81. AI J D. Risk prevention of online P2P lending platform [J]. China Finance, 2012(14): 79-81.
[7] CARLOS S C, BEGONA G N. The use of profit scoring as an alternative to credit scoring systems in P2P lending[J]. Decision Support Systems, 2016, 9(89): 113-122.
[8] LARRIMORE L,JIANG L,MARKOWITZ D, et al. Peer to peer lending: the relationship between language features, trustworthiness, and persuasion success[J]. Journal of Applied Communication Research, 2011, 1(39): 19-37.
[9] 周宗放, 帥理, 周一懋. 個(gè)人信用風(fēng)險(xiǎn)評(píng)估理論和方法:拓展性研究[M]. 北京:中國(guó)金融出版社, 2015. ZHOU Z F, SHUAI L, ZHOU Y M. Personal credit assessment theories and methods:extension research[M]. Beijing: China Financial Publishing House, 2015.
[10] YANG Y, JING G, ZHOU Z F. Credit risk evaluation based on social media[J]. Environmental Research, 2016, 7(148): 582-585.
[11] 賴娟, 肖珉, 周宗放. 我國(guó)集團(tuán)上市公司財(cái)務(wù)危機(jī)預(yù)測(cè)建模與實(shí)證[J]. 管理學(xué)家, 2010(9): 18-24. LAI J, XIAO M, ZHOU Z F. Empirical study on forecasting financial distress of listed enterprise groups[J]. An Academic Edition of ManaMaga, 2010(9): 18-24.
[12] MARTIN K, HIRSHLEIFER D, TEOH S H. Investor psychology in capital markets: evidence and policy implications[J]. Journal of Monetary Economics, 2002, 49(1): 139-209.
[13] 劉新文. 制造業(yè)上市公司信用風(fēng)險(xiǎn)實(shí)證研究——基于邏輯回歸方法分析[J]. 金融經(jīng)濟(jì), 2016(7): 113-115.LIU X W. Empirical study on credit risk of listed manufacturings [J]. Finance & Economy, 2016(7): 113-115.
[14] MORINAGA S, YAMANISHI K, TATEISHI K. Mining product reputations on the Web[C]//The 8th ACM International Conference on Knowledge Discovery and Data Mining, July 23-26, 2002, Edmonton, Alberta, Canada. New York: ACM Press, 2002: 341-349.
[15] DOWNS D H, OOI J T L, WONG W C, et al. Related party transactions and firm value: evidence from property markets in hong kong malaysia and singapore[J]. Journal of Real Estate Finance and Economics, 2016, 52(4): 408-427.
[16] 趙子夜. “無過”和“有功”:獨(dú)立董事意見中的文字信號(hào)[J]. 管理世界, 2014(5): 131-141. ZHAO Z Y. “No mistake” and “having meritorious deed”: the text information in independent directors’ opinions [J]. Management World, 2014(5): 131-141.
[17] TETLOCK P C, SAAR-TSECHANSHY M, MACSKASSY S. More than words: quantifying language to measure firms’fundamental[J]. Journal of Finance, 2008, 43(1): 1437-1467.
[18] LOUGHRAN T, MCDONALD B. When is a liability not a liability? textual analysis, dictionaries, and 10-ks[J]. Journal of Finance, 2011, 66(1): 35-65.
[19] CHEN H, PRABUDDHA D, HU Y J, et al. Wisdom of crowds: the value of stock opinions transmitted through social media[J]. Review of Financial Studies, 2014, 5(27): 1367-1403.
Credit risk evaluation with text big data from text
YANG Yang1, ZHOU Yimao2, ZHOU Zongfang3
1. School of Economic Mathematics, Southwestern University of Finance and Economics, Chengdu 611130, China 2. Jiangsu HYT Data Technology Co., Ltd., Suzhou 215123, China 3. School of Economics and Management, University of Electronic Science and Technology of China, Chengdu 611731, China
Banks have more text information pertaining to credit risk of enterprises. This information is more complete and standardized compared with that of individuals. Nevertheless, this incremental information of enterprise credit risk, which is contained in documents has not been effectively utilized by banks. The role of text big data on credit risk evaluation through annual reports and commentaries of crowds on networks was explored. It found that both the annual reports and crowds’ commentaries significantly contain the incremental information on credit risk of enterprises.
text, big data, credit risk, evaluation
F830
A
10.11959/j.issn.2096-0271.2017006
楊揚(yáng)(1987-),男,博士,西南財(cái)經(jīng)大學(xué)經(jīng)濟(jì)數(shù)學(xué)學(xué)院講師、碩士生導(dǎo)師,主要研究方向?yàn)樾庞蔑L(fēng)險(xiǎn)管理、管理信息系統(tǒng)、集團(tuán)管控、風(fēng)險(xiǎn)投資。
周一懋(1982-),男,江蘇匯譽(yù)通數(shù)據(jù)科技有限公司大數(shù)據(jù)事業(yè)部總監(jiān)、工程師,主要研究方向?yàn)閿?shù)據(jù)挖掘、信用評(píng)價(jià)、項(xiàng)目管理、系統(tǒng)平臺(tái)設(shè)計(jì)等。
周宗放(1950-),男,電子科技大學(xué)經(jīng)濟(jì)與管理學(xué)院教授、博士生導(dǎo)師,風(fēng)險(xiǎn)分析與數(shù)據(jù)科學(xué)研究中心主任,中國(guó)科學(xué)院/匯譽(yù)通大數(shù)據(jù)聯(lián)合實(shí)驗(yàn)室特聘研究員,主要研究方向?yàn)樾庞蔑L(fēng)險(xiǎn)管理、信用評(píng)估、優(yōu)化理論與方法等。
2016-12-14
國(guó)家自然科學(xué)基金項(xiàng)目(No.71271043)
Foundation Item:The National Natural Science Foundation of China(No. 71271043)