譚明亮
(川北醫(yī)學(xué)院,四川 南充 637100)
大數(shù)據(jù)、云計(jì)算、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、語義分析、深度學(xué)習(xí)和人工智能等現(xiàn)代化信息技術(shù)手段應(yīng)用于金融領(lǐng)域,對(duì)于驅(qū)動(dòng)金融創(chuàng)新發(fā)展、推動(dòng)金融轉(zhuǎn)型升級(jí)、化解系統(tǒng)性金融風(fēng)險(xiǎn)、創(chuàng)新金融產(chǎn)品和服務(wù)、優(yōu)化業(yè)務(wù)流程有著非常重要的意義,融入前沿科技手段的金融科技(Fintech)和監(jiān)管科技(RegTech)已成為當(dāng)前學(xué)術(shù)界和產(chǎn)業(yè)界所共同關(guān)注的熱點(diǎn)。當(dāng)前國內(nèi)外的研究者們將支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、自組織映射網(wǎng)絡(luò)和隨機(jī)森林等多種機(jī)器學(xué)習(xí)與人工智能技術(shù)運(yùn)用于上市公司的破產(chǎn)預(yù)測(cè)、財(cái)務(wù)危機(jī)預(yù)測(cè)、信用風(fēng)險(xiǎn)預(yù)測(cè)等上市公司風(fēng)險(xiǎn)識(shí)別場(chǎng)景中,并在算法模型的準(zhǔn)確率上取得了不錯(cuò)的效果。近年來,自然語言處理和文本分析技術(shù)的快速發(fā)展也為非結(jié)構(gòu)化的金融文本數(shù)據(jù)的語義理解和挖掘創(chuàng)造了條件。HDFS、MapReduce、Spark和Hadoop等大數(shù)據(jù)的存儲(chǔ)、計(jì)算、管理技術(shù),以及分布式計(jì)算技術(shù)、虛擬化技術(shù)、集群技術(shù)和云平臺(tái)管理等云計(jì)算技術(shù)的基本成熟也為海量金融數(shù)據(jù)的分析和處理奠定了基礎(chǔ)。決策支持系統(tǒng)技術(shù)逐步走向成熟,并被成功地應(yīng)用于醫(yī)療輔助診斷、機(jī)器故障檢測(cè)以及突發(fā)事件應(yīng)急管理等領(lǐng)域中。
作為新一輪產(chǎn)業(yè)變革和科技革命核心驅(qū)動(dòng)力的機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和人工智能技術(shù)的研究也取得了巨大進(jìn)展,有著非常廣闊的應(yīng)用前景,推動(dòng)著經(jīng)濟(jì)社會(huì)各領(lǐng)域向智能化加速躍升,這也為大數(shù)據(jù)環(huán)境下的多源異構(gòu)的金融數(shù)據(jù)資源的分析和挖掘提供了堅(jiān)實(shí)的技術(shù)基礎(chǔ)。大數(shù)據(jù)時(shí)代,如何運(yùn)用數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語言處理、文本分析、知識(shí)組織、決策支持系統(tǒng)和人工智能等技術(shù)來對(duì)海量多源異構(gòu)的金融數(shù)據(jù)資源進(jìn)行分析挖掘,及時(shí)有效地識(shí)別上市公司的風(fēng)險(xiǎn),并以多種知識(shí)服務(wù)形式為投資者、債權(quán)人、銀行、基金管理公司、證券公司和政府監(jiān)管部門等主體的管理決策提供智能化的決策支持,成了計(jì)算機(jī)科學(xué)、管理科學(xué)與工程、金融學(xué)、情報(bào)學(xué)等學(xué)科的研究者所共同面臨的重要問題。
綜合國內(nèi)外的專家學(xué)者、政府部門和相關(guān)組織機(jī)構(gòu)對(duì)風(fēng)險(xiǎn)、企業(yè)風(fēng)險(xiǎn)的相關(guān)定義,文章將上市公司風(fēng)險(xiǎn)定義為:上市公司在生產(chǎn)經(jīng)營(yíng)的過程中,由于各種不確定因素和發(fā)生不利事件,從而有遭受損失的可能性。作為一個(gè)特殊的企業(yè)群體,上市公司除了面臨著一般企業(yè)所面臨的破產(chǎn)風(fēng)險(xiǎn)、信用風(fēng)險(xiǎn)、財(cái)務(wù)風(fēng)險(xiǎn)、政策風(fēng)險(xiǎn)、運(yùn)營(yíng)風(fēng)險(xiǎn)、管理風(fēng)險(xiǎn)、市場(chǎng)風(fēng)險(xiǎn)、人力資源風(fēng)險(xiǎn)、技術(shù)風(fēng)險(xiǎn)和戰(zhàn)略風(fēng)險(xiǎn)等共性風(fēng)險(xiǎn)以外,還面臨著強(qiáng)制退市風(fēng)險(xiǎn)、信息披露違規(guī)風(fēng)險(xiǎn)和股價(jià)暴跌風(fēng)險(xiǎn)等上市公司所特有的風(fēng)險(xiǎn)。與此同時(shí),不同行業(yè)、不同規(guī)模、不同商業(yè)模式、不同業(yè)務(wù)性質(zhì)、不同發(fā)展階段、不同股權(quán)結(jié)構(gòu)、不同財(cái)務(wù)狀況和不同經(jīng)營(yíng)管理水平的上市公司所面臨的風(fēng)險(xiǎn)也不盡相同。
傳統(tǒng)的上市公司風(fēng)險(xiǎn)識(shí)別主要是通過領(lǐng)域?qū)<液颓閳?bào)分析人員運(yùn)用專家分析法、財(cái)務(wù)比率分析法、SWOT分析法、KMV模型等方法來識(shí)別和分析上市公司的風(fēng)險(xiǎn)。專家分析法主要根據(jù)專家的智慧和個(gè)人經(jīng)驗(yàn)來識(shí)別上市公司的風(fēng)險(xiǎn),例如5C專家分析法通過對(duì)目標(biāo)對(duì)象的道德品質(zhì)(character)、償付能力(capacity)、資本實(shí)力(capital)、擔(dān)保抵押(collateral)和經(jīng)營(yíng)環(huán)境條件(condition)五個(gè)方面進(jìn)行綜合分析來識(shí)別其信用風(fēng)險(xiǎn)。當(dāng)前專家分析法依然是標(biāo)普、穆迪等國際信用評(píng)級(jí)機(jī)構(gòu)所使用的主流方法之一。財(cái)務(wù)比率分析法主要根據(jù)上市公司財(cái)務(wù)報(bào)表(資產(chǎn)負(fù)債表、利潤(rùn)表和現(xiàn)金流量表等)中的財(cái)務(wù)數(shù)據(jù)來計(jì)算相應(yīng)的財(cái)務(wù)比值,從而從財(cái)務(wù)角度實(shí)現(xiàn)上市公司風(fēng)險(xiǎn)識(shí)別,典型的財(cái)務(wù)比率分析法包括杜邦財(cái)務(wù)分析體系和沃爾比重評(píng)分法。SWOT分析法通過對(duì)上市公司的優(yōu)勢(shì)、劣勢(shì)、機(jī)會(huì)和威脅進(jìn)行綜合分析,做出系統(tǒng)的評(píng)估從而識(shí)別其風(fēng)險(xiǎn)。KMV模型將Black-Scholes期權(quán)定價(jià)理論和Merton的公司債務(wù)定價(jià)理論作為模型的理論依據(jù),基于上市公司的財(cái)務(wù)數(shù)據(jù)和股票價(jià)格數(shù)據(jù)來度量和識(shí)別公司的信用風(fēng)險(xiǎn)。
隨著企業(yè)所面臨的市場(chǎng)競(jìng)爭(zhēng)日益加劇以及經(jīng)營(yíng)環(huán)境變得更加不穩(wěn)定,風(fēng)險(xiǎn)識(shí)別對(duì)于決策者的作用愈加重要。Baumann等[1]分析了頭腦風(fēng)暴法、訪談法和SWOT分析等被頻繁使用的風(fēng)險(xiǎn)識(shí)別方法的優(yōu)缺點(diǎn),并指出需要將多種方法進(jìn)行有機(jī)結(jié)合以更好地識(shí)別企業(yè)的風(fēng)險(xiǎn)。蔣彧等[2]修正了KMV模型中的參數(shù)計(jì)算(估計(jì))與設(shè)定方法,以更好地適用中國的市場(chǎng)環(huán)境,并將修正后的KMV模型應(yīng)用于識(shí)別中國上市公司的信用風(fēng)險(xiǎn)。吳驍遠(yuǎn)等[3]運(yùn)用文獻(xiàn)調(diào)查法和案例分析等方法來對(duì)上市光伏企業(yè)的風(fēng)險(xiǎn)進(jìn)行識(shí)別。趙鑫[4]運(yùn)用PEST分析法、SWOT分析法、波特五力模型和財(cái)務(wù)比率分析等方法來識(shí)別其選取的一家發(fā)動(dòng)機(jī)制造行業(yè)的上市公司的風(fēng)險(xiǎn)。
國內(nèi)外的研究者們還將統(tǒng)計(jì)方法引入上市公司風(fēng)險(xiǎn)識(shí)別中,使用的統(tǒng)計(jì)方法主要包括單變量判別分析法(UDA)、多元線性判別分析法(MDA)、多元邏輯回歸分析法(Logit)和多元概率比回歸分析法(Probit)等。單變量判別分析法是指通過單一的財(cái)務(wù)指標(biāo)來識(shí)別上市公司的風(fēng)險(xiǎn)。多元線性判別分析法則是通過在多個(gè)財(cái)務(wù)指標(biāo)的基礎(chǔ)上構(gòu)造多元線性判別函數(shù)來實(shí)現(xiàn)上市公司風(fēng)險(xiǎn)的識(shí)別。多元邏輯回歸分析法與多元概率比回歸分析法非常相似,都是將因變量(上市公司是否發(fā)生破產(chǎn)、財(cái)務(wù)危機(jī)等)和自變量(上市公司的財(cái)務(wù)指標(biāo)等)之間的關(guān)系轉(zhuǎn)化為概率求解問題;不同的是,前者通過線性回歸的方法求解,而后者則是通過極大似然函數(shù)的方法求解。此外,多元概率比回歸分析對(duì)于樣本數(shù)據(jù)的分布要求嚴(yán)格,要求樣本數(shù)據(jù)服從高斯分布假設(shè),且模型計(jì)算過程相對(duì)復(fù)雜。
利用統(tǒng)計(jì)方法來實(shí)現(xiàn)上市公司風(fēng)險(xiǎn)識(shí)別提高了數(shù)據(jù)分析的效率,并且在很大程度上能夠克服專家分析法和SWOT分析法等方法的主觀性,統(tǒng)計(jì)方法與統(tǒng)計(jì)模型成了標(biāo)普、穆迪和惠譽(yù)等著名國際評(píng)級(jí)機(jī)構(gòu)最流行的工具之一。但是統(tǒng)計(jì)方法與統(tǒng)計(jì)模型存在著諸多的限制性假設(shè),例如變量的線性假設(shè)、正態(tài)性假設(shè)和獨(dú)立性假設(shè)等;由于上市公司的財(cái)務(wù)數(shù)據(jù)等經(jīng)常會(huì)違背這些假設(shè),因此統(tǒng)計(jì)假設(shè)的固有缺陷在一定程度上限制了統(tǒng)計(jì)方法與統(tǒng)計(jì)模型在上市公司風(fēng)險(xiǎn)識(shí)別中的應(yīng)用和效果。
人工智能方法相較于傳統(tǒng)的統(tǒng)計(jì)方法和統(tǒng)計(jì)模型,不需要對(duì)數(shù)據(jù)的分布進(jìn)行假設(shè),并且能夠識(shí)別和表示數(shù)據(jù)集上的非線性和非參數(shù)關(guān)系。自20世紀(jì)90年代以來,國內(nèi)外的研究者們已經(jīng)成功地將人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林、樸素貝葉斯、基于案例的推理、粗糙集和遺傳算法等多種人工智能方法應(yīng)用于上市公司的破產(chǎn)預(yù)測(cè)、財(cái)務(wù)危機(jī)預(yù)測(cè)、信用風(fēng)險(xiǎn)預(yù)測(cè)和退市風(fēng)險(xiǎn)預(yù)測(cè)等上市公司風(fēng)險(xiǎn)識(shí)別場(chǎng)景中。
Olson等[5]將邏輯回歸、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和決策樹等方法應(yīng)用于上市公司的破產(chǎn)預(yù)測(cè)中,并分析和比較了這些方法存在的優(yōu)缺點(diǎn)。Lee等[6]將反向傳播神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于韓國的建筑業(yè)、零售業(yè)和制造業(yè)上市公司的破產(chǎn)預(yù)測(cè)中,發(fā)現(xiàn)反向傳播神經(jīng)網(wǎng)絡(luò)能夠更好地識(shí)別變量與破產(chǎn)之間的非線性關(guān)系,在破產(chǎn)預(yù)測(cè)上的準(zhǔn)確性要優(yōu)于多元判別分析方法;與此同時(shí),實(shí)驗(yàn)結(jié)果還表明針對(duì)特定行業(yè)建立的破產(chǎn)預(yù)測(cè)模型的預(yù)測(cè)精度要高于通用的破產(chǎn)預(yù)測(cè)模型。Serrano-Cinca等[7]將偏最小二乘判別分析法(PLS-DA)應(yīng)用于美國銀行的破產(chǎn)預(yù)測(cè)中,并將其與線性判別分析、邏輯回歸、多層感知器、K最近鄰、樸素貝葉斯、支持向量機(jī)和集成學(xué)習(xí)等破產(chǎn)預(yù)測(cè)中廣泛使用的方法進(jìn)行了對(duì)比分析。Barboza等[8]將支持向量機(jī)、集成學(xué)習(xí)和隨機(jī)森林等機(jī)器學(xué)習(xí)方法與判別分析、邏輯回歸等傳統(tǒng)的統(tǒng)計(jì)模型在破產(chǎn)預(yù)測(cè)上進(jìn)行了對(duì)比,發(fā)現(xiàn)機(jī)器學(xué)習(xí)模型的破產(chǎn)預(yù)測(cè)準(zhǔn)確率要比傳統(tǒng)的統(tǒng)計(jì)模型平均高出10%左右。
Huang等[9]比較了支持向量機(jī)(SVM)、混合聯(lián)想記憶神經(jīng)網(wǎng)絡(luò)模型(HACT)、混合遺傳模糊聚類(hybrid GA-fuzzy clustering)和極端梯度提升模型(XGBoost)等有監(jiān)督機(jī)器學(xué)習(xí)方法以及深度信念網(wǎng)絡(luò)(DBN)和混合DBN-SVM模型在上市公司財(cái)務(wù)危機(jī)預(yù)測(cè)上的性能,發(fā)現(xiàn)在四種有監(jiān)督機(jī)器學(xué)習(xí)方法中,XGBoost具有最高的預(yù)測(cè)準(zhǔn)確率;與單獨(dú)的SVM或DBN相比,混合DBN-SVM模型具有更優(yōu)的預(yù)測(cè)能力。梁明江等[10]將集成學(xué)習(xí)方法應(yīng)用于預(yù)測(cè)A 股制造業(yè)上市公司的財(cái)務(wù)危機(jī),發(fā)現(xiàn)該方法能夠比單個(gè)的基分類器取得更高的預(yù)測(cè)準(zhǔn)確率。陳瀟瀾[11]將BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和隨機(jī)森林用于預(yù)測(cè)上市公司的信用風(fēng)險(xiǎn),發(fā)現(xiàn)隨機(jī)森林有著最高的分類準(zhǔn)確率。
國內(nèi)外的研究者們還將多種人工智能算法模型進(jìn)行融合和集成以更好地識(shí)別上市公司的風(fēng)險(xiǎn)。Iturriaga等[12]將多層感知器網(wǎng)絡(luò)(MLP)和自組織映射網(wǎng)絡(luò)(SOM)相結(jié)合,建立了一個(gè)混合神經(jīng)網(wǎng)絡(luò)模型來預(yù)測(cè)美國銀行的破產(chǎn)。趙智繁等[13]將數(shù)據(jù)包絡(luò)分析(DEA)和關(guān)聯(lián)規(guī)則、決策樹等數(shù)據(jù)挖掘技術(shù)相結(jié)合以實(shí)現(xiàn)上市公司財(cái)務(wù)危機(jī)程度的預(yù)測(cè)。王魯?shù)萚14]將模糊集與自組織映射網(wǎng)絡(luò)相結(jié)合,提升了財(cái)務(wù)危機(jī)預(yù)測(cè)模型的預(yù)測(cè)性能。劉玉敏等[15]綜合運(yùn)用主成分分析、粒子群優(yōu)化算法和支持向量機(jī)等方法來提高上市公司財(cái)務(wù)危機(jī)預(yù)測(cè)的準(zhǔn)確率。鄭立[16]將粗糙集與最小二乘支持向量機(jī)方法進(jìn)行融合,并將其應(yīng)用于制造業(yè)上市公司的財(cái)務(wù)危機(jī)預(yù)測(cè)中,提高了預(yù)測(cè)的準(zhǔn)確率。
近年來,深度學(xué)習(xí)技術(shù)發(fā)展迅速,目前已經(jīng)被成功應(yīng)用于機(jī)器翻譯、圖像識(shí)別、自動(dòng)駕駛、語音識(shí)別、文本生成、智能機(jī)器人、計(jì)算機(jī)視覺、問答系統(tǒng)和商品推薦等領(lǐng)域中。國內(nèi)外的研究者們也嘗試將深度學(xué)習(xí)技術(shù)應(yīng)用于上市公司的風(fēng)險(xiǎn)識(shí)別中。Hosaka[17]將日本上市公司的財(cái)務(wù)指標(biāo)數(shù)據(jù)以圖像的形式進(jìn)行表示,并利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)對(duì)其進(jìn)行分類來實(shí)現(xiàn)破產(chǎn)預(yù)測(cè),發(fā)現(xiàn)該方法要優(yōu)于傳統(tǒng)的CART決策樹、線性判別分析(LDA)、支持向量機(jī)(SVM)、AdaBoost集成學(xué)習(xí)算法和多層感知器(MLP)等方法。劉雪林[18]將堆棧式去噪自編碼器(SDAE)深度學(xué)習(xí)網(wǎng)絡(luò)應(yīng)用于上市公司的財(cái)務(wù)危機(jī)預(yù)測(cè)中,發(fā)現(xiàn)其預(yù)測(cè)準(zhǔn)確率要優(yōu)于Logistic回歸模型。孫琦[19]運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)來對(duì)上市公司的信用風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),并將其與多變量線性模型、Logistic回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)效果進(jìn)行了對(duì)比,發(fā)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)準(zhǔn)確率最高。
當(dāng)前上市公司風(fēng)險(xiǎn)識(shí)別研究主要關(guān)注于如何運(yùn)用新興的機(jī)器學(xué)習(xí)和人工智能技術(shù)或者改進(jìn)現(xiàn)有技術(shù)來構(gòu)建具有更高準(zhǔn)確率和更低錯(cuò)誤率的上市公司風(fēng)險(xiǎn)智能識(shí)別模型,而對(duì)于模型的實(shí)用性、透明性和可解釋性的重視程度則明顯不夠。這導(dǎo)致了當(dāng)前研究文獻(xiàn)提出的上市公司風(fēng)險(xiǎn)識(shí)別智能模型大多是缺乏可解釋性和透明性的黑箱模型,這些黑箱模型對(duì)于模型的輸入數(shù)據(jù)和輸出結(jié)果之間的交互和關(guān)系難以給出投資者、債權(quán)人和政府監(jiān)管者等決策者所易于理解的解釋,不能為管理決策提供模型透明化的分析過程以及模型得出結(jié)論的直觀解釋;這不僅使得上市公司風(fēng)險(xiǎn)智能識(shí)別模型的實(shí)用性降低,而且可能會(huì)導(dǎo)致決策者對(duì)模型的不信任。具有較高透明性和可解釋性的模型不僅能夠?yàn)闆Q策者的上市公司風(fēng)險(xiǎn)識(shí)別提供直觀可靠的決策依據(jù),提高管理決策的效果并有效地降低管理決策的風(fēng)險(xiǎn);同時(shí)還可以抽取和發(fā)現(xiàn)上市公司風(fēng)險(xiǎn)識(shí)別相關(guān)的領(lǐng)域知識(shí),從而有助于豐富上市公司風(fēng)險(xiǎn)識(shí)別理論。