• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于大數(shù)據(jù)的企業(yè)財務(wù)預(yù)警研究

      2015-09-19 01:42:16朱建明
      關(guān)鍵詞:財務(wù)指標(biāo)預(yù)警樣本

      宋 彪 朱建明 李 煦

      一、引言

      財務(wù)危機風(fēng)險預(yù)警是一個世界性的問題和難題[1]。從20世紀(jì)30年代開始,比較有影響的財務(wù)預(yù)警方法已經(jīng)有十幾種,但這些方法在經(jīng)濟危機中能夠真正預(yù)測企業(yè)財務(wù)風(fēng)險的很少,還沒有查到這方面的有力證據(jù)。究其原因,大多數(shù)模型中,財務(wù)指標(biāo)是主要的預(yù)測依據(jù)。但財務(wù)指標(biāo)往往只是財務(wù)發(fā)生危機的一種表現(xiàn)形式,甚至還有滯后反應(yīng)性、不完全性和主觀性[2]。更為嚴(yán)重的是在基于財務(wù)指標(biāo)預(yù)警模型建立過程中,學(xué)者們往往都假設(shè)財務(wù)數(shù)據(jù)是真實可靠的,但這種假設(shè)忽略了財務(wù)預(yù)警活動的社會學(xué)規(guī)律,為財務(wù)預(yù)警模型與現(xiàn)實應(yīng)用的脫節(jié)埋下了伏筆。許多學(xué)者建立了結(jié)合非財務(wù)指標(biāo)的模型,但所加入的能夠起到作用的非財務(wù)指標(biāo)都是依靠試錯方法引入的,即都是在危機發(fā)生之后,才能夠使指標(biāo)得以確認(rèn)以及引入模型,下一次經(jīng)濟危機的類型不同,之前建立的財務(wù)預(yù)警模型便會無法預(yù)測甚至可能發(fā)生誤導(dǎo)。因此靠試錯引入的非財務(wù)指標(biāo)具有一定的片面性,忽視了這些指標(biāo)間的相互作用和相互關(guān)系,無法顧及這些指標(biāo)是否對所有企業(yè)具有普遍適用性。

      個人網(wǎng)上搜索、發(fā)布或者關(guān)注行為,以及各種論壇、博客、媒體發(fā)布的企業(yè)相關(guān)信息往往在不經(jīng)意間透露了一些企業(yè)真實的管理狀態(tài)和走勢信息,而且涵蓋的范圍非常廣泛。根據(jù)大數(shù)據(jù)的思維范式[3],可否把這些信息,通過大數(shù)據(jù)的處理技術(shù)量化后引入到財務(wù)風(fēng)險預(yù)警模型當(dāng)中?基于大數(shù)據(jù)的財務(wù)風(fēng)險模型是否能夠在穩(wěn)定性、有效性等方面具有一定的改善?這些問題的本質(zhì)將是當(dāng)前大數(shù)據(jù)技術(shù)破解財務(wù)風(fēng)險預(yù)警難題的一個重要契機。

      二、理論基礎(chǔ)、文獻回顧

      風(fēng)險理論認(rèn)為,經(jīng)濟活動之所以存在風(fēng)險,原因在于經(jīng)濟環(huán)境存在不確定性。在財務(wù)危機預(yù)警過程中,為了更準(zhǔn)確地預(yù)測企業(yè)的財務(wù)風(fēng)險,有效的途徑就是盡可能尋找全面的可以反映企業(yè)自身狀況和所處經(jīng)濟環(huán)境的指標(biāo)。

      目前主流的財務(wù)預(yù)警研究方法依然是用財務(wù)指標(biāo)構(gòu)建模型。“幾乎所有的研究都集中于尋找最佳的公開財務(wù)指標(biāo)來預(yù)測財務(wù)危機”[4]?;谪攧?wù)指標(biāo)建模的支持者往往利用實證研究能夠得出較高的判別率。如Altman在樣本公司破產(chǎn)前一年預(yù)測準(zhǔn)確率是95%[5],Deakin的準(zhǔn)確率為97%等等。由于財務(wù)信息存在滯后性、灰色性和短期性等明顯缺點,許多學(xué)者已經(jīng)認(rèn)識到根據(jù)財務(wù)指標(biāo)預(yù)測財務(wù)風(fēng)險的局限。Johnson針對Altman的論文使用的預(yù)測方法指出:即使比率確實能夠提供目前企業(yè)狀態(tài)的信息,它們也并不包含企業(yè)的替代戰(zhàn)略以及管理層和投資者面臨的經(jīng)濟狀況,比如企業(yè)合并和推遲付款[6]。Ohlson將國民生產(chǎn)總值、價格指數(shù)引入了財務(wù)風(fēng)險預(yù)測模型中[7]。EllMoumi等研究發(fā)現(xiàn),企業(yè)董事會的結(jié)構(gòu)和構(gòu)成可以用于解釋財務(wù)危機的發(fā)生[8]。Campbell等發(fā)現(xiàn)低股票收益率和高股票波動率將增大企業(yè)的財務(wù)風(fēng)險[9]。這些研究都各自證明了所提出非財務(wù)變量的預(yù)警有效性,但在具體操作中,數(shù)據(jù)的獲取難度限制了非財務(wù)指標(biāo)在財務(wù)預(yù)警方面的系統(tǒng)研究,提出的變量沒有統(tǒng)一的標(biāo)準(zhǔn),也沒有考慮變量之外的影響因素,反映不出企業(yè)對某一非財務(wù)指標(biāo)敏感程度。企業(yè)危機發(fā)生后,發(fā)現(xiàn)最終導(dǎo)致預(yù)警失敗的,往往是研究者們未曾考慮過的因素。同時,多數(shù)研究者更關(guān)注危機發(fā)生的根源,以求畢其功于一役,卻忽略了財務(wù)預(yù)警這一行為本身的社會性。簡單認(rèn)為明確了危機發(fā)生的原因,就可以進行準(zhǔn)確的預(yù)測,事實上財務(wù)危機每次發(fā)生的原因都在變化。奧斯特羅姆的研究指出,信任、聲譽與互惠機制來自于人際網(wǎng)絡(luò)[10]。企業(yè)危機的發(fā)生,起源于企業(yè)所有的相關(guān)人在社會網(wǎng)絡(luò)中的相互作用。大數(shù)據(jù)技術(shù)的出現(xiàn),使從社會網(wǎng)絡(luò)角度獲得關(guān)注會計主體更多一些的細(xì)節(jié)信息成為可能。所謂大數(shù)據(jù):一般認(rèn)為具有4V特征的數(shù)據(jù)可以稱之為大數(shù)據(jù),如果從廣義的角度拓展,其實大數(shù)據(jù)是一種思維范式。

      維克托·邁爾-舍恩伯格認(rèn)為,大數(shù)據(jù)在分析過程中需要全部數(shù)據(jù)樣本而不是抽樣[11],目標(biāo)上關(guān)注相關(guān)性而不是因果關(guān)系。人機互動產(chǎn)生的數(shù)據(jù)是大數(shù)據(jù)最主要的來源。這些人們在互聯(lián)網(wǎng)世界里留下的各種“數(shù)據(jù)足跡”,并不是有意識地留下的數(shù)據(jù),而是機器之間相互處理交互時沉淀下來的數(shù)據(jù),從社會學(xué)角度來看,獲得的數(shù)據(jù)無意識性越強,或者說人為主觀參與度越小,這種數(shù)據(jù)就越客觀,也越接近事物的本質(zhì),危機的爆發(fā)總是具有出乎意料的特征,具備更強無意識度的信息對危機的預(yù)測具有更重要的意義。

      目前利用從互聯(lián)網(wǎng)獲得的大數(shù)據(jù)進行研究,一般從分析群體情緒和網(wǎng)民行為規(guī)律來實現(xiàn)。對網(wǎng)絡(luò)上公眾的情緒進行分析是一項高難度工程,國外在相關(guān)方面取得了一系列進展,美國印第安納大學(xué)的約翰·博倫(Johan Bollen)等人對Twitter進行研究,將實驗中獲得的“冷靜”情緒指數(shù)后移3天,可以和道瓊斯指數(shù)獲得驚人的一致。同時該研究還測試了一個基于自組織模糊神經(jīng)網(wǎng)絡(luò)的股市預(yù)測模型,當(dāng)模型僅輸入股市數(shù)據(jù)時,模型可以達到73.3%的準(zhǔn)確率,而在加入“冷靜”的情感信息后,準(zhǔn)確率明顯上升至86.7%。麻省理工的張雪等人,根據(jù)情緒詞將推文標(biāo)定為正面或負(fù)面情緒[12]。結(jié)果發(fā)現(xiàn),無論是如“希望”的正面情緒,或是“害怕”、“擔(dān)心”的負(fù)面情緒,其占總推文數(shù)的比例,都預(yù)示著道瓊斯指數(shù)、標(biāo)準(zhǔn)普爾500指數(shù)、納斯達克指數(shù)的下跌。美國佩斯大學(xué)的亞瑟·奧康納,發(fā)現(xiàn)Facebook上的粉絲數(shù)、Twitter上的聽眾數(shù)和Youtude上的觀看人數(shù),都和股價密切相關(guān)。品牌的受歡迎程度,還能預(yù)測股價在10天、30天之后的上漲情況①New study finds link between social media popularity and stock prices http://www.famecount.com/news/new-study-finds-link-between-social-mediapopularity-and-stock-prices-242652.。Tobias Preis等人研究發(fā)現(xiàn),當(dāng)特定的關(guān)鍵詞在某一時間內(nèi)被大量搜索時,在股票市場上可能有買入或者賣出的行為發(fā)生[13]。

      三、基于大數(shù)據(jù)的企業(yè)危機預(yù)警模型

      從在線信息獲取的企業(yè)相關(guān)大數(shù)據(jù),其內(nèi)容可以包含導(dǎo)致企業(yè)財務(wù)危機方方面面的因素,甚至包含人們尚未認(rèn)識到的危機根源。大數(shù)據(jù)體現(xiàn)了群體智慧的特征,有價值的信息密度非常低,這使一些人為的修改在群體行為的均衡下,信息的價值往往不受太大的影響,可以避免僅依靠信息提供者而受到蒙蔽的現(xiàn)象。大數(shù)據(jù)信息比以往通過公司公告、調(diào)查、談話等方式獲得的信息更為客觀和全面,而且這些信息中可以囊括企業(yè)在社會網(wǎng)絡(luò)中的嵌入性影響。

      在社會環(huán)境中,企業(yè)存在的基礎(chǔ)在于相關(guān)者的認(rèn)可,這些相關(guān)者包括顧客、投資者、供應(yīng)鏈伙伴、政府等等??紤]到企業(yè)的經(jīng)營行為,或者企業(yè)關(guān)聯(lián)方的動作都會使企業(yè)的相關(guān)者產(chǎn)生反應(yīng),進而影響到網(wǎng)絡(luò)上的相關(guān)信息。因此本文把所有網(wǎng)民看作企業(yè)分布在網(wǎng)絡(luò)上的“傳感器”,這些“傳感器”有的反應(yīng)企業(yè)的內(nèi)部運作狀態(tài),有的反應(yīng)企業(yè)所處的整體市場環(huán)境,有的反應(yīng)企業(yè)相關(guān)方的運行狀態(tài)等等。由此構(gòu)建基于大數(shù)據(jù)進行企業(yè)財務(wù)預(yù)警的模型:

      大數(shù)據(jù)企業(yè)財務(wù)預(yù)警系統(tǒng)不排斥財務(wù)報告上的傳統(tǒng)指標(biāo),相反,傳統(tǒng)的財務(wù)指標(biāo)應(yīng)該屬于大數(shù)據(jù)的一部分?;ヂ?lián)網(wǎng)上網(wǎng)民對企業(yè)的相關(guān)行為,包含了線下的人們和企業(yè)的接觸而產(chǎn)生對企業(yè)的反應(yīng),這些反應(yīng)由于人們在社會網(wǎng)絡(luò)中角色的不同,涵蓋了諸如顧客對產(chǎn)品的滿意度、投資方的態(tài)度、政策導(dǎo)向等各種可能的情況。所有這些信息通過線下向互聯(lián)網(wǎng)映射,在互聯(lián)網(wǎng)中通過交互作用,由網(wǎng)民的情緒形成了相關(guān)企業(yè)的企業(yè)網(wǎng)絡(luò)輿情。

      圖1 大數(shù)據(jù)企業(yè)財務(wù)預(yù)警原理

      在具體處理過程中,可以對網(wǎng)絡(luò)輿情信息進行語義分析,通過情緒指標(biāo)對輿情進行量化,形成各種行為的一個融合后的綜合性指標(biāo),具體數(shù)據(jù)處理過程如圖2所示。

      圖2 大數(shù)據(jù)企業(yè)財務(wù)預(yù)警數(shù)據(jù)處理機制

      起到企業(yè)“傳感器”作用的網(wǎng)民,由于在線下和企業(yè)有著各種各樣的角色關(guān)系。這些角色和企業(yè)的相互作用會產(chǎn)生不同的反應(yīng),從而刺激這些角色對企業(yè)產(chǎn)生不同的情緒。群體的情緒通過映射到互聯(lián)網(wǎng),才使這些信息能夠被保存下來并被我們獲取,這些不同的情緒經(jīng)過網(wǎng)絡(luò)上交互過程中的聚集、排斥和融合作用,最后會產(chǎn)生集體智慧,這些群體智慧能反應(yīng)企業(yè)的某種狀態(tài)。

      因此得出如下命題:

      命題1:引入企業(yè)相關(guān)網(wǎng)絡(luò)大數(shù)據(jù)信息正面情緒指標(biāo)的財務(wù)風(fēng)險預(yù)警模型可以提高預(yù)警的有效性。

      命題2:引入企業(yè)相關(guān)網(wǎng)絡(luò)大數(shù)據(jù)信息中性指標(biāo)的財務(wù)風(fēng)險預(yù)警模型可以提高預(yù)警效果。

      命題3:引入企業(yè)相關(guān)網(wǎng)絡(luò)大數(shù)據(jù)信息負(fù)面情緒指標(biāo)的財務(wù)風(fēng)險模型可以提高預(yù)警效果。

      命題4:引入企業(yè)相關(guān)網(wǎng)絡(luò)大數(shù)據(jù)信息正面和負(fù)面交互影響指標(biāo)的財務(wù)風(fēng)險模型可以提高預(yù)警效果。

      命題5:引入企業(yè)相關(guān)大數(shù)據(jù)產(chǎn)生頻次指標(biāo)的財務(wù)風(fēng)險預(yù)警模型可以提高預(yù)警的有效性。

      四、研究樣本、研究變量和研究設(shè)計

      (一)研究樣本

      利用聚焦網(wǎng)絡(luò)爬蟲,收集了從2009年1月1日到2013年12月31日的關(guān)于60家企業(yè)的所有相關(guān)全網(wǎng)網(wǎng)絡(luò)數(shù)據(jù),包括新聞、博客、論壇等信息,經(jīng)過在線過濾刪重,最終獲得有效信息共7 000萬余條。來自網(wǎng)絡(luò)的上市公司相關(guān)大數(shù)據(jù)主要是非結(jié)構(gòu)化的文本信息,而且包含大量重復(fù)信息。為了驗證大數(shù)據(jù)反映的相關(guān)情緒能夠有效提高財務(wù)風(fēng)險預(yù)警模型的性能,首先要把這些信息進行數(shù)值化處理,過濾掉大量無效數(shù)據(jù),并且進行基于財經(jīng)領(lǐng)域詞典的文本情緒傾向計算。同時對相關(guān)上市公司的有效信息進行頻次統(tǒng)計,以便驗證大數(shù)據(jù)有效信息頻次對財務(wù)風(fēng)險預(yù)警模型的影響??紤]到不同行業(yè)的財務(wù)特征并不相同,而制造業(yè)在上市企業(yè)中所占比例最大,正常企業(yè)的數(shù)量遠(yuǎn)大于具有危機風(fēng)險的企業(yè)。研究中把制造業(yè)作為模型研究的樣本企業(yè),將會使模型在實際應(yīng)用中具有更好的代表性。

      在滬深兩市的危機企業(yè)中,危機企業(yè)的數(shù)量遠(yuǎn)遠(yuǎn)小于正常企業(yè)。如果按照資產(chǎn)規(guī)模1∶1配對抽樣,會破壞樣本的隨機性,導(dǎo)致模型效果虛高,夸大了模型的預(yù)測精度[14],同時以資產(chǎn)規(guī)模為配對原則缺乏有力的理論依據(jù),本文后面對資產(chǎn)規(guī)模進行檢驗也發(fā)現(xiàn)在對危機的判斷中并不顯著。因此本文將危機企業(yè)和正常企業(yè)按1∶2的方式進行隨機抽樣配比(注意不是配對)。共搜集60家企業(yè),其中危機企業(yè)20家,正常企業(yè)40家。危機企業(yè)樣本來源于2012、2013年被滬深兩市特別處理的工業(yè)制造業(yè)企業(yè),2012年危機企業(yè)11家,正常企業(yè)22家,2013年危機企業(yè)9家,正常企業(yè)18家。篩選采用的標(biāo)準(zhǔn)是:上市以來首次被處理,上市時間已經(jīng)超過5年,因為連續(xù)兩年虧損而被特別處理。正常企業(yè)的樣本采用隨機抽取,在滬深兩市中上市超過5年,上市以來從未被特殊處理的工業(yè)制造業(yè)企業(yè)。樣本企業(yè)的財務(wù)指標(biāo)的采集和計算源自RESSET瑞斯金融研究數(shù)據(jù)庫。

      (二)研究變量

      財務(wù)危機預(yù)警模型主要有兩個核心的工作:一個是預(yù)警指標(biāo)的確定;一個是預(yù)警模型算法的選擇。前者是財務(wù)預(yù)警信息的深層次挖掘,后者是預(yù)警算法技術(shù)的應(yīng)用,兩者同時對企業(yè)財務(wù)危機預(yù)警的精度產(chǎn)生影響。也就是說,財務(wù)危機預(yù)警模型的效果不僅取決于模型的學(xué)習(xí)和泛化能力,也取決于選擇的財務(wù)預(yù)警模型輸入和輸出變量。

      財務(wù)風(fēng)險預(yù)警理論的研究一直缺乏系統(tǒng)的經(jīng)濟理論支持,在實際預(yù)警工作中沒有特別直接的理論基礎(chǔ)。因此現(xiàn)階段的預(yù)警工作多數(shù)從實際數(shù)據(jù)出發(fā),采用經(jīng)驗研究的方法,用試錯的方法,逐一考察變量的組合在實際樣本數(shù)據(jù)中的表現(xiàn),篩選出突出判別能力的變量組合來構(gòu)建最終的預(yù)測模型。

      財務(wù)指標(biāo)方面的變量選取參考目前財務(wù)危機預(yù)警大量的研究成果,選出32個變量作為備選考察變量,如表1所示。

      表1 財務(wù)指標(biāo)

      續(xù)前表

      其中X1~X5是反映企業(yè)償債能力的指標(biāo),X6~X12是反映企業(yè)盈利能力的指標(biāo),X13~X14是反映企業(yè)現(xiàn)金流量的指標(biāo),X15~X16為反映資本結(jié)構(gòu)的指標(biāo),X17到X28是反映企業(yè)成長能力的指標(biāo),X29~X32是反映企業(yè)營運能力的指標(biāo)。

      輸入變量由假設(shè)形成的5個變量結(jié)合財務(wù)指標(biāo)變量構(gòu)成。關(guān)于輸出變量,考慮企業(yè)發(fā)生財務(wù)危機風(fēng)險的界定,學(xué)者的觀點并不統(tǒng)一,多數(shù)學(xué)者都采用將ST作為企業(yè)陷入財務(wù)危機,具有財務(wù)風(fēng)險的標(biāo)志。這樣的界定標(biāo)準(zhǔn)符合我國的現(xiàn)實情況,而且便于學(xué)者間的成果相互比較,因此把ST作為模型輸出變量。

      (三)研究方法

      研究過程分為3個部分,第一個部分,確定有效的財務(wù)變量指標(biāo),建立基于財務(wù)指標(biāo)的財務(wù)危機預(yù)警模型。第二部分,加入大數(shù)據(jù)變量,考察模型在加入大數(shù)據(jù)變量的基礎(chǔ)上對模型效果的影響,如圖3所示。

      圖3 模型驗證過程圖

      (四)模型的構(gòu)建

      構(gòu)建模型前的數(shù)據(jù)處理:對引入模型的各項指標(biāo)進行顯著性檢驗和多重共線性分析。

      1.財務(wù)指標(biāo)的正態(tài)分布檢驗

      在進行顯著檢驗之前,需要考察樣本的分布情況,并以此來確定使用哪種方法來進行預(yù)警指標(biāo)的差異顯著性檢驗。運用SAS軟件來進行財務(wù)指標(biāo)分布情況的考察。采用Shapiro-Wilk正態(tài)分布檢驗。Shapiro-Wilk檢驗適用于樣本量小于2 000的正態(tài)分布檢驗,適用于探索連續(xù)型隨機變量的分布。對選取的企業(yè)各個財務(wù)指標(biāo)進行檢驗,結(jié)果如表2所示。

      表2 正態(tài)分布檢驗

      根據(jù)Shapiro-Wilk判定原理,多數(shù)財務(wù)指標(biāo)不服從正態(tài)分布,只有X3、X4、X15、X16、X18服從正態(tài)分布。這個結(jié)果和國外對財務(wù)指標(biāo)的實證研究分析結(jié)果大致相同。對不服從正態(tài)分布的財務(wù)指標(biāo)的差異顯著性檢驗要采用非參數(shù)的檢驗方法,而對服從正態(tài)分布的財務(wù)指標(biāo)使用參數(shù)T檢驗方法。

      2.財務(wù)指標(biāo)的差異顯著性檢驗

      采用Wilcoxon rank-sum檢驗法,對2個獨立樣本進行非參數(shù)檢驗。找出對分辨ST公司和非ST公司沒有貢獻的財務(wù)指標(biāo)。檢驗結(jié)果見表3。

      表3 差異顯著性檢驗

      檢驗結(jié)果發(fā)現(xiàn)財務(wù)指標(biāo) X1、X2、X5、X8、X11、 X13、 X14、 X29、 X32的 Pr>Chi-Square都小于0.05,通過顯著性檢驗,而其余指標(biāo)因為沒有通過顯著性檢驗被剔出。

      采用T檢驗方法,對樣本進行參數(shù)檢驗,檢驗結(jié)果如表4所示。

      表4 T檢驗

      發(fā)現(xiàn) X4、X15、X16的 Pr>|t|都小于0.05,通過顯著性檢驗,而X3、X18被剔出。

      其中X1、X2、X4、X5是反映企業(yè)償債能力的指標(biāo);X8、X11是反映企業(yè)盈利能力的指標(biāo);X13、X14是反映企業(yè)現(xiàn)金流的指標(biāo);X15、X16是反映企業(yè)資本結(jié)構(gòu)指標(biāo);X29、X32是反映企業(yè)營運能力的指標(biāo)。

      3.財務(wù)指標(biāo)的多重共線性檢驗

      從數(shù)據(jù)中看出有一定的多重共線性,如表5所示。

      表5 多重共線性檢驗

      存在多重共線性的模型用于預(yù)測時,往往不影響預(yù)測結(jié)果。

      對大數(shù)據(jù)指標(biāo)的檢驗,命名積極情緒指數(shù)P1,中性情緒指數(shù)P2,消極情緒指數(shù)P3,頻次指數(shù)C1,交互情緒指數(shù)P1_P3。根據(jù)分布狀態(tài)分別進行顯著性檢驗,見表6。

      表6 顯著性檢驗

      可以發(fā)現(xiàn)P1和C1顯著。

      從表7可以發(fā)現(xiàn),樣本數(shù)據(jù)中,p2,p3,p1_p3不顯著。

      表7 T檢驗

      4.選用的模型

      支持向量機(Support Vector Machine,SVM)是Vapnik等人在多年研究統(tǒng)計學(xué)習(xí)理論基礎(chǔ)上提出的,是一種新型機器學(xué)習(xí)方法。支持向量機憑借統(tǒng)計學(xué)習(xí)理論,奠定了堅實的基礎(chǔ),其設(shè)計源于結(jié)構(gòu)風(fēng)險最小原則和有限樣本假設(shè),在過學(xué)習(xí)、局部收斂、高維災(zāi)難等問題方面克服了傳統(tǒng)機器學(xué)習(xí)(如神經(jīng)網(wǎng)絡(luò))的缺陷,支持向量機在學(xué)習(xí)能力和泛化性能方面具有不可比擬的優(yōu)勢。SVM分類方法基于結(jié)構(gòu)風(fēng)險最小化理論,在特征空間中建構(gòu)最優(yōu)分割超平面,使得學(xué)習(xí)器得到全局最優(yōu)化,基本原理如圖4。

      圖4 SVM超平面圖

      圖4中黑點和白點代表兩個類別樣本,H表示超平面,H1,H2是平行于超平面的直線,分別表示兩個類別中離超平面最近的樣本。H1與H2的距離稱為分類間隔(margin)。能將兩個類別正確分開,并使分類間隔最大的平面即最優(yōu)分類平面。SVM超平面可用方程表示為:H:ω·x+b=0,對于樣本(xi,yi)i=1,2,3…,n進行最優(yōu)分類超平面構(gòu)造,用如下規(guī)劃問題表示:

      sgn(·)代表一種符號函數(shù),b表示閾值。

      線性不可分的情況,一般進行非線性變換,通過把樣本轉(zhuǎn)化為在高維特征空間使其線性可分。一般處理過程中采用核函數(shù)K(x,xi)來實現(xiàn)樣本變換,引入常數(shù)C(C>0)使最優(yōu)分類問題轉(zhuǎn)化為二次規(guī)劃問題:

      在企業(yè)財務(wù)預(yù)警模型的應(yīng)用中,假設(shè)預(yù)警指標(biāo)有m個,即SVM的輸入為m維變量,判別企業(yè)是否危機的指標(biāo)為n個,即SVM的輸出為n維變量。取p個企業(yè)數(shù)據(jù)作為研究總體S= {xi,yi|i=1,2,3…,p)}x∈Rm,y∈Rn。對于總體S,取出一部分作為訓(xùn)練數(shù)據(jù),另一部分樣本作為驗證數(shù)據(jù)。因此,企業(yè)財務(wù)預(yù)警問題的本質(zhì)即針對訓(xùn)練樣本空間,尋求最優(yōu)分類面,繼而確定核函數(shù)和參數(shù),從而獲得問題的決策函數(shù)。該決策函數(shù)的學(xué)習(xí)能力可以通過訓(xùn)練數(shù)據(jù)檢驗,泛化預(yù)測能力一般根據(jù)驗證數(shù)據(jù)檢驗。在復(fù)雜社會環(huán)境中,企業(yè)與利益相關(guān)者形成了復(fù)雜的社會網(wǎng)絡(luò),各者之間存在著各種各樣的關(guān)系,企業(yè)的物流、信息流和資金流等存在不確定性,種種因素決定了企業(yè)財務(wù)危機具有復(fù)雜性的特征。所以預(yù)測上市公司財務(wù)狀況模型的輸入變量,與預(yù)警輸出變量是非線性關(guān)系,因此引入滿核函數(shù)進行非線性映射處理。通常而言,RBF核是合理的首選。這個核函數(shù)將樣本非線性地映射到一個更高維的空間,與線性核不同,它能夠處理分類標(biāo)注和屬性的非線性關(guān)系。并且,線性核是RBF的一個特例(Keerthi and Lin 2003),因此,使用一個懲罰因子C的線性核與某些參數(shù)(C,γ)的RBF核具有相同的性能。同時,Sigmoid核的表現(xiàn)很像一定參數(shù)的RBF核(Lin and Link 2003)。RBF函數(shù):通過選擇核函數(shù)和其他參數(shù),經(jīng)過訓(xùn)練得到企業(yè)財務(wù)危機預(yù)警的非線性支持向量機模型,其決策函數(shù)為:

      選擇SVM模型,以BP神經(jīng)網(wǎng)絡(luò)為對比對象,SVM具有一定的優(yōu)勢:首先,SVM無需考慮太多的參數(shù),只有懲罰函數(shù)和核函數(shù),而BP神經(jīng)網(wǎng)絡(luò)的控制參數(shù)較多。如隱藏層的數(shù)量、節(jié)點的數(shù)量、學(xué)習(xí)的速率等等,這些參數(shù)一般憑經(jīng)驗選擇。獲得最優(yōu)預(yù)測效果的參數(shù)組合相對很困難。其次,支持向量機的學(xué)習(xí)訓(xùn)練,能夠保證獲得的全局的最優(yōu)解是唯一的。而BP神經(jīng)網(wǎng)絡(luò),訓(xùn)練的結(jié)果無法確保唯一性。因此在比較不同指標(biāo)引入預(yù)測模型效果的時候,BP算法不易確定不同指標(biāo)對結(jié)果的影響。

      (五)實證研究和結(jié)果分析

      為了確保模型在應(yīng)用過程中有穩(wěn)定的預(yù)警能力和能夠滿足大數(shù)據(jù)的程序處理,對SVM所選擇的核函數(shù)處理非線性關(guān)系能力和SVM并行算法進行測試。

      在matlab環(huán)境中構(gòu)建具有非線性關(guān)系的散點如圖5,其中可以看到兩種類型的散點各900個,由于目標(biāo)是測試核函數(shù)在支持向量機中的有效性,所以在選擇散點時,無需考慮散點的具體含義,即這些散點沒有具體的經(jīng)濟意義,但從散點分布上可以看出具備一定的非線性可區(qū)別關(guān)系。

      SVM選擇RBF核函數(shù),其中C=1,sigma=0.1,對上述散點進行分類,即利用SVM對散點進行邊緣劃線區(qū)分,分類結(jié)果如圖6所示。從圖中可以直觀看出,選擇RBF核函數(shù),雖然邊緣附近有一些區(qū)分誤差,但總體上可以對具有非線性區(qū)別關(guān)系的變量進行很好的區(qū)分,因此該核函數(shù)應(yīng)該能夠滿足引入大數(shù)據(jù)指標(biāo)的財務(wù)預(yù)警模型應(yīng)用。

      圖5 隨機散點圖

      圖6 SVM分類結(jié)果圖

      將相關(guān)指標(biāo)具體數(shù)值引入模型,通過SVM模型得到的結(jié)果如表8以及圖7所示。

      表8 效果對比情況

      從圖7中左圖可以看出,當(dāng)采用財務(wù)指標(biāo)進行財務(wù)預(yù)測時,根據(jù)t-3年的數(shù)據(jù),正常企業(yè)中有8個被誤判,判正率達到63%,ST企業(yè)中有2個被誤判,判正率達到81%。通過圖7中右圖可以看出,采用融入積極情緒的指標(biāo)進行預(yù)測時,根據(jù)t-3年的數(shù)據(jù),正常企業(yè)中有5個被誤判,判正率達到77%,ST企業(yè)中有2個被誤判,判正率達到81%。

      圖7 t-3年效果比較

      從圖8中左圖看出,采用財務(wù)指標(biāo)進行預(yù)測,根據(jù)t-2年的數(shù)據(jù),正常企業(yè)中有2個被誤判,判正率達到90%,ST企業(yè)中有1個被誤判,判正率達到90%。通過圖8右圖可以看出,采用融入積極情緒的指標(biāo)進行預(yù)測時,根據(jù)t-2年的數(shù)據(jù),正常企業(yè)的判正率達到95%,ST企業(yè)的判正率達到90%。

      圖8 t-2年效果比較

      雖然中性情緒、負(fù)面情緒和交互情緒指標(biāo)都不顯著,但有一定現(xiàn)實意義,因此逐個帶入t-2年模型,中性情緒和負(fù)面情緒對已經(jīng)加入大數(shù)據(jù)指標(biāo)的模型沒有影響,結(jié)果發(fā)現(xiàn)交互情緒對已經(jīng)引入大數(shù)據(jù)指標(biāo)的模型預(yù)警效果有所提高,如表9。

      表9 效果對比表

      從圖9(詳見下頁)左圖可以看出,正常企業(yè)的判正率達到95%,ST企業(yè)的判正率達到90%,當(dāng)加入交互情緒指標(biāo)后,正常企業(yè)的判正率沒有變化,ST企業(yè)的判正率達到100%。大數(shù)據(jù)模型在預(yù)測有效度上有很大程度的提高,在實驗樣本中T-2期和T-3期的判正率均比財務(wù)指標(biāo)模型要高一些。針對實驗樣本來說,T-3期的大數(shù)據(jù)指標(biāo)引入的影響更大一些,T-2期的大數(shù)據(jù)指標(biāo)引入的影響就逐漸變小。這說明,引入大數(shù)據(jù)指標(biāo)的預(yù)測模型在中短期內(nèi)有一定程度的提高,同時在長期預(yù)測能力方面,明顯高于財務(wù)指標(biāo)模型。

      五、結(jié)論

      本文以網(wǎng)民為企業(yè)傳感器,利用網(wǎng)絡(luò)在線的大數(shù)據(jù)信息,依靠大數(shù)據(jù)涵蓋范圍廣泛、體現(xiàn)群體智慧和不易被修改的特點,引入了大數(shù)據(jù)指標(biāo)建立財務(wù)預(yù)警模型。通過對2012、2013年60家企業(yè)進行全網(wǎng)信息的過濾和爬取,進行了企業(yè)相關(guān)大數(shù)據(jù)信息指標(biāo)的整理,通過與財務(wù)指標(biāo)的結(jié)合,對研究假設(shè)進行實際數(shù)據(jù)驗證,發(fā)現(xiàn)引入大數(shù)據(jù)指標(biāo)的財務(wù)預(yù)警模型,相對財務(wù)指標(biāo)預(yù)警模型,在短期內(nèi)對預(yù)測效果有一定提高,從長期來看,對預(yù)測效果有明顯提高,大數(shù)據(jù)指標(biāo)在誤警率和漏警率上比財務(wù)指標(biāo)表現(xiàn)明顯要好,從而驗證了在復(fù)雜社會環(huán)境中,依靠大數(shù)據(jù)技術(shù)加強信息搜尋是提高財務(wù)預(yù)警有效性的重要路徑這一觀點。

      圖9 t-2年含交互情緒比較

      猜你喜歡
      財務(wù)指標(biāo)預(yù)警樣本
      用樣本估計總體復(fù)習(xí)點撥
      法國發(fā)布高溫預(yù)警 嚴(yán)陣以待備戰(zhàn)“史上最熱周”
      我國金融機構(gòu)股價和主要財務(wù)指標(biāo)的相關(guān)性分析
      推動醫(yī)改的“直銷樣本”
      園林有害生物預(yù)警與可持續(xù)控制
      全國國有企業(yè)主要財務(wù)指標(biāo)
      隨機微分方程的樣本Lyapunov二次型估計
      全國國有企業(yè)主要財務(wù)指標(biāo)
      村企共贏的樣本
      機載預(yù)警雷達對IFF 的干擾分析
      乌拉特前旗| 华阴市| 霍林郭勒市| 连城县| 洛扎县| 鄄城县| 定州市| 乳山市| 伊川县| 新密市| 咸阳市| 商洛市| 广河县| 闽侯县| 铜鼓县| 岳西县| 都昌县| 焦作市| 南城县| 平陆县| 晋城| 阳泉市| 会同县| 渝北区| 克山县| 长垣县| 洪江市| 富民县| 栾川县| 寻甸| 沛县| 武清区| 盐边县| 西宁市| 塔河县| 确山县| 浪卡子县| 青州市| 新余市| 韶关市| 凯里市|