李 麟,賀之夢,吳華明
(1.合肥工業(yè)大學(xué),安徽 合肥 230009;2.安徽財(cái)貿(mào)職業(yè)學(xué)院,安徽 合肥 230601;3.安徽財(cái)經(jīng)大學(xué),安徽 蚌埠 233030)
企業(yè)虛假財(cái)務(wù)報(bào)告會誤導(dǎo)相關(guān)信息使用者,并導(dǎo)致其遭受嚴(yán)重?fù)p失,尤其在資本市場上,如果虛假財(cái)務(wù)報(bào)告繼續(xù)泛濫,不欺詐的上市企業(yè)可能最終無法籌集到所需的資金,不能支持其正常的發(fā)展,最終擾亂了整個資本市場的發(fā)展及國民經(jīng)濟(jì)的正常運(yùn)行。因此,本文試圖根據(jù)財(cái)務(wù)欺詐企業(yè)的治理結(jié)構(gòu)特征構(gòu)建自適應(yīng)熵投影聚類模型,基于自適應(yīng)熵投影聚類算法給出了財(cái)務(wù)報(bào)告文本數(shù)據(jù)挖掘預(yù)測財(cái)務(wù)欺詐應(yīng)用工具開發(fā)設(shè)計(jì),目的是解決上市企業(yè)財(cái)務(wù)欺詐監(jiān)管缺位的問題,使財(cái)務(wù)報(bào)告應(yīng)用工具的使用者更好發(fā)揮監(jiān)督作用,避免產(chǎn)生財(cái)務(wù)欺詐的動機(jī),使上市企業(yè)內(nèi)部形成一種良好的制衡機(jī)制,防止財(cái)務(wù)欺詐的產(chǎn)生,有效抑制財(cái)務(wù)欺詐行為,凈化我國資本市場。
自適應(yīng)熵投影聚類是一種將熵定量分析與熵定性分析相結(jié)合的系統(tǒng)分析方法,它將要數(shù)據(jù)挖掘的問題分解成各影響要素,按支配關(guān)系構(gòu)建合格的熵投影聚類模型,通過兩兩比較的方式確定各個要素的相對重要性,最終按聚類層計(jì)算備選方案基于數(shù)據(jù)挖掘的重要性[1]。
在使用熵投影聚類分析方法處理復(fù)雜問題時(shí),解決問題的備選方案必須是有限的,復(fù)雜問題分解出來的影響要素,應(yīng)該按照元素之間的從屬關(guān)系構(gòu)建熵投影聚類模型,熵投影聚類模型主要包括三層:目標(biāo)聚類層、準(zhǔn)則聚類層以及決策聚類層。
本文設(shè)計(jì)了包括目標(biāo)聚類和準(zhǔn)則聚類兩層的熵投影聚類矩陣[2],聚類標(biāo)度如表1 所示。
表1 自適應(yīng)熵投影聚類矩陣相對重要性等級表
決策者根據(jù)主觀經(jīng)驗(yàn)設(shè)計(jì)了自適應(yīng)熵投影聚類矩陣,為了保證權(quán)重賦值的可靠性,需要通過對該矩陣的一致性檢驗(yàn),來保證熵投影聚類矩陣的相對合理性。熵投影聚類指標(biāo)C.I.的計(jì)算公式如式(1),其中λmax是熵投影聚類矩陣的特征向量對應(yīng)的最大特征值:
查找出C.I.相對應(yīng)的熵投影聚類指標(biāo)R.I,兩者的商即為一致性聚類比率C.R.,具體計(jì)算公式如式(2):
其中R.I.為平均隨機(jī)熵投影聚類指標(biāo)取值,對應(yīng)的取值如表2 所示:
表2 自適應(yīng)熵投影聚類指標(biāo)取值表
自適應(yīng)熵投影聚類矩陣的一致性條件是C.R.<0.10,當(dāng)C.R.>0.10 時(shí)熵投影聚類矩陣不滿足一致性要求,需要修改。
通過上述自適應(yīng)熵投影聚類矩陣的一致性檢驗(yàn)后,采用幾何平均法求各指標(biāo)的權(quán)重。
自適應(yīng)熵投影聚類模型中各指標(biāo)的權(quán)重設(shè)置具有主觀性,為了消除設(shè)置的主觀性造成的影響,本文用熵投影聚類模型來較客觀地計(jì)算各指標(biāo)權(quán)重。假設(shè)存在m 個備選方案,n 個網(wǎng)絡(luò)聚類,則其原始數(shù)據(jù)矩陣如式(4)所示:
參考無量綱化后,獲得標(biāo)準(zhǔn)化后的評估矩陣R 如式(5)所示:
然后依據(jù)公式得出網(wǎng)絡(luò)聚類對應(yīng)的熵權(quán),組成客觀權(quán)重向量W2 如式(6)所示:
自適應(yīng)熵投影聚類模型包括財(cái)務(wù)數(shù)據(jù)挖掘?qū)ο?、?cái)務(wù)文本挖掘?qū)ο蟮男袨?、聚類的次序等方面要素。自適應(yīng)熵投影聚類雙方在聚類過程中有兩種選擇,即財(cái)務(wù)文本數(shù)據(jù)對象A 可以通過發(fā)布有關(guān)企業(yè)經(jīng)營情況的信息影響財(cái)務(wù)欺詐挖掘工具的決策。財(cái)務(wù)文本數(shù)據(jù)對象A 可以發(fā)布真實(shí)的信息,也可以發(fā)布虛假的信息,即財(cái)務(wù)文本數(shù)據(jù)對象A 有兩種選擇:數(shù)據(jù)真實(shí)或數(shù)據(jù)欺詐。同樣,數(shù)據(jù)挖掘應(yīng)用工具B 也有兩種選擇:一種取信財(cái)務(wù)文本數(shù)據(jù)對象A 提供的財(cái)務(wù)報(bào)告信息,另一種是質(zhì)疑對財(cái)務(wù)文本數(shù)據(jù)對象A 提供的信息。
由于只有財(cái)務(wù)報(bào)告信息發(fā)布后,應(yīng)用工具才能根據(jù)財(cái)務(wù)報(bào)告信息進(jìn)一步采取的財(cái)務(wù)欺詐告警行動。因此,在聚類過程中,財(cái)務(wù)報(bào)告信息供給方(即A 方)先行動,決定是否進(jìn)行財(cái)務(wù)欺詐。在A 方出現(xiàn)財(cái)務(wù)欺詐行為后,財(cái)務(wù)挖掘應(yīng)用工具(即B 方)根據(jù)掌握的財(cái)務(wù)數(shù)據(jù),判斷A 方的報(bào)告公布行為,再根據(jù)判斷做出決策。如果B 方的預(yù)測結(jié)論是“相信”,那么應(yīng)用工具就不會進(jìn)行欺詐告警,否則,他會欺詐告警。這里假設(shè)在正常情況下財(cái)務(wù)文本數(shù)據(jù)對象A 取得的聚類增益為M,數(shù)據(jù)挖掘應(yīng)用工具B 取得的聚類增益為m[4]。雙方的聚類將出現(xiàn)以下四種情況:(1)假設(shè)財(cái)務(wù)文本數(shù)據(jù)對象A 為真實(shí),數(shù)據(jù)挖掘應(yīng)用工具B 結(jié)論為取信,那么雙方均不存在額外的聚類增益,即雙方聚類增益為(M,m)。(2)假設(shè)財(cái)務(wù)文本數(shù)據(jù)對象A 的行動是真實(shí),數(shù)據(jù)挖掘應(yīng)用工具B 的策略是“質(zhì)疑”,那么企業(yè)發(fā)布真實(shí)財(cái)務(wù)報(bào)告文本數(shù)據(jù)而應(yīng)用工具B 不取信將給上市企業(yè)帶來負(fù)向聚類增益(RA),則雙方的聚類增益為(M+RA,m-RB)。由于證監(jiān)會查處的概率比為P。所以上市企業(yè)進(jìn)行財(cái)務(wù)欺詐的額外負(fù)向聚類增益為(-PC-RA),而此時(shí)數(shù)據(jù)挖掘應(yīng)用工具不取信上市企業(yè)發(fā)布的財(cái)務(wù)報(bào)告信息,將進(jìn)行欺詐告警,即不會有聚類增益,所以聚類增益為m,這時(shí)雙方的聚類增益為(M-PCRA,m)。由上文可知,數(shù)據(jù)挖掘應(yīng)用工具B 不清楚財(cái)務(wù)文本數(shù)據(jù)對象A 的行為,這樣雙方的行為就構(gòu)成了一個不完美財(cái)務(wù)報(bào)告文本數(shù)據(jù)的動態(tài)聚類,可以表示如表3 所示。
表3 財(cái)務(wù)報(bào)告信息供需雙方自適應(yīng)熵投影聚類的聚類增益表
根據(jù)上述模型不難發(fā)現(xiàn),該模型有一個自適應(yīng)熵投影均衡解。假設(shè)財(cái)務(wù)文本數(shù)據(jù)對象A 屬于欺詐的概率為β,則其屬于真實(shí)的概率為1-β。因此,當(dāng)數(shù)據(jù)挖掘應(yīng)用工具B 選擇“取信”時(shí),財(cái)務(wù)文本數(shù)據(jù)對象A 的期望聚類增益如下:
當(dāng)數(shù)據(jù)挖掘應(yīng)用工具B 選擇“質(zhì)疑”時(shí),財(cái)務(wù)文本數(shù)據(jù)對象A 的期望聚類增益如下:
根據(jù)自適應(yīng)熵投影聚類均衡的定義,均衡時(shí),U=V 成立。則財(cái)務(wù)文本數(shù)據(jù)對象A 進(jìn)行財(cái)務(wù)欺詐的概率為:
可見,上市企業(yè)是否進(jìn)行財(cái)務(wù)欺詐與RA,P,C 有關(guān)。而RA,P,C 分別代表上市企業(yè)財(cái)務(wù)欺詐將獲得的負(fù)向聚類增益、財(cái)務(wù)欺詐被發(fā)現(xiàn)的概率以及發(fā)現(xiàn)后的處罰成本[5]。
2.2.1 財(cái)務(wù)報(bào)告樣本選擇與數(shù)據(jù)來源
鑒于證監(jiān)會要求上市企業(yè)在年報(bào)中披露有關(guān)企業(yè)治理的信息,選擇樣本時(shí)間區(qū)間為2009 年1月1 日至2018 年12 月31 日。由于中報(bào)披露的財(cái)務(wù)數(shù)據(jù)有限,所以中報(bào)欺詐樣本予以剔出。本文主要基于財(cái)務(wù)報(bào)表內(nèi)相關(guān)指標(biāo)及內(nèi)部企業(yè)治理結(jié)構(gòu)來構(gòu)建上市企業(yè)財(cái)務(wù)欺詐的財(cái)務(wù)報(bào)告應(yīng)用工具。因此,對于因資金使用狀況與披露的不符、延遲披露年報(bào)、違規(guī)擔(dān)保、未披露關(guān)聯(lián)交易等情況受到處罰的上市企業(yè)予以剔出。
2.2.2 財(cái)務(wù)報(bào)告控制樣本的選擇
研究結(jié)果表明,產(chǎn)生財(cái)務(wù)欺詐的影響因素之一是行業(yè)要素,因而本文將控制樣本與欺詐樣本所處行業(yè)選擇為一致。另外企業(yè)規(guī)模差別也會影響到分析的結(jié)論,因而本文選擇企業(yè)規(guī)模相當(dāng)?shù)目刂茦颖九c欺詐樣本逐個相配,以消除企業(yè)規(guī)模對分析結(jié)果的影響。具體選擇步驟如下:①確定各欺詐樣本企業(yè)所屬行業(yè),確定欺詐樣本企業(yè)發(fā)生欺詐行為前一年的資產(chǎn)總額。②選取欺詐行為發(fā)生前一年與欺詐樣本企業(yè)在同一交易所且資產(chǎn)總額最為接近的企業(yè)作為控制樣本;當(dāng)有多家符合條件的控制樣本企業(yè)時(shí),選擇與欺詐樣本企業(yè)上市時(shí)間最鄰近的控制樣本企業(yè)。經(jīng)過上述兩個步驟可選擇出與欺詐樣本企業(yè)相匹配的控制樣本企業(yè)[6]。
2.2.3 基于自適應(yīng)熵投影聚類算法的財(cái)務(wù)報(bào)告欺詐應(yīng)用工具變量設(shè)計(jì)[7]
在前一節(jié)研究假設(shè)的基礎(chǔ)上選擇變量指標(biāo),表4 匯總了本文選擇的變量指標(biāo)。
表4 基于自適應(yīng)熵投影聚類算法的財(cái)務(wù)報(bào)告欺詐應(yīng)用工具變量設(shè)計(jì)方法
2.2.4 財(cái)務(wù)報(bào)告應(yīng)用工具開發(fā)結(jié)果驗(yàn)證
采用Forward:Wald 方式,讓變量以步進(jìn)的方式進(jìn)入自適應(yīng)熵投影聚類方程,進(jìn)入自適應(yīng)熵投影聚類方程的標(biāo)準(zhǔn)是分值統(tǒng)計(jì)量顯著水平(0.10),從自適應(yīng)熵投影聚類方程中刪除變量的標(biāo)準(zhǔn)是Wald統(tǒng)計(jì)量的概率(0.15)。而且,采用Wald 統(tǒng)計(jì)量概率來剔除變量檢驗(yàn)可解決變量之間的多重共線性問題[8]。應(yīng)用工具輸出結(jié)果見表5。
表5 財(cái)務(wù)報(bào)告應(yīng)用工具開發(fā)結(jié)果驗(yàn)證
好模型的聚類比值較高。表5 中將對數(shù)聚類比值乘以-2,即用-2Log likelihood 來測量模型對數(shù)據(jù)的聚合度,最終結(jié)果-2Log likelihood=39.363表示擬合度較好。因變量的總變差由自適應(yīng)熵投影聚類模型作出解釋的部分所占的比重大小,以Cox &Snell R Square 熵投影聚類來表示,Nagelkerke R Square 熵投影聚類是調(diào)整值。本應(yīng)用工具Cox &Snell R Square>0.5,Nagelkerke R Square>0.5,數(shù)據(jù)表明應(yīng)用工具對樣本的聚合度較好[9]。
在Logistic 自適應(yīng)熵投影聚類中,盡管Logitp與每個X 之間經(jīng)過變形呈線性關(guān)系,但是變化對p 的作用并不能由此得到確切的解釋,自適應(yīng)熵投影聚類方程通過熵投影聚類相對值b 的正負(fù)號來表示自變量X 對Logitp 的作用方向。當(dāng)b 值為正時(shí),表明每增加一個單位的X 值可提高Logitp 變化量;當(dāng)b 值為負(fù)時(shí),表明每增加一個單位的X值可降低Logitp 變化量[10]。因此,對進(jìn)入應(yīng)用工具的各變量如圖1 所示。
圖1 自適應(yīng)熵投影聚類方程聚類樣本數(shù)量對熵投影聚類相對值
總資產(chǎn)增長率與企業(yè)財(cái)務(wù)欺詐發(fā)生的可能性負(fù)相關(guān),當(dāng)其提高一個單位時(shí),Logitp 降低1.96 個單位。這意味著總資產(chǎn)增長率高,成長基礎(chǔ)好的企業(yè)發(fā)生財(cái)務(wù)欺詐的可能性小。監(jiān)事會規(guī)模與企業(yè)財(cái)務(wù)欺詐發(fā)生的可能性負(fù)相關(guān)。每增加一個監(jiān)事,Logitp 就會減少0.668 個單位,即規(guī)模越小的企業(yè)發(fā)生財(cái)務(wù)欺詐的可能性越大。變更會計(jì)師事務(wù)所與企業(yè)財(cái)務(wù)欺詐發(fā)生的可能性正相關(guān)。因?yàn)榧僭O(shè)變更會計(jì)師事務(wù)所的企業(yè)為1,沒有變更會計(jì)師事務(wù)所的企業(yè)為0,因此,如果企業(yè)變更會計(jì)師事務(wù)所就會使Logitp 增加6.042 個單位,使得變更會計(jì)師事務(wù)所的企業(yè)更可能進(jìn)行財(cái)務(wù)欺詐,驗(yàn)證了本文所給基于自適應(yīng)熵投影聚類算法財(cái)務(wù)報(bào)告欺詐應(yīng)用工具的有效性[11]。
目前,政府有關(guān)部門負(fù)責(zé)對上市公司的財(cái)務(wù)報(bào)告進(jìn)行監(jiān)督,在規(guī)范和維護(hù)市場經(jīng)濟(jì)有序運(yùn)行中起著非常重要的作用。本研究構(gòu)建了自適應(yīng)熵投影聚類算法模型,給出了財(cái)務(wù)報(bào)告欺詐應(yīng)用工具變量設(shè)計(jì),進(jìn)行了基于自適應(yīng)熵投影聚類算法財(cái)務(wù)報(bào)告文本數(shù)據(jù)挖掘預(yù)測財(cái)務(wù)欺詐應(yīng)用工具的開發(fā)設(shè)計(jì)與驗(yàn)證分析,驗(yàn)證結(jié)果表明所給應(yīng)用工具的有效性,具有較好的推廣應(yīng)用價(jià)值。