王子豪
(南京審計(jì)大學(xué)政府審計(jì)學(xué)院,江蘇 南京211899)
當(dāng)今社會(huì)已經(jīng)進(jìn)入大數(shù)據(jù)的時(shí)代,越來(lái)越多的大數(shù)據(jù)技術(shù)被運(yùn)用到社會(huì)的各個(gè)領(lǐng)域,審計(jì)領(lǐng)域也不例外。大數(shù)據(jù)背景下,審計(jì)工作所需的數(shù)據(jù)量越來(lái)越多,數(shù)據(jù)類(lèi)型愈加復(fù)雜,因此,為保障審計(jì)質(zhì)量,在審計(jì)工作中使用大數(shù)據(jù)技術(shù)已經(jīng)成為提高審計(jì)效率、精確審計(jì)結(jié)論的必然趨勢(shì)。
進(jìn)入大數(shù)據(jù)時(shí)代,數(shù)據(jù)數(shù)量不斷增加,數(shù)據(jù)類(lèi)型更加復(fù)雜,而傳統(tǒng)審計(jì)軟件所能處理的數(shù)據(jù)數(shù)量和數(shù)據(jù)類(lèi)型有限,導(dǎo)致其不能滿(mǎn)足大數(shù)據(jù)審計(jì)的需要(陳偉和居江寧,2018)。大數(shù)據(jù)技術(shù)中的可視化技術(shù)可以將數(shù)據(jù)類(lèi)型轉(zhuǎn)換成便于審計(jì)人員理解的圖像,使審計(jì)人員能夠直觀地觀察數(shù)據(jù)概況,迅速發(fā)現(xiàn)數(shù)據(jù)之間的規(guī)律,找出數(shù)據(jù)背后所隱含的關(guān)系及問(wèn)題。此外,在大數(shù)據(jù)背景下,傳統(tǒng)的審計(jì)工具對(duì)被審計(jì)單位的電子化數(shù)據(jù)進(jìn)行審計(jì)時(shí)存在諸多不足,如無(wú)法找出數(shù)據(jù)背后隱藏的關(guān)聯(lián)信息,先進(jìn)的大數(shù)據(jù)技術(shù)也可能會(huì)被審計(jì)對(duì)象用于作弊等(呂新民和王學(xué)榮,2007)。在此情況下,可運(yùn)用數(shù)據(jù)挖掘技術(shù)中的聚類(lèi)分析、關(guān)聯(lián)分析等方法,對(duì)被審計(jì)單位的財(cái)務(wù)報(bào)表、會(huì)計(jì)憑證及賬簿等財(cái)務(wù)數(shù)據(jù)和音視頻等資料進(jìn)行深層次分析,揭示其內(nèi)在聯(lián)系,便于審計(jì)人員識(shí)別與分析。
綜上所述,積極使用可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)等大數(shù)據(jù)技術(shù),是審計(jì)工作更高效的重要保障。
目前可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)均已用于審計(jì)工作中,其中可視化技術(shù)借助圖形化的手段,可以將信息清晰地傳達(dá)出來(lái),方便審計(jì)人員根據(jù)信息進(jìn)行溝通并快速發(fā)現(xiàn)問(wèn)題(陳偉,2017)。
數(shù)據(jù)挖掘技術(shù)可以運(yùn)用數(shù)據(jù)挖掘模型,通過(guò)對(duì)被審計(jì)大數(shù)據(jù)進(jìn)行挖掘,得出可用于產(chǎn)生審計(jì)結(jié)論的證據(jù)或相關(guān)數(shù)據(jù)。但在運(yùn)用數(shù)據(jù)挖掘模型之前,必須對(duì)采集到的原始數(shù)據(jù)進(jìn)行如格式轉(zhuǎn)換、提煉等預(yù)處理操作。然而從被審計(jì)單位獲得的原始數(shù)據(jù)往往是大量且冗雜的,其中會(huì)存在一部分無(wú)關(guān)數(shù)據(jù)不利于審計(jì)人員從中發(fā)現(xiàn)問(wèn)題(陳丹萍,2009)。若想使數(shù)據(jù)挖掘技術(shù)達(dá)到使用目的,就必須做適當(dāng)?shù)念A(yù)處理,而可視化技術(shù)的作用則是對(duì)數(shù)據(jù)進(jìn)行處理,將其轉(zhuǎn)換成便于審計(jì)人員理解及使用的形式。因此,將可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)配合使用,可以解決數(shù)據(jù)的預(yù)處理問(wèn)題,便于數(shù)據(jù)挖掘技術(shù)在審計(jì)工作中正常運(yùn)行。
目前有不少文獻(xiàn)研究可視化技術(shù)在審計(jì)工作中的運(yùn)用,也有大量文獻(xiàn)研究數(shù)據(jù)挖掘技術(shù)運(yùn)用到審計(jì)工作中的情況,這些文獻(xiàn)對(duì)人們分別了解兩種技術(shù)在審計(jì)中發(fā)揮的作用奠定了一定的基礎(chǔ),但若將兩種技術(shù)進(jìn)行配合運(yùn)用,則可以解決數(shù)據(jù)挖掘技術(shù)的預(yù)處理問(wèn)題,文章基于可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)在審計(jì)工作中的運(yùn)行流程,設(shè)計(jì)出將兩種技術(shù)配合使用的運(yùn)行流程,并闡述該流程的運(yùn)用優(yōu)勢(shì)。
可視化分析是通過(guò)圖形分析處理復(fù)雜數(shù)據(jù)模型的一種分析方式,將大量數(shù)據(jù)進(jìn)行總結(jié)概括,將數(shù)據(jù)轉(zhuǎn)換成便于審計(jì)人員理解的圖像,幫助審計(jì)人員發(fā)現(xiàn)數(shù)據(jù)間的規(guī)律,及數(shù)據(jù)背后存在的問(wèn)題。常見(jiàn)的可視化技術(shù)包括:時(shí)間序列圖、折線(xiàn)圖、散點(diǎn)圖、氣泡圖、地區(qū)分布圖,以及標(biāo)簽云等技術(shù)。目前可視化技術(shù)在審計(jì)實(shí)務(wù)工作中被廣泛應(yīng)用。例如,在大氣污染防治審計(jì)中,審計(jì)人員借助其中的時(shí)間序列圖及散點(diǎn)圖等技術(shù),比對(duì)不同時(shí)期某地大氣中不同化合物的占比,來(lái)分析該地空氣質(zhì)量有無(wú)變差,以此來(lái)判斷相關(guān)部門(mén)的績(jī)效情況。此外,在扶貧審計(jì)中,由于扶貧資金單項(xiàng)金額較小且覆蓋面廣的特點(diǎn),因此需要的數(shù)據(jù)較多,來(lái)源較廣,但審計(jì)部門(mén)所能派出的人力、物力有限。利用可視化技術(shù),通過(guò)采集線(xiàn)上數(shù)據(jù)庫(kù)的相關(guān)數(shù)據(jù),就可收集到大量有用數(shù)據(jù),減少了審計(jì)人員的現(xiàn)場(chǎng)辦公時(shí)間,保留了審計(jì)人員的精力,而且可視化技術(shù)還可對(duì)收集到的數(shù)據(jù)按照審計(jì)人員的思路進(jìn)行總結(jié),能夠快速且全面地把握被審計(jì)單位的基本情況,提高了審計(jì)效率。
數(shù)據(jù)挖掘技術(shù)是以找到數(shù)據(jù)間的關(guān)聯(lián)性及因果關(guān)系為目的對(duì)海量、深層次的數(shù)據(jù)源進(jìn)行篩查的技術(shù),能夠幫助審計(jì)人員在短時(shí)間內(nèi)篩選出具有代表性的審計(jì)樣本,在一定程度上降低了審計(jì)風(fēng)險(xiǎn)。其主要技術(shù)方法包括數(shù)據(jù)概化技術(shù)、統(tǒng)計(jì)分析技術(shù)、聚類(lèi)分析技術(shù)及關(guān)聯(lián)分析技術(shù)等。
由于數(shù)據(jù)挖掘技術(shù)可收集利用的數(shù)據(jù)較多,因此該技術(shù)常用于外部審計(jì)人員對(duì)企業(yè)財(cái)務(wù)報(bào)表的審計(jì)當(dāng)中。運(yùn)用統(tǒng)計(jì)分析技術(shù),對(duì)被審計(jì)單位相關(guān)財(cái)務(wù)指標(biāo)的歷史數(shù)據(jù)進(jìn)行分析與預(yù)測(cè),得出預(yù)測(cè)值,再與審計(jì)值進(jìn)行比較,若差別較大,則可對(duì)此重點(diǎn)關(guān)注。此外由于財(cái)務(wù)造假需要多項(xiàng)科目進(jìn)行配合,因此難免出現(xiàn)個(gè)別科目存在異常數(shù)據(jù)的情況,對(duì)此可運(yùn)用關(guān)聯(lián)分析技術(shù),對(duì)可能存在關(guān)聯(lián)的不同類(lèi)科目及各類(lèi)數(shù)據(jù)進(jìn)行審查,若存在異常數(shù)據(jù),則可對(duì)與異常數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)進(jìn)行審查,判斷是否存在隱藏的經(jīng)濟(jì)活動(dòng)。
數(shù)據(jù)挖掘技術(shù)雖有傳統(tǒng)審計(jì)技術(shù)無(wú)法替代的作用,但在現(xiàn)階段的運(yùn)用過(guò)程中,還是會(huì)存在一定的風(fēng)險(xiǎn)。例如,2014年外部審計(jì)人員對(duì)某燃?xì)饪毓捎邢薰緲?gòu)建的運(yùn)用了數(shù)據(jù)挖掘技術(shù)的審計(jì)系統(tǒng)進(jìn)行深層次分析,發(fā)現(xiàn)該系統(tǒng)存在一些審計(jì)風(fēng)險(xiǎn)。首先,該公司傾向于借助專(zhuān)家的審計(jì)經(jīng)驗(yàn),以此為基礎(chǔ)確定審計(jì)目的及需要收集的相關(guān)數(shù)據(jù),而隨著該公司規(guī)模的擴(kuò)大,業(yè)務(wù)類(lèi)型也變得復(fù)雜,使得專(zhuān)家確定的范圍并不能覆蓋所有類(lèi)型的業(yè)務(wù),產(chǎn)生了審計(jì)盲區(qū)。其次,該公司運(yùn)用數(shù)據(jù)挖掘技術(shù)僅對(duì)如財(cái)務(wù)報(bào)表、會(huì)計(jì)憑證等結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理,而如音頻、視頻等非結(jié)構(gòu)化的數(shù)據(jù)則不進(jìn)行檢查,這就會(huì)導(dǎo)致一些關(guān)鍵信息遺漏,從而影響審計(jì)結(jié)論。
由此可以看出,若在進(jìn)行數(shù)據(jù)處理時(shí)不借助其他輔助技術(shù)進(jìn)行處理,很可能導(dǎo)致數(shù)據(jù)收集和篩查不全面的情況發(fā)生,從而影響審計(jì)結(jié)論。
由于可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)都是對(duì)海量復(fù)雜數(shù)據(jù)進(jìn)行分析處理,因此,目前二者在個(gè)別審計(jì)案例中配合使用,但在配合使用過(guò)程中,依然是進(jìn)行分開(kāi)使用,雖然通過(guò)可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)產(chǎn)生的審計(jì)線(xiàn)索可以相互參考,但這樣分開(kāi)使用會(huì)造成審計(jì)思路不清晰、審計(jì)流程不便捷的情況。
2016年7月1日,國(guó)家發(fā)展改革委發(fā)布《推進(jìn)醫(yī)療服務(wù)價(jià)格改革的意見(jiàn)》,要求各地公立醫(yī)院調(diào)整醫(yī)療服務(wù)價(jià)格,取消藥品加成政策。在此背景下,審計(jì)部門(mén)就是否存在藥物加成現(xiàn)象對(duì)某市某公立醫(yī)院進(jìn)行了審計(jì)。由于該公立醫(yī)院藥品類(lèi)型繁多,且要對(duì)2013~2016年的藥物價(jià)格情況進(jìn)行審計(jì),涉及數(shù)據(jù)較多,因此審計(jì)部門(mén)運(yùn)用了可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)對(duì)相關(guān)內(nèi)容進(jìn)行分析,以保障審查的數(shù)據(jù)可準(zhǔn)確表現(xiàn)該醫(yī)院藥品的整體情況。
審計(jì)人員首先使用了可視化技術(shù)中的氣泡圖進(jìn)行分析,通過(guò)將每年的氣泡圖進(jìn)行整合,審計(jì)人員發(fā)現(xiàn),從2013年到2016年,氣泡圖中氣泡的數(shù)量,即加價(jià)藥品數(shù)量雖然在減少,但是每個(gè)氣泡的面積,即加價(jià)率卻在增大,在對(duì)此情況進(jìn)一步考察后,審計(jì)人員發(fā)現(xiàn)該公立醫(yī)院表面上響應(yīng)政策的號(hào)召,在減少藥品的加價(jià)情況,但實(shí)際上通過(guò)增加藥品的加價(jià)率來(lái)變相地對(duì)藥品進(jìn)行加成。隨后,審計(jì)人員利用散點(diǎn)圖進(jìn)行分析,發(fā)現(xiàn)加價(jià)藥品的購(gòu)入價(jià)大多集中在100元以?xún)?nèi)。而為了探究對(duì)什么類(lèi)型的藥品進(jìn)行加價(jià),審計(jì)人員又通過(guò)數(shù)據(jù)挖掘技術(shù)中的聚類(lèi)分析,將藥品進(jìn)行分類(lèi)篩查后發(fā)現(xiàn),從2015年到2016年,該醫(yī)院選擇加價(jià)的藥品大多為膠囊藥品。最后,針對(duì)以上現(xiàn)象實(shí)施進(jìn)一步審計(jì)程序后,審計(jì)人員最終得出結(jié)論:該公立醫(yī)院為對(duì)藥品進(jìn)行加成,選用了購(gòu)入價(jià)較低的膠囊類(lèi)藥品進(jìn)行加價(jià),由于購(gòu)入價(jià)較低,因此其加價(jià)空間較大,且購(gòu)入價(jià)較低的膠囊類(lèi)藥品不易被著重檢查。
從以上案例可以看出,可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)在審計(jì)工作中可同時(shí)使用,且能達(dá)到審計(jì)人員所期望的目的,但是在該案例中,對(duì)于兩種技術(shù)的使用效率并沒(méi)有達(dá)到最優(yōu)。此案例中審計(jì)人員先使用了所有需要用到的可視化技術(shù)后再使用的數(shù)據(jù)挖掘技術(shù),然而使用其中的聚類(lèi)技術(shù)的目的便是找到哪些類(lèi)型的藥品進(jìn)行了加價(jià),而這一步可以在使用完氣泡圖后就實(shí)施。因?yàn)闅馀輬D可以顯示哪些藥品進(jìn)行了加價(jià),在此基礎(chǔ)上對(duì)氣泡圖所顯示的藥品直接利用聚類(lèi)分析即可進(jìn)行分類(lèi)篩查,這樣在使用數(shù)據(jù)挖掘技術(shù)時(shí)就不用對(duì)被審計(jì)單位的數(shù)據(jù)進(jìn)行預(yù)處理,因?yàn)闅馀輬D的作用就是為了預(yù)處理,從而可以?xún)?yōu)化審計(jì)流程。
數(shù)據(jù)挖掘技術(shù)在使用過(guò)程中,若想建立數(shù)據(jù)挖掘模型,則必須先對(duì)獲取的數(shù)據(jù)進(jìn)行預(yù)處理,但審計(jì)人員在這一環(huán)節(jié)若只使用數(shù)據(jù)挖掘技術(shù),很可能遇到難以理解的數(shù)據(jù)形式,阻礙審計(jì)人員進(jìn)行預(yù)處理。此外,預(yù)處理的結(jié)果關(guān)系到審計(jì)問(wèn)題的提出,所以單靠審計(jì)人員自身很可能不能精準(zhǔn)總結(jié)出數(shù)據(jù)的關(guān)聯(lián)性及因果關(guān)系。因此,若使用可視化技術(shù)對(duì)收集到的數(shù)據(jù)進(jìn)行預(yù)處理,則可以幫助審計(jì)人員較為全面準(zhǔn)確地總結(jié)出數(shù)據(jù)的基本情況,再配合審計(jì)目標(biāo),就可提出關(guān)鍵性的問(wèn)題進(jìn)行審查,最終使審計(jì)結(jié)果更加可靠。
可視化技術(shù)在審計(jì)工作中運(yùn)用的基本流程如圖1所示,在收集到被審計(jì)單位的相關(guān)數(shù)據(jù)后,將數(shù)據(jù)錄入承載可視化技術(shù)工具的系統(tǒng)中,再根據(jù)審計(jì)人員的需要,對(duì)數(shù)據(jù)進(jìn)行可視化建模與分析,將初步的結(jié)果通過(guò)圖形等方式表現(xiàn)出來(lái)。此時(shí)審計(jì)人員再通過(guò)視覺(jué)感知,并配合自身的審計(jì)經(jīng)驗(yàn)進(jìn)行分析,若對(duì)結(jié)果存疑,還可再次將數(shù)據(jù)錄入系統(tǒng),轉(zhuǎn)換其表現(xiàn)形式,將此過(guò)程不斷循環(huán),最終得出讓審計(jì)人員能夠完全理解的數(shù)據(jù)特征、數(shù)據(jù)間關(guān)系的圖像,將其確定為審計(jì)證據(jù)。
圖1 可視化技術(shù)在審計(jì)工作中的運(yùn)用流程圖
圖2為數(shù)據(jù)挖掘技術(shù)在審計(jì)工作中的應(yīng)用流程,審計(jì)人員根據(jù)審計(jì)目標(biāo)提出審計(jì)需求,根據(jù)需求對(duì)被審計(jì)大數(shù)據(jù)進(jìn)行預(yù)處理,并對(duì)處理結(jié)果進(jìn)行總結(jié)與分析,使其轉(zhuǎn)化成數(shù)據(jù)挖掘問(wèn)題。再和數(shù)據(jù)挖掘人員進(jìn)行交流與溝通,數(shù)據(jù)挖掘人員根據(jù)問(wèn)題設(shè)計(jì)出數(shù)據(jù)挖掘模型,對(duì)被審計(jì)單位內(nèi)外部數(shù)據(jù)進(jìn)行挖掘。最后由審計(jì)人員對(duì)產(chǎn)生的數(shù)據(jù)挖掘結(jié)果進(jìn)行評(píng)價(jià),檢驗(yàn)結(jié)果的有效性,即是否可作為有效的審計(jì)線(xiàn)索或?qū)徲?jì)證據(jù)。
圖2 數(shù)據(jù)挖掘技術(shù)在審計(jì)工作中的運(yùn)用流程圖
圖3為可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)配合運(yùn)用的流程,從圖中可以看出,該流程實(shí)際上是將數(shù)據(jù)挖掘技術(shù)中原有的預(yù)處理步驟換成可視化技術(shù)中的分析模塊,即從建模到審計(jì)人員判斷可視化結(jié)果是否可作為審計(jì)線(xiàn)索這一段流程,然后將由可視化技術(shù)分析出的審計(jì)線(xiàn)索轉(zhuǎn)化成數(shù)據(jù)挖掘問(wèn)題,使可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)進(jìn)行拼接,產(chǎn)生一個(gè)新的運(yùn)用流程,以解決數(shù)據(jù)的預(yù)處理問(wèn)題。
圖3 可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)的配合運(yùn)用流程圖
該流程相比于未加入可視化流程的數(shù)據(jù)挖掘流程而言,該流程在建立數(shù)據(jù)挖掘模型之前,可對(duì)數(shù)據(jù)進(jìn)行可視化分析,使得預(yù)處理的結(jié)果不再完全依靠主觀判斷,而是依賴(lài)于客觀技術(shù),使分析出的結(jié)果更加接近被審計(jì)單位的實(shí)際情況,幫助審計(jì)人員與數(shù)據(jù)挖掘人員建立有效且包含面廣的數(shù)據(jù)挖掘模型,使得出的審計(jì)結(jié)論更加全面可靠。此外,將兩項(xiàng)技術(shù)流程組合成一個(gè)新流程使用,能夠規(guī)范操作步驟,使審計(jì)思路更加清晰。就該流程的應(yīng)用范圍而言,由于該流程既包含了可視化技術(shù),也包含了數(shù)據(jù)挖掘技術(shù),因此該流程可應(yīng)用于兩項(xiàng)技術(shù)單獨(dú)使用的審計(jì)項(xiàng)目中,另外,該流程解決了數(shù)據(jù)挖掘技術(shù)的預(yù)處理問(wèn)題,因此可以將該流程嘗試應(yīng)用到目前數(shù)據(jù)挖掘技術(shù)無(wú)法較好發(fā)揮作用的審計(jì)項(xiàng)目中,進(jìn)一步檢驗(yàn)該流程的應(yīng)用范圍。
綜上所述,在大數(shù)據(jù)背景下,將可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)進(jìn)行配合運(yùn)用,可以解決數(shù)據(jù)預(yù)處理難的問(wèn)題,可保障審計(jì)工作順利開(kāi)展。但在現(xiàn)階段,兩項(xiàng)技術(shù)并沒(méi)有得到較好的配合,因此需要審計(jì)人員不斷提升自身素質(zhì),與不同領(lǐng)域的部門(mén)進(jìn)行合作,盡快掌握相關(guān)大數(shù)據(jù)技術(shù),從而優(yōu)化審計(jì)工作流程,提高審計(jì)效率。
大數(shù)據(jù)帶我們進(jìn)入了一個(gè)新紀(jì)元,使我們對(duì)這個(gè)世界有了更加深刻、客觀的認(rèn)識(shí),而審計(jì)作為經(jīng)濟(jì)監(jiān)督活動(dòng)的重要工作,審計(jì)部門(mén)應(yīng)該對(duì)此更加重視,這就需要審計(jì)人員既努力學(xué)習(xí)先進(jìn)技術(shù),又要掌握大數(shù)據(jù)背景下新的審計(jì)思路,以更加飽滿(mǎn)的態(tài)度來(lái)迎接大數(shù)據(jù)技術(shù)所帶來(lái)的便利與挑戰(zhàn)。