邊 瑩,張世國
(1.大連財經(jīng)學(xué)院 會計學(xué)院,遼寧 大連 116622;2.遼寧澤潤信會計師事務(wù)所,遼寧 大連 116000)
大數(shù)據(jù)推動社會信息化技術(shù)發(fā)展,財務(wù)、業(yè)務(wù)信息化系統(tǒng)更新使企業(yè)管理向?qū)崟r化、精細(xì)化方向調(diào)整[1]。隨著5G 的進(jìn)一步發(fā)展,5G 具有更大容量,利用無線電頻的模式要比傳統(tǒng)的技術(shù)手段有著更高速的數(shù)據(jù)傳輸能力,實現(xiàn)海量數(shù)據(jù)的快速傳輸[2],同時可以實現(xiàn)多個設(shè)備之間進(jìn)行相應(yīng)連接,在進(jìn)入5G 快速發(fā)展時代之后,人工智能、物聯(lián)網(wǎng)等高新技術(shù)開始逐漸應(yīng)用于人們的日常生活之中[3-5]。隨著審計信息化建設(shè)的興起,國內(nèi)學(xué)者更多地強(qiáng)調(diào)大數(shù)據(jù)進(jìn)行數(shù)據(jù)分析對工作的改變[6]。大數(shù)據(jù)等相關(guān)技術(shù)對于審計的計算,抽樣調(diào)查、數(shù)據(jù)抽取、結(jié)果計算都有著極大促進(jìn)作用[7]。對于區(qū)塊鏈、人工智能技術(shù)也引發(fā)廣大學(xué)者研究相關(guān)審計平臺的建設(shè)路徑,高廷帆表示區(qū)塊鏈這一智能技術(shù)所形成的分布形式賬本,將幫助審計朝著自動化、智能化的方向發(fā)展[8]。畢秀玲等更是提出了審計智能+的建設(shè)[9]。
傳統(tǒng)審計的特點是勞動密集性、時間密集性,使審計無法實時呈現(xiàn)出財務(wù)、業(yè)務(wù)中的問題,使管理者在戰(zhàn)略規(guī)劃中、資源分配做出錯誤決策,阻礙企業(yè)提升生產(chǎn)效率及發(fā)展業(yè)務(wù)[10]。基于智能技術(shù)、數(shù)據(jù)挖掘支撐的審計系統(tǒng)研究具有一定應(yīng)用價值,通過數(shù)據(jù)提取技術(shù)對于審計內(nèi)容進(jìn)行分析的相應(yīng)場景越來越多,在進(jìn)行數(shù)據(jù)提取的過程中聚類算法是比較常用到的方法之一[11]。在對于審計的相關(guān)數(shù)據(jù)進(jìn)行分析時,工作人員需要對于數(shù)據(jù)進(jìn)行充分了解之后,利用驗證、查證、挖掘等方式去獲取更加準(zhǔn)確的審計目標(biāo)。在“智能+”的背景下,5G、物聯(lián)網(wǎng)、人工智能、云計算以及區(qū)塊鏈等新興技術(shù)為審計信息化建設(shè)帶來了新的機(jī)遇與挑戰(zhàn)。目前,關(guān)于審計自動化的研究仍處于探索階段,針對“智能+”時代審計方面的研究更是甚少。基于此,本文在現(xiàn)有研究的基礎(chǔ)上,面對5G、物聯(lián)網(wǎng)、區(qū)塊鏈的高新技術(shù)使得人們的生活日益發(fā)生改變,并逐漸進(jìn)入到智能化時代,探究基于聚類算法的自動化審計研究。
在對審計中的數(shù)據(jù)進(jìn)行研究時,首先數(shù)據(jù)提取階段需要對數(shù)據(jù)進(jìn)行相應(yīng)的收集,之后進(jìn)行數(shù)據(jù)的粗略處理,在建立起合適的模型后針對表現(xiàn)異常的數(shù)據(jù)進(jìn)行及時剔除和完善。具體見圖1所示。
圖1 審計數(shù)據(jù)分析階段的數(shù)據(jù)提取過程具體步驟
在收集審計相關(guān)數(shù)據(jù)時需要用到合適的軟件和系統(tǒng),且根據(jù)本次審計的目的去精準(zhǔn)收集和審計數(shù)據(jù)相關(guān)的內(nèi)容。在進(jìn)行數(shù)據(jù)的收集過程中,采集的原始數(shù)據(jù)要滿足審計模型要求,數(shù)據(jù)的收集之前相關(guān)工作人員需要對于數(shù)據(jù)收集的具體內(nèi)容、收集范圍等進(jìn)行規(guī)劃,在數(shù)據(jù)提取的階段是對于整體數(shù)據(jù)粗略處理,在進(jìn)行處理之后需要對其中表現(xiàn)較為異常的數(shù)據(jù)進(jìn)行剔除,這樣可以增加整體數(shù)據(jù)的準(zhǔn)確程度,圖2 為數(shù)據(jù)清洗的一般過程。
圖2 數(shù)據(jù)清洗的一般過程
在驗證業(yè)務(wù)性時,需要對于順序代碼號中缺失和重復(fù)等問題檢查之后,對每一個明細(xì)中的年度賬戶結(jié)算與整體賬目記錄是否相同進(jìn)行判斷,便進(jìn)行噪聲數(shù)據(jù)的平滑處理。在數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)范圍選取階段,根據(jù)數(shù)據(jù)提取的具體目的,在大數(shù)據(jù)庫中進(jìn)行精準(zhǔn)選取,這一步驟也可以稱為數(shù)據(jù)挖掘,之后根據(jù)要求對數(shù)據(jù)進(jìn)行相應(yīng)處理,從而可將數(shù)據(jù)挖掘準(zhǔn)確性提高。數(shù)據(jù)挖掘過程核心步驟是模型建立與調(diào)整階段,對被審數(shù)據(jù),需要根據(jù)審計工作的具體類型,再加上審計單位現(xiàn)有業(yè)務(wù)情況、行業(yè)模式、數(shù)據(jù)結(jié)構(gòu)等出發(fā),通過多樣化的數(shù)據(jù)提取技術(shù),對審計中需要的數(shù)據(jù)進(jìn)行相應(yīng)挖掘。數(shù)據(jù)分類模型可生成提升圖,通過數(shù)據(jù)提取模型對于審計中需要用到的數(shù)據(jù)進(jìn)行處理,再加上相關(guān)要求對于審計數(shù)據(jù)進(jìn)行評審,比較、判斷審計數(shù)據(jù)的準(zhǔn)確性、真實性、一致性。對不合格數(shù)據(jù),需采取相關(guān)糾正措施糾正。
在審計數(shù)據(jù)分析中,一般會使用聚類算法對審計工作的數(shù)據(jù)進(jìn)行相應(yīng)計算。被審計企業(yè)自身的數(shù)據(jù)、財務(wù)數(shù)據(jù)分布通常具有一定規(guī)律。若經(jīng)聚類算法處理后,某些數(shù)據(jù)處于稀疏區(qū)域,則該數(shù)據(jù)異常。通過分析該區(qū)域特征,發(fā)現(xiàn)審計人員需查證問題的特征。如審計銀行信貸業(yè)務(wù)時,可進(jìn)行各種信貸業(yè)務(wù)聚類,劃分為高風(fēng)險、中風(fēng)險、低風(fēng)險。采用聚類算法比較分好的類別及被審計單位往年數(shù)據(jù),分析出被審計單位數(shù)據(jù)準(zhǔn)確性、真實性。
K-means 聚類算法從類別上屬于聚類算法的范疇,這一算法的初期聚類重點是無規(guī)律選擇K個研究對象之后,針對選擇對象和聚類中心之間的間距進(jìn)行計算,之后選擇出一批與聚類中心距離較近的數(shù)據(jù)。最后對每一個聚類中心進(jìn)行相應(yīng)的計算;根據(jù)此方法重復(fù)進(jìn)行計算,若各類聚類中心滿足聚類算法停止條件,則該K-means 聚類算法停止。K-means 這一算法主要是針對數(shù)據(jù)中的聚類中心進(jìn)行具體計算,在初級的數(shù)據(jù)選擇中先選擇K 個相關(guān)數(shù)據(jù),這一方法比較適合數(shù)據(jù)體量較大的場景。
K-means 聚類算法在流程上可分成四個步驟,第一,去選擇數(shù)據(jù)體量較大的數(shù)據(jù)包,將聚類的次數(shù)表達(dá)為I,之后再選擇K 個數(shù)據(jù)去進(jìn)行聚類中心計算,可以用字母表示為Z(jI)。第二,是對于相關(guān)數(shù)據(jù)xi、,聚類中心的間距D(xi,Z j(I)),i= 1,2,····,n;j= 1,2,···,k進(jìn)行計算,具體公式見(1):
在判斷條件的D(xi,Z k(I)) =min {D(xi,Z j(I))) ,i= 1,2,···,n}達(dá)到要求時,在該類Z(jI)劃入數(shù)據(jù)元素xi,。
第三,是對這k個聚類中心Z(jI+1)重新計算,見公式(2):
第四,是若Z(jI+1)≠Z(jI),則說聚類算法仍在變化,需繼續(xù),令I(lǐng)=I+1,那么需要直接進(jìn)行第二個步驟,否則這一算法將會終止。
對投資類型的公司來說,經(jīng)營預(yù)算報表的審計分析對于管理層的相關(guān)決策有著極大的參考價值,對審計部門來說也非常重要。審計部門主要是對整個行業(yè)內(nèi)的動態(tài)進(jìn)行監(jiān)督,能夠?qū)⑹袌鼍S持在比較穩(wěn)定的秩序范圍內(nèi)。伴隨著大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)的快速發(fā)展,在審計工作中也逐漸開始應(yīng)用計算機(jī)和軟件等相關(guān)技術(shù),對企業(yè)自身的財務(wù)情況進(jìn)行相應(yīng)分析,判斷企業(yè)的預(yù)算計算方法、財務(wù)核算數(shù)據(jù)報表是否符合要求。在聚類分析的基礎(chǔ)之上,審計可以更加高效、準(zhǔn)確地計算出數(shù)據(jù)結(jié)果,對審計的相關(guān)要求以及在投資融資企業(yè)管理過程中,需要對內(nèi)部的財務(wù)報表、預(yù)算申請進(jìn)行嚴(yán)格監(jiān)督。隨著現(xiàn)代化企業(yè)的逐漸發(fā)展,傳統(tǒng)的審計模式和方法已經(jīng)不能夠滿足現(xiàn)有企業(yè)的需求,新的審計方法主要是在云計算和大數(shù)據(jù)的基礎(chǔ)之上構(gòu)建新的系統(tǒng),利用現(xiàn)代高新技術(shù)有效提高工作效率。按照當(dāng)前審計準(zhǔn)則、會計準(zhǔn)則,基于聚類分析審計系統(tǒng)基本要求進(jìn)行模塊結(jié)構(gòu)的構(gòu)建,利用計算機(jī)高新技術(shù)對于審計內(nèi)容進(jìn)行計算,在進(jìn)行數(shù)據(jù)提取的過程之中再次進(jìn)行系統(tǒng)高效性特征進(jìn)行處理,圖3 的報表是審計分析體系的整體設(shè)計。
圖3 預(yù)算報表聚類分析審計系統(tǒng)總體結(jié)構(gòu)設(shè)計
從圖3 可以看出,在計算預(yù)算報表時利用聚類分析的方法,能夠?qū)芾硐鄳?yīng)內(nèi)容、用戶體系、數(shù)據(jù)庫、財務(wù)預(yù)算等方面進(jìn)行相應(yīng)計算。首先用戶維度主要包含用戶名、使用密碼、信息、企業(yè)情況記錄、經(jīng)營現(xiàn)狀等內(nèi)容。在登錄用戶賬戶時一定要進(jìn)行后臺的授權(quán),通常需要查看的人員身份為公司管理者、股東、財務(wù)負(fù)責(zé)人,在系統(tǒng)進(jìn)行授權(quán)的基礎(chǔ)之上審計工作人員和企業(yè)的債權(quán)人可以對企業(yè)現(xiàn)有情況進(jìn)行查詢,這兩個角色并不具有信息增減功能。系統(tǒng)的維護(hù)人員擁有全部使用功能,在登錄之后管理人員可以對于這一系統(tǒng)更新、維護(hù)、系統(tǒng)完善等,進(jìn)行相應(yīng)整改和優(yōu)化。對分析完成的數(shù)據(jù)需要及時儲存在數(shù)據(jù)庫中,相關(guān)人員對于數(shù)據(jù)報表進(jìn)行定期的整理和優(yōu)化,幫助企業(yè)高層管理者進(jìn)行日常的使用和查詢。因為系統(tǒng)自身特有原因一定要定期維護(hù),較多數(shù)據(jù)支持將會促使系統(tǒng)運行過慢,系統(tǒng)的重要內(nèi)容需要數(shù)據(jù)聚類分析,這一分支內(nèi)容可以對預(yù)算報表中的數(shù)據(jù)進(jìn)行篩選、提取、聚合優(yōu)化、處理數(shù)據(jù)儲存等。
企業(yè)自身的預(yù)算報表可以通過聚類分析進(jìn)行數(shù)據(jù)的提取,聚類分析是利用人工智能、物聯(lián)網(wǎng)等技術(shù)對表格之間進(jìn)行相應(yīng)的邏輯梳理。對預(yù)算表格中的數(shù)據(jù)進(jìn)行相應(yīng)分析,且將沒有展現(xiàn)出來的價值進(jìn)行提取,幫助公司內(nèi)部管理者、審計工作人員進(jìn)行數(shù)據(jù)決策。在聚類分析這一方法的使用下,預(yù)算報表需要經(jīng)歷數(shù)據(jù)整合、設(shè)計提取、結(jié)果分析等相應(yīng)過程,財務(wù)方面的預(yù)算分析主要選擇較為雷同的文件進(jìn)行相應(yīng)審計,在計算、提交數(shù)據(jù)方面中每一個數(shù)據(jù)都具有不同的比重和含義,可以將用戶想要查詢的內(nèi)容自動識別出來,幫助審計人員在工作中對于公司財務(wù)預(yù)算的相關(guān)審計流程進(jìn)行管理。本文的研究主要是從審計工作人員日常維護(hù)、使用、狀態(tài)查詢等出發(fā),相關(guān)審計流程參考圖4 的聚類分析軟件操作內(nèi)容。
圖4 預(yù)算報表聚類分析審計系統(tǒng)軟件操作流程
在實用性、功能性、使用性能方面,在本次的研究之中主要是對審計提起的作用優(yōu)勢進(jìn)行擴(kuò)大,幫助企業(yè)進(jìn)行重要決策的數(shù)據(jù)分析。同時還能夠幫助政府以及相關(guān)部門去進(jìn)行財務(wù)方面的盤點,能夠幫助企業(yè)進(jìn)行盈利表、財產(chǎn)權(quán)益變動表、資產(chǎn)負(fù)債表、現(xiàn)金流表格等進(jìn)行分類,同時系統(tǒng)能夠自行算出結(jié)果。在數(shù)據(jù)計算的便捷性與準(zhǔn)確性上來說都具有強(qiáng)大的優(yōu)勢,對聚類分析審計體系中可能會存在的誤差進(jìn)行分析,最終發(fā)現(xiàn)得到的數(shù)據(jù)結(jié)果非常準(zhǔn)確。
系統(tǒng)可以解決多個用戶共同登錄和進(jìn)行相關(guān)操作,可以在系統(tǒng)使用期間進(jìn)行較為流暢的數(shù)據(jù)查找、篩選功能,圖5 為系統(tǒng)測試步驟。
圖5 系統(tǒng)測試步驟
測試過程一共包含五個步驟:首先需要管理員去進(jìn)行自身身份的認(rèn)證,之后對系統(tǒng)各項參數(shù)進(jìn)行的調(diào)整;然后對企業(yè)內(nèi)部的盈利情況、負(fù)債情況、現(xiàn)金流使用率等進(jìn)行相應(yīng)的分析,選擇待測試的賬號去進(jìn)入到系統(tǒng)之中進(jìn)行聚類數(shù)據(jù)測試;第三步對系統(tǒng)中的彈窗、保存、數(shù)據(jù)儲存等功能進(jìn)行驗證;第四步是對數(shù)據(jù)的準(zhǔn)確性進(jìn)行深層次檢驗,同時還需要查驗財務(wù)預(yù)算能否進(jìn)行自主測試;最后一步是利用檢測系統(tǒng)對距離很近的相關(guān)數(shù)據(jù)精準(zhǔn)程度進(jìn)行再次校驗。
系統(tǒng)的硬件環(huán)境:系統(tǒng)硬盤1.5 T,用戶端使用的是4.3 GHz 酷睿i5 CPU,內(nèi)部存儲10 G;工作人員使用的電腦系統(tǒng)是Windows11 操作系統(tǒng),審計系統(tǒng)開發(fā)環(huán)境:MYSQLServer2014、VS2012。
在分析聚類方法對審計計算的功能時,首先選擇的數(shù)據(jù)主要來自于上海市A 股的投資融資公司,且對于企業(yè)公布的2010 年利潤預(yù)算表格、資金負(fù)債表格、資產(chǎn)權(quán)利變更表格、現(xiàn)金流流動率表格進(jìn)行收集,在這些數(shù)據(jù)的基礎(chǔ)之上進(jìn)行聚類方法的相應(yīng)系統(tǒng)內(nèi)容分析,且選擇市盈率、資金周轉(zhuǎn)率、權(quán)益乘數(shù)這幾個內(nèi)容,對財務(wù)預(yù)算報表的審計能力進(jìn)行一系列測試。同時分析聚類算法在數(shù)據(jù)計算過程中的誤差性,每個小組需要經(jīng)過120 次計算,每10 個為一組取平均值。圖6 是為預(yù)測報表的財務(wù)指標(biāo)誤差計算分析。
圖6 預(yù)測報表的財務(wù)指標(biāo)分析測量誤差分布
由圖6 知,120 次計算數(shù)據(jù)結(jié)果可以發(fā)現(xiàn),權(quán)益乘數(shù)的結(jié)果數(shù)據(jù)并沒有太大誤差性,但總資產(chǎn)周轉(zhuǎn)率和市場盈利率這兩個因素在計算上有著一定誤差。從宏觀上來講,總體誤差值要低于系統(tǒng)5%的測試目標(biāo),和傳統(tǒng)的計算方式相比更加便捷,測試誤差率要小很多。這表明在現(xiàn)實的審計工作之中,聚類分析方法在財務(wù)報表的數(shù)據(jù)審計工作中效果較好。
在評測聚類算法效果時,指標(biāo)包括準(zhǔn)確率、召回率、Purity 值、F-Measure 值、Normalized Mutual Information(NMI)值等指標(biāo)。以商業(yè)銀行審計項目為案例進(jìn)行分析,表1 為商業(yè)銀行信用風(fēng)險監(jiān)管指標(biāo)體系。
表1 商業(yè)銀行信用風(fēng)險監(jiān)管指標(biāo)體系
在審計計算中使用K-means 聚類算法對銀行中體量較大的數(shù)據(jù)進(jìn)行提取、計算、驗證等一系列內(nèi)容,本研究中對幾家商業(yè)銀行的自身風(fēng)險情況進(jìn)行相應(yīng)調(diào)查,可以參照圖7 的內(nèi)容,表2 是風(fēng)險的對應(yīng)指標(biāo)。
圖7 十家商業(yè)銀行信用風(fēng)險狀態(tài)
表2 審計分析后十家商業(yè)銀行的信用風(fēng)險狀態(tài)指標(biāo)
通過專家討論、認(rèn)證,表2 確定信用風(fēng)險等級劃分可信,間接說明使用K-means 聚類算法可將審計分析質(zhì)量提高是可行的。
本文在現(xiàn)有研究的基礎(chǔ)上,面對5G、人工智能、區(qū)域鏈等技術(shù)快速發(fā)展的時代,智能科技開始進(jìn)入大眾視野,本研究主要是通過聚類算法對自動化審計進(jìn)行探究,得出如下結(jié)論:
(1)聚類分析審計的方法能夠幫助企業(yè)對盈利表、財產(chǎn)權(quán)益變動表、資產(chǎn)負(fù)債表、現(xiàn)金流表格等進(jìn)行分類,同時系統(tǒng)能夠自行算出結(jié)果。在數(shù)據(jù)計算的便捷性與準(zhǔn)確性上來說都具有強(qiáng)大的優(yōu)勢。
(2)對聚類分析審計體系中可能會有的誤差進(jìn)行分析,最終發(fā)現(xiàn)得到的數(shù)據(jù)結(jié)果非常準(zhǔn)確,在計算資產(chǎn)的使用率以及市場流動率中會有略微誤差,但整體的誤差率不高于審計體系5%的目標(biāo),由此可以得知聚類分析審計方法計算的結(jié)果較為精準(zhǔn)。
(3)以商業(yè)銀行審計項目為案例,評測聚類算法效果,結(jié)果表明,使用K-means 聚類算法提高審計分析質(zhì)量可行。