魏春花
(江西外語(yǔ)外貿(mào)職業(yè)學(xué)院,江西 南昌 330000)
大數(shù)據(jù)是具有海量化、多樣化、高速化、高價(jià)值和真實(shí)化等特征的數(shù)據(jù),隨著互聯(lián)網(wǎng)、云計(jì)算、物聯(lián)網(wǎng)等技術(shù)在我國(guó)的不斷發(fā)展,當(dāng)前的網(wǎng)絡(luò)數(shù)據(jù)、企業(yè)數(shù)據(jù)、政務(wù)數(shù)據(jù)等呈爆發(fā)式增長(zhǎng)態(tài)勢(shì),如何在這些海量的大數(shù)據(jù)中發(fā)現(xiàn)篩選出有用的數(shù)據(jù),并將其運(yùn)用到實(shí)踐中是應(yīng)對(duì)當(dāng)前激烈社會(huì)競(jìng)爭(zhēng)的關(guān)鍵,而大數(shù)據(jù)技術(shù)就是伴隨著數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)挖掘和數(shù)據(jù)分析等方法的研究而應(yīng)運(yùn)而生的。
大數(shù)據(jù)技術(shù)也對(duì)審計(jì)領(lǐng)域產(chǎn)生了極大影響,給現(xiàn)代審計(jì)提供了新的技術(shù)和方法。面對(duì)大數(shù)據(jù)、云計(jì)算技術(shù)的迅猛發(fā)展,審計(jì)人員應(yīng)該轉(zhuǎn)變思維,改變傳統(tǒng)的審計(jì)技術(shù)、審計(jì)報(bào)告模式、審計(jì)證據(jù)搜集方式和審計(jì)工作方式,才能不斷適應(yīng)新技術(shù)、新方法帶來(lái)的挑戰(zhàn)。
隨著大數(shù)據(jù)時(shí)代的到來(lái),互聯(lián)網(wǎng)搜索引擎、各證券網(wǎng)站論壇、微博以及微信等資源每天都會(huì)加載大量的數(shù)據(jù),這些數(shù)據(jù)可以成為發(fā)現(xiàn)審計(jì)線(xiàn)索的重要來(lái)源。在大數(shù)據(jù)環(huán)境下,審計(jì)可以通過(guò)建設(shè)審計(jì)云和大數(shù)據(jù)審計(jì)平臺(tái)實(shí)時(shí)采集和整理各種內(nèi)外部數(shù)據(jù),用于獲取審計(jì)線(xiàn)索,審計(jì)人員通過(guò)對(duì)這些數(shù)據(jù)的分析,不僅可以在審計(jì)準(zhǔn)備階段對(duì)審計(jì)業(yè)務(wù)做出了解,還可以在審計(jì)實(shí)施中將數(shù)據(jù)作為補(bǔ)充審計(jì)證據(jù),對(duì)審計(jì)單位進(jìn)行業(yè)務(wù)分析,降低審計(jì)風(fēng)險(xiǎn),在審計(jì)收尾階段還可以對(duì)未來(lái)業(yè)務(wù)情況進(jìn)行預(yù)測(cè)。所以,依據(jù)大數(shù)據(jù)的時(shí)代特點(diǎn),審計(jì)模式將向數(shù)據(jù)導(dǎo)向?qū)徲?jì)模式發(fā)展。
大數(shù)據(jù)背景下,被審計(jì)單位本身就是一個(gè)大數(shù)據(jù)的集合,數(shù)據(jù)量的爆炸式增長(zhǎng),科學(xué)技術(shù)的大幅度提高,計(jì)算機(jī)技術(shù)高速發(fā)展,云計(jì)算技術(shù)、數(shù)據(jù)挖掘、聚類(lèi)分析等技術(shù)為全部數(shù)據(jù)的分析處理提供了條件,大數(shù)據(jù)分析替代抽樣逐漸成為趨勢(shì),這就避免了審計(jì)抽樣的風(fēng)險(xiǎn)。
大數(shù)據(jù)背景下,審計(jì)人員面對(duì)的數(shù)據(jù)量是十分龐大的,靠傳統(tǒng)的審計(jì)軟件和excel等工具難以實(shí)現(xiàn)數(shù)據(jù)分析,在這種情況下,審計(jì)人員有必要應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)大數(shù)據(jù)進(jìn)行分析。審計(jì)人員可以通過(guò)這些技術(shù)和方法對(duì)審計(jì)數(shù)據(jù)進(jìn)行分析,在一定程度上提高大數(shù)據(jù)審計(jì)的效率,從而更好地在審計(jì)過(guò)程中識(shí)別和控制風(fēng)險(xiǎn)。
本文就以Hadoop海量數(shù)據(jù)處理平臺(tái)為例分析建設(shè)人工智能審計(jì)模式技術(shù)架構(gòu)。
1.審計(jì)大數(shù)據(jù)采集階段。大數(shù)據(jù)環(huán)境下,審計(jì)數(shù)據(jù)采集來(lái)源更加豐富。審計(jì)人員主要釆集財(cái)務(wù)數(shù)據(jù)和業(yè)務(wù)等結(jié)構(gòu)化數(shù),也可以采集會(huì)議紀(jì)要、業(yè)務(wù)文檔等非結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)量很大;大數(shù)據(jù)環(huán)境下,設(shè)置傳感器、采集日志文件和Web爬蟲(chóng)技術(shù),成為大數(shù)據(jù)采集的重要手段,審計(jì)人員可以采集和處理的數(shù)據(jù)范圍得以顯著拓展。
2.審計(jì)大數(shù)據(jù)處理和存儲(chǔ)階段。大數(shù)據(jù)環(huán)境下,可以采用Hadoop海量數(shù)據(jù)處理平臺(tái),以HDFS分布式文件系統(tǒng)、Hbas數(shù)據(jù)庫(kù)和MapReduce編程模型為核心,實(shí)現(xiàn)人工智能審計(jì)大數(shù)據(jù)的存儲(chǔ)于管理。采用Hbase列式存儲(chǔ)數(shù)據(jù)庫(kù),可以整合已有的關(guān)系型數(shù)據(jù)庫(kù),方便智能批量數(shù)據(jù)處理和實(shí)時(shí)查詢(xún)。
3.審計(jì)大數(shù)據(jù)分析階段。人工智能分析可以更多采用統(tǒng)計(jì)分析、數(shù)據(jù)挖掘和數(shù)據(jù)可視化等方法以擴(kuò)大審計(jì)數(shù)據(jù)分析能力。不同的數(shù)據(jù)分析類(lèi)型需要采用不同的分析方法,結(jié)構(gòu)化數(shù)據(jù)分析主要采用數(shù)據(jù)挖掘和統(tǒng)計(jì)分析方法。
大數(shù)據(jù)環(huán)境下,人工智能審計(jì)需要建立在審計(jì)云基礎(chǔ)之上,審計(jì)云的建立將大大提升審計(jì)工作效率。在已經(jīng)實(shí)現(xiàn)審計(jì)聯(lián)網(wǎng)的基礎(chǔ)上,可以以上級(jí)審計(jì)數(shù)據(jù)中心和下級(jí)審計(jì)數(shù)據(jù)分中心為平臺(tái),在金審工程三期項(xiàng)目中加快推進(jìn)審計(jì)云計(jì)算和大數(shù)據(jù)功能建設(shè),統(tǒng)籌建設(shè)和使用審計(jì)機(jī)關(guān)的計(jì)算資源和數(shù)據(jù)資源,變分散的審計(jì)資源為集中的審計(jì)資源,一方面提高資金使用效率,另一方面提升數(shù)據(jù)利用效果,為審計(jì)人員提供更好的審計(jì)數(shù)據(jù)分析平臺(tái)。
大數(shù)據(jù)環(huán)境下,審計(jì)機(jī)構(gòu)可以以審計(jì)大數(shù)據(jù)平臺(tái)為基礎(chǔ),構(gòu)建多維審計(jì)分析系統(tǒng),支持橫向和縱向的應(yīng)用。
1.以審計(jì)大數(shù)據(jù)平臺(tái)作為基礎(chǔ)。審計(jì)大數(shù)據(jù)平臺(tái)基于大數(shù)據(jù)采集系統(tǒng)、大數(shù)據(jù)存儲(chǔ)系統(tǒng)和大數(shù)據(jù)管理系統(tǒng)構(gòu)建。大數(shù)據(jù)采集系統(tǒng)負(fù)責(zé)從互聯(lián)網(wǎng)、被審計(jì)單位和審計(jì)機(jī)關(guān)內(nèi)部采集和整理各種結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);數(shù)存儲(chǔ)系統(tǒng)負(fù)責(zé)采用分布式文件存儲(chǔ)技術(shù)和數(shù)據(jù)倉(cāng)庫(kù)技術(shù)存儲(chǔ)數(shù)據(jù);數(shù)據(jù)管理系統(tǒng)負(fù)責(zé)優(yōu)化和調(diào)度數(shù)據(jù);審計(jì)大數(shù)據(jù)平臺(tái)負(fù)責(zé)對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析、數(shù)據(jù)挖掘和可視化分析等多維分析,充分解析數(shù)據(jù)的信息價(jià)值。
2.利用大數(shù)據(jù)技術(shù)建設(shè)審計(jì)分析系統(tǒng)。在審計(jì)大數(shù)據(jù)平臺(tái)的基礎(chǔ)上,可以重點(diǎn)建設(shè)審計(jì)線(xiàn)索分析系統(tǒng)、業(yè)務(wù)審計(jì)分析系統(tǒng)和審計(jì)成果分析系統(tǒng)。審計(jì)線(xiàn)索分析系統(tǒng)主要采用網(wǎng)頁(yè)分析、社交網(wǎng)絡(luò)分析和多媒體分析技術(shù),基于互聯(lián)網(wǎng)社會(huì)熱點(diǎn)話(huà)題和舉報(bào)信息搜集審計(jì)線(xiàn)索,加大搜集審計(jì)線(xiàn)索的能力。業(yè)務(wù)審計(jì)分析系統(tǒng)主要采用結(jié)構(gòu)化分析和文本分析技術(shù),在傳統(tǒng)審計(jì)分析的基礎(chǔ)上,加入對(duì)中央重大政策和各行業(yè)主管部門(mén)具體政策的分析,有助于調(diào)整業(yè)務(wù)審計(jì)“微觀化”和“案件化”趨勢(shì),發(fā)揮審計(jì)宏觀監(jiān)督的作用。審計(jì)成果分析系統(tǒng)主要采用文本分析技術(shù),對(duì)以前年度的審計(jì)成果進(jìn)行信息提取、分類(lèi)聚類(lèi)和觀點(diǎn)挖掘等分析,加大對(duì)審計(jì)整改情況的追蹤,提升審計(jì)監(jiān)督的效果。