• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    審計信息系統(tǒng)的異常數(shù)據(jù)挖掘算法和應用

    2020-09-22 03:26:26毛玲玥
    全國流通經(jīng)濟 2020年19期
    關鍵詞:應用

    摘要:信息系統(tǒng)作為企業(yè)經(jīng)營管理活動的基本手段,需要從海量數(shù)據(jù)中搜索得到有效的審計證據(jù)和審計線索,能夠發(fā)現(xiàn)經(jīng)營活動的異常是審計工作的重要內容。本文在對各類異常數(shù)據(jù)挖掘算法的分析和總結基礎上,關注審計數(shù)據(jù)挖掘中問題的解決,使得審計信息系統(tǒng)的異常數(shù)據(jù)挖掘算法得以推廣應用。

    關鍵詞:審計信息系統(tǒng);異常數(shù)據(jù);挖掘算法;應用

    中圖分類號:F232.6;TP393?文獻識別碼:A?文章編號:2096-3157(2020)19-0183-02

    隨著信息技術的發(fā)展和廣泛應用,審計單位的經(jīng)營和管理及核算模式出現(xiàn)明顯變化,其更加復雜且龐大的信息系統(tǒng),使得傳統(tǒng)的會計核算和經(jīng)營管理系統(tǒng)的構成要素也隨之改變。審計人員在進行資料整理的時候,需要面對大量電子數(shù)據(jù)信息,信息系統(tǒng)審計屬于信息環(huán)境中全新的審計方式,其地位日益凸顯。當前審計信息系統(tǒng)所面臨的問題是應對數(shù)據(jù)海量化的挑戰(zhàn),能夠在海量數(shù)據(jù)中有效快速得到規(guī)律及特點,挖掘審計線索,降低審計工作的風險,需要數(shù)據(jù)挖掘技術的支持,這也為審計信息系統(tǒng)的構建及應用提供新的發(fā)展方向[1]。

    一、數(shù)據(jù)挖掘概論

    數(shù)據(jù)挖掘主要是指從大量不完全和有噪音及隨機數(shù)據(jù)信息中提取隱含的信息和知識的過程,數(shù)據(jù)挖掘在信息系統(tǒng)審計工作開展的時候具有重要作用和積極影響,其不僅能夠對信息系統(tǒng)所產(chǎn)生審計業(yè)務數(shù)據(jù)及財務信息等深層次研究,得出其本來所具有的特點和內在聯(lián)系,也可以在模型匹配及挖掘算法的支持下實現(xiàn)信息系統(tǒng)開發(fā)審計和安全審計等各個方面的實際應用,在數(shù)據(jù)挖掘技術和信息系統(tǒng)審計技術的融合下,能夠明確系統(tǒng)控制審計符合文件資料嵌入審計程序所需要采集的信息內容[2]。

    二、異常數(shù)據(jù)及其來源

    數(shù)據(jù)挖掘主要是在計算機技術和軟件支持的基礎上,所獲取的大量模糊的數(shù)據(jù)中提取一些不明顯的規(guī)律,在這一基礎上得出更多有效的知識內容。異常指不一般的數(shù)據(jù),推動人們認識到這些數(shù)據(jù)不屬于原本系統(tǒng)的隨機偏差,多數(shù)情況下是在不同機制的支持下實現(xiàn)的,異常本質和正常數(shù)據(jù)之間差異明顯,個數(shù)和正常數(shù)據(jù)相對比具有對象數(shù)量比較少的特點,通常情況下,異常數(shù)據(jù)的來源主要有相異的類和自然變異及數(shù)據(jù)收集誤差等。

    首先,相異的類屬于數(shù)據(jù)對象的異常,其可能來源于不同的對象,在審計處理的時候,需要分析異常變動數(shù)據(jù),例如資金流量異常變化和異常的交易情況等,這些異常多數(shù)情況下存在著代表性特點,是關注的重要對象。

    其次,自然變異則屬于多數(shù)數(shù)據(jù)在正態(tài)規(guī)律分布的基礎上實現(xiàn)的,通常這些數(shù)據(jù)都比較接近數(shù)據(jù)的中心,而兩邊的數(shù)據(jù)相對較少,例如在營業(yè)收入分析的時候,主營業(yè)務是正常的計算對象,而偶然一次性營業(yè)收入是對象類中的異常情況[3]。

    最后,數(shù)據(jù)測量收集誤差的異常是在設備測量問題比較突出所得出的不正確記錄問題,這些數(shù)據(jù)本身不會提供被審計對象認可的有價值信息支撐,相關數(shù)據(jù)資料不會為去除這些異常,同時注重提高數(shù)據(jù)及數(shù)據(jù)分析的質量。

    三、異常數(shù)據(jù)挖掘算法

    1.基于統(tǒng)計方法的數(shù)據(jù)挖掘算法

    數(shù)據(jù)挖掘算法產(chǎn)生之前,多數(shù)情況下處于異常數(shù)據(jù)的時候是利用剔除法,近些年是基于不同分布的異常檢驗方式進行異常數(shù)據(jù)處理,通常是在不同分布的異常檢驗方式基礎上實現(xiàn)的,在概率分布模型支持下,隨后在某一個顯著性水平上明確得出具體的拒絕域和接受域,如果數(shù)據(jù)落在拒絕域范圍中,將其確定為異常數(shù)據(jù),基于統(tǒng)計的算法受到廣泛關注,實際操作的時候,具有兩種比較簡單快速的異常檢測方式,也就是3σ異常檢測方法和Z統(tǒng)計量法。統(tǒng)計方法本身具有較為堅實的數(shù)學基礎,如果給定相關模型,其本身存在著比較大的指導意義,但是這一方式多數(shù)是在明確單個屬性的情況下實現(xiàn)的,無法有效處理多維空間的異常數(shù)據(jù)。

    2.基于距離方式的數(shù)據(jù)挖掘算法

    基于距離方式的數(shù)據(jù)挖掘算法是基于數(shù)據(jù)點距離進行計算的,其本身具有明顯的幾何解釋,且能夠避免統(tǒng)計方式的局限性特點,其也能夠有效應用到多維數(shù)據(jù)樣本中,而統(tǒng)計方法則不行?;诰嚯x的算法中應用比較多的包含著DB(p,d)方法和k-近鄰方法。DB(p,d)方法的基于距離的異常是沒有充足的另據(jù)的對象。k-近鄰方法的主要思想是為每個對象找到其k個最近的鄰居,在有效對其對象到這k個鄰居的最大的距離分析的情況下,進行對象距離排序處理,得出排序比較靠前的對象作為異常點。

    3.基于密度的數(shù)據(jù)挖掘算法

    基于統(tǒng)計學和距離的異常數(shù)據(jù)方式主要是在給定的數(shù)據(jù)集合的全局分布基礎上實現(xiàn)的,隨后,也要能夠結合明確數(shù)據(jù)分布情況得出當前基于密度的方法是局部離群范圍是遠離的,則可以成為局部離群點,其不將離群點作為二元性質的對象,而僅僅是評估一個對象為離群點的程度[4]。

    四、審計信息系統(tǒng)的異常數(shù)據(jù)挖掘算法的選擇和應用

    在審計數(shù)據(jù)的時候,要求能夠盡快發(fā)現(xiàn)其中的異常數(shù)據(jù),從而達到預警和減少損失的效果,被審計的信息通常情況下都會被儲存到ERP等信息系統(tǒng)中,審計人員也要能夠將數(shù)據(jù)導入到計算機分析數(shù)據(jù)表內,隨后挖掘其所包含著的異常數(shù)據(jù),但是,在企業(yè)信息化更大范圍推廣和數(shù)據(jù)庫并行應用的基礎上,單一的異常數(shù)據(jù)挖掘算法當前無法滿足被審計對象數(shù)據(jù)異常的及時發(fā)展過程中,需要加強對算法的改進和完善[5]。

    1.基本算法

    首先,測量距離的量度相對較為常用的包含著絕對距離和歐式距離,絕對距離的定義為:

    最后,描述算法,如果數(shù)據(jù)集合S中所涉及到的P部分和對象O距離明顯要大于d,對象O也為帶參數(shù)的P和d的給定距離方面具有的異常點。R[k]表示在第一屬性值記錄情況下,假設O(1,2,…,n)按照順序排列,則具體算法如下:第一步選擇中心點,第二步設置初始值和權重向量,第三步WHILE(不滿足結束條件)。

    2.基于單元的異常數(shù)據(jù)算法

    基于單元的孤立點是充分將數(shù)據(jù)劃分為相似的單元格,根據(jù)單元格的坐標及數(shù)據(jù)對象關系有效推動數(shù)據(jù)對象能夠更好地映射到單元格中,從而對其異常點深入檢查和有效確定,對于無法利用單元格的算法也能夠根據(jù)其所具有的距離算法加以解決,首先假設數(shù)據(jù)為二維數(shù)據(jù),隨后向多維數(shù)據(jù)推導[6]。

    (1)經(jīng)典的基于單元的異常點算法

    最早得出基于單元的異常數(shù)據(jù)的算法是可以檢測儲存于內部的存儲數(shù)據(jù)信息,這一算法能夠檢測所有的DB(p,d)異常點,其也存在著一定不足,也就是閾值和距離值屬于常量,并不是動態(tài)調整的,其中閾值首先是不會隨著單元格的位置不同而產(chǎn)生差異,可以在相關分析中得出,如果邊界單元格的第一層鄰居主要為三個或者五個,而其他的單元格顯示為八個,如果是結合單一的閾值,就可以使得邊界處的異常點出現(xiàn)誤判。另外距離值也屬于固定值,在程序給定這一固定值后,對距離值進行計算,在不同的用戶需求分析的時候,也要能夠明確尺度差異,需要存在著不同的距離值,且對比不同的距離值之后產(chǎn)生結果的時候,也會促使問題掌握更加透徹。

    (2)算法的實際調整

    固定閾值對判斷會造成一定影響,而造成這些影響的主要原因是邊界單元格和非邊界單元格之間的差異,因此,對閾值調整的時候,較為有效的方式是判斷單元格是否為邊界單元格,這一問題解決的時候,主要是利用以下公式解決:

    (3)經(jīng)典單元異常挖掘算法的完善擴展

    多維度數(shù)據(jù)始終是沒有問題的。

    五、具體實踐及效果

    為了對算法實際應用效果有效改善,需要在實驗的方式基礎上開展實際驗證,實際數(shù)據(jù)主要是基于電力企業(yè)的2017年~2019年的財務信息和業(yè)務數(shù)據(jù)等收集分析處理,數(shù)據(jù)屬性中主要有52項,其具體的實驗目標是監(jiān)測異常數(shù)據(jù)。硬件環(huán)境Pentium雙核2.1GHz,3.2G內存,硬盤為160G,數(shù)據(jù)庫利主要是利用DB2,程序則實驗net架構編寫。實驗的過程也要清理相關數(shù)據(jù),將中文和字幕等充分轉換為統(tǒng)一編碼數(shù)值數(shù)據(jù),在這一環(huán)境下確定相關的目標數(shù)據(jù)庫,隨后利用算法挖掘的方式得出具有的實驗結果。

    在和原本算法相對比的基礎上,可以得出新的算法對不同數(shù)據(jù)操作時間相對減少,平均的節(jié)約量主要為3%,新的算法也會得到比較多異常數(shù)據(jù)點,在實際實施的時候存在著顯著的指導作用,利用電力企業(yè)的實際應用情況分析,為企業(yè)提供更多舞弊行為的審計證據(jù)。

    六、結語

    在基于距離的經(jīng)典算法擴展的基礎上,能夠對審計對象多類數(shù)據(jù)應用的要求有效滿足,明確得出滿足審計系統(tǒng)的異常數(shù)據(jù)挖掘算法,這一算法也就能夠充分發(fā)現(xiàn)異常數(shù)據(jù),從而減少損失,同時也能夠廣泛在相關商務實踐活動異常數(shù)據(jù)挖掘中具體實施。

    參考文獻:

    [1]潘東陽,劉靜瑞.基于數(shù)理統(tǒng)計的網(wǎng)絡運行異常數(shù)據(jù)挖掘模型構建[J].信息通信,2019,(07):21~22.

    [2]張波,李舸.基于改進聚類算法的Web異常數(shù)據(jù)挖掘軟件設計[J].現(xiàn)代電子技術,2019,42(08):73~76+81.[3]張凱斐,劉繼華,張菊芳.大規(guī)模高維數(shù)據(jù)集中局部異常數(shù)據(jù)挖掘算法[J].微電子學與計算機,2018,35(03):116~119+124.

    [4]向楨,向守兵.基于模糊遺傳算法的數(shù)據(jù)庫異常數(shù)據(jù)挖掘[J].控制工程,2017,24(05):947~951.[5]馬寧,廖慧惠.云計算環(huán)境下頻繁出現(xiàn)異常數(shù)據(jù)挖掘方法研究[J].赤峰學院學報(自然科學版),2017,33(03):31~32.

    [6]王樂,王芳.數(shù)據(jù)庫異常數(shù)據(jù)的檢測仿真研究[J].計算機仿真,2016,33(01):430~433.

    作者簡介:

    毛玲玥,供職于浙江浙能富興燃料有限公司,中級審計師。

    猜你喜歡
    應用
    配網(wǎng)自動化技術的應用探討
    科技視界(2016年21期)2016-10-17 19:54:47
    帶壓堵漏技術在檢修中的應用
    科技視界(2016年21期)2016-10-17 19:54:05
    行列式的性質及若干應用
    科技視界(2016年21期)2016-10-17 18:46:46
    癌癥擴散和治療研究中的微分方程模型
    科技視界(2016年21期)2016-10-17 18:37:58
    紅外線測溫儀在汽車診斷中的應用
    科技視界(2016年21期)2016-10-17 18:28:05
    多媒體技術在小學語文教學中的應用研究
    考試周刊(2016年76期)2016-10-09 08:45:44
    微課的翻轉課堂在英語教學中的應用研究
    大學教育(2016年9期)2016-10-09 08:28:55
    分析膜技術及其在電廠水處理中的應用
    科技視界(2016年20期)2016-09-29 14:22:00
    GM(1,1)白化微分優(yōu)化方程預測模型建模過程應用分析
    科技視界(2016年20期)2016-09-29 12:03:12
    煤礦井下坑道鉆機人機工程學應用分析
    科技視界(2016年20期)2016-09-29 11:47:01
    冀州市| 汕头市| 新郑市| 湄潭县| 泸西县| 静安区| 朔州市| 河东区| 鄂托克旗| 河间市| 高唐县| 本溪| 托克逊县| 乌兰县| 北辰区| 宽甸| 博白县| 灵川县| 永德县| 海南省| 沂水县| 安阳市| 子长县| 崇信县| 葫芦岛市| 凤山县| 大丰市| 景洪市| 遂溪县| 鄄城县| 临清市| 永和县| 海淀区| 稷山县| 林口县| 鹤山市| 玛多县| 杭州市| 玉溪市| 建湖县| 海城市|