摘要:在當(dāng)今社會(huì),隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,人們對(duì)信息交流越來越重視。而審計(jì)是一種特殊且不可缺少的手段?;贐/S架構(gòu)實(shí)現(xiàn)數(shù)據(jù)相似檢測(cè)方法具有一定可行性和實(shí)用性;本文首先介紹了研究背景、研究現(xiàn)狀以及意義;然后分析了現(xiàn)有相似算法存在問題及改進(jìn)方向并提出一些建議,希望能夠給該行業(yè)提供一些參考。
關(guān)鍵詞:B/S構(gòu)架;電子數(shù)據(jù);審計(jì)方法
前言:隨著社會(huì)的快速發(fā)展,互聯(lián)網(wǎng)上越來越多的信息被存儲(chǔ)在數(shù)據(jù)庫中,但是人們對(duì)大量、復(fù)雜和龐大內(nèi)容進(jìn)行分析判斷時(shí)都需要將這些大量非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為可量化且有一定相關(guān)性特征(比如強(qiáng)度等)。傳統(tǒng)基于審計(jì)署提交了年審報(bào)告后再通過人工獲取審計(jì)結(jié)果已不能滿足用戶需求。為了解決這個(gè)問題,因此要開始研究一種新型項(xiàng)目管理方法。
1、基于B/S架構(gòu)的電子數(shù)據(jù)相似檢測(cè)審計(jì)方法研究
研究背景
在當(dāng)今世界,信息技術(shù)已經(jīng)成為社會(huì)經(jīng)濟(jì)發(fā)展的重要組成部分,對(duì)人類生活產(chǎn)生巨大影響,并且是未來科技發(fā)展的方向。審計(jì)作為一種監(jiān)督手段和管理控制工具在經(jīng)濟(jì)領(lǐng)域中發(fā)揮著越來越大作用。從最初開始研究審計(jì)概念到現(xiàn)在電子數(shù)據(jù)技術(shù)、數(shù)據(jù)庫等方面,都有很多成功的應(yīng)用,相似檢測(cè)方法進(jìn)行分析與評(píng)估從而得出結(jié)論,并以此為標(biāo)準(zhǔn)來制定相關(guān)政策以達(dá)到提高效率減少成本支出的目的。
研究現(xiàn)狀
在目前的社會(huì)中,數(shù)據(jù)挖掘是一項(xiàng)熱門研究領(lǐng)域。對(duì)于人們來說,無論是大到國家還是小到一個(gè)企業(yè)或者機(jī)構(gòu)都需要大量的時(shí)間和精力去處理這些海量信息。而這個(gè)龐大規(guī)模巨大數(shù)據(jù)庫里存儲(chǔ)了各種各樣有價(jià)值、具有廣泛用途以及潛在意義等,是可靠有效的數(shù)據(jù)來源途徑之一。
研究意義
基于B/S架構(gòu)的電子數(shù)據(jù)相似檢測(cè)方法是一個(gè)結(jié)合了實(shí)時(shí)性、安全性等特點(diǎn)并運(yùn)用到審計(jì)過程中,解決傳統(tǒng)審計(jì)問題不足,提高效率和降低成本的一種新技術(shù),實(shí)現(xiàn)無紙化辦公方式下具有重要意義。
2、相似檢測(cè)方法的定義
B/S結(jié)構(gòu)的審計(jì)方法是基于相似理論、邏輯分析和一致性驗(yàn)證等,然后根據(jù)實(shí)際項(xiàng)目,對(duì)數(shù)據(jù)進(jìn)行測(cè)試,從而確定相似程度。在傳統(tǒng)的類似項(xiàng)目的判定過程中通常采用以下幾個(gè)步驟:首先要收集相關(guān)業(yè)務(wù)需求文檔;接著通過工作說明書來判斷是否可以將其分類到不同類型或類別上;最后再進(jìn)行相似性度量并建立相應(yīng)標(biāo)準(zhǔn)模型用來衡量被審計(jì)對(duì)象之間差異性大小以及可接受度等指標(biāo)。
3、相似檢測(cè)方法的工作原理
3.1、相似檢測(cè)的參數(shù)設(shè)置
在相似測(cè)試中,數(shù)據(jù)的獲取是以被測(cè)項(xiàng)目為基礎(chǔ),并根據(jù)其對(duì)應(yīng)需求進(jìn)行分類。特征選擇及提取是利用虛擬學(xué)習(xí)算法從數(shù)據(jù)庫上獲得審計(jì)對(duì)象的相關(guān)信息和屬性來確定待測(cè)項(xiàng)目的類型、內(nèi)容等關(guān)鍵特性以及適用范圍;同時(shí)對(duì)所要實(shí)施推薦方案或其他重要事項(xiàng)進(jìn)行詳細(xì)描述以便于理解與使用;最后在相似測(cè)試中需要考慮的是數(shù)據(jù)處理方法,即如何將不同項(xiàng)目之間的關(guān)系映射到同一文檔當(dāng)中去并保存其特征。
3.2、記錄相似度的算法和度量
字符型字段相似度的計(jì)算方法
傳統(tǒng)的字符型相似度算法是將待測(cè)漢字集進(jìn)行了一定時(shí)間間隔內(nèi)相似性,然后再利用模板匹配來計(jì)算出各個(gè)字段之間存在相同或相似之處。但是這種方法在對(duì)所有文字都能判別出來時(shí)具有明顯優(yōu)勢(shì):對(duì)于同一個(gè)文本來說,可以用同樣的方式去判定與其他字體間是否相同。然而如果兩個(gè)不同字的間隔比較大的話則會(huì)導(dǎo)致無法找到一個(gè)合適距離作為參考字符進(jìn)行比較;在進(jìn)行基于相似的方法檢測(cè)時(shí),其原理和其他算法一樣,但是最大不同之處就是字間隔比較大。因?yàn)閷?duì)于數(shù)據(jù)而言比字符間隔較小的時(shí)候采用的是傳統(tǒng)法,或者是采用B/S技術(shù)來對(duì)連續(xù)化圖像中出現(xiàn)相同字符像素點(diǎn)作對(duì)比。這種算法雖然計(jì)算量相對(duì)來說不大,而且很直觀容易操作,但由于沒有具體到某一特定值上就會(huì)導(dǎo)致結(jié)果不真實(shí)等問題。
數(shù)值型字段的相似度計(jì)算方法
數(shù)據(jù)的特征相似度是指,對(duì)同一個(gè)待測(cè)項(xiàng)目,在一定時(shí)間內(nèi)不同時(shí)間下進(jìn)行比較分析得出結(jié)論。基于關(guān)聯(lián)規(guī)則的方法。該算法采用了一種從整體上計(jì)算待測(cè)試項(xiàng)目的部分與總體之間聯(lián)系程度來判斷項(xiàng)目是否具有重復(fù)性、關(guān)聯(lián)性和相似性等特性指標(biāo);另外利用計(jì)算公式將數(shù)據(jù)集與具體屬性集合相乘后得到項(xiàng)目特征相似度結(jié)果,并對(duì)其進(jìn)行評(píng)價(jià)從而為審計(jì)工作提供參考依據(jù)。
布爾型字段的相似度計(jì)算方法
基于布爾碼的相似度計(jì)算方法是一種對(duì)數(shù)據(jù)進(jìn)行關(guān)聯(lián)性測(cè)試,首先,將待測(cè)項(xiàng)目和已知項(xiàng)目之間建立一個(gè)簡(jiǎn)單模態(tài)模型。然后根據(jù)已有系統(tǒng)中相同指標(biāo)的統(tǒng)計(jì)分布情況,來確定該序列是否具有公共項(xiàng)特征屬性(例如:時(shí)間、距離、位置等)。并以此為基礎(chǔ)訓(xùn)練出對(duì)應(yīng)于各子樣點(diǎn)或者某幾個(gè)特定類別的相似度函數(shù)關(guān)系式;最后再利用這些關(guān)系式計(jì)算出新數(shù)據(jù)所屬類。
4、存在的問題
基于B/S架構(gòu)的電子數(shù)據(jù)相似檢測(cè)方法是一種非常有效且成熟實(shí)用的解決思路。該算法采用的是以審計(jì)署信息化司為核心,由其他相關(guān)業(yè)務(wù)單位支持,對(duì)采集來到數(shù)據(jù)庫中存儲(chǔ)著所有與年檢、統(tǒng)計(jì)等信息進(jìn)行分析處理。但是由于系統(tǒng)內(nèi)部存在大量復(fù)雜結(jié)構(gòu)和關(guān)系型應(yīng)用需求導(dǎo)致了此方式計(jì)算繁瑣、效率低下并且需要額外配置相應(yīng)硬件和軟件資源;此外因?yàn)閿?shù)據(jù)接口是一個(gè)非面向異構(gòu)的映射文件或封裝文件而造成了審計(jì)困難以及成本高等問題。 基于B/S架構(gòu)的電子數(shù)據(jù)相似檢測(cè)方法在實(shí)際運(yùn)用中,存在以下幾點(diǎn)問題有待進(jìn)一步改進(jìn):
在B/S架構(gòu)中,將兩個(gè)或多個(gè)審計(jì)單位的數(shù)據(jù)進(jìn)行合并,這就導(dǎo)致了大量冗余信息。因此需要通過相似測(cè)試來處理這些龐大且不易提取、不可靠的大樣本。而傳統(tǒng)方法是基于一定時(shí)間內(nèi)對(duì)同一被測(cè)實(shí)體是否相同進(jìn)行人工獲取審計(jì)證據(jù)并以此為依據(jù)判斷分析結(jié)果;但是這種方式耗時(shí)長耗力而且難以保證其準(zhǔn)確性和客觀性;
由于審計(jì)署是一個(gè)具有獨(dú)立性和權(quán)威性的部門,而各個(gè)區(qū)縣市也都有自己管轄區(qū)域名。因此如果利用傳統(tǒng)技術(shù)手段的話會(huì)浪費(fèi)大量人力物力成本。但是使用基于B/S架構(gòu)下對(duì)所有區(qū)域進(jìn)行測(cè)試分析、處理以及判斷得出結(jié)論是否可以應(yīng)用到實(shí)際情況中去,并且在數(shù)據(jù)采集之后的結(jié)果整理方面更加細(xì)致化了審計(jì)人員工作效率和難度;并且B/S架構(gòu)下對(duì)數(shù)據(jù)存儲(chǔ)和分析利用更加高效,在提高審計(jì)效率的同時(shí)減少了人為失誤。
5、解決措施
在審計(jì)過程中,要保證數(shù)據(jù)的準(zhǔn)確性、完整性,就必須嚴(yán)格遵守相關(guān)法律法規(guī)。所以可以從以下幾個(gè)方面來采取措施。首先,分析在傳統(tǒng)的審計(jì)方法中,數(shù)據(jù)相似檢測(cè)是最基礎(chǔ)、最有效也最為重要的一種。但是由于這種基于歷史文獻(xiàn)或現(xiàn)有審計(jì)技術(shù)上假設(shè)性錯(cuò)誤而造成無效工作量和效率低下等問題。所以需要對(duì)這些問題進(jìn)行深入研究并提出改進(jìn)措施來提高相似測(cè)試結(jié)果質(zhì)量;其次,要建立一個(gè)具有通用性質(zhì)(即統(tǒng)一使用)且可以在不同環(huán)境下同時(shí)應(yīng)用多種接口方式,從而實(shí)現(xiàn)相同數(shù)據(jù)源之間、不同數(shù)據(jù)源與系統(tǒng)間的關(guān)聯(lián)關(guān)系的檢測(cè)方法。最后,在這個(gè)基礎(chǔ)上設(shè)計(jì)一種基于B/S架構(gòu)的數(shù)據(jù)相似檢測(cè)方法。該算法能夠解決傳統(tǒng)審計(jì)方式無法處理海量數(shù)據(jù)庫中數(shù)據(jù)間關(guān)系和存貯等一系列問題。
總結(jié):在傳統(tǒng)的基于相似鍵測(cè)試中,利用B/S結(jié)構(gòu)來實(shí)現(xiàn)同一類項(xiàng)目的內(nèi)部相同和不同類別數(shù)據(jù)之間相互關(guān)聯(lián)。這種方法既能減少人力物力資源又可以避免人為因素造成不必要損失并提高效率。
參考文獻(xiàn):
[1]許莉.一種基于B/S架構(gòu)的電子天平數(shù)據(jù)自動(dòng)記錄及分析系統(tǒng)[J].衡器,2018,47(07):33-34.
[2]陳文佳.基于B/S架構(gòu)的電子數(shù)據(jù)相似檢測(cè)審計(jì)方法研究[J].現(xiàn)代經(jīng)濟(jì)信息,2017(02):215-216.
[3]李偉,白冰,毛鵬舉.基于B/S架構(gòu)的電子表格數(shù)據(jù)上報(bào)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].電腦編程技巧與維護(hù),2016(05):46-47.
個(gè)人簡(jiǎn)介
朱曉,出生年月日:1981年11月1日,男,漢,江蘇無錫人,本科,工作崗位:技術(shù),目前在無錫飛威信息系統(tǒng)有限公司 從事數(shù)據(jù)固定以及恢復(fù)等相關(guān)工作
無錫飛威信息系統(tǒng)有限公司 214000