梁偉
[摘要]本文將大數(shù)據(jù)技術(shù)與審計(jì)業(yè)務(wù)有機(jī)結(jié)合,深度探討了大數(shù)據(jù)在公安采購(gòu)項(xiàng)目審計(jì)監(jiān)督中的應(yīng)用,通過案例,構(gòu)建“三維一體”大數(shù)據(jù)分析模型對(duì)電子投標(biāo)文件進(jìn)行全面解析,從投標(biāo)文件之間的整體相似度、重復(fù)的文本內(nèi)容和雷同的圖像信息三個(gè)維度為審計(jì)人員發(fā)現(xiàn)圍標(biāo)串標(biāo)線索提供綜合性參考和重要證據(jù)支撐。
[關(guān)鍵詞]內(nèi)部審計(jì)? ?大數(shù)據(jù)? ?模型? ?公安采購(gòu)項(xiàng)目? ?圍標(biāo)串標(biāo)
2015年10月,在黨的十八屆五中全會(huì)提出實(shí)
施國(guó)家大數(shù)據(jù)戰(zhàn)略,大數(shù)據(jù)技術(shù)在各行各業(yè)得到廣泛應(yīng)用,有力推動(dòng)了經(jīng)濟(jì)發(fā)展、促進(jìn)社會(huì)治理完善、助力提升政府服務(wù)和監(jiān)管能力。公安機(jī)關(guān)內(nèi)部審計(jì)面對(duì)海量的業(yè)務(wù)數(shù)據(jù)和日益繁重的審計(jì)任務(wù),傳統(tǒng)審計(jì)模式已經(jīng)無(wú)法滿足新時(shí)代公安發(fā)展的需求。公安機(jī)關(guān)建設(shè)項(xiàng)目數(shù)量多、警用物資和裝備采購(gòu)頻繁、合同金額巨大,風(fēng)險(xiǎn)隱患與日俱增,對(duì)采購(gòu)項(xiàng)目的監(jiān)督更是擺在所有審計(jì)人員面前的一道難題。內(nèi)部審計(jì)作為新時(shí)代公安特色大監(jiān)督格局的重要組成部分,要嚴(yán)格落實(shí)審計(jì)專門監(jiān)督職責(zé)和發(fā)揮“治已病、防未病”的作用,就必須將大數(shù)據(jù)技術(shù)與公安審計(jì)業(yè)務(wù)深度融合,進(jìn)一步提升精準(zhǔn)監(jiān)督效能,以有力有效的審計(jì)監(jiān)督服務(wù)助力公安事業(yè)高質(zhì)量發(fā)展。
一、公安采購(gòu)項(xiàng)目審計(jì)監(jiān)督存在的問題與機(jī)遇
(一)當(dāng)前存在的問題
1.采購(gòu)任務(wù)重周期長(zhǎng),過程復(fù)雜專業(yè)性強(qiáng)。公安機(jī)關(guān)每年的物資采購(gòu)和項(xiàng)目建設(shè)任務(wù)繁重,以重慶市公安局九龍坡區(qū)公安分局為例,平均每年分局審計(jì)部門需參與監(jiān)督的采購(gòu)項(xiàng)目有上百個(gè),每個(gè)采購(gòu)項(xiàng)目的完成要?dú)v經(jīng)立項(xiàng)、審批、預(yù)算、采購(gòu)、合同、驗(yàn)收和付款等多個(gè)階段,可以說周期長(zhǎng)環(huán)節(jié)多,審計(jì)部門疲于應(yīng)付,監(jiān)督效果欠佳。楊榮機(jī)等(2022)認(rèn)為,公安審計(jì)人員不再是單一的財(cái)務(wù)監(jiān)督人員,不僅要有審計(jì)和財(cái)務(wù)基礎(chǔ)知識(shí),還要掌握工程造價(jià)、項(xiàng)目管理和招投標(biāo)等相關(guān)專業(yè)知識(shí)。當(dāng)前大多數(shù)公安審計(jì)人員僅僅停留在采購(gòu)項(xiàng)目的程序性監(jiān)督上,受限于時(shí)間精力和專業(yè)性的知識(shí)背景,審計(jì)監(jiān)督難以深入。
2.審計(jì)人員力量單薄,信息化應(yīng)用水平低。目前全國(guó)各地公安機(jī)關(guān)內(nèi)部審計(jì)普遍面臨人員少和審計(jì)任務(wù)重的問題。以江蘇為例,全省公安機(jī)關(guān)審計(jì)人員不足300人,每年經(jīng)濟(jì)責(zé)任審計(jì)項(xiàng)目數(shù)量卻多達(dá)上千個(gè),如果加上專項(xiàng)審計(jì)和其他審計(jì)調(diào)查任務(wù),審計(jì)人員的任務(wù)更加艱巨。且公安審計(jì)隊(duì)伍中信息化專業(yè)人才少,信息化應(yīng)用整體水平偏低,大部分人員只能勉強(qiáng)使用一些簡(jiǎn)單的財(cái)會(huì)軟件。例如,重慶市公安局于2019年組建了公安審計(jì)人才庫(kù),共有122名入庫(kù)人員,其中審計(jì)類和財(cái)務(wù)類人員分別為72名和32名,而信息化人員14名,占比僅為11.5%,且實(shí)際從事公安審計(jì)崗位的信息化專業(yè)人員更少。
3.規(guī)章制度日趨完善,違規(guī)行為更加隱蔽。隨著巡視巡察、審計(jì)監(jiān)督和各類財(cái)務(wù)交叉檢查的深入推進(jìn),各級(jí)部門的規(guī)章制度日益完善,采購(gòu)程序逐漸規(guī)范。采購(gòu)項(xiàng)目管理和采購(gòu)程序的規(guī)范并不意味著違規(guī)行為的消失,反而會(huì)使違規(guī)行為更加隱蔽。尤其在當(dāng)前經(jīng)濟(jì)下行壓力下,供應(yīng)商為獲得業(yè)務(wù)訂單鋌而走險(xiǎn)時(shí)將更加謹(jǐn)慎,這給審計(jì)人員發(fā)現(xiàn)問題增加了難度。
4.應(yīng)急采購(gòu)時(shí)有發(fā)生,監(jiān)督能力明顯不足。部分公安機(jī)關(guān)的應(yīng)急物資采購(gòu)和保障機(jī)制存在許多短板和漏洞,面臨較大考驗(yàn)。每次應(yīng)急采購(gòu)的需求和情形都不一樣,審計(jì)監(jiān)督的重點(diǎn)、內(nèi)容和方法也都不同,因此每次應(yīng)急采購(gòu)對(duì)審計(jì)監(jiān)督都是一次全新的考驗(yàn),傳統(tǒng)公安審計(jì)模式已無(wú)法適應(yīng),迫使公安審計(jì)部門創(chuàng)新工作方法,提高審計(jì)效能。例如,2020年新冠疫情發(fā)生后,國(guó)家和各地方政府先后出臺(tái)了關(guān)于開通緊急采購(gòu)防疫物資綠色通道的相關(guān)文件,這些文件的出臺(tái)對(duì)審計(jì)監(jiān)督提出了更高要求,既要保障防疫物資按時(shí)采購(gòu)到位,又要保證財(cái)政資金安全。
(二)新的發(fā)展機(jī)遇
1.審計(jì)委員會(huì)陸續(xù)成立,組織保障更加有力。2022年4月重慶市公安局黨委成立了審計(jì)委員會(huì),隨后全市各區(qū)縣公安機(jī)關(guān)審計(jì)委員會(huì)或?qū)徲?jì)工作領(lǐng)導(dǎo)小組也陸續(xù)成立。公安機(jī)關(guān)審計(jì)委員會(huì)的成立進(jìn)一步優(yōu)化了公安審計(jì)職責(zé),將紀(jì)檢監(jiān)察、組織人事、督察法制、警務(wù)保障等“大監(jiān)督”格局相關(guān)部門的監(jiān)督力量整合起來(lái),壯大了審計(jì)力量,保障了審計(jì)部門依法獨(dú)立行使監(jiān)督權(quán),有助于解決原有審計(jì)監(jiān)督覆蓋范圍過窄、監(jiān)督獨(dú)立性和權(quán)威性不強(qiáng)、體制機(jī)制不暢等突出問題。
2.科技強(qiáng)警持續(xù)深入,大數(shù)據(jù)賦能成效初顯。在公安改革創(chuàng)新和大數(shù)據(jù)賦能警務(wù)的不斷推進(jìn)下,公安機(jī)關(guān)自身業(yè)務(wù)產(chǎn)生了大量數(shù)據(jù),并且從社會(huì)單位采集了海量數(shù)據(jù)用于公安業(yè)務(wù)工作。目前,重慶市公安局已打造警務(wù)云支撐平臺(tái),整合全局應(yīng)用系統(tǒng)改造上云,全局民警可按權(quán)限使用;同時(shí)積極開展數(shù)據(jù)匯聚治理共享工作,在匯聚不同行業(yè)的數(shù)據(jù)后按照統(tǒng)一標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)治理,數(shù)據(jù)建模平臺(tái)上已開發(fā)數(shù)十個(gè)模型算子。2021年12月,重慶市公安局在全國(guó)公安審計(jì)隊(duì)伍中率先舉辦了公安審計(jì)大數(shù)據(jù)比武,進(jìn)一步提升了審計(jì)人員的大數(shù)據(jù)運(yùn)用水平,擴(kuò)展了審計(jì)思維。
3.網(wǎng)上采購(gòu)更加便捷,智慧監(jiān)督提質(zhì)增效。自重慶市財(cái)政局開通“采購(gòu)云”和“行采家”平臺(tái)以來(lái),各級(jí)部門可以直接登錄系統(tǒng)在網(wǎng)上實(shí)施采購(gòu),極大提升了采購(gòu)效率。例如,九龍坡公安分局2022年在網(wǎng)上平臺(tái)完成了42個(gè)采購(gòu)項(xiàng)目,占全年采購(gòu)項(xiàng)目數(shù)量的40.38%,節(jié)約財(cái)政資金170.93萬(wàn)元。在網(wǎng)上平臺(tái)完成的采購(gòu)項(xiàng)目均有完整的電子數(shù)據(jù),包括需求文件、響應(yīng)文件、電子合同等重要信息,這為大數(shù)據(jù)審計(jì)提供了重要的數(shù)據(jù)基礎(chǔ)。采購(gòu)行為已經(jīng)逐步從線下向線上轉(zhuǎn)移,審計(jì)監(jiān)督也應(yīng)當(dāng)緊跟采購(gòu)方式的轉(zhuǎn)移步伐,通過大數(shù)據(jù)建模對(duì)網(wǎng)上采購(gòu)信息數(shù)據(jù)進(jìn)行分析,提升公安采購(gòu)項(xiàng)目審計(jì)監(jiān)督質(zhì)效。
二、大數(shù)據(jù)審計(jì)在采購(gòu)項(xiàng)目監(jiān)督中的應(yīng)用探討
(一)大數(shù)據(jù)審計(jì)的原理
1.大數(shù)據(jù)技術(shù)的內(nèi)涵。大數(shù)據(jù)在互聯(lián)網(wǎng)上被定義為無(wú)法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)具有4V特點(diǎn):大量(Volume)、快速(Velocity)、多樣性(Variety)、真實(shí)性(Veracity)。鄔賀銓(2013)認(rèn)為大數(shù)據(jù)帶來(lái)的挑戰(zhàn)體現(xiàn)在對(duì)數(shù)據(jù)的收集、存儲(chǔ)、處理及結(jié)果的可視化,因此,大數(shù)據(jù)技術(shù)就是具有更強(qiáng)決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力,對(duì)海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)的新型處理模式方法的統(tǒng)稱。
2.大數(shù)據(jù)審計(jì)的特征。大數(shù)據(jù)審計(jì)就是將大數(shù)據(jù)技術(shù)應(yīng)用于審計(jì)業(yè)務(wù),對(duì)被審計(jì)單位的所有電子數(shù)據(jù)進(jìn)行采集、挖掘和分析,大數(shù)據(jù)審計(jì)是審計(jì)信息化發(fā)展到一定階段的產(chǎn)物。孫夢(mèng)蝶(2018)從數(shù)據(jù)層面、技術(shù)層面和應(yīng)用層面對(duì)大數(shù)據(jù)審計(jì)進(jìn)行了研究,認(rèn)為大數(shù)據(jù)審計(jì)可以處理多種類型數(shù)據(jù)、跨越不同行業(yè)、應(yīng)用于不同領(lǐng)域,并助推審計(jì)全覆蓋的實(shí)現(xiàn)。
(二)在采購(gòu)項(xiàng)目審計(jì)監(jiān)督中的應(yīng)用探討
公安機(jī)關(guān)建設(shè)項(xiàng)目數(shù)量多、增速快、金額大,特別是信息化項(xiàng)目投資金額逐年倍增,隱性風(fēng)險(xiǎn)持續(xù)增長(zhǎng);在基建設(shè)施、警務(wù)保障、裝備采購(gòu)、信息化項(xiàng)目招投標(biāo)過程中,圍標(biāo)串標(biāo)的現(xiàn)象仍有發(fā)生。審計(jì)部門應(yīng)根據(jù)工作實(shí)際,突出重點(diǎn)、選準(zhǔn)靶標(biāo)、精準(zhǔn)施策,在采購(gòu)項(xiàng)目領(lǐng)域結(jié)合大數(shù)據(jù)審計(jì)方法重點(diǎn)開展以下四個(gè)方面的應(yīng)用。
1.在供貨商資質(zhì)及股權(quán)關(guān)系監(jiān)督方面。為驗(yàn)明供貨商資質(zhì)真?zhèn)渭巴稑?biāo)人之間、法人和股東的關(guān)聯(lián)線索,需要獲取供應(yīng)商的工商信息。在審計(jì)實(shí)踐中,審計(jì)人員通常在網(wǎng)上進(jìn)行手工查詢或親自到工商部門查詢,工作效率較低。利用大數(shù)據(jù)技術(shù),通過網(wǎng)絡(luò)爬蟲可以快速便捷地在互聯(lián)網(wǎng)上采集工商信息和資質(zhì)信用信息,將供貨商法人和股東信息與公安戶籍人口數(shù)據(jù)關(guān)聯(lián)起來(lái),分析是否存在親屬關(guān)系以及股權(quán)勾連的情況。
2.在商品采購(gòu)價(jià)格監(jiān)督方面。商品采購(gòu)容易產(chǎn)生以次充好、低配高價(jià)和競(jìng)爭(zhēng)不充分等問題,商品采購(gòu)價(jià)格是否合理是審計(jì)的重要內(nèi)容。公安機(jī)關(guān)每年采購(gòu)的商品品種多、數(shù)量大,審計(jì)人員同樣可以通過網(wǎng)絡(luò)爬蟲技術(shù),定期抓取國(guó)內(nèi)主流電商常用商品的價(jià)格數(shù)據(jù),建立內(nèi)部動(dòng)態(tài)價(jià)格庫(kù),定期對(duì)價(jià)格數(shù)據(jù)進(jìn)行更新,對(duì)相應(yīng)時(shí)期價(jià)格異常和價(jià)格虛高的采購(gòu)實(shí)行重點(diǎn)監(jiān)督。
3.在采購(gòu)商品入庫(kù)監(jiān)督方面。采購(gòu)的商品是否入庫(kù)并納入固定資產(chǎn)管理,是驗(yàn)證采購(gòu)行為真實(shí)性和完整性的重要依據(jù)。按照相關(guān)規(guī)定,金額較大的商品或者批量采購(gòu)的非易耗品應(yīng)當(dāng)及時(shí)入庫(kù),審計(jì)人員可以將審計(jì)期間符合入庫(kù)要求的采購(gòu)商品清單與固定資產(chǎn)臺(tái)賬,通過商品名稱和商品型號(hào)進(jìn)行關(guān)聯(lián),如果有未能匹配的數(shù)據(jù),則說明存在未入庫(kù)的情況,涉嫌虛報(bào)采購(gòu)數(shù)量,應(yīng)當(dāng)重點(diǎn)關(guān)注。
4.在驗(yàn)收和付款審計(jì)監(jiān)督方面。首先批量提取合同開始時(shí)間、履約周期和結(jié)束時(shí)間,利用EXCEL、SQL查詢等工具分析出是否存在履約超期和驗(yàn)收滯后的問題。針對(duì)付款環(huán)節(jié),批量提取合同金額,結(jié)合OCR技術(shù)智能識(shí)別發(fā)票內(nèi)容,可以分析發(fā)票真?zhèn)?,同時(shí)比對(duì)合同金額與發(fā)票金額是否一致,可以查證是否存在虛開發(fā)票、未足額付款或者超額支付等問題。
(三)采購(gòu)項(xiàng)目審計(jì)監(jiān)督平臺(tái)的設(shè)計(jì)
要解決當(dāng)前采購(gòu)項(xiàng)目審計(jì)監(jiān)督中存在的問題,應(yīng)當(dāng)對(duì)現(xiàn)有的審計(jì)監(jiān)督業(yè)務(wù)進(jìn)行重構(gòu),打通各個(gè)監(jiān)督環(huán)節(jié)的信息通道,破除數(shù)據(jù)壁壘,暢通消息共享機(jī)制。在大數(shù)據(jù)環(huán)境下,采購(gòu)項(xiàng)目的審計(jì)監(jiān)督應(yīng)該堅(jiān)持“以數(shù)據(jù)為基礎(chǔ)、以大數(shù)據(jù)技術(shù)為手段、以采購(gòu)業(yè)務(wù)邏輯為核心、以審計(jì)應(yīng)用為最終目標(biāo)”的原則。因此,可以將審計(jì)監(jiān)督平臺(tái)構(gòu)建為由數(shù)據(jù)層、技術(shù)層、數(shù)據(jù)治理層、業(yè)務(wù)層和應(yīng)用層組成的智能監(jiān)督體系,具體如圖1所示。
1.數(shù)據(jù)層。數(shù)據(jù)層包含了審計(jì)監(jiān)督平臺(tái)所需的數(shù)據(jù)信息,是整個(gè)系統(tǒng)的基礎(chǔ)。各部門應(yīng)當(dāng)根據(jù)實(shí)際情況,從工商企業(yè)數(shù)據(jù)、國(guó)家信用數(shù)據(jù)、第三方數(shù)據(jù)以及本單位內(nèi)部的采購(gòu)數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)中獲取數(shù)據(jù)集,為大數(shù)據(jù)分析做準(zhǔn)備。數(shù)據(jù)層提供了審計(jì)所需各類數(shù)據(jù)的訪問接口,可以將孤立數(shù)據(jù)整合在一起。
2.技術(shù)層。運(yùn)用大數(shù)據(jù)技術(shù)手段,與底層數(shù)據(jù)集進(jìn)行連接,獲取審計(jì)監(jiān)督系統(tǒng)所需數(shù)據(jù),打通數(shù)據(jù)訪問通道?,F(xiàn)在常用的大數(shù)據(jù)技術(shù)手段包括網(wǎng)絡(luò)爬蟲、圖像識(shí)別、OCR技術(shù)、語(yǔ)音識(shí)別以及數(shù)據(jù)挖掘和文本分析等。技術(shù)層也可以為應(yīng)用層提供支撐,例如,通過機(jī)器學(xué)習(xí)和專家系統(tǒng)進(jìn)行數(shù)據(jù)建模,能夠有效地分析業(yè)務(wù)數(shù)據(jù)的發(fā)展趨勢(shì)。
3.數(shù)據(jù)治理層。數(shù)據(jù)治理是大數(shù)據(jù)發(fā)展最重要的工作之一。現(xiàn)階段獲取的大量數(shù)據(jù)存在很多非結(jié)構(gòu)化數(shù)據(jù),這樣的數(shù)據(jù)不能直接使用,而數(shù)據(jù)治理層就是要解決數(shù)據(jù)生產(chǎn)和數(shù)據(jù)使用之間不匹配的矛盾,是對(duì)數(shù)據(jù)的再整理和再加工的過程??梢酝ㄟ^數(shù)據(jù)清洗、轉(zhuǎn)換、篩選、關(guān)聯(lián)、比對(duì)等方法生成結(jié)構(gòu)化數(shù)據(jù),并存入審計(jì)關(guān)系型數(shù)據(jù)庫(kù)中,治理后的數(shù)據(jù)可以直接用于業(yè)務(wù)邏輯需求和應(yīng)用分析。
4.業(yè)務(wù)層。立足于項(xiàng)目采購(gòu)的業(yè)務(wù)邏輯,全面梳理各個(gè)采購(gòu)流程,將立項(xiàng)、招投標(biāo)、采購(gòu)、合同、履約、入庫(kù)驗(yàn)收及付款等環(huán)節(jié)全部納入監(jiān)督系統(tǒng),形成審計(jì)監(jiān)督閉環(huán),從根本上解決各環(huán)節(jié)之間信息不通和反饋滯后的問題,將事前控制、事中跟蹤和事后審計(jì)有機(jī)結(jié)合起來(lái)。隨著采購(gòu)進(jìn)度的推進(jìn),每個(gè)采購(gòu)項(xiàng)目自身會(huì)產(chǎn)生許多業(yè)務(wù)數(shù)據(jù),這些業(yè)務(wù)數(shù)據(jù)將和數(shù)據(jù)治理后的數(shù)據(jù)一起供應(yīng)用層分析使用。
5.應(yīng)用層。根據(jù)不同的審計(jì)事項(xiàng)和目標(biāo),通過與技術(shù)層連接構(gòu)建不同的大數(shù)據(jù)模型,為審計(jì)人員進(jìn)行全方位的風(fēng)險(xiǎn)預(yù)警,如價(jià)格異常預(yù)警、圍標(biāo)串標(biāo)預(yù)警、采購(gòu)舞弊預(yù)警等。同時(shí)大數(shù)據(jù)模型還可以進(jìn)行綜合分析、趨勢(shì)分析、績(jī)效分析等,從多個(gè)維度和多個(gè)視角對(duì)數(shù)據(jù)進(jìn)行全面分析,再通過圖像、表格和文字等方式綜合呈現(xiàn)分析結(jié)果,為審計(jì)人員提供清晰易懂、智能高效的決策參考。
三、大數(shù)據(jù)審計(jì)在采購(gòu)項(xiàng)目監(jiān)督中的應(yīng)用案例
(一)案例背景
某地一工程建設(shè)項(xiàng)目進(jìn)行公開招標(biāo),共有4家建筑公司前來(lái)投標(biāo),分別為A、B、C和D。4家公司均提供了電子投標(biāo)文件,現(xiàn)要求進(jìn)一步審查4家公司投標(biāo)文件的實(shí)質(zhì)性內(nèi)容,探究是否存在圍標(biāo)串標(biāo)的嫌疑。
(二)“三維一體”智能分析模型
投標(biāo)文件是供應(yīng)商響應(yīng)招標(biāo)文件內(nèi)容和要求的重要信息載體,深入分析投標(biāo)文件的內(nèi)容能夠發(fā)現(xiàn)其背后隱藏的“秘密”。針對(duì)案例中的審計(jì)需要,審計(jì)人員通過大數(shù)據(jù)技術(shù)從文本、表格和圖片3個(gè)方面對(duì)投標(biāo)文件進(jìn)行全面分析,構(gòu)建“三維一體”智能分析模型,輔助審計(jì)人員快速發(fā)現(xiàn)圍標(biāo)串標(biāo)線索。
1.文本分析。文本分析的目的是挖掘出投標(biāo)文件中文本內(nèi)容之間的關(guān)聯(lián)性,本案例通過余弦相似度算法來(lái)計(jì)算投標(biāo)文件之間內(nèi)容的整體相似度,通過N-Gram算法計(jì)算出投標(biāo)文件之間內(nèi)容重復(fù)的字符串。將余弦相似度算法結(jié)合N-Gram算法,可以快速分析出投標(biāo)文件的整體相似度以及重復(fù)的內(nèi)容。
①余弦相似度。對(duì)文本A和文本B進(jìn)行分析時(shí),分別將A和B文本內(nèi)容進(jìn)行分詞并組成一個(gè)集合,然后依次統(tǒng)計(jì)各個(gè)分詞出現(xiàn)的頻率,再將分詞和詞頻組成一個(gè)向量,兩個(gè)文本的相似度則可以通過文本向量之間夾角的余弦值來(lái)表示,余弦值越大則相似度越高,如果余弦值為1則表明兩個(gè)文本完全相似。
②N-Gram算法。分別將A和B兩個(gè)文本的內(nèi)容以N字符為長(zhǎng)度進(jìn)行切割并分別組成切割好的字符串集合,再將兩個(gè)集合中的字符串遍歷比較,能夠快速找出內(nèi)容一致的字符串,最后將這些字符串去重,便能得到連續(xù)重復(fù)N個(gè)字符以上的內(nèi)容。當(dāng)通過N-Gram算法對(duì)投標(biāo)文件分析時(shí),不管將文件中的段落和語(yǔ)句內(nèi)容如何調(diào)整順序,都不會(huì)影響分析結(jié)果。
2.圖像識(shí)別。運(yùn)用圖像識(shí)別技術(shù)可以計(jì)算出投標(biāo)文件之間有無(wú)高度相似或雷同的圖片。本文利用OpenCV模塊庫(kù)功能進(jìn)行圖像的感知哈希值計(jì)算,比對(duì)圖像之間的相似度,當(dāng)計(jì)算出來(lái)的漢明距離越小,圖像的相似度越大。在圖像識(shí)別領(lǐng)域,一般認(rèn)為當(dāng)漢明距離小于5時(shí),兩張圖片高度相似。如果不同的標(biāo)書存在雷同的圖片,則圍標(biāo)串標(biāo)的可能性很大。
3.模型實(shí)現(xiàn)。本模型利用計(jì)算機(jī)語(yǔ)言Python編程實(shí)現(xiàn)。首先讀取投標(biāo)文件,將每個(gè)投標(biāo)文件分別解析為文本信息、表格信息和圖像信息3個(gè)部分。然后將文本信息和表格信息連接起來(lái),經(jīng)過數(shù)據(jù)清洗后形成新的文本信息集合存入內(nèi)存。再次將文本信息集合分別進(jìn)行分詞處理,通過余弦相似度算法計(jì)算出文本內(nèi)容的整體相似度,通過N-Gram算法進(jìn)行文本N元切割計(jì)算出文本中連續(xù)重復(fù)的內(nèi)容。最后,依次將標(biāo)書之間的圖片逐個(gè)比較,智能識(shí)別出高度相似的圖片。智能分析模型運(yùn)行流程如圖2所示。
(三)模型運(yùn)行結(jié)果
審計(jì)人員節(jié)選了4家公司技術(shù)標(biāo)書中的《安全文明施工措施》章節(jié)的全部?jī)?nèi)容進(jìn)行分析。4家公司關(guān)于該章節(jié)內(nèi)容的字?jǐn)?shù)均在2萬(wàn)至4萬(wàn)之間,倘若通過傳統(tǒng)的人工作業(yè)方式進(jìn)行線索甄別是非常困難的,但通過“三維一體”智能分析模型僅需數(shù)分鐘即可完成。模型運(yùn)行綜合結(jié)果如表1所示(N設(shè)為20時(shí))。
1.整體相似度。從4份標(biāo)書整體相似度的比較結(jié)果柱形圖(見圖3)中可以清楚地看出,A公司同BCD3家公司之間的整體相似度明顯低于BCD3家公司之間的整體相似度。同時(shí),B和C標(biāo)書之間以及C和D標(biāo)書之間的整體相似度較高,均超過了48%。
2.重復(fù)內(nèi)容的字符數(shù)。4家公司之間標(biāo)書內(nèi)容的重復(fù)字符數(shù)柱形圖如圖4所示,從圖中可以清楚地看出B和C之間、C和D之間的重復(fù)字符數(shù)特別多,而其他公司的標(biāo)書之間只有少量的重復(fù)內(nèi)容。經(jīng)審計(jì)人員查看重復(fù)的內(nèi)容并結(jié)合標(biāo)書發(fā)現(xiàn),B和C的投標(biāo)文件在“文明施工措施”部分內(nèi)容完全重復(fù);C和D的投標(biāo)文件在“施工現(xiàn)場(chǎng)安全技術(shù)措施”“施工機(jī)械安全技術(shù)措施”“觸電事故應(yīng)急救援”和“經(jīng)濟(jì)處罰措施”等多處內(nèi)容存在重復(fù),尤其是在“經(jīng)濟(jì)處罰金額的設(shè)置”中的條款規(guī)定和“架駛室”等處出現(xiàn)的錯(cuò)別字均完全相同。
3.雷同圖片數(shù)。B和C兩公司的投標(biāo)文件中各有4張圖片分別相似,經(jīng)人工甄別,上述圖片內(nèi)容雷同。這4張圖片分別是“安全管理體系結(jié)構(gòu)圖”“安全生產(chǎn)管理組織機(jī)構(gòu)圖”“應(yīng)急救援領(lǐng)導(dǎo)小組結(jié)構(gòu)圖”和“文明施工保障體系圖”。
綜合以上模型運(yùn)行結(jié)果,公司C和D的標(biāo)書之間存在諸多相同或相似文本內(nèi)容,公司B和C的標(biāo)書之間存在較多重復(fù)內(nèi)容且存在多張雷同圖片,并且公司B、C、D三者標(biāo)書之間的內(nèi)容整體相似度很高。結(jié)合本次分析結(jié)果,根據(jù)《中華人民共和國(guó)招標(biāo)投標(biāo)法實(shí)施條例》第四十條關(guān)于圍標(biāo)串標(biāo)情形的認(rèn)定中第(四)項(xiàng)“不同投標(biāo)人的投標(biāo)文件異常一致”的相關(guān)規(guī)定,公司B、C、D涉嫌圍標(biāo)串標(biāo),需進(jìn)一步重點(diǎn)監(jiān)督。
(作者單位:重慶市公安局九龍坡區(qū)分局審計(jì)室,郵政編碼:400039,電子郵件:810235281@qq.com)