黃山 陳昊 陸克初
【摘 要】文章旨在研究將大數(shù)據(jù)應(yīng)用于公共資源交易的優(yōu)勢,充分發(fā)揮大數(shù)據(jù)在公共資源交易中的作用,突破傳統(tǒng)交易數(shù)據(jù)僅用于簡單統(tǒng)計(jì)、粗略分析的層面,助力尋求公共資源交易內(nèi)在規(guī)律,發(fā)現(xiàn)市場主體違法行為,預(yù)測公共資源交易發(fā)展趨勢,為公共資源交易提供了嶄新的視角。
【關(guān)鍵詞】大數(shù)據(jù);公共資源;信息資源共享
【中圖分類號(hào)】G203 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1674-0688(2016)02-0081-03
0 引言
近日,國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,提出要全面推進(jìn)大數(shù)據(jù)的發(fā)展和應(yīng)用,加快政府?dāng)?shù)據(jù)開放共享,深化大數(shù)據(jù)在各行業(yè)的創(chuàng)新應(yīng)用,通過建設(shè)數(shù)據(jù)強(qiáng)國,提升政府治理能力,推動(dòng)經(jīng)濟(jì)轉(zhuǎn)型升級(jí)。此外,《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》還提出,要在2017年年底前形成跨部門數(shù)據(jù)資源共享共用格局,在2018年年底前建成國家政府?dāng)?shù)據(jù)統(tǒng)一開放平臺(tái)。這是我國第一次把發(fā)展大數(shù)據(jù)上升為國家戰(zhàn)略。本文以此為契機(jī),提出了利用大數(shù)據(jù)實(shí)現(xiàn)公共資源交易信息共享的優(yōu)勢。
1 公共資源交易信息的概念和分類
1.1 概念
公共資源交易信息是指公共資源交易活動(dòng)中所產(chǎn)生的各種信息資源的集合,是交易活動(dòng)過程中所涉及的一切文件、資料、圖表和數(shù)據(jù)等信息的總稱。它涉及交易活動(dòng)過程中所產(chǎn)生、獲取、處理、存儲(chǔ)、傳輸和使用的一切信息資源,貫穿交易活動(dòng)的全過程。
1.2 分類
1.2.1 按數(shù)據(jù)的呈現(xiàn)形態(tài)劃分
按數(shù)據(jù)的呈現(xiàn)形態(tài)劃分,公共資源交易信息可分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。在公共資源交易領(lǐng)域中,結(jié)構(gòu)化數(shù)據(jù)應(yīng)指格式固定,簡單量少的電子數(shù)據(jù),如項(xiàng)目名稱、項(xiàng)目預(yù)算金額、保證金金額、開標(biāo)時(shí)間等,而非結(jié)構(gòu)化數(shù)據(jù)指沒有統(tǒng)一固定的數(shù)據(jù)格式和長度,不易存儲(chǔ)和讀取的電子數(shù)據(jù),如電子版的招標(biāo)公告、唱標(biāo)記錄表、評(píng)標(biāo)報(bào)告、中標(biāo)通知書、開評(píng)標(biāo)監(jiān)控音視頻等,可為Word、PDF、Excel等格式。
1.2.2 按數(shù)據(jù)的擁有者劃分
按數(shù)據(jù)的擁有者劃分,公共資源交易信息可分為部門內(nèi)數(shù)據(jù)和部門間數(shù)據(jù)。公共資源交易活動(dòng)各業(yè)務(wù)環(huán)節(jié)由不同責(zé)任部門承接,再流轉(zhuǎn)到下一部門,從而產(chǎn)生部門內(nèi)數(shù)據(jù)和部門間數(shù)據(jù)。例如,保證金繳退記錄、評(píng)審費(fèi)發(fā)放記錄等數(shù)據(jù)只被財(cái)務(wù)部門掌握,屬部門內(nèi)數(shù)據(jù);項(xiàng)目名稱、項(xiàng)目編號(hào)、開標(biāo)時(shí)間等數(shù)據(jù)在各業(yè)務(wù)部門間流轉(zhuǎn)和共享,屬部門間數(shù)據(jù)。
1.2.3 按數(shù)據(jù)的保密性要求劃分
按數(shù)據(jù)的保密性要求劃分,公共資源交易信息又可分為公開數(shù)據(jù)和保密類數(shù)據(jù)。既然是組建公共資源交易大數(shù)據(jù),所包含的應(yīng)是國家相關(guān)法律法規(guī)規(guī)定,能公開的數(shù)據(jù)。因此,這里所說的保密類數(shù)據(jù)是屬于公開數(shù)據(jù)的“特例”,泛指那些需要有一定權(quán)限或特定時(shí)間內(nèi)才能公開和共享的數(shù)據(jù),例如投標(biāo)報(bào)名信息、保證金繳納信息等。
2 利用大數(shù)據(jù)實(shí)現(xiàn)公共資源交易信息共享的優(yōu)勢
2.1 大數(shù)據(jù)研究的公共資源交易對象更廣
在信息處理能力受限的時(shí)代,數(shù)據(jù)分析缺少用來分析所收集數(shù)據(jù)的工具,因此隨機(jī)數(shù)據(jù)應(yīng)運(yùn)而生。但這只是一條捷徑,是在不可收集和分析全部數(shù)據(jù)的情況下的選擇。大數(shù)據(jù)不需要隨機(jī)分析法,而采用所有數(shù)據(jù)的方法。因?yàn)榇髷?shù)據(jù)是建立在掌握所有的數(shù)據(jù),至少是盡可能多的數(shù)據(jù)的基礎(chǔ)上的,所以可以正確地考察細(xì)節(jié)并進(jìn)行新的分析。
2.1.1 可以采集海量的公共資源交易數(shù)據(jù)
以往,大家對公共資源交易數(shù)據(jù)采集的作用沒有統(tǒng)一的意識(shí),未能形成一個(gè)整體的作用。各個(gè)行業(yè)、單位和部門之間的數(shù)據(jù)不能有效流通、共享。傳統(tǒng)公共資源交易數(shù)據(jù)僅能采集到交易金額、中標(biāo)單位、中標(biāo)金額、節(jié)約率等結(jié)構(gòu)化數(shù)據(jù)。通過大數(shù)據(jù),我們可以收集幾乎全部的公共資源交易數(shù)據(jù),包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化的公共資源交易數(shù)據(jù)包括全區(qū)范圍內(nèi)的工程建設(shè)、政府采購、藥品采購和產(chǎn)權(quán)交易等公共資源交易項(xiàng)目的完成宗數(shù)、交易金額、節(jié)約率等交易數(shù)據(jù),投標(biāo)企業(yè)和代理機(jī)構(gòu)的資質(zhì)等級(jí)、行業(yè)分布、地域分布、工作業(yè)績等相關(guān)數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)包括公共資源交易過程的聲音、影片、圖片等媒體內(nèi)容,文書處理、電子表格、簡報(bào)檔案與電子郵件等部門內(nèi)容。
2.1.2 可以利用海量的公共資源交易數(shù)據(jù)
以往的公共資源交易數(shù)據(jù)研究,在不能收集和分析全部的數(shù)據(jù)情況下而采用隨機(jī)采樣進(jìn)行研究,比如僅采集部分行業(yè)、公共資源中心的交易數(shù)據(jù),以此來分析并得出結(jié)論,這本身就存在許多固有的缺陷。現(xiàn)在的數(shù)據(jù)量龐大、機(jī)器計(jì)算能力強(qiáng),因此不再需要人工選擇一個(gè)關(guān)聯(lián)物或者小部分相似數(shù)據(jù)來逐一分析,而通過對全部的公共資源交易數(shù)據(jù)的采集,即“樣本=總體”時(shí),就能從不同的角度,更細(xì)致、全面地觀察和研究數(shù)據(jù),以此得出更準(zhǔn)確、更有說服力的結(jié)論。此外,傳統(tǒng)的公共資源交易活動(dòng)收集的數(shù)據(jù)有限,僅能分析交易活動(dòng)的增長率、節(jié)約率等基本情況,利用大數(shù)據(jù),不僅可以分析公共資源交易的基本情況,還可以對投標(biāo)人/代理機(jī)構(gòu)資質(zhì)等級(jí)、投標(biāo)人報(bào)名次數(shù)與中標(biāo)次數(shù)情況、評(píng)標(biāo)專家評(píng)標(biāo)次數(shù)與交易結(jié)果、服務(wù)滿意度、投訴率等公共資源交易相關(guān)活動(dòng)進(jìn)行全方位的分析,為公共資源交易管理工作指明方向。
2.2 允許公共資源交易數(shù)據(jù)不精確
以前,由于可獲得的數(shù)據(jù)量比較小,為此我們必須盡量準(zhǔn)確地記錄下所獲得的所有數(shù)據(jù),采樣過程的精確度被放在重要的地位。大數(shù)據(jù)時(shí)代,數(shù)據(jù)的收集問題不再成為困擾,采集海量的數(shù)據(jù)成為現(xiàn)實(shí),但海量數(shù)據(jù)的涌現(xiàn)一定會(huì)增加數(shù)據(jù)的混亂性且造成結(jié)果的不準(zhǔn)確性??梢酝ㄟ^某些不精確的數(shù)據(jù)分析公共資源交易相關(guān)情況。
在大數(shù)據(jù)面前,允許數(shù)據(jù)的不精確性已經(jīng)成為一個(gè)新的亮點(diǎn),而非缺點(diǎn),因?yàn)榉潘闪巳蒎e(cuò)的標(biāo)準(zhǔn),所以掌握的數(shù)據(jù)也多了起來。2015年1~8月某省公共資源交易中心網(wǎng)站的瀏覽次數(shù)(PV)為734 139人次,排在前三位的訪客使用的網(wǎng)絡(luò)運(yùn)營商分布分別為電信541 774人次,占比為73.78%;聯(lián)通106 221人次,占比為14.47%;移動(dòng)47 896人次,占比為6.52%(如圖1所示)。
雖然訪客網(wǎng)絡(luò)運(yùn)營商數(shù)據(jù)的采集正確率不是100%,但是采集的是全部數(shù)據(jù)且數(shù)據(jù)足夠龐大,仍然可以很清晰地發(fā)現(xiàn),廣西公共資源交易中心網(wǎng)站的訪客選擇網(wǎng)絡(luò)運(yùn)營商最多的是電信,其次是聯(lián)通和移動(dòng)。針對訪客訪問網(wǎng)站時(shí)使用的網(wǎng)絡(luò)接入商數(shù)據(jù)進(jìn)行分析,以此調(diào)整電信、聯(lián)通線路帶寬的比重,以提高各交易對象的網(wǎng)站訪問滿意度。傳統(tǒng)數(shù)據(jù)處理主要針對結(jié)構(gòu)化數(shù)據(jù),大數(shù)據(jù)則把數(shù)據(jù)范圍擴(kuò)展到半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),不再要求數(shù)據(jù)必須有極強(qiáng)的準(zhǔn)確性,大數(shù)據(jù)的核心思想是高度整合,將分散的資源集中起來,因此能夠?qū)⒏餍袠I(yè)、單位相對獨(dú)立的信息化建設(shè)統(tǒng)一起來,打破原有信息系統(tǒng)的壁壘,實(shí)現(xiàn)各行業(yè)、單位信息資源的高度整合。
2.3 注重?cái)?shù)據(jù)的相關(guān)關(guān)系以提供預(yù)測
相關(guān)關(guān)系的核心是量化兩個(gè)數(shù)據(jù)之間的數(shù)理關(guān)系。相關(guān)關(guān)系強(qiáng)是指當(dāng)一個(gè)數(shù)據(jù)值增加時(shí),另一個(gè)數(shù)據(jù)值很有可能也會(huì)隨之增加。比如,在一個(gè)特定的地理位置,越多的人通過百度搜索與公共資源交易相關(guān)的詞條,該地區(qū)就有更多的企業(yè)參與公共資源交易。
2.3.1 有利于發(fā)現(xiàn)公共資源交易活動(dòng)中的違法違規(guī)行為
通過應(yīng)用相關(guān)關(guān)系,可以比以前更容易、更快捷、更清楚地分析事物。以西部某省公共資源交易中心2014年交易數(shù)據(jù)分析報(bào)告為例,通過對投標(biāo)人報(bào)名次數(shù)與中標(biāo)次數(shù)情況分析發(fā)現(xiàn),投標(biāo)報(bào)名次數(shù)與中標(biāo)次數(shù)嚴(yán)重背離,是否可視為與“圍串標(biāo)專業(yè)戶”有相關(guān)性,不能僅憑這一個(gè)證據(jù)就武斷定性,而要通過其他更多數(shù)據(jù)指標(biāo)對投標(biāo)人進(jìn)行多維度考證。比如:IP地址及其出現(xiàn)頻率。3個(gè)以上投標(biāo)企業(yè)報(bào)名使用同一IP地址,可視為與圍標(biāo)串標(biāo)現(xiàn)象有相關(guān)性,從而及時(shí)發(fā)現(xiàn)違規(guī)行為。通過對投標(biāo)企業(yè)IP地址、中標(biāo)人、中標(biāo)次數(shù)、評(píng)標(biāo)專家、代理機(jī)構(gòu)、資格審查方式、招標(biāo)方式等進(jìn)行多維度分析,尋找交易參與各方交易行為的相關(guān)性,找出因果聯(lián)系,可以及時(shí)地發(fā)現(xiàn)交易參與各方的違規(guī)行為,為交易活動(dòng)的監(jiān)督和管理提供決策參考。
2.3.2 有效預(yù)測公共資源交易發(fā)展趨勢
相關(guān)關(guān)系通過識(shí)別有用的關(guān)聯(lián)物來分析一個(gè)現(xiàn)象,而不是通過揭示其內(nèi)部的運(yùn)作機(jī)制。通過找到一個(gè)現(xiàn)象的良好的關(guān)聯(lián)物,相關(guān)關(guān)系可以捕捉現(xiàn)在和預(yù)測未來。例如,通過研究某省年度計(jì)劃投資額的變化情況,即可預(yù)測該省公共資源交易中心項(xiàng)目交易量發(fā)展趨勢。通過數(shù)據(jù)的相關(guān)關(guān)系,不僅能為我們提供新的視角,而且提供的視角都很清晰。貴州省公共資源交易中心對2014年的全部交易數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和分析,不僅掌握了全年的交易情況和取得的成效,更重要的是,通過對交易數(shù)據(jù)的分析和數(shù)據(jù)價(jià)值的挖掘,發(fā)現(xiàn)了項(xiàng)目交易工作的基本規(guī)律、市場競爭狀況、經(jīng)濟(jì)運(yùn)行的活躍程度及項(xiàng)目交易過程中存在的問題。
參 考 文 獻(xiàn)
[1]維克托·邁爾·舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時(shí)代[M].盛楊燕,周濤,譯.浙江:浙江人民出版社,2013.
[2]國務(wù)院.促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要[EB/OL].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm,2015-08-31.
[3]徐子沛.大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2012.
[4]艾伯特-拉斯洛·巴拉巴西.爆發(fā):大數(shù)據(jù)時(shí)代預(yù)見未來的新思維[M].馬慧,譯.北京:中國人民大學(xué)出版社,2012.
[5]麥肯錫公司.大數(shù)據(jù):下一個(gè)競爭、創(chuàng)新和生產(chǎn)力的前沿領(lǐng)域[EB/OL].http://www.360doc.com/content/13/1230/17/2205372_341286261.shtml,2013-08-02.
[責(zé)任編輯:陳澤琦]