劉智聰
摘要:隨著大數(shù)據(jù)時(shí)代的到來(lái),給政府統(tǒng)計(jì)工作帶來(lái)了機(jī)遇和挑戰(zhàn)。近年來(lái),我國(guó)統(tǒng)計(jì)信息化建設(shè)取得初步成績(jī),但也存在一定的問(wèn)題,大數(shù)據(jù)在信息化建設(shè)中的應(yīng)用亟待深入。該文分析了當(dāng)前統(tǒng)計(jì)信息化的現(xiàn)狀特點(diǎn)和問(wèn)題,提出了大數(shù)據(jù)技術(shù)在統(tǒng)計(jì)息化發(fā)展中應(yīng)用的對(duì)策建議。
關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)信息化;應(yīng)用
中圖分類號(hào):F222? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)25-0146-03
隨著電子信息技術(shù)的發(fā)展,大數(shù)據(jù)時(shí)代已經(jīng)到來(lái),大數(shù)據(jù)技術(shù)日趨成熟,在各行各業(yè)的應(yīng)用面越來(lái)越廣。近年來(lái),我國(guó)大力推行統(tǒng)計(jì)信息化建設(shè),充分利用信息化手段優(yōu)化統(tǒng)計(jì)工作流程、工作方式和工作職能,不斷提高統(tǒng)計(jì)服務(wù)能力,但對(duì)大數(shù)據(jù)背景下的統(tǒng)計(jì)信息化建設(shè)還需進(jìn)一步探索。加強(qiáng)大數(shù)據(jù)技術(shù)在統(tǒng)計(jì)信息化建設(shè)中的應(yīng)用具有重要意義。
1 大數(shù)據(jù)的概念和特征
1.1 大數(shù)據(jù)的概念
在信息化、數(shù)字化發(fā)展背景下,數(shù)據(jù)量劇增,結(jié)構(gòu)也趨于復(fù)雜化,對(duì)于大數(shù)據(jù)的概念,目前沒(méi)有完全統(tǒng)一的明確定義,但不同機(jī)構(gòu)和學(xué)者對(duì)大數(shù)據(jù)的概念進(jìn)行了探討。維基百科對(duì)于大數(shù)據(jù)的定義是:大數(shù)據(jù)是指使用常用軟件工具獲取、管理和處理數(shù)據(jù)所耗時(shí)間超過(guò)科容忍時(shí)間的數(shù)據(jù)集[1]。Gartner研究機(jī)構(gòu)認(rèn)為:大數(shù)據(jù)是一種信息資產(chǎn),具有海量、高增長(zhǎng)率以及多樣化的特點(diǎn),需要新的處理模式,以獲得更強(qiáng)決策力、洞察發(fā)現(xiàn)力以及物流優(yōu)化能力[2]。美國(guó)麥肯錫咨詢公司(2011年)認(rèn)為:大數(shù)據(jù)就是對(duì)超大樹(shù)數(shù)據(jù)的采集、存儲(chǔ)與分析的新技術(shù),這些新技術(shù)的內(nèi)涵已經(jīng)遠(yuǎn)遠(yuǎn)超出傳統(tǒng)的技術(shù)范疇。國(guó)內(nèi)學(xué)者徐子沛(2012)認(rèn)為大數(shù)據(jù)的意義在于海量數(shù)據(jù)交換、分析和整合,通過(guò)大數(shù)據(jù)創(chuàng)造新價(jià)值、發(fā)現(xiàn)新知識(shí),讓大數(shù)據(jù)帶來(lái)大利潤(rùn)、大發(fā)展、大科技和大知識(shí)[3]。
1.2 大數(shù)據(jù)的特征
盡管學(xué)者對(duì)于大數(shù)據(jù)的定義各有不同,但是均有如下幾個(gè)特征:一是數(shù)據(jù)容量大,具有巨大的數(shù)據(jù)量以及數(shù)據(jù)規(guī)模的完整性;二是數(shù)據(jù)的來(lái)源多樣化,格式多樣,涵蓋關(guān)系型和非關(guān)系型數(shù)據(jù),數(shù)據(jù)之間的內(nèi)在聯(lián)系需要去發(fā)掘;三是高速性和實(shí)時(shí)性,數(shù)據(jù)從創(chuàng)建、處理分析是連續(xù)的和實(shí)時(shí)的;四是數(shù)據(jù)具有價(jià)值性,需要利用大數(shù)據(jù)技術(shù),提取有價(jià)值的信息。大數(shù)據(jù)技術(shù)體系龐大且復(fù)雜,基礎(chǔ)的技術(shù)包含數(shù)據(jù)的采集、數(shù)據(jù)預(yù)處理、分布式數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)清洗、建立數(shù)據(jù)庫(kù)、機(jī)器學(xué)習(xí)、查詢分析、并行計(jì)算、數(shù)據(jù)可視化等[4]。
2 統(tǒng)計(jì)信息化發(fā)展現(xiàn)狀
2.1 統(tǒng)計(jì)信息化的概念
統(tǒng)計(jì)信息化是將信息化技術(shù)應(yīng)用于統(tǒng)計(jì)工作的統(tǒng)稱,是利用計(jì)算機(jī)網(wǎng)絡(luò)和通信技術(shù),實(shí)現(xiàn)對(duì)統(tǒng)計(jì)數(shù)據(jù)的收集、管理、匯總、傳輸和發(fā)布功能,以高效地獲取更多、更快、更準(zhǔn)確地統(tǒng)計(jì)信息,從而提高統(tǒng)計(jì)機(jī)構(gòu)的管理效率、統(tǒng)計(jì)人員的工作效率和統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量。信息化技術(shù)和統(tǒng)計(jì)工作的結(jié)合,可以推動(dòng)統(tǒng)計(jì)工作和業(yè)務(wù)流程網(wǎng)絡(luò)化水平逐步提高,進(jìn)而提高統(tǒng)計(jì)數(shù)據(jù)質(zhì)量、工作效率和優(yōu)化統(tǒng)計(jì)服務(wù)。
2.2 統(tǒng)計(jì)信息化發(fā)展現(xiàn)狀
我國(guó)的統(tǒng)計(jì)信息化建設(shè)始于20世紀(jì)80年代,經(jīng)過(guò)幾十年的發(fā)展歷程,特別是“十三五”時(shí)期,統(tǒng)計(jì)信息化建設(shè)取得長(zhǎng)足發(fā)展,為統(tǒng)計(jì)工作的正常開(kāi)展提供了可靠保障,為提高統(tǒng)計(jì)工作效率、數(shù)據(jù)質(zhì)量和服務(wù)水平提供了有力支撐。一是全國(guó)統(tǒng)計(jì)信息化基礎(chǔ)設(shè)施不斷完善,統(tǒng)計(jì)聯(lián)網(wǎng)直報(bào)平臺(tái)運(yùn)營(yíng)基本完善,統(tǒng)計(jì)信息網(wǎng)絡(luò)覆蓋范圍不斷擴(kuò)大,系統(tǒng)資源建設(shè)穩(wěn)步推進(jìn),系統(tǒng)運(yùn)維和保障能力不斷增強(qiáng);二是信息化應(yīng)用水平持續(xù)提高,除了聯(lián)網(wǎng)直報(bào)系統(tǒng)可滿足大量用戶在線填報(bào)日常統(tǒng)計(jì)報(bào)表外,在各類普查數(shù)據(jù)采集處理工作中,通過(guò)不同采集方式在線采集各類數(shù)據(jù),大大提高了數(shù)據(jù)采集效率和處理能力;三是統(tǒng)計(jì)數(shù)據(jù)管理和服務(wù)能力顯著提升,已經(jīng)建成微觀數(shù)據(jù)庫(kù)、統(tǒng)計(jì)基礎(chǔ)數(shù)據(jù)庫(kù)等,管理數(shù)據(jù)量近4000億條,滿足不同用戶群體統(tǒng)計(jì)數(shù)據(jù)使用需要,同時(shí)在部門數(shù)據(jù)交換共享方面積極推進(jìn),成效顯著;四是統(tǒng)計(jì)信息網(wǎng)絡(luò)安全保障不斷增強(qiáng),網(wǎng)絡(luò)安全標(biāo)準(zhǔn)制度體系和保障體系不斷健全,安全管理與監(jiān)控能力不斷提升,重要統(tǒng)計(jì)數(shù)據(jù)和關(guān)鍵信息基礎(chǔ)設(shè)施保護(hù)全面強(qiáng)化。隨著新一輪科技革命深入發(fā)展、大數(shù)據(jù)應(yīng)用日益普及,為提高統(tǒng)計(jì)生產(chǎn)力、變革統(tǒng)計(jì)生產(chǎn)方式、重塑統(tǒng)計(jì)生產(chǎn)關(guān)系提供了強(qiáng)勁動(dòng)力。
3 大數(shù)據(jù)時(shí)代統(tǒng)計(jì)信息化存在的問(wèn)題
大數(shù)據(jù)背景下,統(tǒng)計(jì)信息化建設(shè)要跟上時(shí)代的潮流,還存在一些短板和問(wèn)題,統(tǒng)計(jì)信息化建設(shè)尚未充分利用現(xiàn)代信息技術(shù)發(fā)展成果,也不能完全滿足統(tǒng)計(jì)現(xiàn)代化改革的新需要[5]。
3.1 數(shù)據(jù)采集的準(zhǔn)確性和安全性有待提高
目前,國(guó)家統(tǒng)計(jì)局通過(guò)統(tǒng)計(jì)“四大工程”建設(shè)已經(jīng)建立了較為完善的企業(yè)一套表制度,統(tǒng)一采用數(shù)據(jù)處理軟件系統(tǒng),企業(yè)和機(jī)構(gòu)端用戶各司其職,共同確保數(shù)據(jù)上報(bào)的準(zhǔn)確性和安全性。但是由于企業(yè)配合度、統(tǒng)計(jì)人員更換頻繁、統(tǒng)計(jì)指標(biāo)理解不到位等問(wèn)題,企業(yè)的數(shù)據(jù)質(zhì)量難以得到有效保障;同時(shí),企業(yè)數(shù)據(jù)僅來(lái)源于企業(yè)統(tǒng)計(jì)人員上報(bào)的報(bào)表指標(biāo),無(wú)法從企業(yè)的直接生產(chǎn)數(shù)據(jù)、上報(bào)部門的相關(guān)數(shù)據(jù)等指標(biāo)對(duì)企業(yè)的上報(bào)數(shù)據(jù)進(jìn)行核實(shí),數(shù)據(jù)的準(zhǔn)確性無(wú)法保障。在安全性方面,數(shù)據(jù)在網(wǎng)絡(luò)傳輸?shù)倪^(guò)程中,是否被篡改無(wú)法及時(shí)掌握,是否存在人為干預(yù)也無(wú)法判斷,這對(duì)基層統(tǒng)計(jì)數(shù)據(jù)的質(zhì)量帶來(lái)一定的影響。
3.2 數(shù)據(jù)更新、維護(hù)和共享機(jī)制有待健全
一是名錄庫(kù)管理機(jī)制需要完善。統(tǒng)計(jì)信息化建設(shè)的一項(xiàng)重要基礎(chǔ)性工作就是進(jìn)行單位名錄庫(kù)的建設(shè)、更新和管理,我們目前雖然有基本單位名錄庫(kù)管理制度,但是更新速度慢,手段落后,無(wú)法實(shí)現(xiàn)自動(dòng)化管理和更新,在基層統(tǒng)計(jì)力量不足的情況下,無(wú)法做到對(duì)企業(yè)信息及時(shí)、準(zhǔn)確更新。二是數(shù)據(jù)維護(hù)機(jī)制不健全,隨著社會(huì)各界對(duì)統(tǒng)計(jì)數(shù)據(jù)使用的重視,各地各部門建立了各種類型的數(shù)據(jù)庫(kù),但是未形成統(tǒng)一的數(shù)據(jù)庫(kù)標(biāo)準(zhǔn);在數(shù)據(jù)維護(hù)上,僅僅依靠各專業(yè)人員,在業(yè)務(wù)工作量大的情況下,數(shù)據(jù)的更新和維護(hù)無(wú)法做到及時(shí)和準(zhǔn)確。三是數(shù)據(jù)共享機(jī)制有待完善,目前統(tǒng)計(jì)數(shù)據(jù)庫(kù)與各政府部門的數(shù)據(jù)實(shí)現(xiàn)了一定的共享和交流機(jī)制,但由于各部門的數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范不統(tǒng)一,因此共享獲得的數(shù)據(jù)的清洗和整理需要耗費(fèi)大量的人力和時(shí)間,資源的利用率有待提高。