李娜
摘要:政務(wù)數(shù)據(jù)治理的定義:何謂數(shù)據(jù)治理?有兩種定義,一種是“依靠數(shù)據(jù)進(jìn)行治理”,也就是通過對數(shù)據(jù)的利用、應(yīng)用,完成一些流程規(guī)范、效率提升、社會治理的過程;另一種解釋則是“對數(shù)據(jù)進(jìn)行治理”,即采取一定的方法或者形式,對數(shù)據(jù)本身進(jìn)行整理、規(guī)范、標(biāo)準(zhǔn)化、統(tǒng)一化,提升數(shù)據(jù)的質(zhì)量,提高數(shù)據(jù)的價值,有利于后續(xù)對數(shù)據(jù)的利用。本文所采用的是后一種解釋,同時限定了數(shù)據(jù)的范圍,僅對目前智慧城市建設(shè)中所涉及到的政務(wù)數(shù)據(jù)的數(shù)據(jù)治理進(jìn)行一些粗淺的討論。
關(guān)鍵詞:數(shù)據(jù)治理 必要性 數(shù)據(jù)落地 數(shù)據(jù)治理經(jīng)驗 數(shù)據(jù)治理模型
引言
政務(wù)數(shù)據(jù),其實就是政府單位在執(zhí)行對城市、社會、公眾的服務(wù)、管理等行政職能過程中,擁有和管理的數(shù)據(jù),如典型的公安、交通、醫(yī)療、衛(wèi)生、就業(yè)、社保、地理、文化、教育、科技、環(huán)境、金融、統(tǒng)計、氣象等數(shù)據(jù)??梢哉f,自從開始履行行政管理職能之時,就在不斷地產(chǎn)生政務(wù)數(shù)據(jù)(數(shù)字化之前的紙質(zhì)資料,如檔案,也可算作政務(wù)數(shù)據(jù)的一種),而自政府部門IT信息化建設(shè)開始之后,政務(wù)數(shù)據(jù)則呈現(xiàn)爆炸式增長,積累了這么多年,早已形成了海量的數(shù)據(jù),自然也就形成了“政務(wù)大數(shù)據(jù)”。
政務(wù)數(shù)據(jù)中,包括了多種類別的數(shù)據(jù),如自然信息采集測量類數(shù)據(jù)(包括地理、資源、氣象、環(huán)境、水利、礦藏、植被等),城市建設(shè)類數(shù)據(jù)(包括交通設(shè)施、旅游景點、住宅建設(shè),名勝古跡等),城市管理類數(shù)據(jù)(包括工商、稅收、人口、機(jī)構(gòu)、企業(yè)、商品、環(huán)保、團(tuán)體等),民生服務(wù)類數(shù)據(jù)(包括水、電、通訊、醫(yī)療、社保、燃?xì)?、污水、出行等),社會政治?jīng)濟(jì)類數(shù)據(jù)(宗教、金融、法律、保險、工業(yè)、商業(yè)、服務(wù)業(yè)等)……可以說是包羅萬象。
政務(wù)數(shù)據(jù)相對于其他數(shù)據(jù)而言,具有很大的特殊性和幾個明顯的特點,即:它是可信度最高的數(shù)據(jù),是最有價值的數(shù)據(jù),是價值密度最高的數(shù)據(jù),是延續(xù)性最好的數(shù)據(jù),同時也是最為敏感的數(shù)據(jù)。
1 政務(wù)數(shù)據(jù)治理的必要性
那么,為何要對政務(wù)數(shù)據(jù)進(jìn)行治理?它的必要性在哪里?
政務(wù)數(shù)據(jù),既是城市管理與服務(wù)過程中產(chǎn)生的數(shù)據(jù),同時也是完成城市管理與服務(wù)所依賴的數(shù)據(jù)。
舉一個簡單的例子,僅就市民的婚姻登記信息而言,就可能涉及到生育(一孩二孩)、房產(chǎn)(購買商品房、政策房)、教育(小孩上學(xué))、繼承(遺產(chǎn)繼承資格)、金融(配偶賬戶銷戶和資金轉(zhuǎn)移)、養(yǎng)老(虛領(lǐng)養(yǎng)老金)、收養(yǎng)、就業(yè)、醫(yī)療等各個方面。不同的信息將導(dǎo)致所能適用的完全不同的政策條款和依據(jù)。而就該信息而言,可能令其產(chǎn)生變化的,又涉及到民政(結(jié)婚離婚登記)、司法(離婚判決)、醫(yī)院(配偶死亡開具證明)、公安(配偶可能的非正常死亡)等多個部門。
在這種情況下,如果民政司法公安等部門的信息系統(tǒng)不互通,市民又無意或者有意地不去派出所及時變更,便可能造成房產(chǎn)、教育、繼承方面的錯誤處理,這種由于信息錯誤所帶來的管理失誤,往往很難糾正,甚至牽連更廣,引發(fā)一些社會問題。
同樣,由于信息不互通,不準(zhǔn)確所帶來的諸如同一身份證結(jié)婚兩次,離婚后債務(wù)分擔(dān),喪偶后死者依然領(lǐng)養(yǎng)老金之類的情況也偶有發(fā)生。
通過對政務(wù)數(shù)據(jù)進(jìn)行整理和規(guī)范,解決可能出現(xiàn)的問題,建立全網(wǎng)統(tǒng)一的、實時的、準(zhǔn)確的權(quán)威數(shù)據(jù)資源以供各部門、職能單位共享,是數(shù)據(jù)治理的核心目標(biāo)。
2 政務(wù)數(shù)據(jù)治理需要解決的問題
完成政務(wù)數(shù)據(jù)治理,需要解決當(dāng)前政務(wù)數(shù)據(jù)存在的一些問題,包括但不限于以下幾個方面:
(1)數(shù)據(jù)互聯(lián)互通:數(shù)據(jù)治理的前提是完成跨職能部門間的政務(wù)數(shù)據(jù)互聯(lián)互通,一方面互聯(lián)互通的數(shù)據(jù)才能夠進(jìn)行比較,查看是否存在數(shù)據(jù)值沖突的問題,另一方面也需要將完成治理的政務(wù)數(shù)據(jù)反饋到各職能部門的系統(tǒng)中,對原系統(tǒng)中的數(shù)據(jù)進(jìn)行更新、糾正。
(2)清除空白數(shù)據(jù):職能部門的信息化系統(tǒng)中,存在一些空白數(shù)據(jù),這些數(shù)據(jù)可能由于測試、誤操作等原因而輸入,沒有經(jīng)過刪除而遺留在原系統(tǒng)中,可能影響到一些服務(wù)事項的辦理、統(tǒng)計分析的結(jié)果。
(3)去除重復(fù)數(shù)據(jù):在各部門的信息化系統(tǒng)中,由于重復(fù)錄入,或者由于錄入錯誤而重新錄入而造成的重復(fù)數(shù)據(jù)大量存在。
(4)修正錯誤數(shù)據(jù):政務(wù)數(shù)據(jù)中存在不少錯誤數(shù)據(jù)是顯而易見的現(xiàn)象,有無意輸入錯誤的,有故意篡改的,有歷史遺留的,都有可能造成數(shù)據(jù)的錯誤。
(5)規(guī)范不統(tǒng)一數(shù)據(jù):同樣的數(shù)據(jù),在不同的系統(tǒng)可,可能使用不同的規(guī)范,例如身份證號碼的15位和18位,例如對于性別,其屬性可能是“男女”的字符屬性,可能使用“M”和“F”,也可能直接使用0和1來替代,甚至也可能使用“是”和“否”這樣的邏輯值。為構(gòu)建能夠為全網(wǎng)所“信賴”的權(quán)威數(shù)據(jù)資源池,需要將同一物理含義的數(shù)據(jù)規(guī)范為唯一的一種數(shù)據(jù)格式或?qū)傩浴?/p>
3 完成政務(wù)數(shù)據(jù)治理需要注意的幾個方面
政務(wù)數(shù)據(jù)的治理,是一個繁瑣、枯燥而又不得不一點一點認(rèn)真細(xì)致完成的過程,絲毫沒有捷徑可言。在這一過程中,需要重點注意幾個方面
(1)需要數(shù)據(jù)落地
數(shù)據(jù)互聯(lián)互通是件非常困難的事,因此在某些地市,采取折中的方式,即僅開發(fā)互聯(lián)互通的接口,并不將各職能部門信息化系統(tǒng)中的數(shù)據(jù)取出來集中構(gòu)建數(shù)據(jù)平臺,而采取“隨用隨取”的方式,即“數(shù)據(jù)不落地”。這種方式雖然也構(gòu)建模型完成一定的數(shù)據(jù)治理操作,但一方面數(shù)據(jù)的多源性(同一數(shù)據(jù)來源于多個部門的從外系統(tǒng))、調(diào)取數(shù)據(jù)的隨機(jī)性(這次和下次從多源中獲取數(shù)據(jù)的順序不一樣)、數(shù)據(jù)本身的質(zhì)量誤差都會最終導(dǎo)致數(shù)據(jù)治理的失敗,另一方面,這種“隨用隨取”的方式無法實現(xiàn)歷史數(shù)據(jù)的積累(數(shù)據(jù)不落地)和更新(無需求則不取最新數(shù)據(jù)),對于基于大數(shù)據(jù)分析的大量應(yīng)用都成了無源之水,無從談起。
(2)需要對政務(wù)數(shù)據(jù)有較為清晰的理解
政務(wù)數(shù)據(jù)大多是有明確的物理含義的,數(shù)據(jù)之間有錯綜復(fù)雜的相互關(guān)系,這種相互關(guān)系是對數(shù)據(jù)進(jìn)行復(fù)核校驗的邏輯依據(jù),并非一堆毫無關(guān)聯(lián)的數(shù)據(jù)的堆砌。只有對政務(wù)數(shù)據(jù)有較為清晰的理解,才能更為有效和無誤地完成數(shù)據(jù)治理,無論是對于數(shù)據(jù)合理性的判斷(如身份證號18個數(shù)字有著明確的定義,某地就曾有出現(xiàn)過1865年出生日期的身份證號,明顯是錯誤的),還是對于多源數(shù)據(jù)對比校驗的邏輯的定義(以哪個部門的數(shù)據(jù)為主,或如何比較多個沖突數(shù)據(jù)間的時間記錄,以便于獲取最新更新的數(shù)據(jù)值),都依賴于對這些數(shù)據(jù)的深刻理解。
(3)需要有豐富的數(shù)據(jù)治理經(jīng)驗
這一點與(2)一樣,都是基于對數(shù)據(jù)的理解而取得的。這種理解和經(jīng)驗,沒有太多的理論依據(jù),完全需要實踐的摸索,一點一點積累經(jīng)驗而成。城市信息化建設(shè)中,很多職能部門的信息化系統(tǒng)建成多年,對于數(shù)據(jù)沒有相關(guān)的文檔留存,甚至于連建設(shè)方都已注銷解體,或根本不配合,在這種情況下,如何快速地分辨數(shù)據(jù)的含義、數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,都需要依靠長期積累的實踐經(jīng)驗,才能迅速找到路徑,否則只能“望洋興嘆”。
(4)需要有大量數(shù)據(jù)治理模型的積累
我國政體上下統(tǒng)一,從中央到地方,部門劃分、部門職責(zé)、服務(wù)與管理事項基本統(tǒng)一,對于某些垂管部門,甚至于“國家-部委-省-市-縣-鄉(xiāng)鎮(zhèn)”全盤一體,這也就意味著各地市的職能部門信息化系統(tǒng)基本一致,哪怕是由不同的企業(yè)承建的,但其中重要的數(shù)據(jù)內(nèi)容也會大部分相同,跨部門的數(shù)據(jù)間的邏輯關(guān)系也基本一致,這就意味著可以使用幾乎相同的數(shù)據(jù)治理模型。這種數(shù)據(jù)治理模型本質(zhì)上也就是數(shù)據(jù)治理經(jīng)驗積累的物理載體(成熟的開發(fā)人員是經(jīng)驗載體)。這種數(shù)據(jù)治理模型積累得越多,政務(wù)大數(shù)據(jù)平臺的開發(fā)(數(shù)據(jù)治理是其中的最耗時的重要一環(huán))則效率越高、失誤越少、可靠性越大。
4 結(jié)語
國家層面,越來越重視政府部門的服務(wù)職能,越來越重視服務(wù)的高效性、精準(zhǔn)性,浙江的“最多跑一次”是典型的代表,而“互聯(lián)網(wǎng)+政務(wù)”建設(shè)則是由國家推動的一波建設(shè)浪潮,再加上推動大數(shù)據(jù)產(chǎn)業(yè)、建設(shè)信用城市等,越來越多的地市都在推動城市政務(wù)大數(shù)據(jù)平臺的構(gòu)建。
基于政務(wù)大數(shù)據(jù)平臺,提升政府服務(wù)辦事效率,推動精準(zhǔn)社會治理,離不開一個權(quán)威的、可信的、全網(wǎng)統(tǒng)一的政務(wù)數(shù)據(jù)資源池。未經(jīng)過數(shù)據(jù)治理的數(shù)據(jù),很難談得上“權(quán)威”和“可信”,基于錯誤數(shù)據(jù)帶來的錯誤事項,將浪費大量的時間和服務(wù)資源,甚至于有可能引起社會事件。從這個角度來說,數(shù)據(jù)治理是構(gòu)建城市政務(wù)大數(shù)據(jù)平臺不可缺少的關(guān)鍵步驟,而如何更好地完成數(shù)據(jù)治理,則是可能影響到城市未來信息化、智慧化發(fā)展的大事。