湯志偉 郭雨暉 黃怡蕓
(1.電子科技大學(xué)公共管理學(xué)院 成都 611731;2.電子科技大學(xué)經(jīng)濟與管理學(xué)院 成都 611731)
在數(shù)據(jù)時代,各國政府陸續(xù)開展開放政府數(shù)據(jù)(Open Government Data)戰(zhàn)略,向社會公開政府資源,以期促進數(shù)據(jù)利用、釋放數(shù)據(jù)紅利,實現(xiàn)社會、經(jīng)濟的創(chuàng)新發(fā)展。在我國,隨著《促進大數(shù)據(jù)發(fā)展行動綱要》(2015年)、《公共信息資源開放試點工作方案》(2018年)等相關(guān)政策的逐步頒布,越來越多的地方政府開始建立開放政府數(shù)據(jù)平臺,并有序上線覆蓋生態(tài)環(huán)境、政府機構(gòu)、企業(yè)服務(wù)、交通運輸、衛(wèi)生健康等各個領(lǐng)域的數(shù)據(jù)集。據(jù)統(tǒng)計,截至2018年8月20日,我國已上線省市兩級地方政府開放數(shù)據(jù)平臺共47個,累計開放數(shù)據(jù)集接近5萬個。然而,開放政府數(shù)據(jù)本身并不是該戰(zhàn)略的核心目標,能否將開放后的數(shù)據(jù)進行有效利用,才是使數(shù)據(jù)發(fā)揮其價值的關(guān)鍵一步。
隨著相關(guān)研究的不斷推進,學(xué)術(shù)界也逐漸開始關(guān)注開放數(shù)據(jù)利用的話題:Mila等認為開放數(shù)據(jù)利用率低的原因之一是使用者缺乏靈活運用數(shù)據(jù)的能力,而通過培訓(xùn)與干預(yù)的方式可以提高用戶對開放數(shù)據(jù)的認識、理解和掌握[1]。Antonio等通過構(gòu)建開放政府數(shù)據(jù)評估框架,指出提高數(shù)據(jù)質(zhì)量、及時更新數(shù)據(jù)等有助于數(shù)據(jù)的有效利用[2]。陳美認為應(yīng)從商業(yè)應(yīng)用角度出發(fā),鼓勵政企合作,實現(xiàn)開放政府數(shù)據(jù)收益最大化[3]。湯志偉等對國內(nèi)開放政府數(shù)據(jù)利用研究進行了系統(tǒng)性文獻綜述,發(fā)現(xiàn)平臺、數(shù)據(jù)等直接條件與政策、文化等間接條件,對開放政府數(shù)據(jù)利用的各個環(huán)節(jié)都會存在潛在影響[4]。而在地方政府數(shù)據(jù)開放平臺中,最有可能通過廣泛利用,率先釋放數(shù)據(jù)紅利的當屬交通數(shù)據(jù),其緣由有三:第一,國務(wù)院常務(wù)會議上強調(diào),我國要優(yōu)先推動包括交通在內(nèi)的民生領(lǐng)域政府數(shù)據(jù)向社會開放,可見交通數(shù)據(jù)具備必要的國家助力[5];第二,隨著我國城市化建設(shè)和交通運輸業(yè)的高速發(fā)展,人均汽車擁有率、鐵路公路里程、公共交通設(shè)施數(shù)量等逐年攀升,由此帶來的交通擁堵問題、道路規(guī)劃欠佳問題、環(huán)境污染問題等引起了公眾的廣泛關(guān)注,因而由交通帶來的城市病亟待通過數(shù)據(jù)科學(xué)的方式進行解決[6];第三,交通數(shù)據(jù)相對于教育、衛(wèi)生、社保、服務(wù)等其他民生數(shù)據(jù)來說,更具備大體量、高質(zhì)量、實時性等特征,對于分析和解決當前城市問題、建設(shè)新型智慧城市等具備明顯的數(shù)據(jù)優(yōu)勢。
因此,深入研究打響開放政府數(shù)據(jù)利用環(huán)節(jié)第一槍的交通數(shù)據(jù),具有顯著的現(xiàn)實意義和理論意義,可為探討其他種類的數(shù)據(jù)如何進行有效利用和價值發(fā)揮提供指導(dǎo)與借鑒?;诖耍恼聫慕煌愰_放數(shù)據(jù)入手,選取來自省市兩級共43個政府數(shù)據(jù)開放平臺中的交通數(shù)據(jù)集,參考了鄭磊等人從“數(shù)據(jù)、使用、效果”幾方面評估政府開放數(shù)據(jù)的研究成果[7],探索交通數(shù)據(jù)開放和利用的現(xiàn)狀與所存在的問題。同時還參照了OECD的開放政府數(shù)據(jù)指數(shù)(OGD)評估框架,從數(shù)據(jù)可用性(Data Availability)、可獲取性(Data Accessibility)和數(shù)據(jù)再利用(Re-use)三個維度進行數(shù)據(jù)收集和評估[8],試圖通過數(shù)據(jù)的優(yōu)質(zhì)開放來打開高效利用的大門,以創(chuàng)造較高的社會、經(jīng)濟價值。
截至2018年8月,全國共計開放47個政府數(shù)據(jù)開放平臺,除去蘇州、威海、煙臺、淄博這四個平臺未提供交通數(shù)據(jù)以外,文章對其余43個來自省市兩級政府數(shù)據(jù)開放平臺的交通數(shù)據(jù)集進行爬取和分析。以平臺分類為依據(jù),采集“交通出行”“城市交通”等板塊內(nèi)的交通數(shù)據(jù)集共1 375個,其中山東省的省、市兩級平臺中重復(fù)數(shù)據(jù)集達280個,有效數(shù)據(jù)集1 095個。表1首先列出了交通類數(shù)據(jù)集個數(shù)大于40的平臺與其占總數(shù)據(jù)集的比例情況,其中山東、上海、武漢、廣東的交通數(shù)據(jù)集總量均已超過100,上海、寧波、中山的交通數(shù)據(jù)集占比分別達到12.23%、12.81%和19.81%,雖然部分城市交通數(shù)據(jù)開放數(shù)量情況較為樂觀,但仍有大量城市并未對此給予重視。
表1 主要交通類數(shù)據(jù)集發(fā)布平臺情況
其次,文章對1 095個交通類數(shù)據(jù)集的發(fā)布單位進行了統(tǒng)計分析,發(fā)現(xiàn)目前數(shù)據(jù)來源主要集中于交通委員會、公安局、交通運輸局這三個部門(交通委員會和交通運輸局因地域行政文化差異的原因,大部分市級政府中只存其一),其數(shù)據(jù)總量高達574個,已超過所有交通類數(shù)據(jù)集的50%,是交通數(shù)據(jù)開放的主要推動者。除此以外,交通類數(shù)據(jù)集還有來源于統(tǒng)計局、港航局、公路管理局等多個部門的數(shù)據(jù),圖1列出了發(fā)布數(shù)據(jù)集超過10個的單位。
圖1 交通數(shù)據(jù)集發(fā)布部門統(tǒng)計
目前國內(nèi)外都有科學(xué)的評估體系,對各個國家和地區(qū)的開放政府數(shù)據(jù)能力進行綜合評估。國外如由萬維網(wǎng)基金會和開放數(shù)據(jù)研究會發(fā)布的開放數(shù)據(jù)晴雨表,從準備度、執(zhí)行力和影響力三個角度對世界各國進行評價[9];國內(nèi)如復(fù)旦大學(xué)數(shù)字與移動治理實驗室發(fā)布的《中國地方政府數(shù)據(jù)開放報告》,從基礎(chǔ)層、數(shù)據(jù)層和平臺層對中國各省市政府數(shù)據(jù)開放水平進行橫向評估[10]。無論是國外評估體系還是國內(nèi)評估體系,都全面評價了開放政府數(shù)據(jù)的各個維度,對各國政府都有較強的現(xiàn)實指導(dǎo)意義,但其問題診斷和對策建議卻往往是針對整個開放政府數(shù)據(jù)生態(tài)系統(tǒng)進行的綜合性、全面性考量,作為報告本身還難以回答如何促進數(shù)據(jù)高效利用和價值體現(xiàn)的現(xiàn)實問題?;诖耍恼略诰C合各類評估體系的指標前提下,專注于數(shù)據(jù)本身及其使用情況,構(gòu)建與開放利用有關(guān)的數(shù)據(jù)集調(diào)查維度——“優(yōu)質(zhì)開放”和“高效利用”,來對我國地方政府所開放的交通數(shù)據(jù)進行調(diào)查研究。
“優(yōu)質(zhì)開放”維度。主要從數(shù)據(jù)集本身進行考察,包括數(shù)據(jù)集的內(nèi)容、質(zhì)量、種類、更新情況等方面。這些指標均以“用”為最終導(dǎo)向,探索怎樣的“開放”才能促進利用效率的提升。
“高效利用”維度。主要從數(shù)據(jù)集使用情況進行考察,既包括數(shù)據(jù)集自身的瀏覽量、下載量、評論量,也包括類似APP等數(shù)據(jù)集產(chǎn)品的落地。同時,文章還將相關(guān)數(shù)據(jù)應(yīng)用競賽納入調(diào)查范圍內(nèi),最大程度解析當前開放數(shù)據(jù)的應(yīng)用和產(chǎn)出。
數(shù)據(jù)介紹包括數(shù)據(jù)集的名稱、關(guān)鍵詞、摘要等基本信息,完備的數(shù)據(jù)介紹是使用者準確找尋所需數(shù)據(jù)集的前提,也可謂是促進數(shù)據(jù)充分利用的第一步。首先,文章對所有交通數(shù)據(jù)集名稱進行了詞云分析。如圖2所示,“機動車”“運輸”“企業(yè)”“道路”“公路”等出現(xiàn)頻率最高,形成了交通數(shù)據(jù)集詞云的主干,體現(xiàn)了各地方交通數(shù)據(jù)以車輛數(shù)據(jù)、運輸情況數(shù)據(jù)、城市道路數(shù)據(jù)和相關(guān)運輸企業(yè)數(shù)據(jù)為主。與此同時,“客運”“駕駛”“許可”“車輛”等詞作為交通數(shù)據(jù)領(lǐng)域的第二梯隊關(guān)鍵詞出現(xiàn),指出了交通運輸服務(wù)和車輛駕駛許可等公眾參與較多的領(lǐng)域也易形成數(shù)據(jù)積累。通過數(shù)據(jù)集關(guān)鍵詞的詞云分析,不難發(fā)現(xiàn)目前政府部門對交通數(shù)據(jù)開放的價值取向,既對后續(xù)數(shù)據(jù)分類、數(shù)據(jù)目錄制作大有裨益,也為未進行交通數(shù)據(jù)開放的城市指明了道路。其次,在全部交通類數(shù)據(jù)集中,有175個數(shù)據(jù)集并未提供關(guān)鍵詞,占全部交通數(shù)據(jù)集總量的15.98%,涵蓋15個城市,其中山東省各市尤為嚴重。摘要(部分城市為數(shù)據(jù)描述、簡介)部分,是對數(shù)據(jù)集整體情況的概述,目前主要存在三種類型:其一,信息缺失,并未提供數(shù)據(jù)摘要內(nèi)容;其二,對數(shù)據(jù)集名稱的簡單重復(fù);其三,包含數(shù)據(jù)發(fā)布單位、名稱、數(shù)據(jù)集具體指標的簡要描述,這也應(yīng)是目前政府數(shù)據(jù)開放平臺的基本要求。
圖2 交通數(shù)據(jù)集的詞云圖
數(shù)據(jù)內(nèi)容與質(zhì)量是數(shù)據(jù)能否產(chǎn)生價值的關(guān)鍵環(huán)節(jié),低內(nèi)容、低質(zhì)量的數(shù)據(jù)集發(fā)布得再多,其價值量也難以企及一個保質(zhì)保量的數(shù)據(jù)集。因此,為了深入了解交通數(shù)據(jù)集的開放質(zhì)量,筆者切實下載并打開了1 095個數(shù)據(jù)集,將所有數(shù)據(jù)集內(nèi)容進行分類梳理,以便客觀地分析問題。
文章結(jié)合數(shù)據(jù)介紹與數(shù)據(jù)實質(zhì)內(nèi)容,對所搜集的數(shù)據(jù)集進行系統(tǒng)分類,其主要分為道路站點信息、企業(yè)信息、人員信息、車船信息、統(tǒng)計數(shù)據(jù)、執(zhí)法機構(gòu)信息、路況數(shù)據(jù)、費用信息等,具體見表2。由此可知,目前我國各地交通數(shù)據(jù)集的發(fā)布,主要趨向于道路、企業(yè)、人員、車船四個方面,且占有較大比重,與關(guān)鍵詞詞云相互契合。仔細觀察各數(shù)據(jù)集實際內(nèi)容,存在的問題也十分典型:其一,信息與數(shù)據(jù)的邊界尚不明確,大量數(shù)據(jù)信息公開、新聞發(fā)布的內(nèi)容被以數(shù)據(jù)集形式強硬進行發(fā)布。其二,統(tǒng)計數(shù)據(jù)與數(shù)據(jù)開放混淆,多數(shù)地方平臺均有由統(tǒng)計局發(fā)布的歷年統(tǒng)計數(shù)據(jù),并將其分行業(yè)分年份進行強行拆分。其三,動態(tài)數(shù)據(jù)比例明顯少于靜態(tài)數(shù)據(jù),含金量較高的動態(tài)數(shù)據(jù)或?qū)崟r流量數(shù)據(jù)較少,對于數(shù)據(jù)實時調(diào)用與展現(xiàn)較為困難。
表2 交通數(shù)據(jù)集內(nèi)容分類
其次,在數(shù)據(jù)容量方面,總體出現(xiàn)數(shù)據(jù)容量體量偏小、字段數(shù)維度狹窄的問題?!吨袊胤秸當?shù)據(jù)開放報告》中首次提出“數(shù)據(jù)容量”這一概念,即將字段數(shù)(列數(shù))乘以條數(shù)(行數(shù))得出數(shù)據(jù)的總量,以衡量數(shù)據(jù)集的實際數(shù)據(jù)量大小[10]。在文章統(tǒng)計的交通類數(shù)據(jù)集中,數(shù)據(jù)容量突破10 000的僅有116個數(shù)據(jù)集,占總數(shù)據(jù)集個數(shù)的10.59%,而數(shù)據(jù)容量低于100的多達293個,占比26.76%。雖然低容量數(shù)據(jù)可能存在數(shù)據(jù)搜集的現(xiàn)實局限性,但不可否認的是,它們所產(chǎn)生的價值是微小而有限的,甚至在大數(shù)據(jù)時代中,這樣的數(shù)據(jù)集其含金量幾乎為0。其次,部分城市為了在數(shù)據(jù)集“量”上做文章,將數(shù)據(jù)集刻意拆分,如武漢市地鐵運行時間數(shù)據(jù),按不同地鐵線路拆分為多個數(shù)據(jù)集;又如揚州市按月發(fā)布郵政業(yè)經(jīng)濟運行情況,以月為單位分割為多個數(shù)據(jù)集;再如中山市沙口大橋交通量數(shù)據(jù),以地點為單位分割為上、下橋位兩個數(shù)據(jù)集。如此種種,不勝枚舉。其本質(zhì)是對數(shù)據(jù)集進行降維處理以增加數(shù)據(jù)集數(shù)量。這種做法嚴重缺乏促進數(shù)據(jù)利用的大局觀,也加大了使用者的利用成本。
數(shù)據(jù)格式關(guān)系到用戶利用數(shù)據(jù)的方式手段,最直接影響到用戶分析數(shù)據(jù)的效率和效果,不同格式的數(shù)據(jù)集對發(fā)布者和使用者具有不同的成本效益[11]。文章從可機讀格式和開放格式兩個角度入手進行分析:可機讀格式是指能被計算機自動讀取與處理的格式,包括XLS、CSV、JSON、XML等,而不可機讀格式包括DOC、PDF、JPG等。其次,開放格式是指可下載數(shù)據(jù)集應(yīng)以開放的、非專屬的格式提供,不得在格式上排除他人使用數(shù)據(jù)的權(quán)利。在Berners Lee提出的開放數(shù)據(jù)五星標準中,指出數(shù)據(jù)格式應(yīng)滿足可獲取、非專屬的要求,即可達到三星標準[12],如CSV、XML等,該標準在我國各地政府中多有實踐,同時也是開放格式的題中應(yīng)有之義,因而作為文章調(diào)查交通數(shù)據(jù)格式的重點觀測指標。
在各省市開放數(shù)據(jù)平臺中所檢索到的1 095條交通數(shù)據(jù)集中,有100條數(shù)據(jù)尚未提供任何可下載獲取的數(shù)據(jù)格式,僅能檢索到名稱和簡介,其主要出現(xiàn)在日照、泰安、濰坊、棗莊和濟南。在可下載數(shù)據(jù)集中,存有88.28%的可機讀數(shù)據(jù),但其中僅有66.60%滿足可獲取、非專屬的開放格式要求。其中,貴陽、濟南、東莞、廣州、山東等24個地方平臺上提供的交通數(shù)據(jù)集已全部滿足開放格式的標準。例如貴陽交通運輸建設(shè)從業(yè)人員信息提供了xls,csv,xlm,json,rdf等5種數(shù)據(jù)格式,用戶可根據(jù)自身需求選擇不同格式下載使用。在整體數(shù)據(jù)格式形勢較好的情況下,仍有浙江、武漢、肇慶等6個開放數(shù)據(jù)平臺存有58條(占總量5.2%)數(shù)據(jù)集提供的是不可機讀格式。例如2016年肇慶市郵電業(yè)務(wù)總量,數(shù)據(jù)容量小且采用DOC格式展示表格數(shù)據(jù),其實這類數(shù)據(jù)完全可以采用XLS格式,以方便用戶下載利用。究其原因,一方面是部分交通數(shù)據(jù)集內(nèi)容使然,如湖北省已建高速公路圖、漢口漢陽片區(qū)堵點繞行圖等通過JPG的方式呈現(xiàn)更加直觀,另一方面則是可用機讀格式實現(xiàn)的數(shù)據(jù)卻未使用,如武漢市車管所及其分所、荊門市交通運輸局行政執(zhí)法持證人員信息公示、肇慶市運輸工具擁有量等。除此以外,部分省市還出現(xiàn)所展示數(shù)據(jù)格式與可供下載的數(shù)據(jù)格式并不匹配的問題,如某市“道路運輸從業(yè)人員查詢”數(shù)據(jù)集,展示了xls,csv,xlm,json,rdf五種格式,卻只提供了csv格式下載渠道。
數(shù)據(jù)持續(xù)是指各個數(shù)據(jù)集更新的時間頻率,關(guān)系到數(shù)據(jù)本身的時效性和用戶對數(shù)據(jù)的持續(xù)使用。政府數(shù)據(jù)開放平臺管理運營是一項持續(xù)性和常態(tài)化工作,平臺上線后應(yīng)持續(xù)更新和添加數(shù)據(jù)集,以滿足社會對開放數(shù)據(jù)日益增長的需求。文章跟蹤考察各個數(shù)據(jù)平臺在截至2018年8月20日更新的交通類數(shù)據(jù)集情況,發(fā)現(xiàn)大量平臺能基本保持新增數(shù)據(jù)集持續(xù)增加與存量數(shù)據(jù)集動態(tài)更新,但仍有不少地方平臺存在交通數(shù)據(jù)集延遲更新或停滯現(xiàn)象。
表3 交通數(shù)據(jù)集更新情況
調(diào)查發(fā)現(xiàn),在各數(shù)據(jù)開放平臺所提供的1 095條交通數(shù)據(jù)集中,共有183條(16.71%)數(shù)據(jù)集并未承諾更新頻率,導(dǎo)致用戶無法尋求數(shù)據(jù)更新時間以持續(xù)利用數(shù)據(jù);另有178條(16.26%)數(shù)據(jù)集承諾更新頻率類型為自定義和不定時更新,即不能提供準確更新頻率。上述現(xiàn)象皆容易造成數(shù)據(jù)的維護與更新缺乏監(jiān)督機制,從而導(dǎo)致數(shù)據(jù)集發(fā)布形同虛設(shè),無法持續(xù)產(chǎn)生數(shù)據(jù)價值。實際情況也印證了以上觀點:在承諾更新頻率為自定義的數(shù)據(jù)集中,有85%以上的數(shù)據(jù)都未再進行更新。除此以外,承諾更新頻率以年為周期所占的比重最大,達到41.37%,相比之下以半年、季度、月、周為承諾更新頻率的數(shù)據(jù)集占比較少,如表3所示。一般來說,更新周期越短,更新頻率越快,用戶利用數(shù)據(jù)的可能性也越大,從而更能推動相關(guān)部門更新數(shù)據(jù),形成良性循環(huán)。不可否認,部分數(shù)據(jù)確實存在收集成本大、難度高,并不適用于短頻更新。但在承諾更新的數(shù)據(jù)集中,共有38.54%的數(shù)據(jù)集并未履行承諾,直接影響了各平臺數(shù)據(jù)持續(xù)性的整體水平。其中,貴陽、山東各地、上海等市的交通數(shù)據(jù)更新情況較好,但大部分省市在數(shù)據(jù)持續(xù)方面仍然存在未及時更新的情況,且無法找到其歷史存量數(shù)據(jù)的情況。
數(shù)據(jù)瀏覽量和下載量直觀展現(xiàn)了數(shù)據(jù)利用情況,反映出用戶對數(shù)據(jù)信息的需求導(dǎo)向和使用意向,有助于平臺運營維護者根據(jù)用戶需求有針對性地完善數(shù)據(jù)集內(nèi)容,逐步提升平臺數(shù)據(jù)利用率。
從交通數(shù)據(jù)瀏覽量上看,各數(shù)據(jù)集瀏覽量普遍偏低,其中低于500人次瀏覽的共有758條,占比達69.22%;數(shù)據(jù)集瀏覽量在5 000以上的僅占2%,主要體現(xiàn)為北京軌道交通路線、廣州市機動車交通違法監(jiān)控抓拍位置信息、高架上匝道關(guān)閉時間等信息,其瀏覽量均超過10 000,其中北京軌道交通路線瀏覽量達到了22 968,這類信息與市民日常交通出行密切相關(guān),因此其利用率較高。
在數(shù)據(jù)下載量方面,下載量在500以內(nèi)的數(shù)據(jù)集占到73.97%,其中有近19.36%的數(shù)據(jù)集下載量為0。零下載量數(shù)據(jù)集的存在一方面是由于數(shù)據(jù)不滿足用戶需求,另一方面是該部分數(shù)據(jù)集未提供可下載的文件,用戶無法進行下載和使用。另外,數(shù)據(jù)下載量高于500的僅占7.03%,主要體現(xiàn)為廣東機動車臨界未檢驗通告、上海城市道路信息、上海車輛統(tǒng)計等信息,尤其上海高架上匝道關(guān)閉時間信息下載量達到5 603,居所有交通數(shù)據(jù)下載量榜首。
值得注意的是,部分數(shù)據(jù)集出現(xiàn)下載量嚴重大于瀏覽量的奇怪現(xiàn)象,通過政府信箱反饋后,被告知為技術(shù)問題,但并未做出修正。
應(yīng)用程序編程接口(Application Program Interface)是各地數(shù)據(jù)開放平臺都會普遍提供的一種數(shù)據(jù)調(diào)用形式,相比于數(shù)據(jù)集下載,API更能使用戶高效獲取所需要的數(shù)據(jù)條目,以滿足開發(fā)者的數(shù)據(jù)需求。在文章所搜集的交通類數(shù)據(jù)集中,有112個數(shù)據(jù)集提供了調(diào)用接口,占10.23%。同時,部分城市借鑒數(shù)據(jù)下載量的形式,展示了API調(diào)用統(tǒng)計量,以便于更加深入了解數(shù)據(jù)集的利用程度與開發(fā)程度,如北京市政務(wù)數(shù)據(jù)資源網(wǎng)和東營市公共數(shù)據(jù)開放網(wǎng)。
目前,雖然大量城市的數(shù)據(jù)開放平臺已認識到數(shù)據(jù)接口對促進數(shù)據(jù)活化的重要性,但總體實施仍處于初級階段,以致數(shù)據(jù)調(diào)用接口提供的規(guī)范性較差、自主性較強。主要問題有:其一,數(shù)據(jù)調(diào)用和下載的混亂,部分城市分別提供了數(shù)據(jù)和接口兩個欄目,但具體數(shù)據(jù)集分配交叉,如上?!翱焖俾仿访婢W(wǎng)流量”數(shù)據(jù)集在數(shù)據(jù)產(chǎn)品中提供了普通下載渠道和調(diào)用渠道,但在數(shù)據(jù)接口中卻無法檢索到該數(shù)據(jù)集。相對而言,北京市整體較為規(guī)范,所有交通數(shù)據(jù)集都可進行下載和調(diào)用。其二,數(shù)據(jù)調(diào)用說明缺失,增大數(shù)據(jù)利用難度。部分城市提供了以json和xml為主的可調(diào)用格式,但卻未提供涵蓋接口描述、錯誤代碼等數(shù)據(jù)調(diào)用說明,增大了數(shù)據(jù)利用難度。
數(shù)據(jù)分析工具是由政府數(shù)據(jù)開放平臺所提供,用以幫助用戶對數(shù)據(jù)集進行簡單分析和程序開發(fā)。目前國內(nèi)政府數(shù)據(jù)開放平臺提供的工具主要包括三類,分別是:可視化分析工具、開發(fā)工具和地理空間工具。
可視化分析工具是指平臺提供了實現(xiàn)數(shù)據(jù)集可視化或統(tǒng)計分析的工具。用戶可以在數(shù)據(jù)集頁面通過設(shè)置不同條件,對數(shù)據(jù)進行初步的統(tǒng)計分析,還可以對統(tǒng)計結(jié)果進行可視化呈現(xiàn),如餅狀圖、柱狀圖和曲線圖。其次,開發(fā)工具的提供以便利開發(fā)者為目的,但部分地區(qū)僅提供了付費下載的跳轉(zhuǎn)鏈接或僅有對工具的文字介紹,性質(zhì)更接近于開發(fā)工具的推薦者,而不是開發(fā)工具的提供者。地理空間工具是指平臺提供了將政府開放數(shù)據(jù)和地理信息進行融合應(yīng)用的功能。目前,長沙、東莞、佛山、山東等平臺提供了地理空間工具,這類地圖工具多與高德、百度等企業(yè)合作,提供導(dǎo)航功能,或?qū)⒁恍┕膊块T的位置疊加在地圖上提供服務(wù)。以山東公共數(shù)據(jù)開放網(wǎng)為例,用戶可在頁面上自行檢索或根據(jù)主題分類查找地理數(shù)據(jù)集,然后疊加在地圖上顯示。
交通數(shù)據(jù)開放的利用成果主要包括APP應(yīng)用程序、數(shù)據(jù)分析結(jié)果和各項研究成果,其中APP應(yīng)用程序使用范圍最廣,對于公眾來說實用價值最高??v觀43個數(shù)據(jù)開放平臺,僅有貴陽、濟南、無錫、成都等12個平臺在應(yīng)用欄目中提供了交通領(lǐng)域的APP應(yīng)用程序,但都未直接提供下載鏈接,用戶最便捷的方式是在手機應(yīng)用下載中搜索APP名稱進行下載。通過下載該類APP發(fā)現(xiàn),超過一半的應(yīng)用程序存在閃退、系統(tǒng)不兼容、更新慢、用戶體驗感差等問題。例如成都熊貓駕信APP,是一款實現(xiàn)駕駛?cè)撕蜋C動車違法查詢、處理、繳費的一條龍?zhí)幚碥浖?,擁有高達171萬次的下載量,但卻存在評分低、數(shù)據(jù)處理能力弱、繳費慢、廣告多、高額代辦費等各項問題。
數(shù)據(jù)應(yīng)用比賽是政府和企業(yè)從推動數(shù)據(jù)利用、鼓勵公眾參與、宣傳數(shù)據(jù)開放的角度出發(fā),所籌辦的大數(shù)據(jù)應(yīng)用創(chuàng)新設(shè)計大賽。由于城市交通問題日益突出,很多數(shù)據(jù)應(yīng)用比賽都從交通層面出發(fā),開展以交通為主題的應(yīng)用比賽,例如貴州省2017年舉辦的“云上貴州智慧交通大數(shù)據(jù)應(yīng)用創(chuàng)新大賽”,貴陽市2016年舉辦的“貴陽交通大數(shù)據(jù)系列競賽”和上海市2015年舉辦的以城市交通為主題的“上海開放數(shù)據(jù)創(chuàng)新應(yīng)用大賽”。這類比賽都是以解決交通問題為目的,有針對性地利用交通數(shù)據(jù)研發(fā)新應(yīng)用,形成以公交線路優(yōu)化、出行行為分析、路網(wǎng)流量預(yù)測、高速路異常事件監(jiān)測等交通主題作品,既實現(xiàn)了對數(shù)據(jù)的跨越融合和創(chuàng)新應(yīng)用,釋放了數(shù)據(jù)隱含的價值,也為城市交通治理的智能化、數(shù)據(jù)化發(fā)展提供了探索思路。
數(shù)據(jù)始終是開放政府數(shù)據(jù)戰(zhàn)略的基本元素,沒有優(yōu)質(zhì)的、可用的、規(guī)范的數(shù)據(jù),那么數(shù)據(jù)開放也僅僅是變相的進行統(tǒng)計數(shù)據(jù)發(fā)布或數(shù)據(jù)信息公開。因此,文章認為要想提高交通數(shù)據(jù)利用率,首要解決數(shù)據(jù)本身的問題。在數(shù)據(jù)內(nèi)容方面,各部委應(yīng)對一部分在各省市中都廣泛涉及的數(shù)據(jù)集類型進行統(tǒng)一化和標準化,具體如介紹、格式、更新頻率、數(shù)據(jù)維度等,以做到各平臺交通數(shù)據(jù)橫向可綜合利用。而對于非統(tǒng)一標準的數(shù)據(jù)集,應(yīng)盡可能的向“統(tǒng)一標準”靠攏,最大程度提升數(shù)據(jù)質(zhì)量,以實現(xiàn)各平臺縱向創(chuàng)新發(fā)展。其次,對屬于信息公開和統(tǒng)計數(shù)據(jù)等非“開放數(shù)據(jù)”進行嚴格的審查和追責,確保各平臺開放的是真正有價值的數(shù)據(jù)。在數(shù)據(jù)主題分類方面,交通部門應(yīng)設(shè)置規(guī)范的數(shù)據(jù)目錄,對各平臺發(fā)布的各類交通數(shù)據(jù)進行明確規(guī)定,而針對各平臺創(chuàng)新特色的交通數(shù)據(jù)集,則可先在已分類基礎(chǔ)上進行劃分,不屬于任何分類的則劃入其他類型中,如北京市將交通數(shù)據(jù)劃分為飛機、汽車、火車等。
當前各平臺中80%以上的交通數(shù)據(jù)集屬于靜態(tài)數(shù)據(jù),且降維增量的情況頻出。因此,各平臺應(yīng)整合已發(fā)布的交通數(shù)據(jù),擴充數(shù)據(jù)維度,如時間維度、區(qū)域維度等,而非為圖方便和數(shù)量,而以某某年某某數(shù)據(jù)集的形式進行數(shù)據(jù)開放。例如某市公交類數(shù)據(jù)集,應(yīng)盡可能包含各路公交站臺名、收發(fā)車時間、每日班次、收費標準、車型等數(shù)據(jù),而非形成路線數(shù)據(jù)集、收費數(shù)據(jù)集、車型車檢數(shù)據(jù)集等。
對于路況流量數(shù)據(jù),其數(shù)據(jù)粒度更小、更新頻率更高,對于數(shù)據(jù)利用與數(shù)據(jù)價值產(chǎn)生的作用較大,也更能開發(fā)出高質(zhì)量的交通數(shù)據(jù)應(yīng)用程序。例如地鐵線路流量數(shù)據(jù)集、高速收費站流量數(shù)據(jù)、路口違章數(shù)據(jù)等,是有條件形成優(yōu)質(zhì)數(shù)據(jù)集并向社會公眾開放的。相較于其他類型的數(shù)據(jù)集,交通數(shù)據(jù)中動態(tài)流量數(shù)據(jù)來源渠道多、種類多,且目前多由人工智能設(shè)備采集統(tǒng)計,從而增加流量數(shù)據(jù)占比,并促進交通數(shù)據(jù)的高效利用。
交通數(shù)據(jù)的開放和利用,乃至更為廣泛的政府數(shù)據(jù)的開放和利用,其主要推力仍來自于政府部門對數(shù)據(jù)開放的正確認識,包括開放什么、怎么開放、如何追責、如何評估等。以交通數(shù)據(jù)為例,其開放的目的在于和社會公眾一起探討和解決城市擁堵問題、公路運輸問題、尾氣排放問題等,以期實現(xiàn)智慧交通、智慧城市。同樣,為促進交通數(shù)據(jù)活用,政府交通部門可通過政府采購、服務(wù)外包、社會眾包等方式,將數(shù)據(jù)量大、敏感度高的數(shù)據(jù)集,依托企業(yè)、高等院校、科研機構(gòu)來開展交通數(shù)據(jù)應(yīng)用,創(chuàng)造更多新產(chǎn)品和新業(yè)態(tài)。目前,由交通運輸部采用政企合作模式建設(shè)的、基于公共云服務(wù)的綜合交通出行服務(wù)數(shù)據(jù)開放、管理與應(yīng)用平臺——出行云(綜合交通出行大數(shù)據(jù)開放云平臺)已上線,其匯聚了交通部門、院校、企業(yè)等搜集的交通數(shù)據(jù),并聯(lián)合了各單位提供的決策服務(wù)與開發(fā)服務(wù),為各類數(shù)據(jù)集的開發(fā)應(yīng)用提供了借鑒[13]。
交通數(shù)據(jù)開放的根本目的在于促進數(shù)據(jù)利用,大力提倡和鼓勵舉辦各類數(shù)據(jù)大賽,有助于挖掘數(shù)據(jù)潛在價值,可為交通領(lǐng)域帶來巨大的商業(yè)價值和社會價值。目前各地數(shù)據(jù)大賽以數(shù)據(jù)開放為切口,通過政府搭臺、政企合作等方式,發(fā)動公眾參與和協(xié)作來共同解決公共問題。在舉辦大賽的過程中,政府部門感受到了開放數(shù)據(jù)的巨大潛能,加大了對開放數(shù)據(jù)的支持力度,有助于政府部門拓展思路,促使決策實現(xiàn)科學(xué)化和精準化;而社會各界基于開放數(shù)據(jù)提出的創(chuàng)新方案,也為解決實際交通問題提供了實證依據(jù)和新思路。從比賽效果來看,各類數(shù)據(jù)大賽吸引了企業(yè)、高校和社會組織的廣泛參與[14],對解決實際問題、宣傳普及開放數(shù)據(jù)文化、提升公眾數(shù)據(jù)素養(yǎng)具有深刻意義[15]。舉辦大賽的成果也對其他尚未開放數(shù)據(jù)的政府部門起到了示范效應(yīng),加速各行各業(yè)數(shù)據(jù)開放的深入推進。
隨著各省市數(shù)據(jù)開放平臺的陸續(xù)推出,不少專家學(xué)者提出在重視數(shù)據(jù)質(zhì)量的同時,更應(yīng)關(guān)注對數(shù)據(jù)的充分利用。文章以交通數(shù)據(jù)為切入點,對廣東省及其各市、貴州省及其各市、山東省及其各市平臺的數(shù)據(jù)利用情況進行省、市兩級的對比調(diào)查,發(fā)現(xiàn)當前省市兩級政府存在普遍使用不同平臺、市級數(shù)據(jù)無法在省級平臺中找到、同省各市級平臺各自為營等現(xiàn)象,唯有山東省較為樂觀,能夠?qū)崿F(xiàn)省市兩級同一平臺、數(shù)據(jù)共享。上述省市分離現(xiàn)象雖在開放數(shù)據(jù)前期易形成各平臺創(chuàng)新發(fā)展趨向,但若長期如此,勢必造成網(wǎng)站運營成本高昂、數(shù)據(jù)共享難以貫通、用戶查找困難、數(shù)據(jù)標準不一等現(xiàn)象,無形之中為數(shù)據(jù)跨區(qū)域利用增加了難度。正如目前政務(wù)服務(wù)網(wǎng)站一般,省市分離情況嚴重,全面實現(xiàn)省級統(tǒng)籌非一朝一夕之功。因此,在政府數(shù)據(jù)開放平臺建立初期,各地政府如何以實現(xiàn)數(shù)據(jù)充分利用為目的,兼顧省級統(tǒng)籌建設(shè)與地方創(chuàng)新發(fā)展,將會成為后續(xù)探討數(shù)據(jù)橫向跨區(qū)域利用的重要話題。
(來稿時間:2018年12月)