陳 美
(湖北工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院 武漢 430068)
近年來(lái),伴隨著電子政府建設(shè)熱潮,有關(guān)政府開(kāi)放數(shù)據(jù)的議題持續(xù)在全球各國(guó)推進(jìn)。先是2009年美國(guó)政府Data.gov與2010年英國(guó)政府Data.gov.uk的政府開(kāi)放數(shù)據(jù)平臺(tái)正式推出上線,接著許多國(guó)家也都先后加入政府開(kāi)放數(shù)據(jù)平臺(tái)構(gòu)建行動(dòng)當(dāng)中,掀起了這股開(kāi)放數(shù)據(jù)熱潮。就我國(guó)而言,2015年9月5日,國(guó)務(wù)院發(fā)布的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知》提出:“到2018年底前,建成國(guó)家政府?dāng)?shù)據(jù)統(tǒng)一開(kāi)放平臺(tái)?!盵1]2016年7月,中共中央辦公廳和國(guó)務(wù)院辦公廳印發(fā)的《國(guó)家信息化發(fā)展戰(zhàn)略綱要》中第10條對(duì)構(gòu)建政府開(kāi)放數(shù)據(jù)平臺(tái)中數(shù)據(jù)相關(guān)問(wèn)題提出了要求,對(duì)數(shù)據(jù)分享機(jī)制、數(shù)據(jù)管理、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)應(yīng)用、數(shù)據(jù)質(zhì)量、元數(shù)據(jù)提供了政策性的指導(dǎo)[2]。在地方政府層面,貴陽(yáng)市制訂的《貴陽(yáng)市政府?dāng)?shù)據(jù)共享開(kāi)放條例》已于2017年5月1日起執(zhí)行[3];河北省政府提出,要推進(jìn)政府?dāng)?shù)據(jù)的開(kāi)放共享,到2018年底前建設(shè)政府統(tǒng)一數(shù)據(jù)開(kāi)放平臺(tái)[4]。政府開(kāi)放數(shù)據(jù)平臺(tái)的構(gòu)建不僅只是政府向外部世界開(kāi)放其門(mén)戶(hù)及其同每位公民謀求合作的需要,更是實(shí)現(xiàn)政府?dāng)?shù)據(jù)的知識(shí)組織與知識(shí)創(chuàng)新的過(guò)程,即政府?dāng)?shù)據(jù)增值的過(guò)程。因此,政府開(kāi)放數(shù)據(jù)平臺(tái)的基本宗旨應(yīng)立足于政府?dāng)?shù)據(jù)的增值服務(wù)。在創(chuàng)新2.0背景下,政府不僅要注重?cái)?shù)據(jù)資源的總量投入,更要注重其開(kāi)發(fā)利用問(wèn)題,特別是在我國(guó)缺乏統(tǒng)一的政府開(kāi)放數(shù)據(jù)平臺(tái)的情況下,政府開(kāi)放數(shù)據(jù)平臺(tái)的頂層設(shè)計(jì)問(wèn)題就變得尤為突出。
政府部門(mén)是數(shù)據(jù)提供者,民間私營(yíng)部門(mén)是數(shù)據(jù)利用者,但后者對(duì)政府部門(mén)的數(shù)據(jù)產(chǎn)生、搜集與存儲(chǔ)等過(guò)程不了解,這使得政府部門(mén)與數(shù)據(jù)利用者之間存在信息不對(duì)稱(chēng)。在信息不對(duì)稱(chēng)的情況下,容易出現(xiàn)“囚徒困境”。“囚徒困境”是博弈論中的一個(gè)經(jīng)典案例,意指兩個(gè)較為理性的人,由于擔(dān)心彼此的背叛而采取不合作策略,最終導(dǎo)致集體行動(dòng)的無(wú)效率[5]。由于信息不對(duì)稱(chēng),政府部門(mén)不太了解數(shù)據(jù)利用者的數(shù)據(jù)需求,而數(shù)據(jù)利用者亦無(wú)法掌握各級(jí)政府部門(mén)所持有的政府?dāng)?shù)據(jù),也不了解哪些數(shù)據(jù)受知識(shí)產(chǎn)權(quán)保護(hù)。因此,各級(jí)政府部門(mén)應(yīng)當(dāng)通過(guò)一定手段來(lái)避免這種信息不對(duì)稱(chēng),從而推動(dòng)政府?dāng)?shù)據(jù)的增值利用。例如,美國(guó)開(kāi)放數(shù)據(jù)平臺(tái)Data.gov上的許可(Licensing)說(shuō)明中指出:“所有聯(lián)邦數(shù)據(jù)都無(wú)償提供而且沒(méi)有權(quán)利限制。基于前述《著作權(quán)法》第105條,政府的工作成果原則不在《著作權(quán)法》保障范圍內(nèi),該數(shù)據(jù)集會(huì)顯示‘聯(lián)邦’的文字標(biāo)記;但是,本平臺(tái)的非聯(lián)邦數(shù)據(jù)的授權(quán)則依照該數(shù)據(jù)集下方所提供的‘Show more’鏈接來(lái)進(jìn)行,非聯(lián)邦數(shù)據(jù)集則會(huì)顯示‘大學(xué)’‘多樣資源’‘州’等其它文字標(biāo)示?!盵6]
開(kāi)放數(shù)據(jù)強(qiáng)調(diào)的兩個(gè)重點(diǎn)方面是開(kāi)放和機(jī)器可讀性,旨在將政府服務(wù)與技術(shù)結(jié)合,達(dá)到公私合作的目標(biāo)。與公共數(shù)據(jù)或信息公開(kāi)不同的是,開(kāi)放數(shù)據(jù)側(cè)重于應(yīng)用層面。正如大數(shù)據(jù)一樣,開(kāi)放數(shù)據(jù)被看作一座礦山,政府部門(mén)不斷增加這個(gè)礦山上的數(shù)據(jù)量,如果數(shù)據(jù)沒(méi)有得到利用或者讓使用者漫無(wú)目的進(jìn)行挖掘,那么將導(dǎo)致數(shù)據(jù)價(jià)值無(wú)法得到釋放。因此,如何鼓勵(lì)并促進(jìn)更多開(kāi)發(fā)者進(jìn)行利用,才是關(guān)鍵所在。例如,新加坡開(kāi)放數(shù)據(jù)平臺(tái)Data.gov.sg特別設(shè)置“開(kāi)發(fā)者專(zhuān)區(qū)”,方便使用者查找與使用數(shù)據(jù)集,為使用者提供諸如API等得以開(kāi)發(fā)App的資源工具,而且強(qiáng)調(diào)使用Data.gov.sg所列示的API必須遵循Data.gov.sg的“數(shù)據(jù)集使用規(guī)范”,還必須額外遵循數(shù)據(jù)提供部門(mén)數(shù)據(jù)集的規(guī)范。此外,該平臺(tái)將使用政府?dāng)?shù)據(jù)開(kāi)發(fā)的App提交至App 展示區(qū)展示(App Showcase)[7]。
企業(yè)架構(gòu)(EA)最早是由學(xué)者札克曼(J.A.Zachman)在1987年發(fā)表的一篇名為《信息系統(tǒng)架構(gòu)框架》(A Framework for Information Systems Architecture)的論文中所提出[8],后來(lái)他又將信息系統(tǒng)架構(gòu)(Information Systems Architecture)重新命名為企業(yè)架構(gòu),將其視為企業(yè)信息基礎(chǔ)設(shè)施提供的一種可以理解的表達(dá)方式:綜合考慮不同角色,通過(guò)不同的觀點(diǎn)來(lái)看企業(yè)流程[9]。企業(yè)架構(gòu)影響范疇非常廣泛,這是因?yàn)槊總€(gè)領(lǐng)域都有企業(yè)架構(gòu),引導(dǎo)企業(yè)架構(gòu)發(fā)展、構(gòu)建與維護(hù)的是企業(yè)架構(gòu)師,如連接和聯(lián)系企業(yè)的領(lǐng)導(dǎo)人、重要關(guān)系人、具有決策權(quán)的政府高級(jí)官員、學(xué)校教授或軍隊(duì)軍官等。企業(yè)機(jī)構(gòu)能引導(dǎo)出各種觀點(diǎn)的架構(gòu)觀,通過(guò)架構(gòu)框架進(jìn)行觀點(diǎn)整合并確保信息可互操作性,從而達(dá)到對(duì)規(guī)劃、發(fā)展、使用、維護(hù)的可控制循環(huán)。
當(dāng)前,存在許多企業(yè)架構(gòu)理論,包括IBM架構(gòu)(IBM Architecture)、開(kāi)放群組架構(gòu)(The Open Group Architecture Framework)、美國(guó)國(guó)防部架構(gòu)規(guī)范(U.S. Department of Defense Architecture Framework,DoDAF)、Zachman架構(gòu)(Zachman Architecture)、美國(guó)聯(lián)邦企業(yè)架構(gòu)規(guī)范(Federal Enterprise Architecture Framework,F(xiàn)EAF)、英國(guó)國(guó)防部架構(gòu)規(guī)范(Ministry of Defense Architecture Framework,MODAF)、企業(yè)架構(gòu)立體規(guī)范(Enterprise Architecture 3 Cube Framework)等(見(jiàn)表1),這些架構(gòu)大多都以特定的架構(gòu)規(guī)范來(lái)界定企業(yè)架構(gòu)。特定的架構(gòu)規(guī)范有其優(yōu)越性,但由于它具有的特定屬性,使得其應(yīng)用的彈性會(huì)略顯不足。當(dāng)然,也有企業(yè)架構(gòu)存在一定彈性,如TOGAF企業(yè)架構(gòu)方法使用ArchiMate架構(gòu)語(yǔ)言,以定義好的視點(diǎn)來(lái)設(shè)計(jì)企業(yè)架構(gòu)視圖。由于它具有一定彈性,而且沒(méi)有明確制定企業(yè)架構(gòu)規(guī)范,完全符合開(kāi)放群組的精神,因而企業(yè)架構(gòu)師也可以依據(jù)不同的企業(yè)架構(gòu)需求來(lái)制定自身的企業(yè)架構(gòu)規(guī)范。
表1 引入 EA 進(jìn)行頂層設(shè)計(jì)的國(guó)家
企業(yè)架構(gòu)早期應(yīng)用于一些美國(guó)政府機(jī)構(gòu),而且美國(guó)政府對(duì)企業(yè)架構(gòu)的發(fā)展起了重要的推動(dòng)作用。1999年,美國(guó)聯(lián)邦政府根據(jù)Colinger-Cohen法案要求政府部門(mén)信息主管(CIO)負(fù)責(zé)開(kāi)發(fā)、維護(hù)和協(xié)助一個(gè)整合的IT架構(gòu),因而在Zachman架構(gòu)上構(gòu)建了聯(lián)邦企業(yè)架構(gòu)框架FEAF[10],旨在促進(jìn)跨部門(mén)資源共享、降低成本、提升對(duì)民眾的服務(wù)質(zhì)量。FEAF包括業(yè)務(wù)、數(shù)據(jù)、應(yīng)用、績(jī)效和技術(shù)5個(gè)參考模型,旨在為聯(lián)邦機(jī)構(gòu)提供一個(gè)架構(gòu)的公共結(jié)構(gòu),以利于這些聯(lián)邦機(jī)構(gòu)間的公共業(yè)務(wù)流程、技術(shù)引入、信息流和系統(tǒng)投資的協(xié)調(diào)等(見(jiàn)圖1)。
圖1 美國(guó)聯(lián)邦政府總體架構(gòu)框架(FEAF)[11]
2002年2月,美國(guó)OMB建立聯(lián)邦企業(yè)架構(gòu)程序管理辦公室,開(kāi)發(fā)了聯(lián)邦企業(yè)架構(gòu)FEA(Federal Enterprise Architecture),包括如下參考模型[12]:①績(jī)效參考模型(Performance Reference Model,PRM)對(duì)應(yīng)至戰(zhàn)略子領(lǐng)域架構(gòu)觀點(diǎn)來(lái)進(jìn)行結(jié)構(gòu)分析和產(chǎn)出報(bào)表。PRM聯(lián)結(jié)單位政策、內(nèi)部業(yè)務(wù)組件和投資,為投資策略成果提供測(cè)量方式。②業(yè)務(wù)參考模型(Business Reference Model,BRM)對(duì)應(yīng)到業(yè)務(wù)子領(lǐng)域架構(gòu)觀點(diǎn)來(lái)進(jìn)行結(jié)構(gòu)分析和產(chǎn)出報(bào)表。BRM通過(guò)共同任務(wù)和支持服務(wù)領(lǐng)域的分類(lèi)描述組織來(lái)強(qiáng)化內(nèi)部與跨部門(mén)之間的合作。③數(shù)據(jù)參考模型(Data Reference Model,DRM)對(duì)應(yīng)到數(shù)據(jù)領(lǐng)域架構(gòu)。DRM有助于在數(shù)據(jù)孤島中發(fā)現(xiàn)數(shù)據(jù)所有權(quán),理解數(shù)據(jù)的含義以及如何存取、支持績(jī)效結(jié)果的應(yīng)用。④應(yīng)用系統(tǒng)參考模型(Application Reference Model,ARM)對(duì)應(yīng)到應(yīng)用系統(tǒng)領(lǐng)域架構(gòu)。ARM歸納出系統(tǒng)和應(yīng)用程序相關(guān)的標(biāo)準(zhǔn)和技術(shù)支持的服務(wù)能力,提供允許機(jī)構(gòu)分享和重復(fù)使用以實(shí)現(xiàn)規(guī)模經(jīng)濟(jì)的通用解決方案。⑤基礎(chǔ)設(shè)施參考模型(Infrastructure Reference Model,IRM)對(duì)應(yīng)到基礎(chǔ)設(shè)施領(lǐng)域架構(gòu)。IRM將網(wǎng)絡(luò)或云端相關(guān)的標(biāo)準(zhǔn)和技術(shù)進(jìn)行分類(lèi),用以支持或提供語(yǔ)音、數(shù)據(jù)、影片及行動(dòng)服務(wù)的組件和功能。⑥安全參考模型(Security Reference Model,SRM)對(duì)應(yīng)到安全領(lǐng)域架構(gòu)。SRM提供聯(lián)邦部門(mén)通用的語(yǔ)言和方法,進(jìn)行業(yè)務(wù)和績(jī)效目標(biāo)的安全、隱私內(nèi)容討論。
文章采用FEAF的框架理論以及FEA的相應(yīng)方法,同時(shí)借鑒其它框架,探討政府開(kāi)放數(shù)據(jù)平臺(tái)頂層設(shè)計(jì)框架。
基于企業(yè)架構(gòu)并結(jié)合中國(guó)國(guó)情,無(wú)論是中央或地方層面,政府開(kāi)放數(shù)據(jù)平臺(tái)頂層架構(gòu)應(yīng)該包括業(yè)務(wù)架構(gòu)、數(shù)據(jù)架構(gòu)、應(yīng)用軟件架構(gòu)、技術(shù)架構(gòu)、績(jī)效架構(gòu)(見(jiàn)圖2)。
圖2 …政府開(kāi)放數(shù)據(jù)平臺(tái)頂層架構(gòu)的總體框架結(jié)構(gòu)
4.1.1 數(shù)據(jù)獲取和存儲(chǔ)
所有開(kāi)放數(shù)據(jù)目錄都提供通向公開(kāi)可用數(shù)據(jù)的入口。數(shù)據(jù)目錄可以將數(shù)據(jù)存儲(chǔ)在自己的管理系統(tǒng)中,并為用戶(hù)提供基本可視化選項(xiàng),或者簡(jiǎn)單地管理元數(shù)據(jù)并提供存儲(chǔ)在其它服務(wù)器上的完整數(shù)據(jù)集的鏈接??傮w來(lái)看,數(shù)據(jù)目錄應(yīng)當(dāng)具有如下多種選擇:既可以諸如CSV、XML和JSON等開(kāi)放的非專(zhuān)有格式來(lái)提供數(shù)據(jù),也可為了方便專(zhuān)業(yè)用戶(hù)而提供專(zhuān)有格式的數(shù)據(jù),如Excel、數(shù)據(jù)管理統(tǒng)計(jì)繪圖軟件或形狀文件GIS;既可以把數(shù)據(jù)存儲(chǔ)在內(nèi)部存儲(chǔ)器上,使得只有內(nèi)部可以看到和可用,能夠滿(mǎn)足客戶(hù)需求,也可以將數(shù)據(jù)存儲(chǔ)在獨(dú)立的、可公開(kāi)訪問(wèn)的服務(wù)器上,使得數(shù)據(jù)成為共有的,即所有人都可見(jiàn)和可用;既可以自定義元數(shù)據(jù)字段,也可以提供都柏林核心元數(shù)據(jù)或DCAT支持(DCAT是一個(gè)基于RDF的出版標(biāo)準(zhǔn));既可以實(shí)現(xiàn)手動(dòng)、批量和自動(dòng)化方式來(lái)上傳數(shù)據(jù),也可以通過(guò)外部系統(tǒng)或代理系統(tǒng)的數(shù)據(jù)接口來(lái)寫(xiě)入數(shù)據(jù)。
4.1.2 用戶(hù)體驗(yàn)
開(kāi)放數(shù)據(jù)目錄應(yīng)當(dāng)為用戶(hù)提供訪問(wèn)、探索和參與數(shù)據(jù)的工具,包括:①搜索,即全文搜索、多面搜索、結(jié)果篩選和排序;②地理搜索,即在定義的地理區(qū)域內(nèi)來(lái)搜索數(shù)據(jù);③數(shù)據(jù)預(yù)覽;④通過(guò)圖表和地圖進(jìn)行數(shù)據(jù)可視化;⑤參與工具,能夠?qū)?shù)據(jù)集來(lái)表達(dá)偏好或進(jìn)行評(píng)論;能夠建議新的數(shù)據(jù)集;提供鏈接到臉書(shū)、谷歌+、推特等社交媒體;⑥能夠?yàn)橛脩?hù)保存可視化,而且能將可視化分析作品嵌入在博客、網(wǎng)站或分享到網(wǎng)絡(luò)上;⑦提供多種語(yǔ)言支持;⑧提供移動(dòng)支持。
4.1.3 應(yīng)用程序編程接口
API 為開(kāi)發(fā)人員提供了一個(gè)入口點(diǎn),使得可直接訪問(wèn)數(shù)據(jù)目錄及其內(nèi)容,提供了與開(kāi)放數(shù)據(jù)目錄本身相同的服務(wù)。API使得數(shù)據(jù)提供者可以通過(guò)外部系統(tǒng)來(lái)上傳數(shù)據(jù)。API具有如下功能或特點(diǎn):通過(guò)API可以搜索或查詢(xún)數(shù)據(jù)目錄;調(diào)用API服務(wù)后可采用多種格式返回?cái)?shù)據(jù),如CSV、XML、JSON;數(shù)據(jù)提供者可以通過(guò)API來(lái)添加和更新數(shù)據(jù)集;數(shù)據(jù)提供者可以通過(guò)API來(lái)更新元數(shù)據(jù)。
4.1.4 集成 /定制
這一特點(diǎn)指開(kāi)放數(shù)據(jù)網(wǎng)站是否能與其它網(wǎng)站集成或嵌入數(shù)據(jù)目錄、 添加額外的頁(yè)面、布局、配色方案、徽標(biāo)等。具體包括:自定義主題;自定義主頁(yè)和登錄頁(yè);與外部?jī)?nèi)容系統(tǒng)集成;擴(kuò)展性,即通過(guò)模塊添加或自定義功能;分析,即提供有關(guān)頁(yè)面視圖和下載的統(tǒng)計(jì)信息。
4.2.1 軟件交付模型
包括:開(kāi)源、自管理、云托管和軟件服務(wù)(SaaS)。總體成本是開(kāi)放數(shù)據(jù)目錄的一個(gè)關(guān)鍵評(píng)估標(biāo)準(zhǔn)?!伴_(kāi)源”軟件分發(fā)的產(chǎn)品是“免費(fèi)的”,因?yàn)檫@些產(chǎn)品可以通過(guò)免費(fèi)下載獲得,而且可以得到修改或定制,不受限制也不收取許可費(fèi)。但是,開(kāi)源軟件仍然引發(fā)了管理成本,這些成本涉及托管、維護(hù)源代碼、安裝更新和安全補(bǔ)丁以及提供培訓(xùn)。許多咨詢(xún)公司和企業(yè)都提供這些服務(wù)。開(kāi)放源碼目錄可以由云托管,以減少服務(wù)器成本和提供績(jī)效可測(cè)量性。
相比之下,SaaS產(chǎn)品通常是數(shù)據(jù)來(lái)源于單個(gè)供應(yīng)商的專(zhuān)有產(chǎn)品,這些供應(yīng)商提供軟件和托管服務(wù),針對(duì)這些服務(wù)來(lái)設(shè)置費(fèi)用并定期收取相應(yīng)費(fèi)用。在SaaS交付模型下,供應(yīng)商負(fù)責(zé)軟件維護(hù)并確保服務(wù)器可用和可靠,而且根據(jù)合同來(lái)提供可測(cè)量的績(jī)效,通常還提供培訓(xùn)和一些定制措施。就決策者而言,應(yīng)該考慮兩個(gè)方面的內(nèi)容。一方面,開(kāi)源目錄提供高度的可定制性和自主性,使得政府部門(mén)具有一定的技術(shù)能力來(lái)管理技術(shù)和定制程序。大多數(shù)開(kāi)源目錄都被設(shè)計(jì)為在Linux或Apache服務(wù)器上運(yùn)行,并以Python或PHP編程語(yǔ)言編寫(xiě)。這意味著,如果在這些領(lǐng)域的技術(shù)并不成熟,那么政府部門(mén)可能很快發(fā)現(xiàn)開(kāi)源產(chǎn)品不靈活或難于管理。另一方面,雖然SaaS產(chǎn)品可以提供大量的定制,但它們的靈活性明顯取決于供應(yīng)商是否能夠并愿意提供哪些服務(wù)。開(kāi)放數(shù)據(jù)目錄必須承載在可靠、快速的服務(wù)器架構(gòu)上,因?yàn)榉?wù)器停機(jī)或響應(yīng)時(shí)間過(guò)慢會(huì)使得用戶(hù)不愿使用。如果政府部門(mén)沒(méi)有提供快速、可靠的IT基礎(chǔ)設(shè)施,那么云托管或SaaS可能是更好的選擇。但這其中所面臨的一個(gè)困境是,政府部門(mén)可能有采購(gòu)政策或法律的約束,使得較難收購(gòu)SaaS產(chǎn)品和進(jìn)行云托管。
4.2.2 可擴(kuò)展性
政府部門(mén)應(yīng)該預(yù)期需要在幾個(gè)方面擴(kuò)展其開(kāi)放數(shù)據(jù)目錄。隨著數(shù)據(jù)供應(yīng)的增長(zhǎng)和數(shù)據(jù)集的增加,開(kāi)放數(shù)據(jù)目錄必須能夠容納額外的數(shù)據(jù)集,而且不會(huì)降低績(jī)效。同樣地,隨著需求的增長(zhǎng),目錄必須能夠容納更多用戶(hù)產(chǎn)生的額外服務(wù)器負(fù)載。由于供求增長(zhǎng)可能給技術(shù)增加負(fù)擔(dān),因而重要的是選擇一個(gè)能夠輕松擴(kuò)展的服務(wù)器基礎(chǔ)設(shè)施。同樣地,政府部門(mén)可能已經(jīng)在內(nèi)部有這種能力,在這種情況下,自我管理的目錄可能是最好的選擇。否則,政府部門(mén)應(yīng)考慮云托管或SaaS方法。最后,隨著開(kāi)放數(shù)據(jù)計(jì)劃的發(fā)展,開(kāi)放數(shù)據(jù)目錄應(yīng)該能夠靈活添加附加功能,而且其中一些功能可能是在開(kāi)始沒(méi)有預(yù)料到的。一些開(kāi)放數(shù)據(jù)目錄的目的是讓客戶(hù)盡快運(yùn)行起來(lái),但當(dāng)目錄增長(zhǎng)到成百上千的數(shù)據(jù)集時(shí),可能就無(wú)法進(jìn)行擴(kuò)展。政府部門(mén)判斷可擴(kuò)展性的一個(gè)方法是,在數(shù)據(jù)目錄初始建立時(shí)先計(jì)劃好數(shù)據(jù)目錄在一年、兩年或三年以后的大小。隨后,看看當(dāng)前的目錄,以確定哪些工作在需要的規(guī)模中得到良好運(yùn)行。每個(gè)數(shù)據(jù)目錄的網(wǎng)站都應(yīng)該提供使用該數(shù)據(jù)的政府和組織的列表。
4.2.3 數(shù)據(jù)管理的“一體化”模式和聯(lián)合編錄模式
政府部門(mén)在設(shè)計(jì)上需要考慮到的一個(gè)關(guān)鍵點(diǎn)是如何在數(shù)據(jù)目錄中管理和存儲(chǔ)數(shù)據(jù)集。在“一體化”目錄中,數(shù)據(jù)集存儲(chǔ)在目錄的文件或?qū)ο篌w系結(jié)構(gòu)中。相比之下,“聯(lián)合”編錄的設(shè)計(jì)使數(shù)據(jù)集可以存在于任何可公開(kāi)訪問(wèn)的文件或Web服務(wù)器上;目錄包含轉(zhuǎn)向數(shù)據(jù)集的鏈接(URL),而不是包含數(shù)據(jù)集本身。“一體化”模式的一個(gè)好處是,所有數(shù)據(jù)集都可以在一個(gè) IT平臺(tái)進(jìn)行托管和管理,因而實(shí)施機(jī)構(gòu)可以對(duì)整個(gè)目錄基礎(chǔ)設(shè)施開(kāi)展強(qiáng)有力的監(jiān)督。“一體化”目錄模型的另一個(gè)好處是它呈現(xiàn)一致的接口,用戶(hù)無(wú)需瀏覽多個(gè)網(wǎng)站和導(dǎo)航即可獲取數(shù)據(jù)集。
“一體化”模式的主要缺點(diǎn)是,負(fù)責(zé)開(kāi)放數(shù)據(jù)目錄的機(jī)構(gòu)被設(shè)定為需要承擔(dān)的責(zé)任是負(fù)責(zé)管理目錄中的每個(gè)數(shù)據(jù)集(包括更新)。在政府部門(mén)因政治原因或?qū)嶋H原因而更愿意負(fù)責(zé)自己的數(shù)據(jù)管理的情況下,這可能是一個(gè)重要的管理問(wèn)題,尤其是在目錄增長(zhǎng)的情況下,而且尤其是在目錄中包含來(lái)自國(guó)家、州、市等多個(gè)層次政府的數(shù)據(jù)集時(shí)?!奥?lián)合”數(shù)據(jù)目錄使得管理機(jī)構(gòu)不用負(fù)責(zé)關(guān)注政府部門(mén)數(shù)據(jù)集,而且還使得各個(gè)政府部門(mén)擁有更大的自主權(quán),因?yàn)檫@些部門(mén)將繼續(xù)在它們自己的系統(tǒng)上持有它們的數(shù)據(jù)集,只需要提供一個(gè)URL和最新的元數(shù)據(jù)即可。但是,聯(lián)合方法還要求政府部門(mén)具有管理其自己的 IT基礎(chǔ)設(shè)施的能力。一些數(shù)據(jù)目錄允許數(shù)據(jù)存儲(chǔ)在內(nèi)部(一體化)或外部(聯(lián)合)中,從而提供了一種混合方法。但是,在設(shè)計(jì)目錄時(shí),應(yīng)該充分考慮數(shù)據(jù)管理問(wèn)題。
政府開(kāi)放數(shù)據(jù)平臺(tái)應(yīng)當(dāng)在網(wǎng)站上發(fā)布它的績(jī)效指標(biāo),以供公眾查看。這將為使用者提供發(fā)現(xiàn)、分析和報(bào)道績(jī)效指標(biāo)的能力,這些績(jī)效指標(biāo)可用于追蹤數(shù)據(jù)實(shí)用性、數(shù)據(jù)用途以及數(shù)據(jù)可用性,增加透明度和數(shù)據(jù)利用。以美國(guó)政府開(kāi)放數(shù)據(jù)平臺(tái)Data.gov為例,它曾經(jīng)制定了政府開(kāi)放數(shù)據(jù)平臺(tái)的績(jī)效指標(biāo)(見(jiàn)表2)。
表2 美國(guó)政府開(kāi)放數(shù)據(jù)平臺(tái)績(jī)效指標(biāo)[10]
政府開(kāi)放數(shù)據(jù)平臺(tái)的業(yè)務(wù)架構(gòu)是以政府職能為前提的,即在政府職能框架下確定可以提供哪些業(yè)務(wù)。政府職能是指國(guó)家行政部門(mén)依法對(duì)國(guó)家和社會(huì)公共事務(wù)進(jìn)行管理時(shí)應(yīng)承擔(dān)的職責(zé)和所具有的功能。因此,政府職能反映著公共行政的基本內(nèi)容和活動(dòng)方向。在職能劃分的架構(gòu)下,中央政府對(duì)于地方公共服務(wù)的供給在一定程度上應(yīng)交由地方政府自主決定,即使地方政府執(zhí)行不力或地方政府間有不同程度的不作為。通過(guò)比較各級(jí)政府職能,可以確立不同層級(jí)政府開(kāi)放數(shù)據(jù)平臺(tái)的業(yè)務(wù)架構(gòu)發(fā)展方向(見(jiàn)表3)。
表3 各級(jí)政府的公共服務(wù)職責(zé)分工[11]
在確定不同層級(jí)政府開(kāi)放數(shù)據(jù)平臺(tái)業(yè)務(wù)架構(gòu)方向后,下一步在于如何調(diào)研具體政府部門(mén)業(yè)務(wù)并將這些數(shù)據(jù)應(yīng)用于業(yè)務(wù)架構(gòu)設(shè)計(jì)當(dāng)中。具體而言,在政府開(kāi)放數(shù)據(jù)平臺(tái)業(yè)務(wù)架構(gòu)設(shè)計(jì)過(guò)程中,應(yīng)考慮設(shè)計(jì)調(diào)研表,對(duì)業(yè)務(wù)對(duì)象、業(yè)務(wù)事項(xiàng)名稱(chēng)、業(yè)務(wù)內(nèi)容等進(jìn)行調(diào)查,同時(shí)設(shè)計(jì)數(shù)據(jù)資源調(diào)查表,內(nèi)容包括數(shù)據(jù)資源名稱(chēng)、數(shù)據(jù)采集途徑、可開(kāi)放情況等,最后將這些調(diào)研數(shù)據(jù)提供給相應(yīng)架構(gòu)設(shè)計(jì)組織,作為業(yè)務(wù)架構(gòu)設(shè)計(jì)的支撐。
數(shù)據(jù)目錄管理軟件是實(shí)現(xiàn)政府開(kāi)放數(shù)據(jù)平臺(tái)中政府開(kāi)放數(shù)據(jù)組織的有力支撐。當(dāng)前,被應(yīng)用得較多的數(shù)據(jù)目錄管理軟件包括:CKAN、DKAN、Junar、OGPL、Socrata、OpenDataSoft等。本研究將對(duì)前5個(gè)進(jìn)行探討,旨在為政府開(kāi)放數(shù)據(jù)平臺(tái)應(yīng)用軟件架構(gòu)的構(gòu)建提供參考。
4.5.1 CKAN
CKAN是一個(gè)瀏覽和使用數(shù)據(jù)的軟件,它能提供相關(guān)工具來(lái)簡(jiǎn)化發(fā)布、分享、查找和使用數(shù)據(jù),如包含儲(chǔ)存數(shù)據(jù)以及強(qiáng)大的數(shù)據(jù)API。CKAN的目的是讓諸如國(guó)家和地區(qū)的政府、企業(yè)和組織之類(lèi)的數(shù)據(jù)發(fā)布者的數(shù)據(jù)得以開(kāi)放和可用。CKAN在世界各地的官方及民間組織的數(shù)據(jù)網(wǎng)站中被廣泛應(yīng)用,如英國(guó)的data.gov.uk、歐盟的publicdata.eu、巴西的dados.gov.br、荷蘭政府門(mén)戶(hù)網(wǎng)站以及美國(guó)、英國(guó)、阿根廷、芬蘭和許多其他國(guó)家的城市地方政府網(wǎng)站。
4.5.2 DKAN
DKAN是一個(gè)有完整編目、發(fā)布及視覺(jué)效果功能的Drupal開(kāi)放數(shù)據(jù)平臺(tái),可讓政府、非營(yíng)利機(jī)構(gòu)及大學(xué)輕松地將數(shù)據(jù)發(fā)布給大眾。Drupal有自己的模塊化體系結(jié)構(gòu),有數(shù)以千計(jì)的模塊可供下載,可以自定義模塊,而且還有一個(gè)大型開(kāi)發(fā)者社區(qū),網(wǎng)址為http://nucivic.com/dkan。應(yīng)用DKAN的例子如德國(guó)科隆(見(jiàn)網(wǎng)址:http://www.offenedatenkoeln.de)。
4.5.3 Junar
Junar是一個(gè)基于云的SaaS開(kāi)放數(shù)據(jù)平臺(tái),因而數(shù)據(jù)通常在Junar的基礎(chǔ)結(jié)構(gòu)(一體化模型)中進(jìn)行管理。Junar可以提供完整的數(shù)據(jù)目錄,或者可以通過(guò)API向單獨(dú)的用戶(hù)目錄提供數(shù)據(jù)[12]。應(yīng)用Junar的例子如:秘魯利馬(見(jiàn)網(wǎng)址:http://lima.datosabiertos.pe);南美洲的智利(見(jiàn)網(wǎng)址:http://recursos.datos.gob.cl);哥斯達(dá)黎加(見(jiàn)網(wǎng)址:http://datosabiertos.gob.go.cr)。
4.5.4 OGPL
與DKAN一樣,OGPL是一個(gè)開(kāi)源的基于Drupal的數(shù)據(jù)目錄,但不能在API 上與CKAN兼容。OGPL由印度政府和美國(guó)聯(lián)合開(kāi)發(fā),應(yīng)用OGPL的例子如:非洲西部國(guó)家加納(見(jiàn)網(wǎng)址:http://data.gov.gh);印度(見(jiàn)網(wǎng)址:http://data.gov.in)。
4.5.5 Socrata
Socrata提供軟體解決方案,它的Data-as-a-Utility平臺(tái)能夠全面檢查政府?dāng)?shù)據(jù)體驗(yàn),提供數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新,并為世界上數(shù)百個(gè)政府部門(mén)領(lǐng)導(dǎo)者及其數(shù)百萬(wàn)名選民節(jié)省應(yīng)用成本。它的一個(gè)顯著特點(diǎn)是,允許用戶(hù)根據(jù)已發(fā)布的數(shù)據(jù)創(chuàng)建視圖并產(chǎn)生可視化效果,予以保存以供其他人使用。此外,它還提供了其API的開(kāi)源版本,旨在幫助決定從SaaS模型遷移的客戶(hù)進(jìn)行過(guò)渡。應(yīng)用Socrata的例子如:美國(guó)芝加哥(見(jiàn)網(wǎng)址:https://data.cityofchicago.org);美國(guó)舊金山(見(jiàn)網(wǎng)址:https://data.sfgov.org);東非肯尼亞(見(jiàn)網(wǎng)址:http://data.kenya.org)。
EA概念是在信息化背景下提出的,旨在從頂層設(shè)計(jì)出發(fā),應(yīng)對(duì)日益復(fù)雜的IT 系統(tǒng)以及高投資、低回報(bào)的問(wèn)題。發(fā)達(dá)國(guó)家政府的EA理論和實(shí)踐經(jīng)驗(yàn)表明,從全面和集成的視角,在統(tǒng)一的架構(gòu)標(biāo)準(zhǔn)下進(jìn)行定義、實(shí)施和評(píng)價(jià),將有效推動(dòng)跨部門(mén)、跨地區(qū)的信息共享和協(xié)同[13]。文章提出基于EA的政府開(kāi)放數(shù)據(jù)平臺(tái)頂層設(shè)計(jì),從增值利用出發(fā)考慮政府開(kāi)放數(shù)據(jù)平臺(tái)的目標(biāo)和價(jià)值取向,并按照EA的思想,提煉出政府開(kāi)放數(shù)據(jù)平臺(tái)頂層架構(gòu)應(yīng)該包括業(yè)務(wù)架構(gòu)、數(shù)據(jù)架構(gòu)、應(yīng)用軟件架構(gòu)、技術(shù)架構(gòu)、績(jī)效架構(gòu),詳細(xì)分析各要素應(yīng)關(guān)注的問(wèn)題,并探討各要素之間的關(guān)系。下一步可以具體的實(shí)例模擬說(shuō)明政府開(kāi)放數(shù)據(jù)平臺(tái)框架、流程和方法的可行性,深入研究各要素及其綜合集成。
(來(lái)稿時(shí)間:2018年7月)