王藝楓 鄭州大學信息管理學院 鄭州 450001
政府數(shù)據(jù)開放是繼政府信息公開之后政府加深政務(wù)公開、提高政府服務(wù)效率、促進政府信息資源共享和公眾對政府信息資源利用的一項重大舉措.政府數(shù)據(jù)開放是指政府在其政務(wù)活動中產(chǎn)生、收集和擁有的數(shù)據(jù),這些數(shù)據(jù)是不受著作權(quán)、專利權(quán),以及其他管理機制所限制,以機器可讀的形式開放給社會公眾,任何人都可以免費獲取和自由使用.
我國政府數(shù)據(jù)開放還處于起步階段,選取幾個具有代表性的地方政府數(shù)據(jù)開放平臺,依據(jù)政府數(shù)據(jù)開放的原則、標準對選取的地方政府數(shù)據(jù)開放平臺的進行分析研究.主要從數(shù)據(jù)層面和平臺層面建立評估指標,考察各個地方政府數(shù)據(jù)平臺的數(shù)據(jù)資源建設(shè)情況和平臺服務(wù)情況進行比較研究,分析各地政府數(shù)據(jù)開放平臺的現(xiàn)狀和不足,為我國建設(shè)全國統(tǒng)一的政府數(shù)據(jù)開放平臺提供經(jīng)驗和建議.
3 研究方法
本次研究選取了部分我國政府數(shù)據(jù)開放平臺作為研究對象.篩選得到符合要求的政府數(shù)據(jù)開放平臺共27個.從27個政府數(shù)據(jù)開放平臺中選取具有代表性和滿足研究條件的平臺共16個作為研究樣本.
表1 .研究樣本選擇
本研究在結(jié)合前者研究的基礎(chǔ)上,選擇一些易于考察、獲取和比較的指標作為評估指標.整體上分為對"數(shù)據(jù)、平臺"兩個層面上對各政府數(shù)據(jù)開放平臺之間和同一個平臺中不同主題資源之間使用的情況進行比較分析.
表2 .政府開放數(shù)據(jù)評估指標
4.1.1 有用性
4.1.1.1 數(shù)據(jù)集總量
數(shù)據(jù)集通常是一組數(shù)據(jù)的集合,數(shù)據(jù)集的內(nèi)容通常以表格形式出現(xiàn),所對應的是數(shù)據(jù)庫中的表.每列表代表一個特定的變量,并且每個行對應于一個的數(shù)據(jù)樣本.政府數(shù)據(jù)開放平臺的數(shù)據(jù)集通常是可供下載的數(shù)據(jù)文件或者可以調(diào)用的API接口.
4.1.1.2 數(shù)據(jù)格式與機器可讀
機器可讀數(shù)據(jù)是可由計算機程序自動讀取和處理的數(shù)據(jù)或元數(shù)據(jù)格式.機器可讀格式包括RDF、XML、JSON、CSV、XLS等格式.對各地政府數(shù)據(jù)開放平臺開放的數(shù)據(jù)格式分析得出,基本上所以的數(shù)據(jù)開放平臺都提供了可供用戶下載的數(shù)據(jù)格式,使用的格式包括CSV、XLS、XLSX、JSON、XML、TXT、RAR、ZIP、PDF、JPG、DOC、網(wǎng)頁鏈接和空間數(shù)等據(jù)格式類型.
4.1.1.3 元數(shù)據(jù)
本次研究選取DC元數(shù)據(jù)和W3C發(fā)布的針對開放數(shù)據(jù)的DCAT元數(shù)據(jù)的部分元素作為基本元數(shù)據(jù)來比較各政府數(shù)據(jù)開放平臺的元數(shù)據(jù)提供情況.主要使用的元數(shù)據(jù)元素有名稱、主題、描述、關(guān)鍵字、提供方、獲取權(quán)限、發(fā)布日期、更新日期、更新頻率、下載量、瀏覽量、格式、字節(jié)大小、語種、標識符等15種基本元數(shù)據(jù)元素.目前我國政府數(shù)據(jù)開放平臺的元數(shù)據(jù)主要以描述性元數(shù)據(jù)為主,元數(shù)據(jù)的機器可讀性和互操作性相對較低.
4.1.2 可獲取性
4.1.2.1 自由下載
各地政府數(shù)據(jù)開放平臺大部分都要求需要登錄才能下載數(shù)據(jù)資源,只有少部分的平臺不需要登錄,可以直接下載數(shù)據(jù).
4.1.2.2 提供API接口
政府數(shù)據(jù)開放平臺除了提供可下載的數(shù)據(jù)資源外,還提供部分數(shù)據(jù)集的API接口.用戶可以調(diào)用API接口開發(fā)相關(guān)的程序和應用軟件,是開放數(shù)據(jù)資源產(chǎn)生新的價值.選取的16個政府數(shù)據(jù)開放平臺中有12平臺開放了API接口,整體上來說大部分平臺都提供了API接口和使用說明并且形成了一定的規(guī)模,大部分平臺的API接口的調(diào)用需要向平臺提交申請.
4.1.3 開放授權(quán)
開放授權(quán)是指通過法律上保證數(shù)據(jù)的開放性,目前我國還沒有出臺關(guān)于數(shù)據(jù)開放權(quán)的法律,但各地的政府數(shù)據(jù)開放平臺都在網(wǎng)站的使用協(xié)議、網(wǎng)站聲明、免責條款或服務(wù)協(xié)議中對開放數(shù)據(jù)的使用進行了授權(quán)和約束.
4.1.3.1 免費獲取
目前我國已上線運行的政府數(shù)據(jù)開放平臺還沒有對用戶收費的項目,提供閱讀網(wǎng)站的使用協(xié)議、網(wǎng)站聲明或免職條款可以看出大部分的政府數(shù)據(jù)開放平臺都對用戶免費獲取數(shù)據(jù)資源作了說明,但是各平臺的免費范圍有所不同,可分為永久免費、現(xiàn)階段免費和為未明確免費期限三種.
4.1.3.2 非歧視性
只有部分政府數(shù)據(jù)開放平臺的授權(quán)協(xié)議中提到了非歧視性,其余的政府數(shù)據(jù)開放平臺未明確說明非歧視性.大部分的政府數(shù)據(jù)開放平臺都需要用戶注冊登錄后才能下載數(shù)據(jù)資源,只有少部分的平臺可以直接下載資源,注冊用戶和未注冊用戶之間的區(qū)別也是一種歧視性的存在.
4.1.3.3 自由使用
部分平臺的中聲明用戶享有基于平臺提供的數(shù)據(jù)進行商業(yè)性或非商業(yè)性的開發(fā)活動、享有增值利用或自由使用的權(quán)利.其余各平臺為申明用戶自由使用的限度,但限制用戶有償轉(zhuǎn)賣或用于商業(yè)用途.
4.1.3.4 自由傳播與分享
對于用戶的自由傳播和分享權(quán)利了大多數(shù)平臺的開放授權(quán)協(xié)議都依據(jù)現(xiàn)有的著作權(quán)法、專利法等相關(guān)的知識產(chǎn)權(quán)法進行了約束.部分平臺授權(quán)協(xié)議以知識產(chǎn)權(quán)法為依據(jù)限制用戶復制、傳播的權(quán)利可能會違背數(shù)據(jù)開放的原則.
4.2.1 易用性
4.2.1.1 檢索與瀏覽方式
檢索功能是用戶能夠通過【關(guān)鍵詞】的查找快速找到所需要的數(shù)據(jù)資源,基本上每個政府數(shù)據(jù)開放平臺都提供了使用【關(guān)鍵詞】對全部數(shù)據(jù)資源的檢索.
良好的瀏覽方式能夠幫助用戶方便快捷的找到數(shù)據(jù)資源,按照數(shù)據(jù)的主題或來源部門的分類方式進行瀏覽,同時還要按照數(shù)據(jù)發(fā)布日期、更新日期、瀏覽量和下載次數(shù)進行排列的功能.
4.2.1.2 數(shù)據(jù)預覽功能
數(shù)據(jù)預覽是用戶在下載數(shù)據(jù)前,可以在線查看數(shù)據(jù)集的全部或者部分內(nèi)容,根據(jù)情況決定是否下載數(shù)據(jù),這種功能功能能夠把數(shù)據(jù)集的一些不能通過標題等描述方式的內(nèi)容呈現(xiàn)給用戶,使用戶能夠發(fā)現(xiàn)自己想要的數(shù)據(jù)資源.
4.2.1.3 數(shù)據(jù)統(tǒng)計分析與可視化工具
數(shù)據(jù)統(tǒng)計分析是政府數(shù)據(jù)開放平臺提供的對數(shù)據(jù)級的總量、分布、使用等情況的統(tǒng)計分析,可能幫助用戶了解平臺數(shù)據(jù)資源的構(gòu)成情況和使用情況.
4.2.1.4 數(shù)據(jù)應用
政府數(shù)據(jù)開放平臺不但提供開放下載的數(shù)據(jù)資源,還展示了一些利用開放數(shù)據(jù)資源開發(fā)的應用產(chǎn)品.
4.2.2 交流互動
大部分平臺都提供了交流互動的功能,比如咨詢建議、問卷調(diào)查、需求調(diào)查等交流互動方式.還有的平臺提供了對數(shù)據(jù)資源的評價功能,比如給數(shù)據(jù)資源的滿意度進行打分或者評論.
數(shù)據(jù)開放的立法應當立足于開放數(shù)據(jù)的基本原則,充分保障用戶在免于授權(quán)許可的條件下自由使用、傳播、分享數(shù)據(jù)的權(quán)利,保障用戶面授歧視的情況下獲取數(shù)據(jù).制定數(shù)據(jù)產(chǎn)權(quán)保護、數(shù)據(jù)開放、隱私保護相關(guān)政策法規(guī)和標準體系;制定政府數(shù)據(jù)開放、互聯(lián)網(wǎng)信息服務(wù)管理、數(shù)據(jù)權(quán)屬、數(shù)據(jù)管理等相關(guān)立法.
政府數(shù)開放平臺的數(shù)據(jù)集開放要以用戶需求為導向,采用需求調(diào)查和數(shù)據(jù)申請的形式,充分了解用戶迫切需要的數(shù)據(jù)類型和數(shù)據(jù)格式.分析用戶的偏好和潛在需求,提前制定好符合用戶需求的數(shù)據(jù)集開放計劃.通過網(wǎng)站和社交媒體上的互動交流,采集公眾需求,不斷改進完善自身工作,并為基于政府開放數(shù)據(jù)開發(fā)的應用提供充分的展現(xiàn)平臺,從而激勵社會的數(shù)據(jù)利用.
政府數(shù)據(jù)開放平臺應當盡可能的提供以機器可讀格式和開放格式的數(shù)據(jù)集,盡可能的為每個數(shù)據(jù)集提供至少一個機器可讀格式.如果原始數(shù)據(jù)集不是機器可讀格式或開放格式,就需要進行必要的格式轉(zhuǎn)換,將原有格式轉(zhuǎn)換成XLS或CSV等機器可讀格式或開放格式.
各地的政府數(shù)據(jù)開放平臺都在網(wǎng)站的使用協(xié)議、網(wǎng)站聲明、免責條款或服務(wù)協(xié)議應當詳細說明用戶的權(quán)利與義務(wù),制定出滿足用戶對數(shù)據(jù)集自由使用、傳播、和復制的使用需求的授權(quán)協(xié)議.政府數(shù)據(jù)開放的初衷是利用已有的數(shù)據(jù)集來創(chuàng)造出新的價值,如果對自由使用的權(quán)利進行限制,這就違背了政府數(shù)據(jù)開放的初衷,不利于數(shù)據(jù)產(chǎn)生新的價值.
我國政府應建立規(guī)范化和標準化的政府開放數(shù)據(jù)元數(shù)據(jù),借鑒和參考國外政府數(shù)據(jù)開放平臺成熟的元數(shù)據(jù)方案,依據(jù)W3C發(fā)布的針對政府數(shù)據(jù)開放的DCAT元數(shù)據(jù)的建立我國政府數(shù)據(jù)開放統(tǒng)一通用的元數(shù)據(jù)標準,從而提高政府數(shù)據(jù)開放的元數(shù)據(jù)描述質(zhì)量,實現(xiàn)數(shù)據(jù)資源之間的互操作性.
我國政府數(shù)據(jù)開放仍處于起步階段,而且已經(jīng)有了幾年發(fā)展的成果和經(jīng)驗,上述研究發(fā)現(xiàn)的幾個問題都是目前我國地方政府數(shù)據(jù)開放平臺建設(shè)存在的不足,但是我國地方政府數(shù)據(jù)開放平臺一些較好的發(fā)展模式和建設(shè)方式,在建設(shè)全國統(tǒng)一的政府數(shù)據(jù)開放平臺時可以借鑒和學習.