陳 展/上海大學(xué)圖書情報檔案系
檔案數(shù)據(jù)開放是“將檔案機構(gòu)收集保存的所有原始數(shù)據(jù),向公眾開放”[1]。大數(shù)據(jù)環(huán)境下,檔案數(shù)據(jù)開放不僅是檔案信息化建設(shè)的必然趨勢,也是檔案部門創(chuàng)新檔案服務(wù)的重要舉措。2016年國家檔案局發(fā)布《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》,再次將檔案信息化建設(shè)列為重要議題,明確提出“建立開放檔案信息資源社會化共享服務(wù)平臺,制定檔案數(shù)據(jù)開放計劃,落實數(shù)據(jù)開放與維護(hù)的責(zé)任;優(yōu)先推動與民生保障服務(wù)相關(guān)的檔案數(shù)據(jù)開放”[2]。遺憾的是,當(dāng)前檔案學(xué)界對檔案數(shù)據(jù)開放的理論研究落后于實踐工作,對數(shù)據(jù)開放的討論也大多集中在政府?dāng)?shù)據(jù)開放上。在“政府?dāng)?shù)據(jù)開放運動”進(jìn)程中,檔案部門作為重要的信息管理部門和公共服務(wù)部門,有責(zé)任也有義務(wù)為社會提供高質(zhì)量的檔案數(shù)據(jù)開放服務(wù)。
我國檔案數(shù)據(jù)開放實踐處于檔案信息公開階段,并未達(dá)到檔案原始數(shù)據(jù)開放存取的程度,檔案部門內(nèi)部所存的大量檔案數(shù)據(jù)以及檔案部門日常工作中產(chǎn)生的數(shù)據(jù)也并未列入檔案數(shù)據(jù)開放范圍。
國外檔案機構(gòu)在推動政府?dāng)?shù)據(jù)開放過程中發(fā)揮了重要作用。英美兩國“開放的數(shù)據(jù)集以統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)和通用的數(shù)據(jù)格式發(fā)布在各自國家級的政府?dāng)?shù)據(jù)開放平臺,即英國的Data.gov.uk.和美國的Data.gov.”[3]。美國國家檔案與文件署(NARA)在國家檔案館網(wǎng)站首頁設(shè)立了針對開放政府計劃的鏈接“Open Government”,公眾可以通過NARA提供的路徑直接下載政府?dāng)?shù)據(jù),對開放政府計劃添加問題或進(jìn)行編輯并給出反饋[4]。英聯(lián)邦及愛爾蘭檔案與文件協(xié)會、蘇格蘭國家新檔案館、英國埃塞克斯大學(xué)國家數(shù)據(jù)檔案館等檔案機構(gòu)對英國內(nèi)閣辦公室2011年發(fā)布的《促進(jìn)開放數(shù)據(jù)成為現(xiàn)實:公共咨詢》[5]中關(guān)于提升數(shù)據(jù)權(quán)、設(shè)置開放數(shù)據(jù)標(biāo)準(zhǔn)等問題做出了答復(fù)。除參與政策建設(shè)外,英國檔案部門還為政府?dāng)?shù)據(jù)開放平臺提供檔案數(shù)據(jù)支持,自2010年起,英國國家檔案館為Data.gov.uk.提供了近50條檔案數(shù)據(jù)集供公民下載。俄羅斯聯(lián)邦檔案署于2016年發(fā)布《2018年前俄羅斯聯(lián)邦檔案署貫徹和實施開放機制計劃》[6],提出實施信息透明原則,要求開放27類檔案數(shù)據(jù)集,并明確2016年至2018年每年的數(shù)據(jù)開放指標(biāo)。新西蘭國家檔案館通過政府?dāng)?shù)據(jù)開放平臺data.govt.nz.發(fā)布4個可用數(shù)據(jù)集,旨在推動檔案數(shù)據(jù)集的可供利用[7]。
檔案數(shù)據(jù)開放的最終目的是實現(xiàn)“任何人對檔案數(shù)據(jù)自由、免費地訪問、獲取、使用和分享”[8],目前不論是國內(nèi)檔案信息的公開還是英美等國數(shù)據(jù)的開放獲取,都沒有真正實現(xiàn)檔案數(shù)據(jù)特別是原始數(shù)據(jù)的開放。我國積極推進(jìn)檔案“信息化”向“數(shù)據(jù)化”轉(zhuǎn)變,是對未來檔案數(shù)據(jù)開放趨勢的準(zhǔn)確把握。
當(dāng)前我國檔案數(shù)據(jù)開放政策關(guān)注宏觀上的制定與把控,對檔案數(shù)據(jù)開放涉及的具體問題并未做出明確規(guī)定,關(guān)于檔案數(shù)據(jù)開放的相關(guān)法律法規(guī)也并不完善。如在2016年《中華人民共和國檔案法》修訂草案(送審稿)[9]中,關(guān)于檔案數(shù)據(jù)管理的內(nèi)容并未出現(xiàn)相關(guān)說明。以隱私權(quán)的保護(hù)為例,我國法律體系關(guān)于隱私權(quán)的相關(guān)敘述并不包括關(guān)于數(shù)據(jù)隱私權(quán)的內(nèi)容。對于檔案數(shù)據(jù)開放涉及的隱私權(quán)、版權(quán)問題,我國目前還沒有明確的權(quán)責(zé)劃分和開放范圍界定,哪些檔案數(shù)據(jù)涉及個人隱私,應(yīng)保密的檔案數(shù)據(jù)如何加密以保障數(shù)據(jù)安全性,都是值得探討和亟待解決的問題。
國際上已將檔案數(shù)據(jù)開放政策制定的關(guān)注點轉(zhuǎn)移到檔案數(shù)據(jù)開放與隱私權(quán)保護(hù)等具體問題上。法國檔案工作者協(xié)會2018年會圍繞“開放數(shù)據(jù)和個人數(shù)據(jù)保護(hù):我們在哪里?”主題,探討檔案數(shù)據(jù)開放與保護(hù)的辯證關(guān)系,思考檔案人員在歸檔、保護(hù)個人數(shù)據(jù)與公開數(shù)據(jù)等工作中應(yīng)扮演的關(guān)鍵角色[10]。美國通過《信息自由法》《陽光下的政府法》《隱私權(quán)法》等一系列完整的個人隱私保護(hù)法律法規(guī),搭建起數(shù)據(jù)開放和個人隱私保護(hù)的平衡機制[11],為其他國家關(guān)于隱私權(quán)的法制建設(shè)提供參考。
對于社會公眾來說,公眾對檔案部門已開放的檔案數(shù)據(jù)內(nèi)容需求較小,且存在獲取難度大、使用技術(shù)要求高等問題,公眾對檔案數(shù)據(jù)的利用需求難以得到滿足。近年來NARA已經(jīng)開始注意到這個問題,在《美國國家檔案與文件署2018—2022財政年度戰(zhàn)略計劃》[12]中明確提出將“公共訪問”作為核心工作,通過提高檔案處理效率加快數(shù)字化進(jìn)程和解決技術(shù)限制,幫助公眾開放獲取海量數(shù)字化檔案資源。以社會需求為導(dǎo)向的檔案數(shù)據(jù)開放能夠幫助不同群體構(gòu)建集體記憶和實現(xiàn)身份認(rèn)同,彰顯檔案數(shù)據(jù)開放工作中的人文關(guān)懷。
要推動檔案數(shù)據(jù)開放進(jìn)程,需要國家頒布配套政策和相關(guān)法律法規(guī)、開放標(biāo)準(zhǔn)、執(zhí)行程序等。只有政策先行,相關(guān)法律法規(guī)和標(biāo)準(zhǔn)建設(shè)漸趨完善,后續(xù)數(shù)據(jù)開放才能有序進(jìn)行。國務(wù)院于2015年印發(fā)的《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》[13],從國家高度提出數(shù)據(jù)開放的目標(biāo)和時間節(jié)點,即“將于2018年底前建成國家政府?dāng)?shù)據(jù)統(tǒng)一開放門戶”。國家檔案局也抓住檔案事業(yè)發(fā)展新趨勢,在《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》中明確提出要“制定檔案數(shù)據(jù)開放計劃”;2016年國家檔案局科技項目立項選題指南中也多次提出檔案數(shù)據(jù)開放問題,并將“檔案數(shù)據(jù)開放與維護(hù)的計劃與責(zé)任”[14]納入選題范圍。但是,在2017年和2018年國家檔案局的科技檔案項目立項選題指南中,沒有出現(xiàn)檔案數(shù)據(jù)管理和檔案數(shù)據(jù)開放的內(nèi)容。國家宏觀層面上對檔案數(shù)據(jù)開放的關(guān)注度降低一方面是對“檔案數(shù)據(jù)熱”的降溫,有利于檔案界冷靜地對檔案數(shù)據(jù)開放理論進(jìn)行深度思考;另一方面是缺乏宏觀政策性文件指導(dǎo)和支持,不利于檔案數(shù)據(jù)開放的實踐。國家層面是否存在關(guān)于檔案數(shù)據(jù)開放的頂層設(shè)計,以及頂層設(shè)計的質(zhì)量是否滿足要求,直接影響檔案數(shù)據(jù)開放是否能順利進(jìn)行;相關(guān)法律體系的完善程度也直接影響檔案數(shù)據(jù)開放進(jìn)程。
檔案部門的數(shù)據(jù)觀念直接影響檔案數(shù)據(jù)的采集、管理、分析、利用、開放和檔案部門內(nèi)部再生產(chǎn),并決定了檔案部門向社會提供檔案數(shù)據(jù)的格式、種類、數(shù)量和質(zhì)量。社會組織的數(shù)據(jù)觀念一方面決定了其能否將自身產(chǎn)生的數(shù)據(jù)向公眾開放和向檔案部門移交,另一方面決定了其能否能夠通過應(yīng)用接口采集檔案部門提供的數(shù)據(jù)并提供再利用。個人檔案數(shù)據(jù)觀念影響個人利用檔案數(shù)據(jù)的方式和途徑,個人對檔案數(shù)據(jù)的認(rèn)識如果局限于電子政務(wù)產(chǎn)生的數(shù)據(jù)或是數(shù)字化的檔案,忽視對電子檔案及其元數(shù)據(jù)的利用,就會導(dǎo)致對檔案的利用僅滿足表層檔案需求,自身的深層檔案需求無法通過檔案部門提供的服務(wù)得到滿足,進(jìn)而導(dǎo)致檔案部門的公信力降低,反過來阻礙檔案部門數(shù)據(jù)開放的開展。
檔案數(shù)據(jù)質(zhì)量和檔案數(shù)據(jù)處理技術(shù)是決定檔案數(shù)據(jù)開放質(zhì)量的關(guān)鍵因素。檔案數(shù)據(jù)處理技術(shù)的對象主要是電子檔案和元數(shù)據(jù),檔案部門的檔案數(shù)據(jù)包括存量檔案數(shù)據(jù)和增量檔案數(shù)據(jù),存量檔案數(shù)據(jù)主要來自現(xiàn)存的電子檔案和檔案數(shù)字化成果,增量檔案數(shù)據(jù)的來源一方面是各業(yè)務(wù)系統(tǒng)產(chǎn)生的各種電子文件,另一方面是檔案部門在日常業(yè)務(wù)中產(chǎn)生的各種數(shù)據(jù)。這些數(shù)據(jù)的質(zhì)量會直接影響后續(xù)檔案數(shù)據(jù)開放的質(zhì)量,低質(zhì)量的檔案數(shù)據(jù)極易在用戶查詢時產(chǎn)生差錯,并在用戶使用過程中產(chǎn)生其他問題,引發(fā)用戶的不滿情緒,甚至產(chǎn)生糾紛?!皩⒆杂脭?shù)據(jù)變?yōu)殚_放數(shù)據(jù)要跨越一道質(zhì)量鴻溝(如同由產(chǎn)品升級為商品),對這種質(zhì)量升級的難度有關(guān)部門應(yīng)有思想準(zhǔn)備?!盵15]開放數(shù)據(jù)的質(zhì)量升級對資金和技術(shù)都有一定要求,資金是引進(jìn)先進(jìn)技術(shù)的重要物質(zhì)保證,先進(jìn)技術(shù)是檔案數(shù)據(jù)開放質(zhì)量的技術(shù)保證。如何選擇、引進(jìn)、推廣最具性價比的技術(shù)完成檔案數(shù)據(jù)開放,需要檔案部門認(rèn)真思考。
首先,推動頂層設(shè)計。優(yōu)質(zhì)的頂層設(shè)計能夠為法規(guī)政策的執(zhí)行提供保障,并減少試點和重復(fù)實踐的成本。除英美俄外,多個國家或組織都針對數(shù)據(jù)開放制定了相關(guān)政策。如2003年歐盟頒布的《公共部門信息再利用指令》是歐盟各國開放政府?dāng)?shù)據(jù)的重要驅(qū)動力,2010年丹麥頒布的《開放政府創(chuàng)新策略》和2012年日本頒布的《電子政務(wù)開放數(shù)據(jù)戰(zhàn)略》都從國家戰(zhàn)略高度推進(jìn)了數(shù)據(jù)開放[16]。要進(jìn)一步加強我國檔案數(shù)據(jù)開放的頂層設(shè)計,制定長效性、綜合性、指導(dǎo)性、基礎(chǔ)性的檔案數(shù)據(jù)開放計劃,出臺促進(jìn)檔案數(shù)據(jù)開放的相關(guān)政策,明確檔案數(shù)據(jù)開放平臺、財政資金支持、檔案數(shù)據(jù)技術(shù)人才和管理人才培養(yǎng)等方面內(nèi)容,從國家層面支持檔案數(shù)據(jù)開放工作。
其次,完善檔案數(shù)據(jù)開放的法律法規(guī)體系?,F(xiàn)今檔案數(shù)據(jù)來源不再單一,檔案數(shù)據(jù)多元形成者和檔案數(shù)據(jù)的易得性使檔案數(shù)據(jù)權(quán)歸屬模糊;個人隱私權(quán)保護(hù)是檔案數(shù)據(jù)開放中一個不容忽視的問題;檔案數(shù)據(jù)開放秩序和公民對檔案數(shù)據(jù)再利用時的檔案數(shù)據(jù)安全問題應(yīng)予關(guān)注。國家在檔案數(shù)據(jù)管理相關(guān)法律法規(guī)體系建設(shè)中,應(yīng)圍繞上述檔案數(shù)據(jù)權(quán)、隱私權(quán)、數(shù)據(jù)再生產(chǎn)和數(shù)據(jù)安全等內(nèi)容完善檔案數(shù)據(jù)開放相關(guān)法律法規(guī),為檔案數(shù)據(jù)開放提供法律保障。
最后,制定檔案數(shù)據(jù)開放的質(zhì)量標(biāo)準(zhǔn)與管理規(guī)范。如英國和德國將開放政府許可OGL(Open Government Licence)作為模型,對公共部門信息提供者的哪些數(shù)據(jù)可以被再利用做了明確規(guī)定,使數(shù)據(jù)開放擁有統(tǒng)一標(biāo)準(zhǔn)和規(guī)范,避免數(shù)據(jù)開放和再生產(chǎn)的混亂。
完善檔案數(shù)據(jù)開放平臺建設(shè)是實現(xiàn)檔案數(shù)據(jù)資源有效整合、改善用戶獲取檔案數(shù)據(jù)服務(wù)體驗的重要路徑。檔案部門要加強對信息基礎(chǔ)設(shè)施的投入力度,引進(jìn)、優(yōu)選和推廣先進(jìn)技術(shù),設(shè)計檔案數(shù)據(jù)開放平臺,使用RDF、SPARQL與RDFS等語義技術(shù)定期發(fā)布檔案數(shù)據(jù)存儲目錄和數(shù)據(jù)開放政策等相關(guān)信息,并使用HTML5等技術(shù)完善門戶網(wǎng)站建設(shè)。在提供數(shù)據(jù)集的同時提供應(yīng)用程序接口和詳細(xì)元數(shù)據(jù),使用戶可以更全面地獲得所需檔案數(shù)據(jù)。此外,可建立國家和地方統(tǒng)一的檔案數(shù)據(jù)開放平臺,整合各級檔案部門的檔案數(shù)據(jù),并開發(fā)APP等服務(wù)工具,為用戶提供一站式服務(wù)。
檔案開放數(shù)據(jù)的質(zhì)量是檔案數(shù)據(jù)開放平臺建設(shè)的基礎(chǔ),也直接影響檔案數(shù)據(jù)的價值挖掘。做到檔案開放數(shù)據(jù)“保量”,就要在相關(guān)法律法規(guī)指導(dǎo)下,對用戶需求度高的檔案如涉民檔案進(jìn)行數(shù)據(jù)化和開放,通過云技術(shù)實現(xiàn)用戶在線訪問和下載。做到檔案開放數(shù)據(jù)“保質(zhì)”,就要提高檔案部門的數(shù)據(jù)處理能力,包括數(shù)據(jù)清洗、數(shù)據(jù)挖掘能力,在提供元數(shù)據(jù)和高質(zhì)量、低錯誤率的原始數(shù)據(jù)的同時,也針對用戶需求深度挖掘檔案數(shù)據(jù)內(nèi)涵,激活檔案數(shù)據(jù)潛在價值,面向用戶提供檔案數(shù)據(jù)產(chǎn)品和基礎(chǔ)的檔案數(shù)據(jù)處理服務(wù)。
檔案部門一要樹立“開放”理念,培養(yǎng)“數(shù)據(jù)”思維。“正視社會信息化進(jìn)程對于文件領(lǐng)域的深刻改變”[17],結(jié)合歷史條件和特定背景對檔案數(shù)據(jù)進(jìn)行理解和認(rèn)識,更好地實現(xiàn)檔案數(shù)據(jù)的開放。二要轉(zhuǎn)變服務(wù)理念。注重與用戶的互動和用戶信息的反饋,了解用戶需求和開放效果,及時調(diào)整檔案數(shù)據(jù)開放策略。三要進(jìn)行檔案數(shù)據(jù)開放的責(zé)任主體及職能劃分。明確各機構(gòu)的職責(zé)和分工,避免出現(xiàn)資源浪費、互相推諉、效率低下的情況。四要強化宣傳教育,提高社會檔案數(shù)據(jù)意識。鼓勵社會參與檔案數(shù)據(jù)的再利用和再生產(chǎn),帶動社會創(chuàng)新,體現(xiàn)檔案數(shù)據(jù)的社會價值。
社會公眾首先要積極主動參與檔案數(shù)據(jù)開放,如積極參與北京市政務(wù)數(shù)據(jù)資源網(wǎng)面向企業(yè)和個人開展的“建議增加的數(shù)據(jù)類型”活動,向檔案部門提出檔案數(shù)據(jù)利用需求,并對檔案部門的數(shù)據(jù)開放服務(wù)予以反饋,與檔案部門形成良性互動和友好交流。其次要提高自身利用數(shù)據(jù)的能力,如數(shù)據(jù)獲取和數(shù)據(jù)處理的能力,從簡單地查詢信息到使用數(shù)據(jù),再到進(jìn)行檔案數(shù)據(jù)再生產(chǎn),讓數(shù)據(jù)真正發(fā)揮出其內(nèi)在價值。
檔案部門、企業(yè)、社會組織、個人等多元主體間要突破傳統(tǒng)的單向關(guān)系,建立基于檔案數(shù)據(jù)服務(wù)的雙向甚至多向互聯(lián),在大數(shù)據(jù)時代共同推動檔案數(shù)據(jù)開放進(jìn)程。