屈亞杰 黃國彬
(1. 北京舞蹈學(xué)院圖書館,北京 100081;2. 北京師范大學(xué)政府管理學(xué)院,北京 100875)
數(shù)據(jù)密集型科學(xué)的發(fā)現(xiàn)使得科學(xué)數(shù)據(jù)的價值逐步凸顯,在自下而上的數(shù)據(jù)管理需求和自上而下的共享政策的共同推動下,越來越多地建立了科學(xué)數(shù)據(jù)發(fā)布平臺。從本質(zhì)上看,科學(xué)數(shù)據(jù)發(fā)布平臺是科研人員之間交流的載體與渠道。目前,國內(nèi)外關(guān)于對科學(xué)數(shù)據(jù)發(fā)布平臺的表述形式多樣,主要有“科學(xué)數(shù)據(jù)平臺”“科學(xué)數(shù)據(jù)管理平臺”“科學(xué)數(shù)據(jù)共享平臺”“科學(xué)數(shù)據(jù)監(jiān)護平臺”“科學(xué)數(shù)據(jù)存儲與共享平臺”“科學(xué)數(shù)據(jù)管理與共享服務(wù)平臺”等。從廣義上看,與科學(xué)數(shù)據(jù)管理有關(guān)的項目與服務(wù)也在發(fā)布平臺的范疇之內(nèi),它們不直接存儲原始科學(xué)數(shù)據(jù),而是通過收割其他發(fā)布平臺的數(shù)據(jù)目錄開展各項數(shù)據(jù)服務(wù);從狹義上看,科學(xué)數(shù)據(jù)發(fā)布平臺指的是存儲、管理與共享科學(xué)數(shù)據(jù)及其元數(shù)據(jù)的知識庫,通過訪問平臺能夠直接獲取科學(xué)數(shù)據(jù)本身。相比廣義概念,狹義概念的科學(xué)數(shù)據(jù)發(fā)布平臺直接存儲科學(xué)數(shù)據(jù),在數(shù)據(jù)采集、分類、描述、質(zhì)量控制等方面都有具體要求,在一定程度上保證了科學(xué)數(shù)據(jù)的質(zhì)量。因此,本文采用狹義概念,即科學(xué)數(shù)據(jù)發(fā)布平臺指的是依托網(wǎng)絡(luò)數(shù)字化技術(shù)建立,采集、存儲、管理與發(fā)布科學(xué)數(shù)據(jù)及其相關(guān)描述性文件的數(shù)據(jù)倉儲。
(1)科學(xué)數(shù)據(jù)發(fā)布平臺的建設(shè)情況調(diào)查分析,調(diào)研的角度可分為總體調(diào)研、單一學(xué)科領(lǐng)域調(diào)研和單一國家調(diào)研。湯子鈺等[1]選擇了20個國外代表性數(shù)據(jù)監(jiān)護平臺,對其使用的數(shù)據(jù)生命周期模型、技術(shù)規(guī)范、組件、軟件工具、功能等各方面進行了全面的調(diào)研。姜穎[2]以英國環(huán)境領(lǐng)域數(shù)據(jù)發(fā)布平臺為調(diào)研對象,張莎莎等[3]則選取英國247個科學(xué)數(shù)據(jù)發(fā)布平臺為研究對象,研究了英國科學(xué)數(shù)據(jù)發(fā)布平臺的特點。
(2)科學(xué)數(shù)據(jù)發(fā)布平臺案例分析。王丹丹等[4]以德國社會科學(xué)數(shù)據(jù)管理與服務(wù)平臺Sowi Data Net|Datorium為例,重點闡釋其構(gòu)建情況、功能與特色以及先進經(jīng)驗。Rousidis等[5]以Dryad科學(xué)數(shù)據(jù)存儲庫為例,闡釋了Dryad的主題元數(shù)據(jù)元素和數(shù)據(jù)質(zhì)量問題。
(3)科學(xué)數(shù)據(jù)發(fā)布平臺中某方面內(nèi)容建設(shè)的研究,包括數(shù)據(jù)管理、數(shù)據(jù)組織、系統(tǒng)選型、元數(shù)據(jù)等。司莉等[6]分析了國家科技基礎(chǔ)條件平臺項目下的6家科學(xué)數(shù)據(jù)共享平臺在數(shù)據(jù)組織方面的現(xiàn)狀及改進意義 。
(4)科學(xué)數(shù)據(jù)發(fā)布平臺的比較研究,以國內(nèi)外比較研究為主。袁夢雪[7]從建設(shè)基礎(chǔ)和管理過程兩個維度對比分析了國內(nèi)外11個健康醫(yī)學(xué)科學(xué)數(shù)據(jù)管理平臺的建設(shè)實踐。
(5)科學(xué)數(shù)據(jù)發(fā)布平臺的優(yōu)化與評價研究。Silva等[8]提出將Dendro(原型研究數(shù)據(jù)管理平臺)與EUDAT B2Share模塊進行整合,以實現(xiàn)為研究人員提供從數(shù)據(jù)準(zhǔn)備、描述到存儲的簡化且完整的工作流程的目標(biāo)。李贊梅等[9]研究并構(gòu)建了針對人口健康平臺資源的綜合評價指標(biāo)體系,從資源主題、資源質(zhì)量、數(shù)據(jù)規(guī)模、服務(wù)能力、服務(wù)成效和來源版權(quán)等維度對資源進行綜合評價。
建設(shè)科學(xué)數(shù)據(jù)發(fā)布平臺需要考慮選擇何種系統(tǒng)軟件進行構(gòu)建、建設(shè)的資金從哪些渠道獲取、科學(xué)數(shù)據(jù)的采集存儲與組織如何開展、平臺的檢索和使用有哪些注意事項等很多因素。但總的來說包括組織管理、內(nèi)容建設(shè)和功能設(shè)計3個層次。現(xiàn)有文獻對科學(xué)數(shù)據(jù)發(fā)布平臺的組織管理問題雖有涉及,但系統(tǒng)探討的較少。因此,本文將科學(xué)數(shù)據(jù)發(fā)布平臺的組織管理作為研究重點,以英、美國家建設(shè)的科學(xué)數(shù)據(jù)平臺為調(diào)研樣本,探討平臺的組織管理機制。
re3data是一個匯集全球不同學(xué)科與類型科學(xué)數(shù)據(jù)發(fā)布平臺的注冊目錄系統(tǒng),由德國研究基金會資助,于2013年5月正式啟動。截至2021年2月28日,共有2 635個科學(xué)數(shù)據(jù)發(fā)布平臺在此注冊。其中,排名前三位的國家分別是美國(1 103個)、德國(435個)、英國(297個)。由于受語言的限制,兼顧平臺類型的均衡性,本文選擇英、美國家建設(shè)較好的8個科學(xué)數(shù)據(jù)發(fā)布平臺為調(diào)研樣本,具體情況如表1。筆者采用網(wǎng)絡(luò)調(diào)查法訪問各平臺,并基于調(diào)研結(jié)果,從依托軟件、建設(shè)模式、資金來源和管理政策等4個方面分析其組織管理機制。
表1 科學(xué)數(shù)據(jù)發(fā)布平臺樣本概況
科學(xué)數(shù)據(jù)發(fā)布平臺的組織管理機制指的是為保證平臺的順利建設(shè)所需要的前提條件,是平臺建設(shè)的基礎(chǔ)保障,可細(xì)分為依托軟件、建設(shè)模式、資金來源和管理政策。
科學(xué)數(shù)據(jù)發(fā)布平臺建設(shè)離不開系統(tǒng)軟件的支撐,這是平臺建設(shè)的技術(shù)基礎(chǔ)。當(dāng)前,可用于構(gòu)建科學(xué)數(shù)據(jù)發(fā)布平臺的軟件類型主要有商業(yè)軟件和開源軟件。這些軟件在商業(yè)模式、學(xué)科范圍、核心功能等方面存在差異,而如何選擇適合的依托軟件是建設(shè)科學(xué)數(shù)據(jù)發(fā)布平臺時不可忽視的重要問題。
所謂商業(yè)軟件,指的是作為商品進行交易的軟件,所有權(quán)屬于商業(yè)公司,一般需要付費并在嚴(yán)格的商業(yè)協(xié)議下被授權(quán)使用,附有一定年限的技術(shù)支持,不提供源代碼,基本上不能進行二次開發(fā)。例如,Nesstar是由UKDA和NSD(挪威社會科學(xué)數(shù)據(jù)服務(wù)局)共同開發(fā)的商業(yè)軟件,能夠處理調(diào)查數(shù)據(jù)、多維表、文本資源等,支持?jǐn)?shù)據(jù)的檢索、瀏覽、上傳與下載、在線分析、數(shù)據(jù)可視化、數(shù)據(jù)關(guān)聯(lián)文獻等功能。而開源軟件,指的是源代碼可以被公眾使用的軟件,其所有權(quán)一般屬于某個開源團體,用戶可以免費使用,雖然沒有承諾提供免費的技術(shù)支持,但可以通過各種社區(qū)和論壇尋求幫助,并且由于提供了源代碼,具備開發(fā)能力的個人或機構(gòu)都可以進行二次開發(fā)。目前應(yīng)用較多的開源軟件有Dataverse和DSpace。
調(diào)研發(fā)現(xiàn),樣本平臺中只有英國國家數(shù)據(jù)存儲庫(UKDA)選擇了商業(yè)軟件,采用Nesstar作為平臺支撐,其他平臺選擇開源軟件作為其技術(shù)實現(xiàn)方式。例如,奧德姆研究所數(shù)據(jù)存儲庫(Odum Institute Data Archive)依托Dataverse建設(shè)平臺,明尼蘇達大學(xué)數(shù)據(jù)存儲庫(DRUM)依托DSpace建設(shè)平臺。總體來說,開源軟件因其便于開發(fā)、節(jié)省成本等優(yōu)點受到平臺建設(shè)主體的青睞。但是在進行科學(xué)數(shù)據(jù)發(fā)布平臺建設(shè)時,依托軟件的選擇受到多種因素的制約,包括建設(shè)主體的資金情況、平臺所存儲和管理數(shù)據(jù)的學(xué)科范圍、平臺擬實現(xiàn)的核心功能情況等,因此平臺建設(shè)主體應(yīng)綜合考慮。
所謂建設(shè)模式,指的是建設(shè)者協(xié)調(diào)分配所需資源的具體方法和形式。從建設(shè)參與主體類型的角度,可將平臺的建設(shè)模式分為自行建設(shè)與合作建設(shè)。這兩種建設(shè)模式并無優(yōu)劣之分,不論何種建設(shè)方式都有其優(yōu)缺點。
自行建設(shè)指的是平臺建設(shè)主體僅有一種類型(如研究機構(gòu)),該主體自行解決平臺建設(shè)中可能遇到的技術(shù)、資金、管理等方面的問題。這種建設(shè)模式的優(yōu)點是由于不涉及機構(gòu)之間的協(xié)調(diào)溝通工作,避免了不必要的溝通協(xié)調(diào)的麻煩,建設(shè)效率較高,而其缺點是資金來源渠道少,在技術(shù)和管理工作方面存在挑戰(zhàn)。合作建設(shè)指的是平臺的建設(shè)主體有多種類型(如研究機構(gòu)、科研資助機構(gòu)、政府部門、基金會組織等),在進行平臺建設(shè)時多種主體之間相互協(xié)作,承擔(dān)的職責(zé)包括提供資金、提供技術(shù)支持和提供一般協(xié)助等。這類建設(shè)方式有兩種類型:一是合作建設(shè)主體中僅有一個研究機構(gòu),平臺的具體建設(shè)和維護工作主要由該機構(gòu)負(fù)責(zé),其他主體一般是科研資助機構(gòu)或政府機構(gòu)等類型;二是合作建設(shè)主體中存在多個研究機構(gòu),一般會選擇某一個研究機構(gòu)負(fù)責(zé)平臺的具體建設(shè)或維護工作,其他研究機構(gòu)和其他類型主體提供資金、技術(shù)或資源方面的協(xié)助。不論何種類型,合作建設(shè)具有無可比擬的優(yōu)點,即有充足的資金來源與保障、有成熟的技術(shù)支持和管理經(jīng)驗。其缺點是由于多種主體之間需要相互溝通協(xié)作,對建設(shè)效率產(chǎn)生一定影響。
調(diào)研發(fā)現(xiàn),樣本平臺中僅有明尼蘇達大學(xué)數(shù)據(jù)存儲庫和利茲大學(xué)數(shù)據(jù)存儲庫選擇了自行建設(shè)模式,其他平臺選擇了合作建設(shè)模式。明尼蘇達大學(xué)數(shù)據(jù)存儲庫主要依靠學(xué)??蒲谢鸬闹С郑擅髂崽K達大學(xué)圖書館進行建設(shè);英國數(shù)據(jù)存儲庫的建設(shè)模式是多個主體合作建設(shè),主要是埃塞克斯大學(xué)、經(jīng)濟和社會研究理事會、國家檔案館、聯(lián)合信息系統(tǒng)委員會等,其中后三者提供資金支持,埃塞克斯大學(xué)提供技術(shù)支持并負(fù)責(zé)具體建設(shè)和維護[10]??偨Y(jié)來說,對于收錄范圍不大和服務(wù)對象不多的機構(gòu)級存儲庫來說,選擇自行建設(shè)方式能夠提高建設(shè)效率;對于聯(lián)盟性質(zhì)的數(shù)據(jù)存儲庫或大型數(shù)據(jù)中心而言,合作建設(shè)的方式有助于獲取多個主體在資金、技術(shù)及管理方面的支持。
穩(wěn)定、充足、集中的經(jīng)費支持是保障科學(xué)數(shù)據(jù)發(fā)布平臺順利建設(shè)的重要條件之一。那么,能夠從哪些途徑獲取平臺建設(shè)的所需資金是建設(shè)主體必須思考的問題。所謂資金來源,指的是科學(xué)數(shù)據(jù)發(fā)布平臺建設(shè)所需資金的獲取渠道。調(diào)研發(fā)現(xiàn),平臺獲取建設(shè)資金的渠道主要有科研資助機構(gòu)資助、政府機構(gòu)撥款、高??蒲谢稹⑵渌溃ㄈ缁饡?、會員費用)等樣本平臺的資金來源情況如表2所示。
表2 樣本科學(xué)數(shù)據(jù)發(fā)布平臺的資金來源統(tǒng)計表
3.3.1 科研資助機構(gòu)資助
不論是學(xué)科型科學(xué)數(shù)據(jù)發(fā)布平臺,還是機構(gòu)型科學(xué)數(shù)據(jù)發(fā)布平臺,科研資助機構(gòu)資助都是其開展建設(shè)的主要經(jīng)費來源。這是因為,一方面,科研資助機構(gòu)的職責(zé)就是為科學(xué)研究提供資金支持,而科學(xué)數(shù)據(jù)發(fā)布平臺是管理科學(xué)數(shù)據(jù)的重要載體;另一方面,很多科研資助機構(gòu)在其資助政策中明確要求研究人員將產(chǎn)出的科學(xué)數(shù)據(jù)存儲在平臺中,必然會支持科學(xué)數(shù)據(jù)發(fā)布平臺的建設(shè)。例如,英國科學(xué)數(shù)據(jù)檔案存儲庫主要由經(jīng)濟與社會研究理事會(ESRC)資助建設(shè),同時英國聯(lián)合信息系統(tǒng)委員會(JISC)、歐盟委員會第七框架計劃、環(huán)境研究理事會(NERC)、工程與物理科學(xué)研究理事會(EPSRC)及生物技術(shù)和生物科學(xué)研究理事會(BBSRC)等也提供了資金支持[11]。
3.3.2 政府機構(gòu)撥款
對于國家級科學(xué)數(shù)據(jù)發(fā)布平臺而言,其經(jīng)費來源還包括政府機構(gòu)撥款。這類平臺所存儲和管理的數(shù)據(jù)通常是國家大型項目所產(chǎn)出的數(shù)據(jù),服務(wù)范圍一般是面向全國或全球,因而更容易受到政府部門的重視。如管理和分發(fā)關(guān)于冰凍地區(qū)研究而產(chǎn)出的雪、冰、冰川、冰凍地面、氣候等科學(xué)數(shù)據(jù)的美國國家冰雪數(shù)據(jù)中心(NSIDC),該平臺的建設(shè)受到國家航空航天局(NASA)、國家海洋和大氣管理局(NOAA)等聯(lián)邦機構(gòu)的資金支持[12]。同時,隨著政務(wù)公開實踐的發(fā)展,行政記錄數(shù)據(jù)和事務(wù)數(shù)據(jù)的共享程度逐步提高,政府機構(gòu)愿意通過科學(xué)數(shù)據(jù)發(fā)布平臺存儲、管理與共享其政務(wù)數(shù)據(jù),因此會與平臺建設(shè)者開展合作,相應(yīng)地也會給予資金支持。
3.3.3 高??蒲谢?/p>
對于機構(gòu)型科學(xué)數(shù)據(jù)發(fā)布平臺而言,高校科研基金是其開展建設(shè)的重要經(jīng)費來源。這類平臺一般是由某個高校主要負(fù)責(zé)建設(shè),建設(shè)目標(biāo)通常是存儲、管理和共享本機構(gòu)內(nèi)科研人員通過項目或研究產(chǎn)出的科學(xué)數(shù)據(jù),以提高科學(xué)數(shù)據(jù)的利用價值,為科研人員提供便利,在某種程度上對高??蒲心芰Ξa(chǎn)生積極影響。基于此,高校在開展經(jīng)費預(yù)算工作時會將部分科研基金用于科學(xué)數(shù)據(jù)發(fā)布平臺的建設(shè)方面。例如,美國明尼蘇達大學(xué)數(shù)據(jù)存儲庫、英國布里斯托大學(xué)數(shù)據(jù)存儲庫的建設(shè)都離不開所在高??蒲谢鸬闹С?。
除了科研資助機構(gòu)資助、政府機構(gòu)撥款和高??蒲谢穑茖W(xué)數(shù)據(jù)發(fā)布平臺建設(shè)的資金來源還包括基金會、會員費用等。如英國布里斯托大學(xué)數(shù)據(jù)存儲庫的建立還得到了Leverhulme Trust基金會的資助。美國校際社會科學(xué)數(shù)據(jù)共享聯(lián)盟存儲庫是由密歇根大學(xué)社會研究中心建立,實行會員制管理,目前有750多家科研機構(gòu)是其會員,除政府機構(gòu)和私人基金會外,會員費用是其重要的資金來源。
管理政策指的是為促進平臺順利建設(shè)及持續(xù)發(fā)展而制定的關(guān)于平臺數(shù)據(jù)資源與用戶管理的各項制度與規(guī)則。調(diào)研發(fā)現(xiàn),樣本平臺的數(shù)據(jù)管理政策主要包括數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)訪問、用戶使用條款及隱私等方面的內(nèi)容。這些管理政策一方面有助于平臺建設(shè)者有序開展科學(xué)數(shù)據(jù)管理工作;另一方面有助于用戶明晰科學(xué)數(shù)據(jù)的管理流程,提升其對平臺的信任度,從而愿意將研究中產(chǎn)出的科學(xué)數(shù)據(jù)存儲到相應(yīng)的平臺進行管理。
3.4.1 數(shù)據(jù)采集政策
采集數(shù)據(jù)是平臺管理或共享科學(xué)數(shù)據(jù)的前提條件,而數(shù)據(jù)采集政策會對數(shù)據(jù)來源、數(shù)據(jù)范圍、數(shù)據(jù)格式、數(shù)據(jù)采集標(biāo)準(zhǔn)等內(nèi)容做出相應(yīng)的規(guī)定。如《ICPSR數(shù)據(jù)收集發(fā)展政策》規(guī)定,ICPSR主要收集社會學(xué)、政治學(xué)、經(jīng)濟學(xué)、人類學(xué)、考古學(xué)等人文社科類科學(xué)數(shù)據(jù);在數(shù)據(jù)格式方面,ICPSR傾向于收集可在各種計算和技術(shù)環(huán)境中訪問的數(shù)據(jù)格式,如SAS格式、SPSS格式及Stata格式。非社會和行為研究數(shù)據(jù)、帶有直接標(biāo)識符的數(shù)據(jù)、有限訪問權(quán)的數(shù)據(jù)等不屬于ICPSR的數(shù)據(jù)收集范圍[13]?!禪KDS數(shù)據(jù)收集發(fā)展政策》要求采集的科學(xué)數(shù)據(jù)具有高質(zhì)量、權(quán)威性、可靠性等特點,具有重要的科學(xué)或歷史價值,屬于新的數(shù)據(jù)來源或類型并對國際研究具有價值等[14]。
3.4.2 數(shù)據(jù)存儲政策
數(shù)據(jù)存儲政策會對存儲內(nèi)容、存儲方式、存儲要求等作出規(guī)定。明確的數(shù)據(jù)存儲政策能夠為研究人員提交數(shù)據(jù)提供便利。也能夠減輕平臺數(shù)據(jù)管理人員的咨詢壓力。如《BODC數(shù)據(jù)存儲通用指南》規(guī)定,BODC提供多種數(shù)據(jù)提交方式,包括電子郵件、DVD,CDROM或軟盤(Zip或軟盤)上的標(biāo)準(zhǔn)郵件、可訪問的ftp站點等;提交的數(shù)據(jù)集必須包含相關(guān)描述文件(元數(shù)據(jù))[15]。關(guān)于元數(shù)據(jù),《RDL數(shù)據(jù)存儲指南》規(guī)定,其內(nèi)容應(yīng)包括數(shù)據(jù)集標(biāo)題、創(chuàng)作者、數(shù)據(jù)集描述(抽象)、項目名稱、資助者、授權(quán)號、學(xué)術(shù)科目等[16]。在存儲要求方面,《DRDR數(shù)據(jù)存儲指南》規(guī)定,除了存儲的數(shù)據(jù)之外,頂級文件夾還必須包含一個名為“readme.txt”的文件,該文件包含數(shù)據(jù)集清單信息、使用數(shù)據(jù)所需的任何特定操作系統(tǒng)或軟件信息、表格數(shù)據(jù)的描述信息等。文件格式最好用開放文件格式[17]。
3.4.3 數(shù)據(jù)訪問政策
雖然科學(xué)數(shù)據(jù)發(fā)布平臺盡可能地促進科學(xué)數(shù)據(jù)的共享、發(fā)現(xiàn)與重用,但并不是所有的科學(xué)數(shù)據(jù)都適合完全開放的發(fā)布方式,比如有些涉及受試者個人信息的數(shù)據(jù)就需要設(shè)置一定的限制。因而,數(shù)據(jù)訪問政策要對不同級別的數(shù)據(jù)設(shè)置相應(yīng)的訪問條件。如《UKDS數(shù)據(jù)訪問政策》將平臺發(fā)布的數(shù)據(jù)分為開放數(shù)據(jù)、保護數(shù)據(jù)和控制數(shù)據(jù)3個級別,并規(guī)定了相應(yīng)級別數(shù)據(jù)的訪問條件。開放數(shù)據(jù)不要求用戶在UKDS注冊,但可能需要遵循開放政府許可證(OGL)或知識共享許可協(xié)議(CC),而受保護和受控數(shù)據(jù)除要求用戶注冊,還會有一些附加條件,如填寫特殊許可表單[18]?!禗RDR數(shù)據(jù)訪問指南》對受限數(shù)據(jù)的訪問申請做了詳細(xì)規(guī)定:受限數(shù)據(jù)不提供給個人;接受任何組織的任何申請;當(dāng)平臺管理者收到訪問申請后,會檢查申請者所提供信息的完整性和是否滿足相關(guān)條件,如所申請的數(shù)據(jù)集是否可以通過該存儲卡獲取、是否提供了可驗證的機構(gòu)信息和機構(gòu)聯(lián)系方式、是否有機構(gòu)簽署人等;符合條件的申請者所在機構(gòu)簽署人會收到數(shù)據(jù)訪問協(xié)議,簽署并返回協(xié)議后,平臺管理者將會安排對數(shù)據(jù)集進行安全訪問[19]。
3.4.4 用戶政策
用戶是科學(xué)數(shù)據(jù)發(fā)布平臺所存儲和發(fā)布數(shù)據(jù)的使用者,平臺建設(shè)過程中除了考慮如何管理數(shù)據(jù)的問題,也應(yīng)當(dāng)對用戶予以重視,制定有關(guān)用戶的相應(yīng)政策,如《用戶使用條款》和《用戶隱私政策》。一方面能夠規(guī)范用戶對平臺的使用行為,另一方面能夠保障用戶的合法權(quán)益。如《UNC Dataverse使用條款》在用戶對象、用戶注冊、用戶提交數(shù)據(jù)、用戶使用數(shù)據(jù)許可協(xié)議等方面做出了相關(guān)規(guī)定。針對用戶注冊,要求用戶需向奧德姆研究所數(shù)據(jù)存儲庫提供準(zhǔn)確、完整和更新的注冊信息,同時應(yīng)全權(quán)負(fù)責(zé)個人賬戶的活動,確保服務(wù)密碼的機密性,未經(jīng)其他用戶的明確許可,不得使用其他用戶的賬戶[20]?!禗RUM用戶使用條款》規(guī)定了用戶在下載或使用數(shù)據(jù)時應(yīng)當(dāng)遵循的一些條款,如用戶使用從DRUM獲取的數(shù)據(jù)時應(yīng)對數(shù)據(jù)作者標(biāo)注引用;如果數(shù)據(jù)需要獲得許可,請直接聯(lián)系數(shù)據(jù)作者[21]。《ICPSR隱私政策》指出,除非用戶向ICPSR提供信息,否則ICPSR不收集除了用戶訪問平臺時自動收集和存儲信息之外的任何信息。而平臺自動收集和存儲的信息主要包括訪問平臺的計算機IP地址、訪問的日期、訪問網(wǎng)頁、訪問者計算機的操作系統(tǒng)、訪問平臺時使用的Web瀏覽器版本[22]。
近年來,我國政府部門、高校及研究所等主體在平臺建設(shè)方面做了很多積極的探索。2013年5月,《國務(wù)院關(guān)于印發(fā)“十二五”國家自主創(chuàng)新能力建設(shè)規(guī)劃的通知》強調(diào),要加快科學(xué)數(shù)據(jù)平臺建設(shè),構(gòu)建科技資源從數(shù)據(jù)獲取、存儲、處理、挖掘到開放共享的完整信息服務(wù)鏈[23]。2018年4月,國務(wù)院辦公廳發(fā)布了《科學(xué)數(shù)據(jù)管理辦法》,指出國務(wù)院科學(xué)技術(shù)行政部門統(tǒng)籌推進科學(xué)數(shù)據(jù)中心建設(shè)與發(fā)展,有關(guān)科研院所、高等院校和企業(yè)等法人單位是科學(xué)數(shù)據(jù)管理的責(zé)任主體,按照有關(guān)標(biāo)準(zhǔn)進行科學(xué)數(shù)據(jù)采集生產(chǎn)、加工整理和長期保存,確保數(shù)據(jù)質(zhì)量[24]??萍疾俊翱茖W(xué)數(shù)據(jù)共享工程”建設(shè)了6家學(xué)科性平臺,并且復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)管理平臺、高??茖W(xué)數(shù)據(jù)共享平臺、北京大學(xué)開放研究數(shù)據(jù)平臺等先后建成。
近年來,雖然我國科學(xué)數(shù)據(jù)發(fā)布平臺發(fā)展迅速,但是因處于發(fā)展初期階段,與國外較成熟的科學(xué)數(shù)據(jù)發(fā)布平臺相比,還存在著諸如資金來源渠道單一、數(shù)據(jù)管理政策數(shù)量不均衡等組織管理問題。具體表現(xiàn):一是我國科學(xué)數(shù)據(jù)發(fā)布平臺的建設(shè)經(jīng)費主要來源于國家財政支持。如國家地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺的建設(shè)資金來源主要是國家科技基礎(chǔ)條件平臺建設(shè)與運行服務(wù)經(jīng)費。二是數(shù)據(jù)管理政策數(shù)量不均衡。有的平臺制定了完善的數(shù)據(jù)管理政策,基本涵蓋數(shù)據(jù)管理全生命周期的各個階段,而有的平臺的數(shù)據(jù)管理政策僅涉及某個管理階段。如地震科學(xué)數(shù)據(jù)共享平臺先后制定了《地震科學(xué)數(shù)據(jù)共享中心運行管理規(guī)范》《地震科學(xué)數(shù)據(jù)發(fā)布規(guī)范》等12個標(biāo)準(zhǔn)規(guī)范,農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心僅有1個涉及數(shù)據(jù)管理的規(guī)范。因此,在建設(shè)科學(xué)數(shù)據(jù)發(fā)布平臺時,我國相關(guān)主體可借鑒國外科學(xué)數(shù)據(jù)發(fā)布平臺組織管理的經(jīng)驗。
4.2.1 理性選擇依托軟件
科學(xué)數(shù)據(jù)發(fā)布平臺的構(gòu)建方式包括自主開發(fā)軟件系統(tǒng)、購買商業(yè)軟件系統(tǒng)和利用開源軟件進行二次開發(fā)。由于自主開發(fā)的難度較大,商業(yè)軟件系統(tǒng)價格昂貴,建議國內(nèi)科學(xué)數(shù)據(jù)發(fā)布平臺優(yōu)先選擇利用開源軟件進行二次開發(fā)這種構(gòu)建方式。目前,應(yīng)用較廣的開源軟件有Dataverse、DSpace等,這些開源軟件各有特點,支持的數(shù)據(jù)管理功能也存在差異。國內(nèi)科學(xué)數(shù)據(jù)發(fā)布平臺的建設(shè)者在選擇開源軟件時,需要結(jié)合實際情況,對開源軟件在學(xué)科范圍、核心功能、服務(wù)模式等方面進行比較評估,必要時對這些軟件進行實地部署測試,以選擇適合的開源軟件。另外,在二次開發(fā)時可適當(dāng)增加一些本地化功能,如平臺與單位統(tǒng)一認(rèn)證系統(tǒng)的對接、數(shù)據(jù)申請與審核功能的優(yōu)化、權(quán)限管理更加靈活等。
4.2.2 密切機構(gòu)合作交流
在建設(shè)科學(xué)數(shù)據(jù)發(fā)布平臺時,無論是采用自行建設(shè)模式還是合作建設(shè)模式,都離不開多個機構(gòu)或部門之間的協(xié)調(diào)配合。在自行建設(shè)模式下,雖然平臺建設(shè)所需的資金、技術(shù)等要素都來自于某一個建設(shè)主體,但具體開展建設(shè)時,依然需要該主體下屬的其他部門的幫助和支持。如明尼蘇達大學(xué)數(shù)據(jù)存儲庫主要依靠學(xué)??蒲谢鸬闹С郑擅髂崽K達大學(xué)圖書館進行建設(shè),但數(shù)據(jù)管理的全面性超出了任何一個單一的大學(xué)單位甚至單一機構(gòu)的能力,所以該校圖書館努力與明尼蘇達超級計算機研究所、明尼蘇達信息學(xué)研究所等協(xié)調(diào)合作。在合作建設(shè)模式下,平臺的建設(shè)主體通常包括多種類型,如研究機構(gòu)、科研資助機構(gòu)、政府部門、基金會組織等,他們各司其職,或者提供資金支持,或者提供技術(shù)指導(dǎo),或者負(fù)責(zé)平臺的日常維護。其典型的案例是英國數(shù)據(jù)存儲庫,由經(jīng)濟和社會研究理事會、國家檔案館、聯(lián)合信息系統(tǒng)委員會等資助機構(gòu)提供資金支持,由埃塞克斯大學(xué)提供技術(shù)支持,并負(fù)責(zé)具體建設(shè)和維護。因此,我國科學(xué)數(shù)據(jù)發(fā)布平臺在建設(shè)過程時,無論是采用何種建設(shè)模式,都要積極加強機構(gòu)或部門間的合作交流,積極尋求如國家自然科學(xué)基金委員會或國家哲學(xué)社會科學(xué)規(guī)劃辦公室的經(jīng)費支持,或者與單位內(nèi)的技術(shù)部門進行合作,以推動平臺的順利建設(shè)。
4.2.3 拓寬資金來源渠道
建設(shè)科學(xué)數(shù)據(jù)發(fā)布平臺時,不論是軟件開發(fā)、數(shù)據(jù)處理還是網(wǎng)站設(shè)計都需要充足的經(jīng)費,這是平臺建設(shè)的基礎(chǔ)保障。然而,目前我國科學(xué)數(shù)據(jù)發(fā)布平臺的建設(shè)經(jīng)費通常來自國家財政支持,存在資金來源渠道單一的問題,一旦國家財政的支持力度減小,平臺建設(shè)就舉步維艱。因此,建議國內(nèi)科學(xué)數(shù)據(jù)發(fā)布平臺的建設(shè)者借鑒國外平臺的相關(guān)經(jīng)驗,積極拓寬資金來源渠道,豐富經(jīng)費獲取方式。如除了以申請項目的方式從科研資助機構(gòu)(國家自然科學(xué)基金委員會、國家哲學(xué)社會科學(xué)辦公室等)和政府部門獲得經(jīng)費支持外,還可以通過行業(yè)內(nèi)專業(yè)學(xué)會、公益基金會尋求建設(shè)資金,部分聯(lián)盟性質(zhì)的平臺建設(shè)者可以采用收取少量會員費用的方式。
4.2.4 完善平臺管理政策
明確而完善的平臺管理政策,為平臺建設(shè)者在數(shù)據(jù)采集、分類、描述、質(zhì)量控制、存儲等方面提供指導(dǎo),也對用戶的使用與隱私信息進行了規(guī)范,具有重要意義。然而,我國已建成的科學(xué)數(shù)據(jù)發(fā)布平臺中僅有少數(shù)制定了較為完善的管理政策,大多數(shù)平臺缺乏管理政策,存在管理政策不均衡的問題。因此,建議科學(xué)數(shù)據(jù)發(fā)布平臺建設(shè)者應(yīng)重視平臺管理政策的制定工作,發(fā)揮其對平臺建設(shè)的指導(dǎo)與約束作用。具體而言,完善的平臺管理政策應(yīng)包括數(shù)據(jù)管理政策和用戶管理政策。其中,數(shù)據(jù)管理政策應(yīng)對數(shù)據(jù)全生命周期的各個階段予以規(guī)范,包括數(shù)據(jù)采集指南、數(shù)據(jù)分類依據(jù)、數(shù)據(jù)描述標(biāo)準(zhǔn)、數(shù)據(jù)質(zhì)量控制流程、數(shù)據(jù)存儲要求、數(shù)據(jù)訪問權(quán)限等;用戶管理政策主要是關(guān)于用戶獲取使用數(shù)據(jù)與用戶個人信息保護的相關(guān)規(guī)定,如用戶使用條款、用戶隱私政策等。
本文綜合采用文獻調(diào)研法、網(wǎng)站調(diào)研法、比較分析法等,以英、美國家發(fā)展較成熟的8個科學(xué)數(shù)據(jù)發(fā)布平臺為分析對象,探析科學(xué)數(shù)據(jù)發(fā)布平臺建設(shè)的組織管理機制。創(chuàng)新之處在于對科學(xué)數(shù)據(jù)發(fā)布平臺的組織管理機制內(nèi)容進行了系統(tǒng)剖析,盡管已有文獻對組織管理問題有所涉及,但多集中于某一方面的研究,系統(tǒng)探討的較少。而本文通過調(diào)查分析英、美國家發(fā)展較成熟的科學(xué)數(shù)據(jù)發(fā)布平臺在依托軟件、建設(shè)模式、資金來源、管理政策等方面的內(nèi)容,總結(jié)科學(xué)數(shù)據(jù)發(fā)布平臺的組織管理機制,并基于我國實際,提出了推動科學(xué)數(shù)據(jù)發(fā)布平臺發(fā)展的建設(shè)策略:理性選擇依托軟件,密切機構(gòu)交流合作,拓寬資金來源渠道,完善平臺管理政策。在樣本對象上,本文選取了英、美國家的8個發(fā)展較成熟的科學(xué)數(shù)據(jù)發(fā)布平臺,后續(xù)相關(guān)研究可以考慮擴大樣本對象,以求研究結(jié)果更加全面。