黃如花 周志峰
近十五年來科學(xué)數(shù)據(jù)管理領(lǐng)域國際組織實(shí)踐研究??
黃如花周志峰
本文介紹了近十五年來聯(lián)合國、歐盟、經(jīng)濟(jì)合作與發(fā)展組織、國際科學(xué)技術(shù)數(shù)據(jù)委員會(huì)、研究數(shù)據(jù)聯(lián)盟、國際圖聯(lián)在科學(xué)數(shù)據(jù)管理領(lǐng)域的主要相關(guān)活動(dòng),并提出應(yīng)從宏觀、中觀和微觀三個(gè)層面,借鑒國際組織關(guān)于科學(xué)數(shù)據(jù)管理的實(shí)踐成果與經(jīng)驗(yàn),以期推動(dòng)我國相關(guān)實(shí)踐活動(dòng)的開展。參考文獻(xiàn)51。
科學(xué)數(shù)據(jù) 科研數(shù)據(jù) 科學(xué)數(shù)據(jù)管理 國際組織
科學(xué)數(shù)據(jù)是重要的公共信息資源,也是寶貴的科研資產(chǎn)。2013年1月,國務(wù)院發(fā)布《“十二五”國家自主創(chuàng)新能力建設(shè)規(guī)劃》,提出“構(gòu)建科技資源從數(shù)據(jù)獲取、存儲(chǔ)、處理、挖掘到開放共享的完整信息服務(wù)鏈,建設(shè)集中與分散相結(jié)合的國家科學(xué)數(shù)據(jù)中心群,形成國家科學(xué)數(shù)據(jù)分級(jí)分類共享服務(wù)體系”[1];2015年8月,國務(wù)院出臺(tái)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,進(jìn)一步提出“發(fā)展科學(xué)大數(shù)據(jù),積極推動(dòng)由國家公共財(cái)政支持的公益性科研活動(dòng)獲取和產(chǎn)生的科學(xué)數(shù)據(jù)逐步開放共享,構(gòu)建科學(xué)大數(shù)據(jù)國家重大基礎(chǔ)設(shè)施,實(shí)現(xiàn)對(duì)國家重要科技數(shù)據(jù)的權(quán)威匯集、長(zhǎng)期保存、集成管理和全面共享。面向經(jīng)濟(jì)社會(huì)發(fā)展需求,發(fā)展科學(xué)大數(shù)據(jù)應(yīng)用服務(wù)中心,支持解決經(jīng)濟(jì)社會(huì)發(fā)展和國家安全重大問題”[2]。本文擬匯總近十五年來國際組織在科學(xué)數(shù)據(jù)管理領(lǐng)域的實(shí)踐活動(dòng),希望為我國“科學(xué)數(shù)據(jù)共享工程”和“中科院數(shù)據(jù)應(yīng)用環(huán)境建設(shè)與服務(wù)”等國家級(jí)科學(xué)數(shù)據(jù)管理項(xiàng)目效率的提高與優(yōu)化以及科研發(fā)展的數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新提供借鑒。
作為世界上最重要的國際組織,聯(lián)合國關(guān)于科學(xué)數(shù)據(jù)管理的態(tài)度和行動(dòng)已在全球范圍內(nèi)產(chǎn)生重大影響。
1.1發(fā)布宣言促進(jìn)和規(guī)范科學(xué)數(shù)據(jù)的共享與利用
2003年10月,聯(lián)合國教科文組織(United Nations Educational,Scientific and Cultural Organi-zation,簡(jiǎn)稱UNESCO)通過《國際人類基因數(shù)據(jù)宣言》(International Declaration on Human Genetic Data),倡議以倫理道德準(zhǔn)則規(guī)范人類基因科學(xué)數(shù)據(jù)的采集、處理、儲(chǔ)存及使用[3]。
2012年9月,UNESCO在“數(shù)字化時(shí)代的世界記憶:數(shù)字化和保存”國際會(huì)議上通過《溫哥華宣言》(UNESCO/UBC Vancouver Declaration),指出“為了確保能夠在未來獲取今天創(chuàng)造的數(shù)據(jù)和產(chǎn)生的記錄、避免數(shù)字失憶,人類面臨著巨大的挑戰(zhàn)”;強(qiáng)調(diào)《世界人權(quán)宣言》(The Universal Declaration of Human Rights)應(yīng)保證每個(gè)人獲取信息的權(quán)利,包括數(shù)字格式的信息;應(yīng)該通過建立相應(yīng)的國家政策來保證信息權(quán)利,促進(jìn)數(shù)據(jù)的開放[4]。
1.2召開重要會(huì)議討論科學(xué)數(shù)據(jù)管理議題
2005年,UNESCO與國際圖聯(lián)(International Federation of Library Associations and Institutions,簡(jiǎn)稱IFLA)在合作主辦的信息社會(huì)世界峰會(huì)(The World Summit on the Information Society,簡(jiǎn)稱WSIS)突尼斯階段會(huì)議中,針對(duì)科學(xué)數(shù)據(jù)共享問題進(jìn)行了專門的討論[5]。
2009年,UNESCO、國際電信聯(lián)盟(International Telecommunications Union,簡(jiǎn)稱ITU)、聯(lián)合國貿(mào)易及發(fā)展大會(huì)(United Nations Conference on Trade and Development,簡(jiǎn)稱UNCTAD)和聯(lián)合國開發(fā)計(jì)劃署(United Nations Development Programme,簡(jiǎn)稱UNDP)等共同組織WSIS論壇,召開“WSIS存取行動(dòng)線與數(shù)字科研行動(dòng)線”會(huì)議,重點(diǎn)討論了促進(jìn)科學(xué)數(shù)據(jù)開放存取和知識(shí)可持續(xù)發(fā)展的行動(dòng)方針[6]。2011年5月,WSIS論壇“Action Lines C3&C7”會(huì)議召開,議題包括開放存取出版、研究出版物與研究數(shù)據(jù)的關(guān)聯(lián)[7]。
在世界首腦級(jí)峰會(huì)上討論科學(xué)數(shù)據(jù)管理問題,表明國際社會(huì)已經(jīng)認(rèn)識(shí)到科學(xué)數(shù)據(jù)充分、有序共享是信息社會(huì)發(fā)展的必然和需要,但實(shí)現(xiàn)這種共識(shí)需要科學(xué)數(shù)據(jù)的各利益相關(guān)者一起以協(xié)商和互惠為總原則,共同構(gòu)架起加速21世紀(jì)科技發(fā)展的數(shù)據(jù)平臺(tái)。
1.3促成科學(xué)數(shù)據(jù)管理領(lǐng)域的國際合作
2005年,UNESCO牽頭發(fā)布了《全球科學(xué)信息共有倡議》(The Global Information Commons for Science Initiative),激勵(lì)人們通過創(chuàng)新模式促進(jìn)科學(xué)數(shù)據(jù)的傳播和合作利用,為共享經(jīng)驗(yàn)、建立合作、制定開發(fā)原則與指南以及最佳實(shí)踐推廣提供一個(gè)全球化平臺(tái)[8]。
2007年,“促進(jìn)發(fā)展中國家科學(xué)數(shù)據(jù)共享與應(yīng)用全球聯(lián)盟(UN e-SDDC)”計(jì)劃獲得聯(lián)合國全球信息通訊技術(shù)與發(fā)展聯(lián)盟(United Nations Global Alliance for Information and Communication Technologies and Development,簡(jiǎn)稱UN GAID)批準(zhǔn)。該計(jì)劃由中國科學(xué)院牽頭,國際科技數(shù)據(jù)委員會(huì)(The Committee on Data for Science and Technology,簡(jiǎn)稱CODATA)、美國哥倫比亞大學(xué)國際地球科學(xué)信息網(wǎng)絡(luò)中心、南非國家基金、巴西國家環(huán)境參考信息中心等參與其中,其目標(biāo)是在科技界盡量縮小發(fā)展中國家與發(fā)達(dá)國家之間的數(shù)字鴻溝,提出一個(gè)全球性的促進(jìn)發(fā)展中國家科學(xué)數(shù)據(jù)共享與應(yīng)用的解決方案[9]。
1.4建立開放數(shù)據(jù)門戶
聯(lián)合國經(jīng)濟(jì)與社會(huì)事務(wù)署(The United Nations Department of Economic and Social Affairs,簡(jiǎn)稱UNDESA)統(tǒng)計(jì)司推出的面向全球用戶的數(shù)據(jù)門戶——UNDATA,截止到2015年12月29日,已收集了34個(gè)數(shù)據(jù)庫、6000多萬條統(tǒng)計(jì)數(shù)據(jù)記錄,涉及能源、環(huán)境、農(nóng)業(yè)、人口、貿(mào)易、工業(yè)、教育、旅游、犯罪等方面,便于用戶進(jìn)行一站式檢索與下載聯(lián)合國系統(tǒng)的各種統(tǒng)計(jì)數(shù)據(jù)。而且,UNDATA為用戶提供直接從各國相關(guān)數(shù)據(jù)庫中進(jìn)行搜索的服務(wù),數(shù)據(jù)源的權(quán)威性能夠得到很好的保證[10]。據(jù)該網(wǎng)站的使用情況統(tǒng)計(jì),自2008年4月到2014年12月,共有來自世界243個(gè)國家或地區(qū)的1870萬次訪問,因不斷提升用戶服務(wù)質(zhì)量,UNDATA網(wǎng)站獲得2010年“聯(lián)合國21世紀(jì)獎(jiǎng)(UN21 Award)”[11]。
1.5 發(fā)布科學(xué)數(shù)據(jù)管理的標(biāo)準(zhǔn)和工具
聯(lián)合國糧農(nóng)組織(Food and Agricultural Organization of the United Nations,簡(jiǎn)稱FAO)負(fù)責(zé)管理農(nóng)業(yè)信息管理標(biāo)準(zhǔn)(Agriculture Information Management Standards,簡(jiǎn)稱AIMS)的門戶網(wǎng)站,致力于傳播農(nóng)業(yè)信息管理的標(biāo)準(zhǔn)和良好規(guī)范[12]。AIMS為農(nóng)業(yè)研究與發(fā)展信息共享體系(Coherence in Information for Agricultural Research for Development,簡(jiǎn)稱CIARD)開展國際合作計(jì)劃提供支持,促進(jìn)了信息和服務(wù)的共享。在AIMS的框架下,F(xiàn)AO現(xiàn)已開發(fā)了AGROVOC、AgroTagger等詞表,農(nóng)業(yè)元數(shù)據(jù)要素集(The Agricultural Metadata Element Set)、有意義的書目元數(shù)據(jù)(Meaningful Bibliographic Metadata)等元數(shù)據(jù)標(biāo)準(zhǔn),以及AgriDrupal、農(nóng)業(yè)海洋數(shù)字式空間(AgriO-ceanDSpace)和農(nóng)業(yè)元數(shù)據(jù)生成器(AgriMetaMaker)等工具,并將AGROVOC等詞表發(fā)布成為關(guān)聯(lián)數(shù)據(jù)(Linked data)。這些詞表、標(biāo)準(zhǔn)、工具為農(nóng)業(yè)信息,尤其是農(nóng)業(yè)科學(xué)數(shù)據(jù)的發(fā)布、互操作和再次利用提供了便利。
1.6推動(dòng)科學(xué)數(shù)據(jù)的共享和應(yīng)用
2015年10月,在《糧食和農(nóng)業(yè)植物遺傳資源國際條約》(The International Treaty on Plant Genetic Resources for Food and Agriculture,簡(jiǎn)稱ITPGRFA)框架下,F(xiàn)AO宣布國際水稻研究所(International Rice Research Institute,簡(jiǎn)稱IRRI)提供的超過3000個(gè)不同品種的水稻的基因組序列科學(xué)數(shù)據(jù)將在全球范圍內(nèi)共享,以促進(jìn)相關(guān)物種研究,確保全球未來糧食安全[13]。在聯(lián)合國全球地理信息管理專家委員會(huì)(United Nations Global Geospatial Information Management,簡(jiǎn)稱UN-GGIM)的推動(dòng)下,2015年2月,第69屆聯(lián)合國大會(huì)第80次會(huì)議通過了“促進(jìn)可持續(xù)發(fā)展的全球大地測(cè)量參考框架”,敦促共享地理空間信息與數(shù)據(jù),以造福人類。地理空間相關(guān)科學(xué)數(shù)據(jù)能夠支持可持續(xù)發(fā)展政策的制定、氣候變化的監(jiān)測(cè)和自然災(zāi)害的管理,也廣泛應(yīng)用于交通、農(nóng)業(yè)和建筑等各行業(yè)[14]。
歐盟(European Union,簡(jiǎn)稱EU)關(guān)于科學(xué)數(shù)據(jù)管理的動(dòng)向?qū)W洲國家產(chǎn)生了直接影響,也在國際范圍內(nèi)起到了示范和引導(dǎo)作用。由于歐盟在一定程度上具有準(zhǔn)政府的職能,因此它制定的關(guān)于科學(xué)數(shù)據(jù)管理的法律和政策等都具有直接的執(zhí)行效力。
2.1逐步完善科學(xué)數(shù)據(jù)共享相關(guān)法律法規(guī)
在科學(xué)數(shù)據(jù)共享的立法和政策制定上,歐盟確定了指導(dǎo)思想和最終目標(biāo)。2002年,在布加勒斯特泛歐大會(huì)上,歐盟發(fā)布《布加勒斯特宣言——邁向信息社會(huì):原則、戰(zhàn)略和優(yōu)先行動(dòng)》,提出了公共部門持有信息的公益性共享原則和指導(dǎo)思想。該宣言中有關(guān)公共數(shù)據(jù)共享的內(nèi)容,為歐盟制定科學(xué)數(shù)據(jù)共享法律規(guī)則提供了基本原則和思想基礎(chǔ)[15]。
在與科學(xué)數(shù)據(jù)共享相關(guān)的法律法規(guī)方面,歐盟除了制定具有指導(dǎo)意義的《歐盟條約》和各國的信息公開法之外,還涉及了科學(xué)數(shù)據(jù)共享保障體系相關(guān)的眾多領(lǐng)域,如基礎(chǔ)設(shè)施、技術(shù)平臺(tái)、數(shù)據(jù)保護(hù)、網(wǎng)絡(luò)和信息安全、知識(shí)產(chǎn)權(quán)、財(cái)政援助等。
2.2積極開展科學(xué)數(shù)據(jù)管理相關(guān)研究
2003年12月,信息基礎(chǔ)設(shè)施咨詢工作組(e-Infrastructure Reflection Group,簡(jiǎn)稱e-IRG)成立。e-IRG作為EU的高層次戰(zhàn)略研究組織,旨在有效地建設(shè)歐洲科研基礎(chǔ)設(shè)施與開展科學(xué)數(shù)據(jù)管理,其任務(wù)是在政策、咨詢和監(jiān)督層面上為e-Infrastructure的戰(zhàn)略提出建議。e-IRG成員們認(rèn)識(shí)到數(shù)據(jù)管理在未來研究中的重要性,專門成立了數(shù)據(jù)管理任務(wù)組(e-IRG Data Management Task Force)。2009年12月,e-IRG發(fā)布《數(shù)據(jù)管理報(bào)告》,對(duì)數(shù)據(jù)管理計(jì)劃、元數(shù)據(jù)及其質(zhì)量、數(shù)據(jù)管理的互操作等進(jìn)行了分析[16]。2012年1月,e-IRG發(fā)布研究報(bào)告,為實(shí)現(xiàn)數(shù)字議程目標(biāo)所需開展的行動(dòng)提供指南,其中數(shù)據(jù)管理的互操作問題是優(yōu)先關(guān)注的領(lǐng)域之一;強(qiáng)調(diào)為確保科學(xué)數(shù)據(jù)的跨學(xué)科利用,應(yīng)支持鼓勵(lì)相應(yīng)項(xiàng)目的開展;并特別提出以下建議:鼓勵(lì)開發(fā)非特定學(xué)科的框架和信息架構(gòu),以實(shí)現(xiàn)數(shù)據(jù)的互操作交換;支持科研團(tuán)體,確定他們對(duì)語義互操作性的需求和擬開展的活動(dòng);在分析現(xiàn)有接口和協(xié)議標(biāo)準(zhǔn)利用現(xiàn)狀及局限性的基礎(chǔ)上,將實(shí)現(xiàn)互操作的接口和協(xié)議標(biāo)準(zhǔn)化作為優(yōu)先領(lǐng)域[17]。
2.3構(gòu)想科學(xué)數(shù)據(jù)信息化的發(fā)展愿景
2.3.12030年的發(fā)展愿景
2008年,EU就已提出科學(xué)數(shù)據(jù)長(zhǎng)期保存計(jì)劃。2010年10月,EU數(shù)字議程發(fā)布的報(bào)告《弄潮:歐洲如何在科學(xué)數(shù)據(jù)潮流中成為贏家》勾畫出了2030年科學(xué)數(shù)據(jù)信息化基礎(chǔ)設(shè)施的發(fā)展愿景——支持對(duì)數(shù)據(jù)的無縫訪問、利用和再利用,描述了與科學(xué)數(shù)據(jù)訪問、管理、保存相關(guān)的挑戰(zhàn),制定了實(shí)現(xiàn)此愿景所需要的戰(zhàn)略和6項(xiàng)行動(dòng)建議[18]。
2.3.2GRDI2020愿景與建議
GRDI2020項(xiàng)目由EU“第七框架計(jì)劃”(FP7)資助。2011年1月,GRDI2020發(fā)布報(bào)告《全球科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施:重大數(shù)據(jù)挑戰(zhàn)》,闡述了構(gòu)建全球科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施所面臨的主要挑戰(zhàn)和亟需解決的問題,進(jìn)而為實(shí)現(xiàn)全球科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施的愿景提出了相關(guān)建議:支持?jǐn)?shù)據(jù)密集型、多學(xué)科與跨學(xué)科的研究;開發(fā)新型數(shù)據(jù)工具;支持構(gòu)建開放鏈接的數(shù)據(jù)空間;開發(fā)和實(shí)施與數(shù)據(jù)、元數(shù)據(jù)等相關(guān)的正式模型和查詢語言;支持科學(xué)數(shù)據(jù)與文獻(xiàn)之間的互操作等[19]。
2.3.32020年行動(dòng)框架展望
2010年,EU啟動(dòng)了“歐洲2020戰(zhàn)略”,作為落實(shí)該戰(zhàn)略的“第七框架計(jì)劃”已于2013年底結(jié)束,2014年又啟動(dòng)“地平線2020——研究與創(chuàng)新框架計(jì)劃”(Horizon 2020 The EU Framework Programme for Research and Innovation)[20]。在數(shù)據(jù)驅(qū)動(dòng)科學(xué)和開放獲取政策與倡議的影響下,EU發(fā)布了公眾咨詢報(bào)告《研究數(shù)據(jù)電子基礎(chǔ)設(shè)施:展望2020行動(dòng)框架》(Research Data e-Infrastructures: Framework for Action in Horizon 2020)[21],提出通過相關(guān)利益方(如研究機(jī)構(gòu)、研究人員、圖書館、數(shù)據(jù)中心、出版商等)的積極參與,開發(fā)具有開放性、互操作性的研究數(shù)據(jù)電子基礎(chǔ)設(shè)施。該行動(dòng)框架認(rèn)識(shí)到不斷變革的研究本質(zhì),以及使整個(gè)科研生態(tài)系統(tǒng)中的相關(guān)方都參與到開發(fā)與整合研究數(shù)據(jù)電子基礎(chǔ)設(shè)施過程中的重要性。為支持“開放式數(shù)字驅(qū)動(dòng)的科學(xué)”,該行動(dòng)框架列舉了7個(gè)行動(dòng)領(lǐng)域:科學(xué)研究共同體支持?jǐn)?shù)據(jù)服務(wù),開放存取的基礎(chǔ)設(shè)施,研究數(shù)據(jù)的存儲(chǔ)、管理和保存,研究數(shù)據(jù)發(fā)現(xiàn)與溯源,面向全球化的研究數(shù)據(jù)電子基礎(chǔ)設(shè)施,電子基礎(chǔ)設(shè)施的身份驗(yàn)證和授權(quán),與研究數(shù)據(jù)相關(guān)的技能和新職業(yè)等。
2013年3月,歐洲研究圖書館協(xié)會(huì)(Ligue des Bibliothèques Européennes de Recherche,簡(jiǎn)稱LIBER)、歐洲研究開放獲取基礎(chǔ)設(shè)施項(xiàng)目(Open Access Infrastructure for Research in Europe,簡(jiǎn)稱OpenAIRE)和開放獲取知識(shí)庫聯(lián)盟(Confederation of Open Access Repositories,簡(jiǎn)稱COAR)聯(lián)合響應(yīng)該行動(dòng)框架,在贊同其舉措的同時(shí),也提出了相關(guān)建議[22],如:為支持研究數(shù)據(jù)的發(fā)現(xiàn)、導(dǎo)航與利用,構(gòu)建一個(gè)能使所有利益相關(guān)者參與、普遍適用于所有行動(dòng)領(lǐng)域的實(shí)施方案;關(guān)注研究機(jī)構(gòu)與研究活動(dòng)的長(zhǎng)尾效應(yīng);研究機(jī)構(gòu)與數(shù)據(jù)中心之間應(yīng)建立清晰的工作流程;解決人文學(xué)科研究數(shù)據(jù)和電子技術(shù)應(yīng)用問題等。
2015年10月,EU發(fā)布《科學(xué)出版物與研究數(shù)據(jù)開放存取指南(第二版)》,計(jì)劃實(shí)施開放科學(xué)數(shù)據(jù)試點(diǎn)(Open Research Data Pilot)[23]工作。
經(jīng)濟(jì)合作與發(fā)展組織(Organization for Economic Cooperation and Development,簡(jiǎn)稱OECD)旨在共同應(yīng)對(duì)全球化帶來的經(jīng)濟(jì)、社會(huì)和政府治理等方面的挑戰(zhàn)。在應(yīng)對(duì)科學(xué)數(shù)據(jù)管理領(lǐng)域的挑戰(zhàn)時(shí),OECD也表明了自己的看法和應(yīng)對(duì)態(tài)度。
3.1推進(jìn)公共領(lǐng)域科學(xué)數(shù)據(jù)的共享與獲取
十余年來,OECD持續(xù)關(guān)注公共領(lǐng)域的科學(xué)數(shù)據(jù)共享與獲取問題。OECD所發(fā)布的宣言對(duì)科學(xué)數(shù)據(jù)的共享與獲取做出了原則性的闡述,雖然沒有產(chǎn)生直接的法定約束力,但在國際范圍內(nèi)特別是其成員國內(nèi),對(duì)科學(xué)數(shù)據(jù)管理相關(guān)政策和法規(guī)的制定產(chǎn)生了深遠(yuǎn)影響。
2004年1月,OECD在巴黎發(fā)表《公共基金資助研究數(shù)據(jù)存取宣言》(Declaration on Access to Research Data from Public Funding),包括中國在內(nèi)的30個(gè)國家承諾公共基金資助的研究項(xiàng)目的數(shù)據(jù)存取應(yīng)向以下目標(biāo)努力,即開放、透明、法律環(huán)境、正式責(zé)任、專業(yè)、保護(hù)智慧財(cái)產(chǎn)、互操作性、品質(zhì)與安全、效率、問責(zé)等[24]。
2006年12月,為對(duì)上述宣言提供具體行為準(zhǔn)則,OECD頒布的《公共資金資助的研究數(shù)據(jù)獲取原則與指南》(OECD Principles and Guidelines for Access to Research Data from Public Funding)要求其成員國在制定并完善與科學(xué)數(shù)據(jù)共享相關(guān)的法律和政策時(shí),將這些原則應(yīng)用其中,并增加或修訂了彈性、長(zhǎng)期性、品質(zhì)、安全等原則[25]。
2008年6月,“網(wǎng)絡(luò)經(jīng)濟(jì)的未來”部長(zhǎng)級(jí)會(huì)議在韓國首爾舉行,OECD成員國簽署《網(wǎng)絡(luò)經(jīng)濟(jì)的未來:首爾宣言》(The Seoul Declaration for the Future of the Internet Economy),宣言提出要通過政策制定來維護(hù)科研與創(chuàng)新的開放環(huán)境,使公共部門包括科學(xué)數(shù)據(jù)在內(nèi)的信息和內(nèi)容能以更加廣泛的形式獲取”[26]。
3.2強(qiáng)調(diào)科學(xué)研究領(lǐng)域的數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新(Data-Driven Innovation)
OECD在《科學(xué)技術(shù)與工業(yè)展望2012》報(bào)告中提到,科學(xué)的發(fā)展越來越依賴于數(shù)據(jù)驅(qū)動(dòng),但科學(xué)數(shù)據(jù)的開放卻受到行政、法律等的束縛[27]。2013年,OECD在《探索數(shù)據(jù)驅(qū)動(dòng)創(chuàng)新作為一種新的增長(zhǎng)源泉》報(bào)告中指出,數(shù)據(jù)已成為打造顯著競(jìng)爭(zhēng)優(yōu)勢(shì)、驅(qū)動(dòng)創(chuàng)新和可持續(xù)發(fā)展的核心要素[28]。
2015年10月,OECD發(fā)布報(bào)告《使開放科學(xué)成為現(xiàn)實(shí)》[29],認(rèn)為網(wǎng)絡(luò)與在線平臺(tái)為科學(xué)研究中大型數(shù)據(jù)集的組織與發(fā)布提供了新的機(jī)遇,使得科學(xué)發(fā)展越來越多地被數(shù)據(jù)所驅(qū)動(dòng);但在各國的開放科學(xué)政策方面,激勵(lì)措施往往是對(duì)開放獲取出版成本的資助,而很少涉及對(duì)科研人員在開放數(shù)據(jù)行動(dòng)方面的補(bǔ)償機(jī)制。報(bào)告還指出:與科學(xué)文獻(xiàn)的開放獲取相比,目前各國關(guān)于開放數(shù)據(jù)的政策不夠完善;需要更好的激勵(lì)機(jī)制促進(jìn)科研人員之間的數(shù)據(jù)共享;科學(xué)界需進(jìn)一步提升與數(shù)據(jù)相關(guān)的技能;國際和國家層面都需要更加清晰的關(guān)于文獻(xiàn)共享和數(shù)據(jù)重用的立法。2015年11月,OECD在《大數(shù)據(jù)促進(jìn)創(chuàng)新以振興經(jīng)濟(jì)和提高人類福祉》的報(bào)告中提出[30]:推動(dòng)數(shù)據(jù)驅(qū)動(dòng)的科學(xué)研究,建立跨國家和自由流動(dòng)的數(shù)據(jù)組織,利用大數(shù)據(jù)來提高效率,促進(jìn)知識(shí)共享;同時(shí),數(shù)據(jù)共享應(yīng)制定相關(guān)的法律保護(hù)條例,如專利保護(hù)、知識(shí)產(chǎn)權(quán)等,使知識(shí)信息共享有法可依。
國際科學(xué)技術(shù)數(shù)據(jù)委員會(huì)(CODATA)作為國際科學(xué)理事會(huì)(International Council for Science U-nions,簡(jiǎn)稱ICSU)下屬的跨學(xué)科國際組織,是促進(jìn)科學(xué)數(shù)據(jù)發(fā)展的專門機(jī)構(gòu),關(guān)注科學(xué)技術(shù)各個(gè)領(lǐng)域的實(shí)驗(yàn)測(cè)量、觀察和數(shù)據(jù)計(jì)算,尤其關(guān)注不同學(xué)科所共有的數(shù)據(jù)管理問題及數(shù)據(jù)在其產(chǎn)生學(xué)科領(lǐng)域之外的應(yīng)用。CODATA的主要作用是促進(jìn)和培育科學(xué)數(shù)據(jù)管理方面的廣泛合作與交流,并提供技術(shù)指導(dǎo)。
4.1組織針對(duì)特定數(shù)據(jù)問題的任務(wù)組與工作組
2014年,經(jīng)CODATA大會(huì)批準(zhǔn)和更新,目前共設(shè)置了針對(duì)特定數(shù)據(jù)問題的2個(gè)委員會(huì)(Committees)、10個(gè)任務(wù)組(Task Groups)、5個(gè)工作組(Working Groups),同時(shí)還參與了地球觀測(cè)組織(Group on Earth Observations,簡(jiǎn)稱GEO)、研究數(shù)據(jù)聯(lián)盟(Research Data Alliance,簡(jiǎn)稱RDA)、世界數(shù)據(jù)系統(tǒng)(World Data System,簡(jiǎn)稱WDS)設(shè)立的3個(gè)工作組[31]。
4.1.1全面推動(dòng)數(shù)據(jù)科學(xué)的發(fā)展
數(shù)據(jù)科學(xué)已經(jīng)逐步發(fā)展成為一門具有明確研究對(duì)象、獨(dú)特研究方法、廣泛研究領(lǐng)域和應(yīng)用領(lǐng)域的交叉學(xué)科。早在1969年,CODATA就成立了“基本物理常數(shù)”任務(wù)組(Fundamental Physical Constants),測(cè)定基本物理常數(shù);2010年,成立了“數(shù)據(jù)引用標(biāo)準(zhǔn)與實(shí)踐”任務(wù)組(Data Citation Standards and Practices)和“數(shù)據(jù)風(fēng)險(xiǎn)管理”任務(wù)組(Data at Risk),關(guān)注科學(xué)數(shù)據(jù)的保存和引用標(biāo)準(zhǔn)問題。
CODATA任務(wù)組不斷完善數(shù)據(jù)科學(xué)基礎(chǔ)理論,特別是在科學(xué)數(shù)據(jù)基本概念標(biāo)準(zhǔn)、科學(xué)數(shù)據(jù)引文標(biāo)準(zhǔn)和海量數(shù)據(jù)風(fēng)險(xiǎn)管理標(biāo)準(zhǔn)方面,其成果為科學(xué)數(shù)據(jù)相關(guān)國際標(biāo)準(zhǔn)的建立奠定了基礎(chǔ)。
4.1.2促進(jìn)全球科學(xué)數(shù)據(jù)的共用與共享
CODATA倡導(dǎo)科學(xué)數(shù)據(jù)是人類共同財(cái)產(chǎn)的理念,并發(fā)起了科學(xué)數(shù)據(jù)共享全球戰(zhàn)略和政策研究,組織全球科學(xué)數(shù)據(jù)共享管理的國際聯(lián)合行動(dòng)計(jì)劃。CODATA長(zhǎng)期發(fā)展戰(zhàn)略將全球科學(xué)數(shù)據(jù)管理作為其重要任務(wù)之一,涉及領(lǐng)域包括人體健康、材料科學(xué)、地球科學(xué)、社會(huì)科學(xué)以及綜合性科學(xué)等。
(1)2004年,CODATA成立“人體測(cè)量數(shù)據(jù)和工程學(xué)”任務(wù)組(Anthropometric Data and Engineering),促進(jìn)國際范圍內(nèi)人體測(cè)量數(shù)據(jù)的協(xié)作收集、共享利用。
(2)2008年,CODATA設(shè)立“地球與空間數(shù)據(jù)互操作”任務(wù)組(Earth and Space Science Data Interoperability),促進(jìn)地球科學(xué)數(shù)據(jù)和元數(shù)據(jù)交換以及全球整合。
(3)2010年,CODATA設(shè)立“全球道路數(shù)據(jù)開發(fā)”任務(wù)組(Global Roads Data Development),加強(qiáng)國際科學(xué)數(shù)據(jù)的使用,通過開放訪問向國際社會(huì)提供更好的道路數(shù)據(jù),以造福社會(huì)。
(4)2012年,CODATA成立“推進(jìn)微生物學(xué)信息學(xué)”任務(wù)組(Advancing Informatics for Microbiology,簡(jiǎn)稱TG-AIM),促進(jìn)和維持微生物研究數(shù)據(jù)的共用與共享,特別是數(shù)據(jù)訪問和使用的互操作性。
(5)2012年,CODATA設(shè)立“全球?yàn)?zāi)害風(fēng)險(xiǎn)研究關(guān)聯(lián)開放數(shù)據(jù)”任務(wù)組(Linked Open Data for Global Disaster Risk Research,簡(jiǎn)稱LODGD),促進(jìn)全球?yàn)?zāi)害風(fēng)險(xiǎn)數(shù)據(jù)的互聯(lián)共享。
(6)2014年,CODATA成立“互操作數(shù)據(jù)出版物”任務(wù)組(Interoperable Data Publications),促進(jìn)科學(xué)數(shù)據(jù)的互操作和數(shù)據(jù)發(fā)布。
4.1.3尋求與其他相關(guān)組織的深入合作
CODATA設(shè)立工作組的目的在于探索解決戰(zhàn)略發(fā)展過程中一些短期問題的具體方案。CODATA與RDA、GEO、WDS等國際上與數(shù)據(jù)相關(guān)的組織有廣泛合作,其中設(shè)立工作組是重要的形式。聯(lián)合工作組主要有兩種:
一是CODATA處于主導(dǎo)地位,如與RDA設(shè)立的3個(gè)工作組,即研究數(shù)據(jù)法律互操作興趣組(CODATA-RDA Interest Group on Legal Interoperability of Research Data)、研究數(shù)據(jù)科學(xué)暑期學(xué)校工作組(CODATA-RDA Working Group on Research Data Science Summer Schools)、國際材料資源注冊(cè)工作組(CODATA-RDA Working Group on International Materials Resource Registry),與新材料與標(biāo)準(zhǔn)凡爾賽公約組織(Versailles Project on Advanced Materials and Standards,簡(jiǎn)稱VAMAS)設(shè)立納米材料描述聯(lián)合工作組(CODATA/VAMAS Joint Working Group on the Description of Nanomaterials)。
二是CODATA參與到其他組織的工作組中,如GEO的數(shù)據(jù)共享工作組(GEO Data Sharing Working Group)和數(shù)據(jù)管理原則工作組(GEO Data Management Principles Task Force)、RDAWDS的數(shù)據(jù)中心成本回收興趣組(RDA-WDS Interest Group on Cost Recovery for Data Centres)。
4.2提供國際科學(xué)數(shù)據(jù)共享的研究與實(shí)踐指導(dǎo)
4.2.1對(duì)國際科學(xué)數(shù)據(jù)管理進(jìn)行長(zhǎng)期規(guī)劃
進(jìn)入21世紀(jì)以來,隨著E-science和數(shù)據(jù)驅(qū)動(dòng)型科學(xué)研究的發(fā)展,CODATA開始注重對(duì)國際科學(xué)數(shù)據(jù)管理進(jìn)行戰(zhàn)略性的規(guī)劃。2005年初,為了規(guī)劃數(shù)據(jù)管理的發(fā)展前景,CODATA成立戰(zhàn)略規(guī)劃委員會(huì),并開始起草戰(zhàn)略計(jì)劃。2008年10月,在烏克蘭基輔召開的CODATA第26屆大會(huì)上,CODATA正式批準(zhǔn)自成立以來的第一個(gè)戰(zhàn)略計(jì)劃《戰(zhàn)略規(guī)劃(2006—2012)》[32];2012年10月,CODATA大會(huì)通過了“2013—2014年科學(xué)議程”[33]。
2013年3月,CODATA發(fā)布《戰(zhàn)略規(guī)劃(2013—2018)》最終版[34]。推出三大計(jì)劃:
(1)發(fā)揮CODATA在科學(xué)數(shù)據(jù)政策、數(shù)據(jù)科學(xué)的體制框架以及數(shù)據(jù)管理方面的領(lǐng)導(dǎo)作用,開展廣泛的合作,確定與科學(xué)數(shù)據(jù)未來發(fā)展最相關(guān)的關(guān)鍵政策和體制框架,與科學(xué)界重要的政策目標(biāo)和戰(zhàn)略相結(jié)合,并加以實(shí)現(xiàn);
(2)明確CODATA在數(shù)據(jù)科學(xué)與數(shù)據(jù)管理中可以發(fā)揮其實(shí)質(zhì)性影響力的關(guān)鍵前沿領(lǐng)域以及重要的跨學(xué)科應(yīng)用領(lǐng)域;
(3)幫助ICSU積極主動(dòng)地解決科學(xué)數(shù)據(jù)管理問題,包括基礎(chǔ)設(shè)施、政策、流程和資源等。
《戰(zhàn)略規(guī)劃(2013—2018)》還提出了CODATA的愿景和發(fā)展方向,包括擴(kuò)大CODATA的作用、厘清CODATA與WDS之間的關(guān)系、加強(qiáng)CODATA會(huì)員的建設(shè)、結(jié)合戰(zhàn)略目標(biāo)拓展CODATA的服務(wù)范圍、加強(qiáng)CODATA的財(cái)務(wù)規(guī)劃、實(shí)現(xiàn)可持續(xù)發(fā)展等。
4.2.2組織學(xué)術(shù)交流活動(dòng)
(1)定期召開CODATA大會(huì)
CODATA大會(huì)和全會(huì)每?jī)赡昱e行一次,是CODATA的主要活動(dòng)之一,CODATA大會(huì)被譽(yù)為“科技數(shù)據(jù)領(lǐng)域的聯(lián)合國大會(huì)”,是全球科技數(shù)據(jù)領(lǐng)域交流合作的重要平臺(tái)[35]。
2012年10月28日至11月2日,第23屆CODATA大會(huì)暨第28屆CODATA全會(huì)在臺(tái)北市召開,會(huì)議以“開放數(shù)據(jù)與信息:變化中的地球(Open Data and Information for a Changing Planet)”為主題。會(huì)議圍繞國家和地區(qū)的數(shù)據(jù)政策、數(shù)據(jù)保藏與管理、數(shù)據(jù)共享與引用、開放數(shù)據(jù)環(huán)境的概念與應(yīng)用、數(shù)據(jù)密集型科學(xué)問題、跨學(xué)科間的數(shù)據(jù)應(yīng)用、災(zāi)害數(shù)據(jù)的處理技術(shù)與基礎(chǔ)設(shè)施建設(shè)等問題進(jìn)行了研討,在CODATA《戰(zhàn)略規(guī)劃(2013—2018)》中,對(duì)原有和新申請(qǐng)任務(wù)組進(jìn)行了討論,最后批準(zhǔn)設(shè)立12個(gè)任務(wù)組。
2014年11月2—5日,CODATA與世界數(shù)據(jù)系統(tǒng)(ICSU-World Data System)、印度科學(xué)院共同組織了國際科學(xué)數(shù)據(jù)會(huì)議(SciDataCon),會(huì)議是CODATA大會(huì)的升級(jí)版,主題涉及發(fā)掘數(shù)據(jù)服務(wù)于全球可持續(xù)發(fā)展、全球數(shù)據(jù)挑戰(zhàn)及開放數(shù)據(jù)、數(shù)據(jù)共享整合與集成對(duì)科學(xué)、社會(huì)、經(jīng)濟(jì)和政策的影響等。
2016年9月11—17日,SciDataCon 2016將在美國科羅拉多州的丹佛召開,主題為“推進(jìn)科學(xué)研究領(lǐng)域的數(shù)據(jù)前沿”(Advancing the Frontiers of Data in Research),圍繞數(shù)據(jù)革命和數(shù)據(jù)驅(qū)動(dòng)的科學(xué)研究等一系列緊迫問題展開研討。
(2)開設(shè)學(xué)術(shù)研討會(huì)、培訓(xùn)班
每年CODATA的任務(wù)組、工作組和成員都會(huì)組織學(xué)術(shù)研討會(huì),也舉辦圍繞科學(xué)數(shù)據(jù)主題的國際研討班,特別是為發(fā)展中國家培訓(xùn)科學(xué)數(shù)據(jù)管理與服務(wù)的專門人才[36]。
2014年6月,CODATA與中科院聯(lián)合舉辦“發(fā)展中國家科學(xué)大數(shù)據(jù)國際培訓(xùn)班”,為發(fā)展中國家的科研與數(shù)據(jù)工作者提供科學(xué)數(shù)據(jù)管理、共享與服務(wù)、大數(shù)據(jù)處理等方面的知識(shí)與技能;同期,“大數(shù)據(jù)與國際科學(xué)計(jì)劃研討會(huì)”召開,審議關(guān)于大數(shù)據(jù)與科學(xué)發(fā)現(xiàn)的聲明,提出大數(shù)據(jù)促進(jìn)科學(xué)發(fā)展的建議與行動(dòng)綱領(lǐng)。2014年8月,CODATA的“發(fā)展中國家科技數(shù)據(jù)保藏與共享”任務(wù)組在肯尼亞首都內(nèi)羅畢舉辦開放數(shù)據(jù)研討班;同時(shí),召開了主題為“科學(xué)開放數(shù)據(jù)與發(fā)展中國家的可持續(xù)發(fā)展”的學(xué)術(shù)研討會(huì)。
2015年3月,CODATA與印度統(tǒng)計(jì)研究所合作,在班加羅爾舉行關(guān)于大數(shù)據(jù)的研討班,培養(yǎng)初、中級(jí)專業(yè)的大數(shù)據(jù)管理和開發(fā)專業(yè)技術(shù)人才。2015年9月,CODATA的成員印尼科學(xué)研究院在雅加達(dá)舉行大數(shù)據(jù)管理與分析的研討班。
(3)籌備國際數(shù)據(jù)周活動(dòng)
2016年9月11—17日,CODATA將舉行國際數(shù)據(jù)周(International Data Week)活動(dòng)[37],主題是“從大數(shù)據(jù)到開放數(shù)據(jù):動(dòng)員數(shù)據(jù)革命”(From Big Data toOpen Data:Mobilizing the Data Revolution),活動(dòng)主要包括第八次研究數(shù)據(jù)聯(lián)盟(Research Data Alliance,簡(jiǎn)稱RDA)全體會(huì)議、SciDataCon 2016會(huì)議以及國際數(shù)據(jù)論壇三個(gè)部分。國際數(shù)據(jù)周活動(dòng)將匯集世界范圍內(nèi)的數(shù)據(jù)科學(xué)家、研究人員、行業(yè)領(lǐng)袖、企業(yè)家、政策制定者和數(shù)據(jù)管理員等,一起探討如何更好地通過數(shù)據(jù)驅(qū)動(dòng)的研究和創(chuàng)新來提高社會(huì)的知識(shí)和利益。
4.2.3出版《數(shù)據(jù)科學(xué)雜志》等刊物
為了給科學(xué)數(shù)據(jù)管理的研究者與從業(yè)者提供信息交流的平臺(tái),推動(dòng)相關(guān)的理論研究和實(shí)踐探索,出版與科學(xué)數(shù)據(jù)相關(guān)的研究報(bào)告、會(huì)議錄等各類出版物,CODATA不斷豐富自身職能,主辦《數(shù)據(jù)科學(xué)雜志》(CODATA Data Science Journal)[38]?!稊?shù)據(jù)科學(xué)雜志》的創(chuàng)立標(biāo)志著數(shù)據(jù)科學(xué)作為一門獨(dú)立的學(xué)科正式誕生[39]。
4.3促進(jìn)科學(xué)數(shù)據(jù)的國際共享
4.3.1協(xié)調(diào)國際數(shù)據(jù)項(xiàng)目
2011年,CODATA實(shí)施“手拉手合作伙伴計(jì)劃”(Hand in Hand Program),旨在促進(jìn)國際項(xiàng)目之間的合作,更充分地使用已有數(shù)據(jù)資源,有效地減少資料收集、數(shù)據(jù)采集等重復(fù)勞動(dòng)及由此產(chǎn)生的相應(yīng)費(fèi)用,幫助科學(xué)家提高科研成果產(chǎn)出,加速科研成果轉(zhuǎn)化,消減數(shù)字鴻溝。目前,該計(jì)劃已經(jīng)啟動(dòng)與“災(zāi)害風(fēng)險(xiǎn)綜合研究計(jì)劃”(Integrated Research on Disaster Risk Program)等的合作[40]。
4.3.2指導(dǎo)發(fā)展中國家的實(shí)踐
2002年,為了關(guān)注發(fā)展中國家科學(xué)數(shù)據(jù)管理的實(shí)踐活動(dòng),CODATA成立了“發(fā)展中國家科技數(shù)據(jù)保藏與共享”任務(wù)組(Preservation of and Access to Scientific and Technical Data in/for/with Developing Countries,簡(jiǎn)稱PASTD)[41]。PASTD促進(jìn)了對(duì)發(fā)展中國家關(guān)于科學(xué)數(shù)據(jù)長(zhǎng)期保存、歸檔和永久訪問需求的更深入了解,推動(dòng)了相關(guān)技術(shù)標(biāo)準(zhǔn)和政策的制定。PASTD自成立以來,先后得到UNESCO、聯(lián)合國經(jīng)社事務(wù)部信息通訊與發(fā)展全球聯(lián)盟(UNDESA GAID)、國際科學(xué)院組織(IAP)、全球變化亞太網(wǎng)絡(luò)組織(APN),以及美國、中國、南非、巴西等國家基金會(huì)的支持,在亞洲、非洲、拉丁美洲先后召開過一系列科學(xué)研討會(huì)和數(shù)據(jù)處理與應(yīng)用技術(shù)培訓(xùn)。PASTD在新階段的發(fā)展計(jì)劃中,將發(fā)展中國家科學(xué)數(shù)據(jù)共享與應(yīng)用能力建設(shè)作為重點(diǎn),這與聯(lián)合國促進(jìn)發(fā)展中國家科學(xué)數(shù)據(jù)共享與應(yīng)用全球聯(lián)盟(UN GAID e-SDDC)的計(jì)劃相互結(jié)合、互為補(bǔ)充。
2012年7月,CODATA舉辦了“發(fā)展中國家科學(xué)數(shù)據(jù)管理和可持續(xù)發(fā)展培訓(xùn)國際研討會(huì)”,聚焦于科學(xué)數(shù)據(jù)生命周期管理以及可持續(xù)使用[42]。該會(huì)議以中科院在科技數(shù)據(jù)管理與共享方面的理論和實(shí)踐經(jīng)驗(yàn)為基礎(chǔ),為發(fā)展中國家的科技人員與數(shù)據(jù)工作者提供系統(tǒng)全面的培訓(xùn)。培訓(xùn)內(nèi)容包括科技數(shù)據(jù)資源規(guī)劃、標(biāo)準(zhǔn)規(guī)范、管理的技術(shù)手段及典型案例分析等。培訓(xùn)的開展為建立發(fā)展中國家科技數(shù)據(jù)共享網(wǎng)絡(luò)、促進(jìn)發(fā)展中國家在國際科技合作項(xiàng)目上開展實(shí)質(zhì)性深入合作奠定了基礎(chǔ)[43]。
2013年,在EU、澳大利亞、美國等的資助下,研究數(shù)據(jù)聯(lián)盟(Research Data Alliance,簡(jiǎn)稱RDA)成立,目標(biāo)是希望通過基礎(chǔ)設(shè)施、標(biāo)準(zhǔn)、政策和實(shí)踐等方面的發(fā)展促進(jìn)研究數(shù)據(jù)的共享與交流、使用與復(fù)用,推進(jìn)全球數(shù)據(jù)驅(qū)動(dòng)的創(chuàng)新與發(fā)展[47]。截止到2016年1月,RDA已有超過3600個(gè)成員,遍布全球105個(gè)國家。
5.1頻繁召開會(huì)議推進(jìn)工作開展
RDA全會(huì)是工作會(huì)議,每半年召開一次,會(huì)議匯集數(shù)據(jù)科學(xué)家、圖書館員、計(jì)算機(jī)科學(xué)家和其他領(lǐng)域科學(xué)家,有助于科學(xué)數(shù)據(jù)在不同學(xué)科領(lǐng)域、不同技術(shù)層面和不同國家地區(qū)之間進(jìn)行共享。RDA尋找有意愿的國家和地區(qū)組織承辦會(huì)議,2013年3月18—20日,RDA在瑞典哥德堡召開了第一次全會(huì),提出了無障礙開放獲取研究數(shù)據(jù)的目標(biāo);第二次全會(huì)于2013年9月16—18日在美國華盛頓召開,會(huì)議的目標(biāo)是在研究數(shù)據(jù)的共享方面建立全球合作伙伴關(guān)系;2014年3月26—28日在愛爾蘭的都柏林舉行第三次全會(huì),主題為“數(shù)據(jù)共享社區(qū):發(fā)揮自己的作用”(The Data Sharing Community:Playing YOUR Part),通過主題演講、展板海報(bào)、網(wǎng)絡(luò)、工作組與興趣組專題討論等各種形式,研討各個(gè)學(xué)科、數(shù)據(jù)生命周期各階段的科學(xué)數(shù)據(jù)問題;2014年9月22—24日,RDA第四次全會(huì)在阿姆斯特丹召開,主題為“沒有障礙的研究數(shù)據(jù)共享”(Research Data Sharing without Barrier);2015年3月8—11日,RDA第五次全會(huì)在美國加州圣地亞哥召開,認(rèn)為RDA成立兩年來作為一個(gè)全球性的組織以新的合作方式促進(jìn)了數(shù)據(jù)共享與交換開放環(huán)境的形成;2015年9月23—25日,RDA第六次全會(huì)在巴黎召開;第七次全會(huì)于2016年2月29日至3月3日在日本東京召開,主題為“開放科學(xué)時(shí)代的數(shù)據(jù)共享工作”(Making Data Sharing Work in the Era of Open Science);第八次全會(huì)將于2016年9月11—16日在美國科羅拉多州丹佛市召開;第九次全會(huì)將于2017年4月3—7日在西班牙巴塞羅那召開。
5.2成立工作組、興趣組、協(xié)調(diào)組
各種工作組(Working Groups)、興趣組(Interest Groups)和協(xié)調(diào)組(Coordination Groups)在實(shí)現(xiàn)RDA職能和目標(biāo)方面具有重要的作用,研究人員可以在RDA網(wǎng)站上通過注冊(cè)參與小組交流。截至2016年1月,RDA已經(jīng)成立21個(gè)工作組、44個(gè)興趣組和5個(gè)協(xié)調(diào)組。
(1)工作組主要圍繞基礎(chǔ)性數(shù)據(jù)工作建立,職能是解決數(shù)據(jù)管理中標(biāo)準(zhǔn)、規(guī)范、政策、安全等之類的問題,如:數(shù)據(jù)引用工作組(Data Citation WG)、元數(shù)據(jù)目錄工作組(Metadata Standards Directory WG)等。RDA通常與其他機(jī)構(gòu)聯(lián)合成立工作組,如與美國國家標(biāo)準(zhǔn)化組織(The National Information Standards Organization,簡(jiǎn)稱NISO)建立研究數(shù)據(jù)集隱私問題工作組(RDA/NISO Privacy Implications of Research Data Sets WG)等。此外,RDA還針對(duì)特定學(xué)科和主題的數(shù)據(jù)問題建立工作組,如生命科學(xué)領(lǐng)域數(shù)據(jù)政策、標(biāo)準(zhǔn)與數(shù)據(jù)庫關(guān)聯(lián)工作組(BioSharing Registry:Connecting Data Policies,Standards&Databases in Life Sciences WG)等。
(2)興趣組主要將數(shù)據(jù)工作與專業(yè)學(xué)科結(jié)合起來,解決相關(guān)領(lǐng)域中的數(shù)據(jù)管理問題,如農(nóng)業(yè)數(shù)據(jù)興趣組(Agriculture Data IG)、歷史和民族志數(shù)字實(shí)踐興趣組(Digital Practices in History and Ethnography IG)等。興趣組將數(shù)據(jù)管理的一般性問題作為研討的主題,如數(shù)據(jù)倫理與社會(huì)問題興趣組(Ethics and Social Aspects of Data IG)、數(shù)字保存電子基礎(chǔ)設(shè)施興趣組(Preservation e-Infrastructure IG)等。RDA還與其他機(jī)構(gòu)聯(lián)合成立興趣組,研討共同感興趣的數(shù)據(jù)管理問題,如與CODATA成立法律互操作興趣組(RDA/CODATA Legal Interoperability IG)等。
(3)協(xié)調(diào)組是為解決RDA的運(yùn)行和管理問題而建立的,如RDA組織咨詢委員會(huì)(RDA Organisational Advisory Board)等;也負(fù)責(zé)協(xié)調(diào)RDA業(yè)務(wù)會(huì)議、學(xué)術(shù)研討會(huì)等的召開,如工作組/興趣組合作會(huì)議(WG/IG Collaboration Meeting)、數(shù)字人文研討會(huì)(Digital Humanities Workshop)等。
國際圖聯(lián)(IFLA)是代表圖書館和信息服務(wù)機(jī)構(gòu)以及用戶利益的最重要的國際組織。
6.1研討科學(xué)數(shù)據(jù)管理的理論與實(shí)踐
IFLA大會(huì)已經(jīng)涉及科學(xué)數(shù)據(jù)管理方面的主題。2011年8月,第77屆國際圖聯(lián)大會(huì)保存、保護(hù)與信息技術(shù)教育培訓(xùn)部分的主題中包含了數(shù)字監(jiān)護(hù)教育,并開展了專題研討[48]。2012年8月,第78屆國際圖聯(lián)大會(huì)將科技圖書館分委會(huì)的主題定為“圖書館在數(shù)據(jù)監(jiān)護(hù)、獲取和保存中的角色:一個(gè)國際的視角”(The Role of Libraries in Data Curation,Access and Preservation:an International Perspective)。會(huì)議認(rèn)為,在科研發(fā)展過程中,數(shù)據(jù)的監(jiān)護(hù)、存取是不可或缺的,會(huì)上研討的內(nèi)容包括:開展國家層面的數(shù)據(jù)監(jiān)護(hù)計(jì)劃所面臨的主要問題;在構(gòu)建數(shù)據(jù)監(jiān)護(hù)知識(shí)庫中,圖書館扮演的角色;參與數(shù)據(jù)監(jiān)護(hù)的圖書館員的培訓(xùn);圖書館數(shù)據(jù)監(jiān)護(hù)可持續(xù)發(fā)展的財(cái)務(wù)模式[49]。此外,會(huì)議還發(fā)布了一系列研究成果,如《德國圖書館在研究數(shù)據(jù)監(jiān)護(hù)和保存中的角色:一項(xiàng)調(diào)查結(jié)果》《大學(xué)圖書館和數(shù)據(jù)研究服務(wù):準(zhǔn)備與態(tài)度》《加拿大的國家研究數(shù)據(jù)倡議》《來自圖書館的領(lǐng)導(dǎo):北安普頓大學(xué)的數(shù)據(jù)管理計(jì)劃》《圖書館作為電子數(shù)據(jù)看護(hù)服務(wù)的經(jīng)紀(jì)人:來自于德國研究基金項(xiàng)目圖書館數(shù)字保存的實(shí)踐見解》《支持?jǐn)?shù)據(jù)交換中的圖書館作用》等研究報(bào)告或論文[50]。這些研究成果主要圍繞圖書館在科學(xué)數(shù)據(jù)管理領(lǐng)域的實(shí)踐展開,探討了圖書館的角色定位、態(tài)度見解、實(shí)施計(jì)劃、功能作用等。
6.2推進(jìn)圖書館科研數(shù)據(jù)服務(wù)相關(guān)研究
IFLA認(rèn)為,圖書館可以通過圖書館學(xué)的基本法則應(yīng)對(duì)各種挑戰(zhàn),在提供科研數(shù)據(jù)管理相關(guān)服務(wù)方面,圖書館員可以通過開展數(shù)據(jù)管理計(jì)劃和元數(shù)據(jù)咨詢、數(shù)據(jù)發(fā)布和保存、數(shù)據(jù)素養(yǎng)教育等服務(wù),為科研人員提供貫穿于數(shù)據(jù)生命周期的幫助。《國際圖聯(lián)雜志》(IFLA Journal)將在2016年10月圍繞科研數(shù)據(jù)服務(wù)(Research Data Services)主題出版???,目前正在征集有關(guān)圖書館科研數(shù)據(jù)服務(wù)最新理論研究、實(shí)踐經(jīng)驗(yàn)方面的論文,分主題主要包括:數(shù)據(jù)素養(yǎng)、數(shù)據(jù)倉儲(chǔ)與館藏管理、數(shù)字?jǐn)?shù)據(jù)保存、數(shù)據(jù)管理計(jì)劃、元數(shù)據(jù)與數(shù)據(jù)分類、數(shù)據(jù)引用與標(biāo)識(shí)符、數(shù)據(jù)政策與許可、圖書館數(shù)據(jù)服務(wù)培訓(xùn)等[51]。
近十五年來,上述國際組織開展了一系列與科學(xué)數(shù)據(jù)相關(guān)的實(shí)踐活動(dòng),在世界范圍內(nèi)推進(jìn)了科學(xué)數(shù)據(jù)的管理、共享與利用。這些國際組織中,UN、EU、OECD屬于綜合性國際組織,它們主要是制定科學(xué)數(shù)據(jù)管理領(lǐng)域宏觀性、原則性的戰(zhàn)略、倡議與計(jì)劃;而數(shù)據(jù)領(lǐng)域?qū)I(yè)性的國際組織CODATA、RDA等則是從具體操作層面推動(dòng)科學(xué)數(shù)據(jù)管理實(shí)踐的開展;IFLA作為國際圖書情報(bào)界最大的組織,則探索把科學(xué)數(shù)據(jù)管理與圖書情報(bào)實(shí)踐相結(jié)合,以拓展信息服務(wù)邊界、提升信息服務(wù)水平。
進(jìn)入新世紀(jì)以來,我國已經(jīng)意識(shí)到科學(xué)數(shù)據(jù)的重要價(jià)值,早在2001年科技部就啟動(dòng)了“國家科學(xué)數(shù)據(jù)共享工程”項(xiàng)目。特別是近年來,隨著“大數(shù)據(jù)”的興起,我國政府積極應(yīng)對(duì),推出了一系列有關(guān)“大數(shù)據(jù)”的戰(zhàn)略與計(jì)劃,其中也涉及科學(xué)數(shù)據(jù)領(lǐng)域。國際組織在科學(xué)數(shù)據(jù)管理領(lǐng)域的實(shí)踐活動(dòng)對(duì)我國推進(jìn)相關(guān)工作具有重要的參考意義,本文認(rèn)為可以在三個(gè)層面借鑒相關(guān)的經(jīng)驗(yàn)和研究成果。
(1)從宏觀層面來說,我國要制定與科學(xué)數(shù)據(jù)管理相關(guān)的政策、法規(guī)以及戰(zhàn)略規(guī)劃等,應(yīng)廣泛吸收國際組織關(guān)于科學(xué)數(shù)據(jù)管理與共享的基本原則和精神。例如,《溫哥華宣言》《全球科學(xué)信息共有倡議》《布加勒斯特宣言》《公共基金資助研究數(shù)據(jù)存取宣言》《首爾宣言》等文獻(xiàn)確立的基本原則和精神,應(yīng)在結(jié)合我國實(shí)際情況的基礎(chǔ)上得到借鑒和體現(xiàn)。
(2)從中觀層面來說,我國科學(xué)數(shù)據(jù)領(lǐng)域的管理和指導(dǎo)機(jī)構(gòu),可以借鑒國際組織在科學(xué)數(shù)據(jù)管理方面的組織模式和運(yùn)行機(jī)制。例如,在科技部“國家科學(xué)數(shù)據(jù)共享工程”和中科院“科學(xué)數(shù)據(jù)云”建設(shè)發(fā)展過程中,可以借鑒和參考CODATA、RDA等采用的以組織咨詢小組和技術(shù)咨詢小組為指導(dǎo),以任務(wù)組、工作組和興趣組(工作周期一般為12—18個(gè)月)為推進(jìn)器的組織結(jié)構(gòu),形成以問題為導(dǎo)向的工作模式。這種組織結(jié)構(gòu)和工作模式既可以保障數(shù)據(jù)管理機(jī)構(gòu)高效、科學(xué)的運(yùn)作,便于過程監(jiān)督和目標(biāo)考核,也能快速應(yīng)對(duì)科學(xué)研究環(huán)境的變化。
(3)從微觀層面來說,應(yīng)鼓勵(lì)我國的研究機(jī)構(gòu)、科研團(tuán)隊(duì)以及科學(xué)家等積極參與國際間科學(xué)數(shù)據(jù)管理與共享的交流與合作。CODATA、RDA皆以促進(jìn)科學(xué)數(shù)據(jù)全球共享與利用為使命,特別是RDA的開放性,降低了機(jī)構(gòu)組織與科學(xué)家參與合作的門檻,提高了各參與方之間的交流效率,有助于全球科學(xué)數(shù)據(jù)共享理念的實(shí)現(xiàn)。因此,國內(nèi)的科學(xué)數(shù)據(jù)中心等機(jī)構(gòu)應(yīng)該增強(qiáng)開放性,廣泛吸引科研機(jī)構(gòu)、科學(xué)家等以加盟的方式開展工作,依靠合力推進(jìn)數(shù)據(jù)的管理與共享,以適合“數(shù)據(jù)密集型科研”環(huán)境和“大數(shù)據(jù)”時(shí)代的要求。
1國務(wù)院關(guān)于印發(fā)“十二五”國家自主創(chuàng)新能力建設(shè)規(guī)劃的通知[EB/OL].[2015-12-18].http://www.gov.cn/zwgk/2013-05/29/ content_2414100.htm.
2國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知[EB/OL].[2015-12-18].http://www. gov.cn/zhengce/content/2015-09/05/content_ 10137.htm.
3International DeclarationonHumanGenetic Data[EB/OL].[2015-12-18].http://www. unesco.org/new/en/social-and-human-sciences/ themes/bioethics/human-genetic-data.
4Setting the Digital Agenda for the Memory of the World[EB/OL].[2015-12-18].http://www. unesco.org/new/en/media-services/single-view/ news/setting_the_digital_agenda_for_the_ memory_of_the_world.
5Final Report of the Tunis Phase of the WSIS[R/ OL].[2015-12-19].http://www.itu.int/wsis/ docs2/tunis/off/9rev1.doc.
6WSIS Forum 2009 Brochure[EB/OL].[2015-12-19].http://www.itu.int/wsis/implementation/2009/forum/geneva/docs/WSIS_Forum_ 2009_Brochure.pdf.
7“Open Access:Progress since WSIS 2010”[EB/OL].[2015-12-22].http://www.unesco. org/new/en/communication-and-information/ flagship-project-activities/unesco-and-wsis/implementation-and-follow-up/wsis-forum/wsis-forum-2011/e-science-open-access-to-scientificknowledge.
8The Global Information Commons for Science Initiative[EB/OL].[2015-12-25].http:// www.codata.org/task-groups/global-informationcommons-for-science-initiative.
9中科院成為全球UN GAID e-SDDC領(lǐng)銜單位[EB/OL].[2015-12-24].http://www.edu. cn/ke_ji_chan_ye_1086/20071205/t20071205 _268829.shtml.
10UNdata[EB/OL].[2015-12-29].http://data. un.org.
11UNdata wins 2010 UN21 Award[EB/OL].[2015-12-29].http://unstats.un.org/unsd/ wsd/News1.aspx.
12Agricultural Information Management Standards(AIMS)[EB/OL].[2015-12-28].http:// aims.fao.org.
13Rice genetics placed in global data pool to help develop sustainable crops-UN agency[EB/OL].[2015-12-29].http://www.un.org/News/dh/ pdf/english/2015/07102015.pdf.
14國家測(cè)繪地理信息局有關(guān)負(fù)責(zé)人就聯(lián)合國大會(huì)決議《促進(jìn)可持續(xù)發(fā)展的全球大地測(cè)量參考框架》答記者問[EB/OL].[2015-12-29]. http://www.sbsm.gov.cn/article/gzcy/zxft/ 201503/20150300022361.shtml.
15The Bucharest Declaration,Bucharest Pan-European Conference in Preparation of the World Summit on the Information Society:Towards an Information Society:Principles,Strategy and Priorities for Action[R/OL].[2016-01-05]. http://www.unece.org/fileadmin/DAM/env/ pp/documents/bucharest.declaration.doc.
16e-IRG Report on Data Management[R/OL].[2016-01-05].http://ec.europa.eu/research/ infrastructures/pdf/esfri/publications/esfri_e_ irg_report_data_management_december_2009_ en.pdf.
17e-InfrastructuresinsupportoftheDigital Agenda[R/OL].[2016-01-05].http://e-irg. eu/documents/10920/239416/digital_agenda_a5_final.pdf.
18Riding the Wave:How Europe can gain from the rising tide of scientific data[R/OL].[2016 -01-05].http://ec.europa.eu/information_society/newsroom/cf/document.cfm?action=display &doc_id=707.
19Global Research Data Infrastructures:Towards a 10-year vision for global research data infrastructures[EB/OL].[2016-01-09].http:// www.grdi2020.eu/Repository/FileScaricati/6b dc07fb-b21d-4b90-81d4-d909fdb96b87.pdf.
20HORIZON 2020 The EU Framework Programme for Research and Innovation[EB/OL].[2016-01-20].http://ec.europa.eu/programmes/horizon2020/en.
21Research Data e-Infrastructures:Framework for Action in H2020[R/OL].[2016-01-19].https:// ec.europa.eu/digital-agenda/sites/digital-agenda/ files/data_einfra_h2020_fiches_on-line_ consult.pdf.
22LIBER/COAR/OpenAIRE joint response to EC Research Data e-Infrastructures Framework[EB/ OL].[2016-01-20].http://libereurope.eu/ blog/2013/03/28/liber-coar-openaire-joint-response-to-ec-research-data-e-infrastructuresframework.
23Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020[EB/OL].[2016-01-28].http://ec.europa. eu/research/participants/data/ref/h2020/grants_ manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_ en.pdf.
24Declaration on Access to Research Data from Public Funding[EB/OL].[2016-01-15].http://archiv.twoday.net/stories/133859.
25OECD Principles and Guidelines for Access to Research Data from Public Funding[R/OL].[2016-01-15].http://www.oecd.org/science/ sci-tech/38500813.pdf.
26The Seoul Declaration for the Future of the Internet Economy[R/OL].[2016-01-15].http://www. oecd.org/internet/consumer/4083 9436.pdf.
27OECD Science,Technology and Industry Outlook 2012[EB/OL].[2016-01-19].http://www. oecd-ilibrary.org/science-and-technology/oecdscience-technology-and-industry-outlook-2012_ sti_outlook-2012-en.
28Exploring Data-Driven Innovation as a New Source of Growth[EB/OL].[2016-01-20].http://www.oecd-ilibrary.org/science-and-technology/oecd-digital-economy-papers_20716826. 29Making Open Science a Reality[EB/OL].[2016-01-19].http://dx.doi.org/10.1787/ 5jrs2f963zs1-en.
30Data-Driven Innovation Big Data for Growth and Well-Being[EB/OL].[2016-01-09].http://www.oecd-ilibrary.org/science-and-technology/data-driven-innovation_9789264229358 -en.
31International Council for Science:Committee on Data for Science and Technology[EB/OL].[2015-12-26].http://www.codata.org.
32CODATA Strategic Plan 2006-2012[EB/OL].[2015-12-26].http://www.codata.info/archives/2006/CODATAstrategicPlan.pdf.
33CODATA TASK GROUPS 2013-2014[EB/ OL].[2015-12-26].http://www.codata.info/ resources/newsletters/Newsletter_SpecialIssue_ TG.pdf.
34CODATA Strategic Plan 2013-2018[EB/OL].[2015-12-26].http://www.codata.org/aboutcodata/codata-strategic-plan-2013-2018.
35Conference[EB/OL].[2015-12-30].http:// www.codata.org/events/conferences.
36Workshops[EB/OL].[2015-12-30].http:// www.codata.org/events/workshops.
37International Data Week[EB/OL].[2015-12-30].http://www.internationaldataweek.org.
38Data Science Journal[EB/OL].[2015-12-31].http://www.codata.org/publications/datascience-journal.
39劉紅,胡新和.數(shù)據(jù)哲學(xué)構(gòu)建的初步探析[J].哲學(xué)動(dòng)態(tài),2012(12).
40Data-Intensive Science and Discovery CODATA 45 Years On Summary Report[EB/OL].[2015 -12-31].http://english.ceode.cas.cn/ps/ 201203/P020120321374100156825.pdf.
41Preservation of and Access to Scientific and Technical Data in Developing Countries[EB/ OL].[2015-12-31].http://www.codata.info/ taskgroups/TGpreservation/index.html.
42International Training Workshop for Developing Countries on Scientific Data Management and Sustainable Development[EB/OL].[2015-12 -31].http://www.codata.info/archives/2012/ index.html.
43International Training Workshop for Developing Countries on Scientific Data Management and Sustainable Development[EB/OL].[2015-12-31].http://www.codata.org/Various%20events/ CODATA%20Training%20Workshop.pdf.
44Fundamental Physical Constants[EB/OL].[2015-12-31].http://www.codata.info/taskgroups/TGfundconst/index.html.
45CODATA/VAMAS Joint Working Group on the Description of Nanomaterials[EB/OL].[2015-21-31].http://www.codata.org/nanomaterials.
46CODATA KEY VALUES FOR THERMODYNAMICS[EB/OL].[2015-21-31].http:// www.codata.org/resources/databases/key1.html.
47The Research Data Alliance[EB/OL].[2016-01-09].https://rd-alliance.org.
48Information Technology Section events and sessions Puerto Rico 2011[EB/OL].[2016-01-21]. http://www.ifla.org/news/information-technology-section-events-and-sessions-puerto-rico-2011.
49The Role of Libraries in Data Curation,Access,and Preservation:an International Perspective[EB/OL].[2016-01-21].http://conference. ifla.org/ifla78/calls-for-papers/the-role-of-libraries-in-data-curation-access-and-preservationinternational.
50The role of libraries in data curation,access and preservation:an international perspective[EB/OL].[2016-01-24].http://conference. ifla.org/past-wlic/2012/session-116.htm.
51Call for Papers:IFLA Journal special issue on Research Data Services[EB/OL].[2016-01-28].http://www.ifla.org/node/9909.
(黃如花 教授 武漢大學(xué)信息管理學(xué)院副院長(zhǎng)武漢大學(xué)信息資源研究中心,周志峰 館員 武漢大學(xué)信息管理學(xué)院圖書館學(xué)專業(yè)2011級(jí)博士研究生溫州大學(xué)圖書館)
Study on Practices of International Organizations in the Field of Scientific Data Management during the Last 15 Years
Huang Ruhua Zhou Zhifeng
This paper introduces the major related events of international organizations in the field of scientific data management during the last 15 years including UN,EU,OECD,CODATA,RDA and IFLA.It also proposes that we should draw on the practical results and experiences of scientific data management in international organizations on micro-level,meso-level and macro-level in order to promote the practices of scientific data management in China.51 refs.
Scientific Data;Research Data;Scientific Data Management;International Organization
?本文系武漢大學(xué)人文社會(huì)科學(xué)自主科研項(xiàng)目“促進(jìn)我國數(shù)據(jù)開放共享的對(duì)策研究”研究成果之一,并得到“中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金”資助。
2016-02-26