萬望輝,崔辰州,喬翠蘭,趙永恒,郝晉新,薛艷杰
(1. 中國科學院國家天文臺,北京 100012;2. 華中師范大學,湖北 武漢 430079;3. 中國科學院,北京 100864)
CN 53-1189/P ISSN 1672-7673
天文觀測數(shù)據(jù)開放共享政策與策略分析研究*
萬望輝1,2,崔辰州1,喬翠蘭2,趙永恒1,郝晉新1,薛艷杰3
(1. 中國科學院國家天文臺,北京 100012;2. 華中師范大學,湖北 武漢 430079;3. 中國科學院,北京 100864)
當代天文學已經(jīng)進入數(shù)據(jù)密集型和數(shù)據(jù)驅(qū)動的時代。隨著我國天文學研究的不斷發(fā)展,國內(nèi)自產(chǎn)的天文觀測數(shù)據(jù)呈現(xiàn)爆炸式增長的趨勢。將天文觀測數(shù)據(jù)資源集成并推動數(shù)據(jù)資源與應用服務的共建共享,建立健全符合科學發(fā)展規(guī)律的數(shù)據(jù)資源開放共享政策與制度,使天文科技資源得到高效有序的管理和使用,對國內(nèi)天文學研究和科普教育的發(fā)展至關重要。在充分調(diào)研各國政府、部門和國際組織有關政策的基礎上,剖析了國外科學數(shù)據(jù)“完全與公開”的共享原則,介紹了我國科學數(shù)據(jù)共享有關的管理規(guī)定和當前狀況,重點論述國際各大天文望遠鏡項目和天文數(shù)據(jù)中心天文觀測數(shù)據(jù)資源開放共享的有關政策。對國內(nèi)天文觀測數(shù)據(jù)資源和開放共享的現(xiàn)狀以及存在的問題進行了分析和總結(jié)。對我國天文觀測數(shù)據(jù)資源共享工作發(fā)展和政策制定提出了具體建議。
天文觀測數(shù)據(jù);開放共享;政策;策略
天文學是一門古老而又始終隨著時代進步不斷發(fā)展的學科?,F(xiàn)代天文學已經(jīng)進入多波段和時域天文學時代,成為一門數(shù)據(jù)密集型和數(shù)據(jù)驅(qū)動的科學[1]。天文觀測數(shù)據(jù)資源的集成和數(shù)據(jù)資源開放共享,對天文學研究和教育普及至關重要。
天文學是一門非常開放的科學,在數(shù)據(jù)和資源的開放共享方面一直發(fā)揮著引領作用。IVOA*http://www.ivoa.net/、VizieR*http://vizier.u-strasbg.fr/viz-bin/VizieR、NED*http://ned.ipac.caltech.edu/、ASCL*http://asterisk.apod.com/wp/、ADS*http://www.adsabs.harvard.edu/、arXiv.astro-ph*http://arxiv.org/archive/astro-ph都是天文學領域資源共享的成功范例。這些成功的范例逐漸培養(yǎng)起了天文學家的行業(yè)傳統(tǒng)。在這樣良好傳統(tǒng)的基礎上,如果能通過政策和制度的手段進一步規(guī)范和要求,必將有利于天文數(shù)據(jù)開放共享事業(yè)的長遠發(fā)展。建立健全符合客觀規(guī)律的天文觀測數(shù)據(jù)資源開放政策與制度,打造天文觀測數(shù)據(jù)資源共享平臺,通過公正、合理的手段集成天文觀測數(shù)據(jù)資源,會使這些數(shù)據(jù)資源得到規(guī)范的管理,充分發(fā)揮它們的科學價值,促進天文學自身的發(fā)展和社會進步。
本文著眼于天文學的長期發(fā)展,旨在為制定國內(nèi)天文觀測數(shù)據(jù)資源共享政策提供參考,規(guī)范數(shù)據(jù)匯交、管理和開放共享流程,對國內(nèi)外科學數(shù)據(jù)和科技計劃,特別是天文觀測數(shù)據(jù)資源開放共享政策等方面的情況進行了調(diào)研、分析和研究。本文第1節(jié)簡要介紹科學數(shù)據(jù)資源開放共享政策;第2節(jié)重點介紹天文觀測數(shù)據(jù)開放共享政策;最后,針對國內(nèi)天文觀測數(shù)據(jù)資源共享現(xiàn)狀,對天文觀測數(shù)據(jù)資源共享工作發(fā)展和政策制定提出了建議。
推動科學數(shù)據(jù)開放共享的動力主要來自于政府機構(gòu)、基金會、學術團體、出版商以及用戶的要求。科學數(shù)據(jù)共享能營造更豐富的數(shù)據(jù)環(huán)境,使研究人員能夠輕松地發(fā)布、發(fā)現(xiàn)、訪問和使用數(shù)據(jù)[2]。相關制度和法規(guī)的制定和實施極大地促進了科學數(shù)據(jù)的開放使用。本節(jié)主要介紹國內(nèi)外政府與機構(gòu)有關科學數(shù)據(jù)共享的規(guī)定和政策。
1.1 國際組織
國際科學數(shù)據(jù)委員會(CODATA)*http://www.codata.org/index.html和經(jīng)濟合作與發(fā)展組織(OECD)*http://www.oecd.org/以及世界數(shù)據(jù)系統(tǒng)(WDS)*http://www.icsu-wds.org/、研究數(shù)據(jù)聯(lián)盟(RDA)*http://www.rd-alliance.org/等國際組織在保護科學數(shù)據(jù)和推動科學數(shù)據(jù)更廣泛的應用和共享方面做出了很大貢獻。這些國際組織要求其成員實行對公共領域科學研究數(shù)據(jù)“完全與公開”的數(shù)據(jù)政策,向國際社會提供無歧視的、完全的數(shù)據(jù)服務,對數(shù)據(jù)和產(chǎn)品實現(xiàn)自由和無限制的國際交換,保證完全、公開、及時的信息交換。數(shù)據(jù)應該以盡可能低的價格提供給用戶。數(shù)據(jù)定價的原則是不能高于數(shù)據(jù)復制和分發(fā)所需的成本。
1.2 歐洲
歐洲國家在科學數(shù)據(jù)共享方面經(jīng)歷了從最初采取收回成本的數(shù)據(jù)共享政策到“完全與公開”的數(shù)據(jù)共享政策的過程。研究與實踐表明,收回成本的數(shù)據(jù)共享模式并不能使科學數(shù)據(jù)的價值最大化,并且也難以達到減輕資金壓力的目的。因此,歐洲議會和歐盟委員會最終規(guī)定除非有正當理由,公共部門不得向數(shù)據(jù)再利用者收取數(shù)據(jù)生產(chǎn)成本費*http://ec.europa.eu/index_en.htm。英國醫(yī)學院研究理事會資助的個人或機構(gòu)必須遵守數(shù)據(jù)創(chuàng)建、收集和管理的相應責任,在項目申報書中必須編制數(shù)據(jù)保管費用計劃,在年底資助款項匯報中介紹數(shù)據(jù)管理與共享相關的工作[3]。
1.3 美國
美國科學數(shù)據(jù)共享政策均以 《信息自由法》 和 《版權法》 為法律基礎。這兩大基本法律明確了公眾對科學數(shù)據(jù)具有自由獲取的權利。除了國家層面的法律法規(guī),美國還有研究機構(gòu)、學術社團、基金會、行業(yè)管理部門制定的具體行業(yè)數(shù)據(jù)共享政策和管理辦法[4]。如美國國立衛(wèi)生研究院((National Institutes of Health, NIH)*http://www.nih.gov/、美國國家科學基金會(National Science Foundation, United States)*http://www.nsf.gov/index.jsp和美國國家科學理事會(National Science Board, NSB)*http://www.nsf.gov/nsb/均根據(jù) 《信息自由法》 制定了相關的數(shù)據(jù)共享政策,充分體現(xiàn)出科學數(shù)據(jù) “完全與公開” 的共享原則。
1.4 中國
我國政府也已經(jīng)認識到科學數(shù)據(jù)共享的重要性,《中華人民共和國科學技術進步法》 第四十六條規(guī)定,“利用財政性資金設立的科學技術研究開發(fā)機構(gòu),應當建立有利于科學技術資源共享的機制,促進科學技術資源的有效利用?!?/p>
國家科學技術部在推動科學數(shù)據(jù)開放共享方面做出了良好的表率。 《國家科技計劃項目管理暫行辦法(科學技術部令第5號)》*http://most.gov.cn/kjzc/gjkjzc/kjjhgl/201308/P020130823577294215924規(guī)定在項目實施管理時 “各類國家科技計劃必須建立相互兼容的數(shù)據(jù)庫,實現(xiàn)信息、數(shù)據(jù)資源共享”,項目驗收時項目的承擔者需要提交有關驗收資料及數(shù)據(jù)。 《國家重點基礎研究發(fā)展計劃(973計劃)管理辦法(國科發(fā)計〔2011〕626號)》*http://most.gov.cn/kjzc/gjkjzc/kjjhgl/201308/P020130823577272814774規(guī)定項目承擔單位和課題承擔單位按照科技部有關科學數(shù)據(jù)共享和科技計劃項目信息管理的規(guī)定和要求,按時上報項目和課題有關數(shù)據(jù)。同時指出“推動科學數(shù)據(jù)共享”是項目首席科學家的主要職責之一?!秶铱萍贾斡媱澒芾磙k法(國科發(fā)計[2011]430號)》*http://most.gov.cn/kjzc/gjkjzc/kjjhgl/201308/P020130823577273283118在 “知識產(chǎn)權、技術標準與成果” 中規(guī)定 “建立規(guī)范、健全的項目科學數(shù)據(jù)和科技報告檔案,建立項目科技資源的匯交和共享機制。項目組織單位和課題承擔單位按照國家有關科學數(shù)據(jù)共享的規(guī)定,按時上報項目(課題)有關數(shù)據(jù)和成果。建立健全支撐計劃項目數(shù)據(jù)和成果庫,實現(xiàn)信息公開、資源共享?!薄秶腋呒夹g研究發(fā)展計劃(863計劃)管理辦法(國科發(fā)計[2006]329號)》*http://most.gov.cn/kjzc/gjkjzc/kjjhgl/201308/P020130823577292654471規(guī)定 “項目(課題)承擔單位應按照科技部有關科學數(shù)據(jù)共享和科技計劃項目信息管理的規(guī)定和要求,按時上報項目(課題)有關科研資料和數(shù)據(jù)。” 科技基礎性工作專項在試行的 《科技基礎性工作專項項目科學數(shù)據(jù)匯交管理辦法(試行)》*http://program.most.gov.cn/htmledit/0984A2B1-6B3B-70EB-1CC0-AE4D6D2C9418.html中規(guī)定 “科技基礎性工作專項項目必須在項目驗收前按照項目任務書的考核指標和有關要求保質(zhì)保量地完成數(shù)據(jù)匯交。科學技術部基礎研究司指定相關科學數(shù)據(jù)管理機構(gòu)具體負責科學數(shù)據(jù)匯交、保管、共享與服務工作。” 該辦法還對組織管理、匯交方案和匯交內(nèi)容、匯交流程、數(shù)據(jù)管理與共享服務、監(jiān)督與處罰等各有關環(huán)節(jié)做出了詳細的規(guī)定。
國家自然科學基金委員會2014年5月出臺了 “受資助項目科研論文的開放獲取政策”*http://www.nsfc.gov.cn/publish/portal0/tab87/info44471.htm,要求“將同行評議后錄用的最終審定稿,存儲到國家自然科學基金委員會的知識庫,不晚于發(fā)表后12個月開放獲取?!?《國家重點實驗室建設與運行管理辦法》*http://www.nsfc.gov.cn/publish/portal0/tab220/info24194.htm中要求重點實驗室要按照有關規(guī)定和要求實施數(shù)據(jù)共享。《國家自然科學基金條例(國務院令 第487號)》*http://www.nsfc.gov.cn/publish/portal0/tab220/info24216.htm等條例和規(guī)定中提及項目研究形成的論文、專著、軟件、數(shù)據(jù)庫、專利等均須標明 “國家自然科學基金資助項目” 并及時向科學基金委員會申報登記,但略有遺憾的是未對科研數(shù)據(jù)的開放共享做出明確要求。
為促進科學數(shù)據(jù)資源的開放共享及有效利用,科技部、中國科學院等部門通過工程項目的方式投資建設了一批以科學數(shù)據(jù)共享為主要內(nèi)容的數(shù)據(jù)庫群和服務平臺,制定了一系列科學數(shù)據(jù)共享的技術規(guī)范和管理辦法。如基礎科學數(shù)據(jù)共享網(wǎng)*http://www.nsdc.cn/index.html研究制定了 《基礎科學數(shù)據(jù)共享管理策略規(guī)范》、《基礎科學數(shù)據(jù)的元數(shù)據(jù)規(guī)范系列》 等標準規(guī)范。國家科技基礎條件平臺下的科學數(shù)據(jù)共享平臺——地球系統(tǒng)科學數(shù)據(jù)共享平臺*http://www.geodata.cn/Portal/index.jsp,以整合、集成科研院所、高等院校和科學家個人科研活動所產(chǎn)生的分散科學數(shù)據(jù)為工作重點,研究制定了《地球系統(tǒng)科學數(shù)據(jù)共享平臺章程》。此外,還有《地震科學數(shù)據(jù)共享管理辦法》*http://data.earthquake.cn/policy/gxbf.htm、《氣象資料共享管理辦法》*http://www.escience.gov.cn/article/article_2897.html、《先進制造與自動化科學數(shù)據(jù)中心免責說明》*http://www.amadata.net.cn/mzsm.aspx和 《遙感數(shù)據(jù)中心數(shù)據(jù)共享協(xié)議》*http://rsdc.bnu.edu.cn:8080/rsdac/modules/apply/等更多領域的數(shù)據(jù)共享管理辦法或規(guī)定出臺。
經(jīng)調(diào)研發(fā)現(xiàn),國外天文觀測數(shù)據(jù)有較完善的共享使用政策,大多參照國家制定的 “完全與公開” 數(shù)據(jù)共享原則,并根據(jù)天文學研究的具體情況制定自己的數(shù)據(jù)資源開放共享規(guī)定和規(guī)范。這些規(guī)定和規(guī)范不僅涵蓋了數(shù)據(jù)存儲、發(fā)布、管理、訪問、分析和傳播等各個層面,而且還對數(shù)據(jù)共享活動中所涉及的個人隱私、數(shù)據(jù)安全、著作權等問題做出了明確的規(guī)定。
國內(nèi)天文觀測設施和觀測項目越來越多,郭守敬望遠鏡(LAMOST)和中國科學院紫金山天文臺的13.7 m毫米波射電望遠鏡已公開提供了明確而規(guī)范的數(shù)據(jù)政策。更多天文觀測設施和觀測項目也在醞釀制定各自的數(shù)據(jù)使用政策。
2.1 國外天文觀測數(shù)據(jù)開放共享政策
天文觀測數(shù)據(jù)自獲取之后,其生命周期一般分為兩個階段,即數(shù)據(jù)保護期和公開使用期。鑒于此,天文望遠鏡項目制定的數(shù)據(jù)使用政策一般包括保護期內(nèi)的使用政策和公開使用后的政策兩部分。
針對保護期內(nèi)的數(shù)據(jù)制定的使用政策重點放在出版政策上。出版政策是與某望遠鏡或數(shù)據(jù)相關的學術論文等科學產(chǎn)出需要遵循的行為規(guī)范和指南,例如斯隆數(shù)字巡天項目(SDSS)制定的出版政策(The SDSS-III Publication Policy)*http://www.sdss3.org/collaboration/publication.php。出版政策的主要內(nèi)容一般包括數(shù)據(jù)資源說明、數(shù)據(jù)保護期界定、數(shù)據(jù)歸檔管理規(guī)范、論文署名原則、成果出版程序、致謝及數(shù)據(jù)引用要求等。
2.1.1 數(shù)據(jù)資源說明
觀測項目獲得的數(shù)據(jù)資源可能有很多種類,用戶根據(jù)研究課題的不同需要的數(shù)據(jù)也不相同,所以出版政策中需要明確說明該政策所針對的數(shù)據(jù)資源。為方便用戶識別和使用觀測數(shù)據(jù),出版政策中需對數(shù)據(jù)的格式進行說明。
2.1.2 數(shù)據(jù)保護期界定
為保證在望遠鏡設計、建造和觀測運行過程中投入大量時間和精力的人員能優(yōu)先獲取數(shù)據(jù)以及在相應文章中署名的權益,最大可能地提高數(shù)據(jù)的利用率和影響力,天文觀測數(shù)據(jù)在公開發(fā)布之前一般都有一段數(shù)據(jù)保護期。保護期內(nèi),觀測數(shù)據(jù)由觀測者和項目合作者等特定范圍人員優(yōu)先使用。保護期過后,其他人員就可以提交申請獲取數(shù)據(jù)的使用權。
數(shù)據(jù)保護期的期限一般由望遠鏡管理機構(gòu)或者觀測項目制定。調(diào)研發(fā)現(xiàn),保護期時限主要根據(jù)以下3種情況確定。
第一,根據(jù)觀測項目獲取數(shù)據(jù)的難易程度劃分數(shù)據(jù)保護期。如歐洲南方天文臺(ESO)在甚大望遠鏡/甚大望遠鏡干涉儀科學運行政策(VLT/VLTI Science Operations Policy)*http://www.eso.org/sci/observing/policies/Cou996-rev.pdf中和澳大利亞平方千米陣列先導項目(ASKAP)在用戶政策(ASKAP User Policy)*http://www.atnf.csiro.au/projects/askap/policy.html中均根據(jù)研究課題的科學價值和技術操作的可行性分配望遠鏡的觀測時間,并根據(jù)使用望遠鏡時間長短不同分為3類觀測項目,不同項目數(shù)據(jù)的保護期不同。比如,巡天科學項目和臨時目標項目(ToO)的數(shù)據(jù)沒有保護期,經(jīng)過質(zhì)量驗證之后直接公開??妥茖W項目的數(shù)據(jù)保護期一般是一年。
第二,根據(jù)數(shù)據(jù)質(zhì)量驗證和數(shù)據(jù)分析利用所需要的時間規(guī)定數(shù)據(jù)保護期。大部分望遠鏡觀測項目設定了默認數(shù)據(jù)保護期,從觀測獲取數(shù)據(jù)當日開始計算分別為三個月、半年、一年、一年半甚至兩年等。有些觀測項目的數(shù)據(jù)可能需要分多個階段提交,這時數(shù)據(jù)保護期從各個數(shù)據(jù)集提交日起滿默認期限為止。
第三,根據(jù)各個天文臺自己的政策規(guī)定數(shù)據(jù)保護期。如美國國立光學天文臺的數(shù)據(jù)使用政策(NOAO Data Use Policy)*http://archive.noao.edu/doc/NOAO_DHB/NOAO_Data_Handbookv1.1.pdf中說明科學數(shù)據(jù)的保護期取決于天文臺的相關政策,并規(guī)定數(shù)據(jù)的默認保護期為18個月,從觀測之日起計算。
但并不是所有的數(shù)據(jù)都遵循默認保護期,可以根據(jù)不同的情況進行調(diào)整。美國國立太陽天文臺(NSO)的數(shù)據(jù)政策(NSO Data Policy)*http://www.nso.edu/data_policy中注明,一般情況下保護期為18個月,但特殊情況時項目負責人(PI)可以向相關部門提出申請調(diào)整期限。歐洲南方天文臺在觀測提案指南(ESO Call for Proposals)*http://www.eso.org/sci/observing/phase1/p94/CfP94.pdf中指出如果項目負責人希望縮短保護期可在提案文檔中注明。同時,指南還明確規(guī)定公共巡天、定標和技術數(shù)據(jù)不受保護期限制,歸檔后隨即公開使用。錢德拉數(shù)據(jù)中心(CXC)在 “錢德拉數(shù)據(jù)庫中的公共數(shù)據(jù)說明”(Information about Public Data in the Chandra Data Archive)*http://cxc.harvard.edu/cda/public.html中提及,并不是所有的數(shù)據(jù)都有保護期,僅僅是真正需要保護期的數(shù)據(jù)才有。
2.1.3 數(shù)據(jù)歸檔管理
為保證數(shù)據(jù)資源的科學價值,觀測數(shù)據(jù)在提交歸檔之前,項目負責人必須對數(shù)據(jù)質(zhì)量進行驗證。望遠鏡項目組一般都鼓勵用戶充分利用已有的觀測數(shù)據(jù),并向項目負責人反饋數(shù)據(jù)資源的使用情況,進而構(gòu)成一個良性循環(huán)。為對數(shù)據(jù)資源進行有效管理,用戶使用保護期數(shù)據(jù)必須遵循一定的程序,一般情況下通過登記注冊的方式訪問數(shù)據(jù)庫。一方面為方便管理員統(tǒng)計數(shù)據(jù)的訪問量,另一方面方便有針對性地管理保護期數(shù)據(jù)。
2.1.4 學術論文署名及出版
現(xiàn)代科學研究,學術合作是非常普遍的現(xiàn)象,天文學也不例外。基于望遠鏡觀測數(shù)據(jù)發(fā)表的學術論文通常是多方合作的成果,這就自然產(chǎn)生了論文署名和知識產(chǎn)權等一系列問題。為確保望遠鏡和觀測項目產(chǎn)出的論文公平代表了各類參與者的貢獻,望遠鏡管理機構(gòu)和項目組需及時有效地審查論文的署名、致謝等內(nèi)容是否符合出版政策的要求。公示結(jié)束并無異議后才可以投稿。
SDSS在出版政策中明確規(guī)定了基于觀測數(shù)據(jù)發(fā)表科研論文的版權歸屬原則。指出利用SDSS項目觀測數(shù)據(jù)發(fā)表的科研論文,除了分析處理數(shù)據(jù)并撰寫論文的研究人員之外,其他執(zhí)行天文觀測的工作人員和參與建設望遠鏡的技術人員等均可要求署名。除望遠鏡的建設者之外,其他要求署名的人員需要提交一份簡短的報告,闡明其對該項目的貢獻。
2.1.5 致謝及數(shù)據(jù)引用
數(shù)據(jù)開放共享并不等于完全自由使用。用戶在下載或獲取數(shù)據(jù)之后有及時反饋使用情況的義務,并且在科研成果中應該對所利用的數(shù)據(jù)進行引用并致謝相關望遠鏡項目組和貢獻者。這一方面是良好學術道德的體現(xiàn),另一方面也會營造良好的資源開放共享氛圍,有利于學科長遠的發(fā)展。
為方便用戶使用同時滿足自己的需求,多數(shù)望遠鏡管理者和天文數(shù)據(jù)中心制定了致謝標準,給出了標準的數(shù)據(jù)使用致謝內(nèi)容。致謝的內(nèi)容大多包括項目描述和參與項目單位清單。同一個望遠鏡項目可能有不同的致謝方式。根據(jù)不同的數(shù)據(jù)資源或者數(shù)據(jù)資源用途不同而采用不同的致謝標準。天文數(shù)據(jù)中心的致謝內(nèi)容中,一般情況下要求不僅致謝提供數(shù)據(jù)和服務的數(shù)據(jù)中心,同時還要致謝所用數(shù)據(jù)對應的項目。
為有效地再利用數(shù)據(jù)資源,方便更多用戶查詢與閱讀相關資料,同時也更好地承認數(shù)據(jù)生產(chǎn)者和保管者所做的貢獻,2014年4月美國國家科學基金會號召科學界制定針對軟件和數(shù)據(jù)引用的規(guī)范和標準*http://www.nsf.gov/pubs/2014/nsf14059/nsf14059.pdf。與很多學科相比,天文學在這方面已經(jīng)走在前面。如歐洲南方天文臺在觀測提案指南中要求基于ESO望遠鏡觀測得到的科學成果需在論文腳注中注明相應的觀測提案號。美國宇航局紅外處理與分析中心的河外數(shù)據(jù)庫(NED)在致謝標準(Acknowledging NED)*http://ned.ipac.caltech.edu/中明確指出在論文中對所引用的數(shù)據(jù)不僅要進行致謝還要添加腳注,并給出標準腳注模板。
2.1.6 公開數(shù)據(jù)的使用政策
對于公開使用的數(shù)據(jù)資源,包括圖像資料和視頻,一般都沒有嚴格的版權要求。通常都允許并鼓勵公眾把這些資源用于非商業(yè)目的的教育和公益事業(yè),鼓勵社會各界積極參與天文學數(shù)據(jù)共享工作,不需要特別授權。同時,開放數(shù)據(jù)的使用應當遵守國家有關法律法規(guī),任何單位和個人不得利用天文觀測數(shù)據(jù)及共享平臺從事危害國家安全、社會公共利益和他人合法權益的活動。
為保護數(shù)據(jù)提供者的利益,有些項目要求在圖像資料上標明其出處,如錢德拉X射線望遠鏡數(shù)據(jù)中心(Chandra X-Ray Center, CXC)在圖片、產(chǎn)品、技術使用約定(Conditions of Use of Images, Products or Technologies (materials))*http://chandra.harvard.edu/photo/image_use.html中要求對被使用的圖片添加 “NASA/CXC/SAO” 的標注。
NASA在數(shù)據(jù)和信息政策(Data & Information Policy)*http://science.nasa.gov/earth-science/earth-science-data/data-information-policy/中明確說明公開使用的天文觀測數(shù)據(jù)資源未經(jīng)許可只能用于非商業(yè)目的,商業(yè)目的的用途需要經(jīng)過許可。任何用戶不能以任何方式向第三方出售、轉(zhuǎn)讓、贈送或復制所共享的數(shù)據(jù)。用戶使用數(shù)據(jù)資源應該具有相應的專業(yè)知識,能夠充分認識和理解數(shù)據(jù)所存在的問題,并能承擔使用數(shù)據(jù)所帶來的各種后果。望遠鏡項目和數(shù)據(jù)中心不會對用戶使用數(shù)據(jù)產(chǎn)生的問題負任何責任。
2.2 國內(nèi)天文觀測數(shù)據(jù)資源的開放共享
2.2.1 國內(nèi)主要觀測數(shù)據(jù)資源
隨著我國天文學研究的不斷發(fā)展,特別是天文觀測設施和觀測項目的推進,國內(nèi)自產(chǎn)的觀測數(shù)據(jù)越來越豐富。中國科學院系統(tǒng)的5個天文臺,即國家天文臺、紫金山天文臺、上海天文臺、云南天文臺、新疆天文臺,是國內(nèi)天文觀測設備的主要運行管理機構(gòu),同時也是天文觀測數(shù)據(jù)的主要來源。
中國天文數(shù)據(jù)中心*http://casdc.china-vo.org/提供觀測數(shù)據(jù)的歸檔、存儲、備份、使用以及數(shù)據(jù)產(chǎn)品的發(fā)布共享等服務。目前,中國天文數(shù)據(jù)中心公開釋放的數(shù)據(jù)包括郭守敬望遠鏡巡天數(shù)據(jù)、中國之星小望遠鏡陣(Chinese Small Telescope Array, CSTAR)天體測光數(shù)據(jù)、云南天文臺2.4 m光學望遠鏡數(shù)據(jù)、BATC多色巡天數(shù)據(jù)等。表1列出了截止2014年5月中國天文數(shù)據(jù)中心提供服務的國內(nèi)觀測數(shù)據(jù)資源。
表1 中國天文數(shù)據(jù)中心提供服務的國內(nèi)數(shù)據(jù)資源
自2008年出光以來,LAMOST已經(jīng)經(jīng)歷了測試觀測、先導巡天、正式巡天等階段。根據(jù)LAMOST的數(shù)據(jù)使用政策,保護期內(nèi)的數(shù)據(jù),國內(nèi)天文界人士和國外合作者可以與郭守敬望遠鏡運行和發(fā)展中心聯(lián)系獲取,國外其他天文學家可通過與郭守敬望遠鏡合作的方式獲取。如有用戶需要使用其他的數(shù)據(jù)集,可以通過郵件與中國天文數(shù)據(jù)中心的管理員聯(lián)系申請*http://casdc.china-vo.org/data/lamost/pilot。
紫金山天文臺毫米波射電天文數(shù)據(jù)庫*http://www.radioast.csdb.cn/收錄了紫金山天文臺青海觀測站13.7 m毫米射電望遠鏡觀測的分子譜線數(shù)據(jù)。按照其數(shù)據(jù)政策超過保護期的數(shù)據(jù)除跨年度的長期項目外已全部開放,所有人都能下載使用。
中國科學院科學數(shù)據(jù)云*http://www.csdb.cn/中的空間科學數(shù)據(jù)網(wǎng)格*http://www.space.csdb.cn/?About,以中科院自主獲取的空間科學數(shù)據(jù)為重點依托,以國外空間科學數(shù)據(jù)為重要補充,按日地空間物理和行星科學兩個主要的學科方向進行分布式數(shù)據(jù)資源的整合,內(nèi)容涵蓋行星際、中高層大氣、宇宙線、電離層、太陽活動、近地空間等典型天、地基空間環(huán)境要素觀測數(shù)據(jù)。
此外,國內(nèi)較系統(tǒng)的觀測數(shù)據(jù)還有紫金山天文臺行星科學數(shù)據(jù)、空間碎片數(shù)據(jù),上海天文臺VLBI射電天文和深空測量數(shù)據(jù),新疆天文臺南山25 m射電望遠鏡脈沖星數(shù)據(jù),云南天文臺撫仙湖太陽觀測數(shù)據(jù),盱眙近地天體望遠鏡銀河系反銀心方向數(shù)字巡天數(shù)據(jù),21CMA宇宙第一縷曙光巡天數(shù)據(jù)等。
2.2.2 開放共享政策
目前,國內(nèi)天文學領域還沒有統(tǒng)一的數(shù)據(jù)開放共享政策。LAMOST和紫金山天文臺13.7 m毫米波射電望遠鏡制訂了明確的數(shù)據(jù)政策并公示執(zhí)行。更多情況是依據(jù)所謂的國際慣例操作,缺乏規(guī)范的數(shù)據(jù)政策和管理規(guī)程。
LAMOST制定了詳細規(guī)范的 《郭守敬望遠鏡(LAMOST)光譜巡天出版政策》*http://www.lamost.org/public/science/policy/publication和 《光譜巡天數(shù)據(jù)政策》*http://www.lamost.org/public/science/policy/data。數(shù)據(jù)政策詳細介紹了LAMOST望遠鏡的基本參數(shù)、數(shù)據(jù)產(chǎn)品類型、數(shù)據(jù)發(fā)布和使用政策。LAMOST巡天的最終數(shù)據(jù)將向公眾開放,即為公開數(shù)據(jù)。原始數(shù)據(jù)不對社會公開,由望遠鏡運行部門長期保存。公開數(shù)據(jù)可由公眾自由使用,但要求致謝,并制定了具體的致謝標準。若有違反將限制再次使用數(shù)據(jù)。同時申明數(shù)據(jù)公開使用,用戶有及時(3個月內(nèi))反饋使用情況的義務。為保證項目和參與單位及參與人員的權利,數(shù)據(jù)在公開前,僅供參與人員按照“郭守敬望遠鏡科學委員會”確認的研究課題使用。違反政策者將可能被科學委員會取消數(shù)據(jù)使用權。出版政策中規(guī)定了可以使用保護期數(shù)據(jù)的參與單位和參與人員范圍,并規(guī)定使用數(shù)據(jù)的相關權利和義務。出版政策是郭守敬望遠鏡的科學類及技術類產(chǎn)出物的出版指南,規(guī)定了利用望遠鏡相關數(shù)據(jù)所得到的科學類文章、技術類文章及數(shù)據(jù)發(fā)布類出版物所必須遵守的權利和義務。
紫金山天文臺13.7 m毫米波射電望遠鏡接受國內(nèi)外專家的觀測課題申請。對一般性課題觀測,數(shù)據(jù)將由課題申請者獨占使用一年后成為開放共享數(shù)據(jù);跨年度的長期項目在觀測結(jié)束日起滿一年后成為開放共享數(shù)據(jù)。開放前的數(shù)據(jù)只有課題申請人在網(wǎng)站登錄后才能下載。開放后的數(shù)據(jù)所有研究團體和個人都能檢索并下載使用。數(shù)據(jù)用戶被要求在取得科研成果之后注明使用了13.7 m望遠鏡或毫米波射電天文數(shù)據(jù)庫*http://www.radioast.csdb.cn/shujuzhengce.php。為了更好地體現(xiàn)紫金山天文臺毫米波實驗室人員對13.7 m毫米波射電望遠鏡的貢獻,在科研成果中對觀測數(shù)據(jù)的引用做了一定要求。對多譜線系統(tǒng)數(shù)據(jù)、超導成像頻譜儀數(shù)據(jù)都有不同的引用要求*http://www.radioast.csdb.cn/ywsm.php。
國內(nèi)有些望遠鏡通過網(wǎng)站或者相關文獻給出了簡略的數(shù)據(jù)使用政策。比如,國家天文臺興隆觀測基地2.16 m光學望遠鏡規(guī)定數(shù)據(jù)保護期為18個月。上海天文臺1.56 m光學天文望遠鏡規(guī)定觀測數(shù)據(jù)由項目負責人負責,保護期為1年。一些小口徑的望遠鏡,從事長周期觀測課題,觀測期長達數(shù)年甚至超過10年。這種情況下,所得到的觀測數(shù)據(jù)一般不輕易公開。
2.2.3 開放共享現(xiàn)狀分析
國內(nèi)天文數(shù)據(jù)的開放共享工作仍處于起步和早期發(fā)展階段,這與國內(nèi)天文學研究的發(fā)展狀況是一致的。隨著觀測設施的不斷建設,觀測項目不斷增多,自產(chǎn)的數(shù)據(jù)資源也會越來越豐富,并將很快進入海量數(shù)據(jù)時代。觀測數(shù)據(jù)的開放共享對學科發(fā)展越來越重要并日益成為用戶、資助者、管理者多方關注的焦點。
在參考國際同行做法并充分考慮國內(nèi)實際情況的基礎上,LAMOST率先制定了比較完善的數(shù)據(jù)政策,從觀測數(shù)據(jù)的獲取、管理、發(fā)布、使用到論文發(fā)表等各個層面都有明確的規(guī)定。但是,國內(nèi)天文觀測數(shù)據(jù)資源的開放共享工作還存在不少的問題,主要體現(xiàn)在如下幾方面。
第一,缺乏明確的國家層面的法律體系。因為缺乏完善的國家層面的法律法規(guī),已制定的相關政策只是天文學界的管理者和用戶參照國際同行做法達成的共識,并不具備法律效力,給貫徹執(zhí)行帶來困難。
第二,科研項目資助體系中的制度約束和政策支持需進一步加強。雖然科學技術部對973計劃、863計劃、科技支撐計劃、科技基礎性工作專項等提出了數(shù)據(jù)歸檔和共享的要求,國家自然科學基金委員會也對資助項目提出了開放論文的要求,但尚有很大需要加強和完善的空間。特別是作為天文學研究經(jīng)費主要來源的國家自然科學基金委和中國科學院應明確規(guī)定項目承擔單位和負責人有開放共享科研數(shù)據(jù)的義務,并制定具體的項目管理辦法來落實。
第三,缺乏行之有效的管理體制。目前成功的數(shù)據(jù)管理和開放共享案例大多是項目組和首席科學家自發(fā)努力的結(jié)果。沒有一個政府、管理機構(gòu)、科研院所乃至社團組織等組織層面上的管理體制,沒有一個完整的天文觀測數(shù)據(jù)生命周期管理環(huán)境,限制了數(shù)據(jù)資源的有效共享??萍疾炕A司對科技基礎性工作專項項目驗收的規(guī)范和流程在數(shù)據(jù)歸檔、共享方面做出了有益的嘗試,值得天文領域關注和借鑒。
第四,缺乏完善的數(shù)據(jù)歸檔、匯交和開放共享平臺。海量的天文觀測數(shù)據(jù)在國內(nèi)天文界已經(jīng)備受關注,但因為缺乏一個領域內(nèi)普遍認可的開放共享平臺,同時大部分望遠鏡管理者也沒有建立規(guī)范的數(shù)據(jù)發(fā)布渠道,阻礙了觀測數(shù)據(jù)開放共享的進程。一方面,科研人員投入很多時間和精力進行長期觀測所獲數(shù)據(jù)不能迅速及時地共享,導致科研人員的貢獻和付出不能及時獲得認可。另一方面,觀測數(shù)據(jù)分散在不同機構(gòu)、團組甚至個人手中,只有在特定情況下通過特定的方式被有限的科研人員使用,科學價值無法充分發(fā)揮。
第五,缺乏數(shù)據(jù)資源開放共享領域的專業(yè)人才。海量數(shù)據(jù)的歸檔管理和分析挖掘離不開掌握專業(yè)知識和技能的人才。數(shù)據(jù)資源和服務的作用沒能得到充分發(fā)揮,其原因主要是缺乏從事數(shù)據(jù)開放共享和分析處理的專業(yè)人才。科研領域中重硬輕軟、重科學輕技術的思想仍然普遍存在。
第六,數(shù)據(jù)生產(chǎn)和管理者面臨著其他的一些困難,導致不愿意或者不能夠?qū)?shù)據(jù)開放共享。比如,因為天氣、儀器、人員等因素使得觀測數(shù)據(jù)質(zhì)量差,沒有臉面開放共享;因為缺乏必要的人力等資源無法將觀測數(shù)據(jù)加工為數(shù)據(jù)產(chǎn)品,無法開放使用;因為擔心同行競爭,對自身的領域優(yōu)勢造成威脅,不愿意毫無保留地共享等。
習近平同志在中國科學院第十七次院士大會、中國工程院第十二次院士大會上的講話中要求 “著力完善科技創(chuàng)新基礎制度,加快建立健全國家科技報告制度、創(chuàng)新調(diào)查制度、國家科技管理信息系統(tǒng),大幅提高科技資源開放共享水平”。在天文學研究已經(jīng)進入數(shù)據(jù)密集型和數(shù)據(jù)驅(qū)動的時代,觀測數(shù)據(jù)的開放共享成為天文學發(fā)展的基本要求。本文提出以下幾條具體建議,希望能夠為我國有關政府部門和科研機構(gòu)在制定科技發(fā)展戰(zhàn)略和行動計劃時提供參考。
第一,推動科學數(shù)據(jù)開放共享政策的制定。和其他學科、行業(yè)、部門與機構(gòu)合作共同推進國家科技資源開放共享有關法律法規(guī)的制定。由中國科學院所屬天文臺牽頭,聯(lián)合高校、科普場館等相關機構(gòu)制定天文科技資源開放共享辦法。通過法律法規(guī)和管理制度為科學數(shù)據(jù)的開放共享保駕護航。
第二,建立有效的數(shù)據(jù)開放共享管理體制。在國家、省、市基金管理部門,中國科學院,天文臺站,高校及其有關學院,建立有效的管理體制,將科學數(shù)據(jù)開放共享的法律法規(guī)等政策落到實處。改進科研項目資助管理模式、科研成果評審評價機制、科研人員績效考核機制,在科研活動的各個環(huán)節(jié)兌現(xiàn)科學數(shù)據(jù)開放共享的承諾。
第三,打造國家或部門級天文數(shù)據(jù)基礎設施。借助先進的信息技術手段,實現(xiàn)物理上數(shù)據(jù)分布式存儲,邏輯上資源統(tǒng)一匯交、管理和使用。規(guī)范數(shù)據(jù)的歸檔和質(zhì)量控制,支持國際虛擬天文臺聯(lián)盟數(shù)據(jù)互操作相關標準,支持元數(shù)據(jù)的匯交和數(shù)據(jù)的統(tǒng)一檢索訪問。通過建設這樣的數(shù)據(jù)基礎設施,減輕望遠鏡管理者和觀測項目數(shù)據(jù)歸檔、管理和發(fā)布工作的負擔,方便用戶對資源的發(fā)現(xiàn)和使用。
第四,發(fā)展數(shù)據(jù)采集、歸檔、管理、分析、共享所需要的核心技術。為了適應新的挑戰(zhàn),增強從海量數(shù)據(jù)中獲取信息和知識的能力,需要發(fā)展數(shù)據(jù)全生命周期中各環(huán)節(jié)的核心技術,比如綠色數(shù)據(jù)存儲技術、高速數(shù)據(jù)傳輸技術、復雜數(shù)據(jù)融合和互操作技術、海量數(shù)據(jù)處理技術、數(shù)據(jù)挖掘和可視化技術、數(shù)據(jù)長期保存與使用技術等。
第五,積極培養(yǎng)新的專業(yè)人才和研究隊伍。為了充分利用現(xiàn)有和未來產(chǎn)生的海量數(shù)據(jù)和數(shù)據(jù)技術,必須培養(yǎng)新的專業(yè)人才,培養(yǎng)具有數(shù)據(jù)式思維和計算式思維的下一代科學家。要建立專門從事數(shù)據(jù)開放共享工作的部門和研究隊伍,并與學科研究人員深入合作,互助多贏,通過專業(yè)的人才完成專業(yè)的工作。
第六,加大科學數(shù)據(jù)資源的宣傳教育和應用推廣。通過宣傳教育增強科研人員科學數(shù)據(jù)開放共享的意識。綜合利用傳統(tǒng)和新媒體手段向?qū)I(yè)、業(yè)余、公眾用戶宣傳優(yōu)質(zhì)的天文觀測數(shù)據(jù)資源和使用時所需的相關知識與技術方法,挖掘潛在的用戶和應用,充分發(fā)揮數(shù)據(jù)的科學價值。
經(jīng)過幾代人數(shù)十年的不懈努力,我國天文學研究目前正從重點跨越階段進入整體跨越階段,以觀測數(shù)據(jù)為代表的天文科技資源開放共享日益成為支撐天文學長遠發(fā)展的內(nèi)在動力。中國虛擬天文臺在中國科學院 “十二五” 科研信息化專項和國家發(fā)改委高技術服務業(yè)研發(fā)及產(chǎn)業(yè)化專項的資助下,正以國內(nèi)核心天文觀測設備的時間申請、審批,數(shù)據(jù)匯交、共享、使用,課題設計、開展為線索,融合天文觀測和科研活動所需的科學數(shù)據(jù)、科技文獻、高性能計算、軟件和實用工具等資源,建設一個物理上分散、邏輯上統(tǒng)一的網(wǎng)絡化科學研究平臺。有望在中國科學院和各天文臺站的共同努力下,制定出切實可行的觀測數(shù)據(jù)等科技資源開放共享政策,并借助這個平臺的建設顯著推動國內(nèi)天文數(shù)據(jù)資源的集成融合和開放共享。
致謝:感謝中國虛擬天文臺理事會、學術委員會及研發(fā)團隊為本文完成提供的大力支持!感謝中國天文數(shù)據(jù)中心(國家科技基礎條件平臺——地球系統(tǒng)科學數(shù)據(jù)共享平臺——天文科學數(shù)據(jù)共享平臺)的數(shù)據(jù)資源支持。
[1] 崔辰州, 薛艷杰, 李建, 等. 中國科研信息化藍皮書[M]. 北京: 科學出版社, 2013: 251.
[2] 黃永文, 張建勇, 黃金霞, 等. 國外開放科學數(shù)據(jù)研究綜述[J]. 現(xiàn)代圖書情報技術, 2013(5): 21-27. Huang Yongwen, Zhang Jianyong, Huang Jinxia, et al. Research on the open research data[J]. New Technology of Library and Information Service, 2013(5): 21-27.
[3] 劉細文, 熊瑞. 國外科學數(shù)據(jù)開放獲取政策特點分析[J]. 情報理論與實踐, 2009, 32(9): 5-9+18. Liu Xiwen, Xiong Rui. Analysis of the characteristics of policies on open access to scientific data in foreign countries[J]. Information Studies:Theory & Application, 2009, 32(9): 5-9+18.
[4] 李娟, 劉德洪, 江洪. 國際科學數(shù)據(jù)共享原則和政策研究[J]. 圖書情報工作, 2008, 52(12): 77-80. Li Juan, Liu Dehong, Jiang Hong. Research on international data sharing principles and policies[J]. Library and Information Service, 2008, 52(12): 77-80.
A Study of Policies and Approaches of Open Access ofAstronomical Observational Data
Wan Wanghui1,2, Cui Chenzhou1, Qiao Cuilan2, Zhao Yongheng1, Hao Jinxin1, Xue Yanjie3
(1. National Astronomical Observatories, Chinese Academy of Sciences, Beijing 100012, China, Email: ccz@nao.cas.cn;2. Central China Normal University, Wuhan 430079, China; 3. Chinese Academy of Sciences, Beijing 100864, China)
In the new century astronomy is entering an era in which research activities are driven by intense observational data. Intense data have become major sources for scientific discoveries. In China astronomical community and facilities are undergoing fast development following the steady economic expansion of the country. There are about to be an explosive growth of astronomical data resulting from Chinese astronomical projects. To build an open data-access environment becomes crucial for long-term development of astronomy in China. In this paper we first investigate laws and policies of various governments and international organizations on open data access. Our investigation follows the analyses of the principle of ‘full and open access to data’ in foreign countries and covers current policies/rules about open access of scientific data in China. Particularly, we focus on the policies of major projects of telescopes and data centers around the world. We have also covered several related issues, including specifications of data resources, durations of data priority, rules of data archiving, policies of data publication, and conventions of data citation/acknowledgement. In the second part of the paper we discuss datasets from major Chinese astronomical telescopes/research projects and the situation of open access to such datasets. We list difficulties and challenges faced by Chinese astronomers to provide full and open access to astronomical data archives. We finally give six specific recommendations to improve open data access in China: (1) To establish and refine laws and policies for open data access; (2) to construct effective administrative systems for astronomical data archiving and access in related government branches and academic institutes; (3) to establish some national or regional astronomical data center(s); (4) to further research on key technologies of collection, processing, analyzing, archiving, sharing, and access of astronomical data; (5) to train scientists and engineers working for data archiving and access; (6) to publicize astronomical data archives and extend scientific applications of data archives.
Astronomical observational data; Open access; Policies; Approaches
中國科學院信息化專項 (XXH12503-05-05);國家自然科學基金委員會與中國科學院天文聯(lián)合基金 (U1231108);科技部科技基礎性工作專項 (2012FY120500);國家發(fā)改委高技術服務業(yè)研發(fā)及產(chǎn)業(yè)化專項 (發(fā)改辦高技[2013]666號) 資助.
2014-10-18;修定日期:2014-10-31
萬望輝,女,碩士. 研究方向:虛擬天文臺,基于科學數(shù)據(jù)的科普教育. Email: wanwh@nao.cas.cn
崔辰州,研究員. 研究方向:虛擬天文臺,天文信息學. Email: ccz@nao.cas.cn
P11
A
1672-7673(2015)03-0364-10