• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)據(jù)論文的出現(xiàn)與發(fā)展*

      2015-02-28 08:38:54屈寶強(qiáng)中國(guó)科學(xué)技術(shù)信息研究所北京100038
      圖書(shū)與情報(bào) 2015年5期
      關(guān)鍵詞:論文期刊信息

      屈寶強(qiáng) 王 凱(中國(guó)科學(xué)技術(shù)信息研究所 北京 100038)

      ·特別策劃:數(shù)據(jù)期刊與數(shù)據(jù)出版·

      數(shù)據(jù)論文的出現(xiàn)與發(fā)展*

      屈寶強(qiáng) 王 凱
      (中國(guó)科學(xué)技術(shù)信息研究所 北京 100038)

      編者按:信息技術(shù)的快速發(fā)展和智能移動(dòng)終端的普及應(yīng)用催生了數(shù)據(jù)的指數(shù)級(jí)增長(zhǎng)和多重化應(yīng)用,使得數(shù)據(jù)已成為人們生活、工作、學(xué)習(xí)的重要組成部分,人類(lèi)進(jìn)入到了一個(gè) “數(shù)據(jù)為王”的大數(shù)據(jù)時(shí)代。大數(shù)據(jù)時(shí)代的到來(lái)改變了人類(lèi)生產(chǎn)和社會(huì)生活的諸多方面,也促成了數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)即科學(xué)研究第四范式的誕生,數(shù)據(jù)特別是科學(xué)數(shù)據(jù)科學(xué)已成為主要研究對(duì)象,因而對(duì)數(shù)據(jù)的共享需求日趨強(qiáng)烈。在這種背景下,數(shù)據(jù)論文 (data papet)、數(shù)據(jù)期刊 (data joutnal)、數(shù)據(jù)出版 (date publication)應(yīng)運(yùn)而生,并迅速受到了業(yè)界的關(guān)注與興趣,如自然出版集團(tuán) (Natute Publishing Gtoup)于2014年5月推出了旨在幫助科研人員發(fā)布、發(fā)現(xiàn)和重用研究數(shù)據(jù)的開(kāi)源數(shù)據(jù)期刊 《科學(xué)數(shù)據(jù)》 (Scientific Data)。國(guó)內(nèi)近一年來(lái)雖也有一些圖書(shū)館界、期刊界學(xué)者的研究成果,但總體而言研究還處于起步階段,對(duì)其的概念與發(fā)展、管理政策與所帶來(lái)的影響等還處于國(guó)外實(shí)踐的介紹與交流探討階段。為了對(duì)這一影響到未來(lái)學(xué)術(shù)出版與知識(shí)傳播,乃至圖書(shū)館等信息服務(wù)機(jī)構(gòu)業(yè)務(wù)轉(zhuǎn)型發(fā)展的數(shù)據(jù)出版實(shí)踐進(jìn)行較為全面的介紹和研究,本刊特組織策劃了這組 “數(shù)據(jù)論文與數(shù)據(jù)出版”稿件,就業(yè)界較為關(guān)注的數(shù)據(jù)論文的誕生與發(fā)展、學(xué)術(shù)期刊的數(shù)據(jù)管理政策、劫持性期刊現(xiàn)象、數(shù)據(jù)出版環(huán)境下的信息交流與圖書(shū)館等主題進(jìn)行了探討,以期能為這一方富有實(shí)踐發(fā)展和學(xué)術(shù)研究空間的沃土添水施肥,進(jìn)而推動(dòng)我國(guó)學(xué)術(shù)期刊數(shù)據(jù)出版的實(shí)踐與研究發(fā)展。

      數(shù)據(jù)論文是一種新型的學(xué)術(shù)出版物形式,它通過(guò)描述創(chuàng)建和處理數(shù)據(jù)方法的細(xì)節(jié)、數(shù)據(jù)的結(jié)構(gòu)和格式、數(shù)據(jù)再利用的潛力等內(nèi)容促進(jìn)數(shù)據(jù)開(kāi)發(fā)和利用。文章對(duì)數(shù)據(jù)論文的概念內(nèi)涵、基本特征、表現(xiàn)形式、主要內(nèi)容以及出版流程等進(jìn)行了介紹,以期推動(dòng)我國(guó)數(shù)據(jù)論文出版的發(fā)展。

      數(shù)據(jù)共享;數(shù)據(jù)論文;數(shù)據(jù)出版;數(shù)據(jù)期刊

      1 引言

      在數(shù)據(jù)密集型研究的“e-science”時(shí)代,科學(xué)家開(kāi)展科學(xué)研究依賴(lài)于從實(shí)驗(yàn)、數(shù)據(jù)模擬和觀測(cè)等手段獲得的數(shù)據(jù)(集)。在現(xiàn)代復(fù)雜科研環(huán)境下,單個(gè)科學(xué)家很難在兼顧科學(xué)研究的同時(shí)完成科學(xué)數(shù)據(jù)的采集、處理、加工、分析等全部工作,數(shù)據(jù)共享成為利用他人科學(xué)數(shù)據(jù)的重要手段,自20世紀(jì)80年代以來(lái)就一直是學(xué)術(shù)界討論的熱點(diǎn)話(huà)題。

      為使得科學(xué)研究過(guò)程可以重現(xiàn),同時(shí)保護(hù)數(shù)據(jù)工作者的知識(shí)產(chǎn)權(quán),可將數(shù)據(jù)以特定的形式“出版”,出版商支持?jǐn)?shù)據(jù)出版的早期嘗試包括:(a)數(shù)據(jù)作為文章的一個(gè)組成部分;(b)數(shù)據(jù)作為補(bǔ)充文件附在論文之后。到2009年左右,大多數(shù)期刊接受數(shù)據(jù)(以及其他材料)作為補(bǔ)充文件,與研究文章的在線(xiàn)版本一同“發(fā)表”,但經(jīng)常限制文件的規(guī)模和數(shù)量。這種出版模式的缺點(diǎn)是,出版商需要管理和保存這些文檔,讀者難以獨(dú)立于主要出版物查找和鏈接數(shù)據(jù)。

      但是Rees指出,即使數(shù)據(jù)已被鏈接到一個(gè)同行評(píng)論文章,它仍然應(yīng)該自由出版,從而表明“材料和方法”而不是使用數(shù)據(jù)產(chǎn)生的結(jié)論。而且如果數(shù)據(jù)由不撰寫(xiě)學(xué)術(shù)論文的人員使用,這個(gè)數(shù)據(jù)則無(wú)法表現(xiàn)為傳統(tǒng)期刊文章的補(bǔ)充,更需要作為有各種權(quán)利的出版物來(lái)描述數(shù)據(jù)。在這種要求下,基于“數(shù)據(jù)論文(data papet)”概念的新數(shù)據(jù)出版模式開(kāi)始被普遍認(rèn)可,出現(xiàn)了同時(shí)發(fā)表學(xué)術(shù)論文和數(shù)據(jù)論文的重疊期刊 (ovetlay joutnal)、純數(shù)據(jù)期刊 (pute data joutnal)等新的出版物形式,生物信息學(xué)、生態(tài)學(xué)、海洋、環(huán)境、醫(yī)學(xué)等各個(gè)領(lǐng)域都出現(xiàn)了大量的數(shù)據(jù)期刊。2014年5月,自然出版集團(tuán)宣布推出出版有科學(xué)價(jià)值數(shù)據(jù)的開(kāi)放存取期刊《科學(xué)數(shù)據(jù)》,將數(shù)據(jù)出版的研究和實(shí)踐推向高潮。在當(dāng)前數(shù)據(jù)論文數(shù)量不斷增長(zhǎng)的情況下,本文對(duì)數(shù)據(jù)論文的概念內(nèi)涵、基本特征以及出版流程等進(jìn)行介紹,以期推動(dòng)我國(guó)數(shù)據(jù)論文出版的發(fā)展。

      2 數(shù)據(jù)論文及其特征

      2.1 概念與內(nèi)涵

      數(shù)據(jù)論文是以標(biāo)準(zhǔn)的學(xué)術(shù)形式出版、可被查詢(xún)的學(xué)術(shù)出版物,描述關(guān)于一個(gè)或一組數(shù)據(jù)的元數(shù)據(jù)文檔?!皵?shù)據(jù)論文”對(duì)數(shù)據(jù)采集過(guò)程中數(shù)據(jù)收集、處理、內(nèi)容、使用軟件、文件格式等進(jìn)行詳細(xì)的描述,類(lèi)似于傳統(tǒng)研究文章中的“方法Methods”部分,但不提供任何分析,也沒(méi)有新的結(jié)論產(chǎn)生,其內(nèi)容只和數(shù)據(jù)有關(guān),可以在數(shù)據(jù)制作完成后迅速發(fā)表。數(shù)據(jù)論文可以在傳統(tǒng)學(xué)術(shù)期刊上與學(xué)術(shù)論文一起混合出版,也可以在專(zhuān)門(mén)數(shù)據(jù)期刊出版,其主要目的是描述數(shù)據(jù),而不是研究,不同的期刊用不同的方法實(shí)現(xiàn)數(shù)據(jù)論文的管理。數(shù)據(jù)期刊發(fā)表數(shù)據(jù)論文,數(shù)據(jù)論文為該期刊關(guān)注的主要對(duì)象,數(shù)據(jù)被視為次要的對(duì)象,可由雜志社進(jìn)行編輯或管理,但更多地是由專(zhuān)業(yè)的第三方數(shù)據(jù)倉(cāng)儲(chǔ)管理。

      數(shù)據(jù)論文要求至少有兩類(lèi)具體的、可識(shí)別的信息對(duì)象:數(shù)據(jù)(數(shù)據(jù)論文的對(duì)象)和數(shù)據(jù)處理信息(描述數(shù)據(jù)產(chǎn)生的過(guò)程)。數(shù)據(jù)論文與傳統(tǒng)期刊文章相同,可以包括標(biāo)題、作者、摘要、章節(jié)、和參考文獻(xiàn)等內(nèi)容。無(wú)論是數(shù)據(jù)論文,還是數(shù)據(jù)都與其信息對(duì)象(元數(shù)據(jù))相關(guān)聯(lián)。

      圖1 數(shù)據(jù)論文及其作用

      可以說(shuō),數(shù)據(jù)論文已經(jīng)存在相當(dāng)長(zhǎng)時(shí)間。例如,美國(guó)物理學(xué)會(huì)雜志 《The Joutnal of Physical and Chemical Refetence Data》從20世紀(jì)70年代早期就開(kāi)始描述物理和化學(xué)材料的一般特性,目前仍在出版。美國(guó)生態(tài)學(xué)會(huì)2000年在《Ecological Atchives》開(kāi)始發(fā)表數(shù)據(jù)論文,地球系統(tǒng)科學(xué)數(shù)據(jù)《Eatth System Science Data》,CMB數(shù)據(jù)論文《CMB data papets》,《BMC Data Notes》和國(guó)際機(jī)器人研究《Intetnational Joutnal of Robotics Reseatch》雜志都有一些零星數(shù)據(jù)論文出版,這是一種新的出版形式,數(shù)據(jù)是開(kāi)放獲取的,可以閱讀數(shù)據(jù)描述文件然后下載數(shù)據(jù)。然而,從豐富的科學(xué)數(shù)據(jù)元數(shù)據(jù)生成數(shù)據(jù)論文手稿的機(jī)制以及相關(guān)工具還遠(yuǎn)遠(yuǎn)沒(méi)有形成主流。

      最近幾年,出版商、期刊、科研基金資助機(jī)構(gòu)等支持推廣數(shù)據(jù)論文。例如歐盟資助的項(xiàng)目ViBRANT (Vittual Biodivetsity Reseatch and Access Netwotk fot Taxonomy)和BioFtesh(a ptogtam to suppott fteshwatet biodivetsity)積極參與數(shù)據(jù)論文推廣,還建立下一代生物多樣性數(shù)據(jù)雜志 《Biodivetsity Data Joutnal》。哥倫比亞的亞力山大洪堡特生物資源研究所(Colombia's Alexandet von Humboldt Biological Resoutces and Reseatch Institute)也致力于出版數(shù)據(jù)論文。2014年5月,自然出版集團(tuán)宣布推出出版有科學(xué)價(jià)值數(shù)據(jù)的開(kāi)放存取期刊《科學(xué)數(shù)據(jù)》,將數(shù)據(jù)出版的研究和實(shí)踐推向高潮。

      數(shù)據(jù)論文中描述的數(shù)據(jù)大多存儲(chǔ)在數(shù)據(jù)倉(cāng)儲(chǔ)或數(shù)據(jù)中心,如DAACs、Dtyad、PANGAEA,通常被視為發(fā)表文章的次要部分或補(bǔ)充,數(shù)據(jù)論文的一個(gè)重要特點(diǎn)是,應(yīng)該和他們所描述的數(shù)據(jù)相關(guān)聯(lián),而這個(gè)鏈接(例如URL,DOI)應(yīng)該在發(fā)表的數(shù)據(jù)論文中公布以便讀者可以發(fā)現(xiàn)和查找數(shù)據(jù)。同樣,存儲(chǔ)該數(shù)據(jù)的數(shù)據(jù)倉(cāng)儲(chǔ)中的科學(xué)數(shù)據(jù)元數(shù)據(jù)也應(yīng)包括這些內(nèi)容。

      2.2 特點(diǎn)

      數(shù)據(jù)論文和學(xué)術(shù)論文都可以視為科研成果出版的形式,與傳統(tǒng)學(xué)術(shù)論文相比,數(shù)據(jù)論文存在以下特點(diǎn):

      (1)數(shù)據(jù)論文包括利用所描述數(shù)據(jù)產(chǎn)品的相關(guān)信息(技術(shù)、公式、軟件等等),它為傳統(tǒng)期刊論文定義了使用數(shù)據(jù)的方法。和傳統(tǒng)期刊論文不一樣,數(shù)據(jù)論文不包括結(jié)論,與學(xué)術(shù)論文隔離,可以作為學(xué)術(shù)論文的補(bǔ)充。

      (2)數(shù)據(jù)論文需要通過(guò)永久的超鏈接或數(shù)據(jù)標(biāo)識(shí)體系連接到數(shù)據(jù),在此過(guò)程中,數(shù)據(jù)倉(cāng)儲(chǔ)、機(jī)構(gòu)知識(shí)庫(kù)等數(shù)據(jù)存儲(chǔ)機(jī)構(gòu)承擔(dān)了唯一標(biāo)識(shí)(例如DOI)的創(chuàng)建和管理方面的工作。

      (3)數(shù)據(jù)論文像期刊論文一樣需要進(jìn)行同行審查,而其描述的數(shù)據(jù)可以被同行審查或非同行審查,但必須聲明這一狀況。如果進(jìn)行數(shù)據(jù)的同行審查,必須詳細(xì)描述該過(guò)程。數(shù)據(jù)論文描述的數(shù)據(jù)可以在其進(jìn)行同行審查之前或者同行審查完成之前就發(fā)布,因?yàn)閷?duì)于科學(xué)數(shù)據(jù)來(lái)講,只有發(fā)布后被廣泛使用和注釋才會(huì)更清晰地體現(xiàn)其價(jià)值。從這點(diǎn)來(lái)講,傳統(tǒng)的預(yù)印本論文與數(shù)據(jù)論文有相似之處。

      (4)為了更好地利用科學(xué)數(shù)據(jù),可以在不影響數(shù)據(jù)完整性、準(zhǔn)確性的情況下校正,但需要明確數(shù)據(jù)版本,需要清楚地在數(shù)據(jù)論文中說(shuō)明修正后相應(yīng)的數(shù)據(jù)版本,以便發(fā)現(xiàn)這樣的數(shù)據(jù)。

      (5)同學(xué)術(shù)論文一樣,數(shù)據(jù)論文也會(huì)受物理頁(yè)碼和格式限制。同時(shí),其描述的數(shù)據(jù)會(huì)有物理存儲(chǔ)器大小的限制,獲取數(shù)據(jù)時(shí)有特定硬件或軟件方面的限制。

      (6)數(shù)據(jù)論文不需要包含所有的數(shù)據(jù)描述,除論文內(nèi)容之外的數(shù)據(jù)描述信息和處理信息分布在多個(gè)數(shù)據(jù)檔案中心,可以通過(guò)引用或關(guān)聯(lián)指向更詳細(xì)的描述。因此在撰寫(xiě)數(shù)據(jù)論文時(shí),需要把與數(shù)據(jù)相關(guān)但是與數(shù)據(jù)查找和發(fā)現(xiàn)無(wú)關(guān)的內(nèi)容區(qū)分出來(lái),一般數(shù)據(jù)論文不需要這部分內(nèi)容。

      (7)經(jīng)過(guò)同行審查的數(shù)據(jù)論文可以形成新的出版類(lèi)型,從期刊的期(issue,連續(xù)的或不連續(xù)的)到編輯成卷(volume)。在此過(guò)程中需要像傳統(tǒng)的學(xué)術(shù)期刊一樣創(chuàng)建一些其他的結(jié)構(gòu)要素,包括封面、前言、目錄、編輯政策、投稿指南等,這些對(duì)于作者來(lái)講是熟悉的。

      2.3 功能

      數(shù)據(jù)論文的目的是描述一個(gè)給定的數(shù)據(jù),正如科學(xué)研究論文介紹研究結(jié)果一樣。數(shù)據(jù)論文通過(guò)描述創(chuàng)建和處理數(shù)據(jù)方法的細(xì)節(jié)、數(shù)據(jù)的結(jié)構(gòu)和格式、再利用的潛力等內(nèi)容促進(jìn)數(shù)據(jù)開(kāi)發(fā)和利用。數(shù)據(jù)論文沒(méi)有利用數(shù)據(jù)進(jìn)行科學(xué)的分析,也沒(méi)有結(jié)果或結(jié)論。提倡發(fā)表數(shù)據(jù)論文的原因包括:第一,是要解決科學(xué)數(shù)據(jù)利用過(guò)程中數(shù)據(jù)發(fā)現(xiàn)的關(guān)鍵需求,提供特定時(shí)間數(shù)據(jù)的特定位置、特定存在形式、特定使用方法等,使數(shù)據(jù)和所有必要的方法文件和其他細(xì)節(jié)共同出版。第二,數(shù)據(jù)論文發(fā)表可以更好地提升數(shù)據(jù)工作者的地位,通過(guò)引用正式出版的數(shù)據(jù)論文來(lái)體現(xiàn)和強(qiáng)化數(shù)據(jù)工作者在科研工作中所做的貢獻(xiàn)。

      因此發(fā)表數(shù)據(jù)論文的目的包括:提供可被引用的期刊出版物,為數(shù)據(jù)出版者帶來(lái)學(xué)術(shù)認(rèn)可,作為其個(gè)人履歷(Cutticulum Vitae,CV)的一個(gè)重要部分;以機(jī)器可讀的形式描述數(shù)據(jù),促進(jìn)數(shù)據(jù)利用的自動(dòng)化和便捷性;引發(fā)學(xué)術(shù)界對(duì)數(shù)據(jù)的關(guān)注。

      (1)對(duì)于研究者,這使他們獲取有價(jià)值的數(shù)據(jù)更為便利,同時(shí)這種學(xué)術(shù)上的認(rèn)可機(jī)制也促進(jìn)他們將其在科研過(guò)程中形成的各類(lèi)數(shù)據(jù)發(fā)布,促進(jìn)了數(shù)據(jù)共享,提升了科研經(jīng)費(fèi)的綜合使用效率。

      (2)對(duì)于出版商,數(shù)據(jù)論文這種新的形態(tài)可以幫助其發(fā)展更詳細(xì)的出版指南,拓展其業(yè)務(wù)領(lǐng)域,改變其工作流程,更好地為科學(xué)交流服務(wù)。

      (3)對(duì)于數(shù)據(jù)倉(cāng)儲(chǔ),與數(shù)據(jù)論文有關(guān)數(shù)據(jù)使用的最佳實(shí)踐案例整理將使他們提升數(shù)據(jù)管理的流程,和期刊交互將提高自己的知名度和聲譽(yù)。

      (4)對(duì)于數(shù)據(jù)服務(wù)商,數(shù)據(jù)論文的元數(shù)據(jù)可以用于任何對(duì)傳統(tǒng)研究論文處理和服務(wù)的工具,例如索引和引文分析工具,使其服務(wù)產(chǎn)品更加豐富。

      (5)對(duì)于科學(xué)共同體內(nèi)為更廣泛的利益相關(guān)者(包括科研資助者、管理機(jī)構(gòu)、學(xué)術(shù)團(tuán)體、企業(yè)和社會(huì)公眾等),則可以獲得整個(gè)學(xué)術(shù)交流與傳播體系中更加全面的信息,例如可以根據(jù)數(shù)據(jù)論文的引用情況來(lái)評(píng)價(jià)數(shù)據(jù)工作,Ketvin等就分析了美國(guó)生態(tài)學(xué)會(huì)(ESA)期刊《Ecological Atchives》發(fā)表的53篇數(shù)據(jù)論文的質(zhì)量問(wèn)題,包括每篇文章在數(shù)據(jù)分析、集成、發(fā)現(xiàn)、保存、描述收集等階段出現(xiàn)質(zhì)量問(wèn)題的數(shù)量、比例等。

      3 數(shù)據(jù)論文形式、內(nèi)容和結(jié)構(gòu)

      3.1 形式

      最早在期刊出版界,出現(xiàn)了學(xué)術(shù)論文的“補(bǔ)充材料”(supplemental matetial,SM),這種信息也稱(chēng)為“data application appendix,DAX”,這些論文中沒(méi)有提到的其他細(xì)節(jié)支持出版論文的主要結(jié)論,但本身并不包含在出版內(nèi)容中。例如Cell出版社有三個(gè)層次的附件材料:對(duì)文章中的主要觀點(diǎn)進(jìn)行支持的證據(jù)、網(wǎng)絡(luò)發(fā)布的大型數(shù)據(jù)集和多媒體、研究方法的詳細(xì)信息。

      數(shù)據(jù)論文出現(xiàn)之后,其形式也是多種多樣,data papet是最常用的名字,但不同的期刊的名稱(chēng)不同,不同的名稱(chēng)也反映出數(shù)據(jù)論文的特定目的。例如在國(guó)際食品污染期刊 《Intetnational Joutnal of Food Contamination》,數(shù)據(jù)文章(data atticle)是主要的論文類(lèi)型,該雜志發(fā)布不同食品污染物濃度重要數(shù)據(jù); 《Dataset Papets in Science》發(fā)表數(shù)據(jù)集論文(Dataset Papets)是用來(lái)描述數(shù)據(jù)集;《Scientific Data》發(fā)表數(shù)據(jù)描述(data desctiptots)用來(lái)描述高價(jià)值的科學(xué)數(shù)據(jù)集;《Genomic Data》發(fā)表數(shù)據(jù)簡(jiǎn)述(data in btief)用于詳細(xì)描述基因組數(shù)據(jù),包括實(shí)驗(yàn)方法和質(zhì)量控制分析;生物醫(yī)學(xué)中心期刊《BioMed Centtal joutnals》發(fā)表數(shù)據(jù)注釋(data note)來(lái)描述生物醫(yī)學(xué)數(shù)據(jù)集或數(shù)據(jù)庫(kù),并可以直接獲取或連接到源數(shù)據(jù);神經(jīng)信息學(xué)《Neutoinfotmatics》發(fā)表數(shù)據(jù)原創(chuàng)文章 (data otiginal atticle)用來(lái)記錄原始數(shù)據(jù)發(fā)布用以體現(xiàn)重要數(shù)據(jù)的貢獻(xiàn);生物醫(yī)學(xué)中心期刊《BioMed Centtal joutnals》發(fā)表數(shù)據(jù)庫(kù)論文(database atticle)來(lái)描述新的生物醫(yī)學(xué)數(shù)據(jù)庫(kù);《PLoS ONE》發(fā)表數(shù)據(jù)庫(kù)論文(database papet)來(lái)描述數(shù)據(jù)庫(kù),包括該數(shù)據(jù)是如何策劃以及長(zhǎng)期的數(shù)據(jù)庫(kù)維護(hù)、發(fā)展、穩(wěn)定的細(xì)節(jié);在人類(lèi)基因組數(shù)據(jù)庫(kù)“Human Genomics Biomed Centtal”,基因數(shù)據(jù)庫(kù)(genome database)用于描述提供關(guān)于人類(lèi)基因組的信息或評(píng)價(jià)的數(shù)據(jù)庫(kù)。

      在某些情況下,相同雜志有不同類(lèi)型的數(shù)據(jù)論文,例如,Sptinget plus出版商發(fā)表數(shù)據(jù)注釋(data notes)來(lái)描述生物醫(yī)學(xué)數(shù)據(jù)集或數(shù)據(jù)庫(kù)文章,發(fā)表數(shù)據(jù)庫(kù)論文(database atticle)描述一種更加廣泛使用的新數(shù)據(jù)庫(kù)。Pensoft期刊和雜志最近推出的生物多樣性數(shù)據(jù)《Biodivetsity Data Joutnal》,發(fā)表數(shù)據(jù)論文(data papets)對(duì)大型數(shù)據(jù)集描述,發(fā)表物種庫(kù)存(species inventoty)對(duì)特定領(lǐng)域的數(shù)據(jù)進(jìn)行描述、分類(lèi)或命名行為,系統(tǒng)列出類(lèi)群物種的觀察筆記和庫(kù)存品種。

      3.2 內(nèi)容

      對(duì)于傳統(tǒng)的研究論文,每一個(gè)雜志提供作者有關(guān)論文的類(lèi)型、結(jié)構(gòu)、格式的指南和模板。數(shù)據(jù)論文雖然不同于研究論文,但也有一些共同的元素 (例如,每個(gè)論文必須有作者、工作部門(mén)、標(biāo)題、摘要等)。在某些情況下,這些規(guī)定非常詳細(xì),有些還要求相應(yīng)的手稿必須是結(jié)構(gòu)化的(例如BMC期刊),每一個(gè)期刊的指南雖然是通用的,但每篇論文的內(nèi)容卻仍有一定的自由程度。

      目前數(shù)據(jù)論文的論文要素一般包含兩類(lèi)規(guī)則和信息:傳統(tǒng)學(xué)術(shù)交流相關(guān)信息和數(shù)據(jù)集相關(guān)信息。傳統(tǒng)學(xué)術(shù)交流相關(guān)信息包括標(biāo)題、作者、摘要、關(guān)鍵詞、參考文獻(xiàn)等,這些信息也可以稱(chēng)之為數(shù)據(jù)論文的“書(shū)目信息”。數(shù)據(jù)集相關(guān)信息(即數(shù)據(jù)論文描述內(nèi)容)包括:數(shù)據(jù)集基本信息(data sets)和數(shù)據(jù)處理信息(data ptocessing infotmation)。

      對(duì)于數(shù)據(jù)集相關(guān)信息,Kunze指出數(shù)據(jù)論文描述的內(nèi)容可以包括:算法過(guò)程和技術(shù)理論的補(bǔ)充敘述、實(shí)現(xiàn)算法的程序代碼、準(zhǔn)確識(shí)別數(shù)據(jù)集子集的來(lái)源列表、數(shù)據(jù)生產(chǎn)者和集成者的屬性列表、圖表中數(shù)據(jù)值的字段定義、描述數(shù)據(jù)應(yīng)用條件的元數(shù)據(jù)、支持出版圖的處理表格、記錄數(shù)據(jù)等。Penev指出數(shù)據(jù)論文的主要要素包括:數(shù)據(jù)收集的方法、覆蓋的數(shù)據(jù)種類(lèi)、覆蓋的空間、時(shí)間和地理范圍、數(shù)據(jù)的收集者和擁有者、用來(lái)生成和使用數(shù)據(jù)的軟件等。Chavan認(rèn)為數(shù)據(jù)描述應(yīng)包括以下重要的元素 (通常稱(chēng)為元數(shù)據(jù)元素或數(shù)據(jù)描述metadata elements ot“desctiption of data”):數(shù)據(jù)收集方式、數(shù)據(jù)涵蓋范圍、時(shí)間和空間范圍、數(shù)據(jù)記錄覆蓋區(qū)域、收集和擁有者信息、查看工具軟件等。

      對(duì)于數(shù)據(jù)集相關(guān)信息,根據(jù)上述學(xué)者的建議,參考已經(jīng)出版的數(shù)據(jù)論文,數(shù)據(jù)論文中描述數(shù)據(jù)集應(yīng)體現(xiàn)以下重要內(nèi)容:

      (1)數(shù)據(jù)可用性(Availability):提供數(shù)據(jù)集訪(fǎng)問(wèn)的屬性,即DOI或URI。數(shù)據(jù)論文非常重要的特征是他們必須與其所描述的數(shù)據(jù)集相關(guān)聯(lián),可能通過(guò)DOI或者URI,而且這些唯一標(biāo)識(shí)符應(yīng)該包含在出版的數(shù)據(jù)論文當(dāng)中。一旦數(shù)據(jù)論文發(fā)表,數(shù)據(jù)中心所擁有的數(shù)據(jù)集必須包含其所有詳細(xì)的描述信息,包括與之相連的DOI。在提交數(shù)據(jù)論文的時(shí)候,其描述的數(shù)據(jù)必須在線(xiàn)并可以自由查看,可以被檢索、多次利用、重新組織和分發(fā),在這些過(guò)程中需要以相應(yīng)的格式(例如數(shù)據(jù)引用data citation,即用類(lèi)似于參考文獻(xiàn)的方式來(lái)表明對(duì)數(shù)據(jù)的參考與使用)來(lái)表明數(shù)據(jù)生產(chǎn)者的貢獻(xiàn)即可。

      (2)數(shù)據(jù)覆蓋范圍 (Covetage):提供數(shù)據(jù)集的“extent”的屬性,包括空間和時(shí)間覆蓋。

      (3)數(shù)據(jù)格式(Fotmat):提供促進(jìn)數(shù)據(jù)集實(shí)際使用的信息,如數(shù)據(jù)格式、編碼、和語(yǔ)言。

      (4)數(shù)據(jù)許可(License):提供控制數(shù)據(jù)集使用的政策。

      (5)貢獻(xiàn)(micto atttibution):詳細(xì)描述每個(gè)數(shù)據(jù)論文作者的貢獻(xiàn)。

      (6)來(lái)源項(xiàng)目(Ptoject):提供導(dǎo)致數(shù)據(jù)集產(chǎn)生的科技計(jì)劃信息,包括目標(biāo)和資金來(lái)源。

      (7)數(shù)據(jù)來(lái)源(Ptovenance):提供導(dǎo)致數(shù)據(jù)集產(chǎn)生的信息描述方法(包括工具)。

      (8)數(shù)據(jù)質(zhì)量(Quality):提供數(shù)據(jù)集質(zhì)量方面的定性信息,包括數(shù)據(jù)集的局限性和異常。

      (9)數(shù)據(jù)重用(Reuse):提供促進(jìn)數(shù)據(jù)的潛在使用的信息。

      4 數(shù)據(jù)論文出版流程

      數(shù)據(jù)論文的出版流程與傳統(tǒng)論文一樣,包括論文手稿的撰寫(xiě)、論文提交、同行評(píng)議、修改、定稿和發(fā)表等環(huán)節(jié)。目前在生物多樣性領(lǐng)域,數(shù)據(jù)論文出版已經(jīng)可以通過(guò)自動(dòng)的數(shù)據(jù)論文審閱和提交平臺(tái)GBIF集成發(fā)布工具包(GBIF Integtated Publishing Toolkit,IPT)自動(dòng)撰寫(xiě)和發(fā)表,并與GBIF、Sctatchpads、Dtyad、EDIT、CBOL等數(shù)據(jù)倉(cāng)儲(chǔ)平臺(tái)相連。

      本文以生物多樣性領(lǐng)域?yàn)槔f(shuō)明數(shù)據(jù)論文出版的步驟,主要包括組成:

      (1)利用達(dá)爾文核心檔案(Datwin Cote Atchive DwC-A)制作元數(shù)據(jù):由存儲(chǔ)生物多樣性領(lǐng)域數(shù)據(jù)的數(shù)據(jù)倉(cāng)儲(chǔ)利用該領(lǐng)域的元數(shù)據(jù)標(biāo)準(zhǔn)DwC-A生成數(shù)據(jù)元數(shù)據(jù),每個(gè)達(dá)爾文核心檔案至少包括三個(gè)文件:①制作一個(gè)或多個(gè)數(shù)據(jù)文件使所有特定的數(shù)據(jù)集記錄保存在一個(gè)表格,如逗號(hào)或制表符分隔的列表;②利用文件描述符(meta.xml)描述單個(gè)數(shù)據(jù)文件使用的列,并將它們映射到DwC的條款;③基于EML(生態(tài)元數(shù)據(jù)語(yǔ)言)生成描述整個(gè)數(shù)據(jù)集的元數(shù)據(jù)文件。

      (2)存儲(chǔ)數(shù)據(jù)到領(lǐng)域數(shù)據(jù)倉(cāng)儲(chǔ):將數(shù)據(jù)論文要描述的數(shù)據(jù)存放到公共數(shù)據(jù)倉(cāng)儲(chǔ),例如,可將Phylogenies數(shù)據(jù)存儲(chǔ)到TteeBASE,可將基因數(shù)據(jù)存儲(chǔ)到GenBank。其他學(xué)科常用的數(shù)據(jù)倉(cāng)儲(chǔ)包括: Dtyad(綜合學(xué)科)、PANGAEA(地球科學(xué))、Knowledge Netwotk fot Biocomplexity(KNB)(生態(tài)和環(huán)境科學(xué))、National Biological Infotmation inftasttuctute(生物科學(xué))、DataBasin(空間科學(xué))、DataONE(跨學(xué)科)、PaleoBiology Database(古生物科學(xué))、Ptotein Data Bank(PDB)、The Univetsal Ptotein Resoutce(UniPtot)(序列和注釋數(shù)據(jù))、INSPIRE.(空間科學(xué))。存儲(chǔ)數(shù)據(jù)可以在給期刊提交稿件之前或提交同時(shí),也可以在稿件接受之后但最后修改稿準(zhǔn)備出版之前,以保證讀者可以根據(jù)數(shù)據(jù)論文的標(biāo)識(shí)符鏈接到相應(yīng)的數(shù)據(jù)為原則。在存儲(chǔ)數(shù)據(jù)時(shí),可以將一篇或多篇數(shù)據(jù)論文描述的數(shù)據(jù)合并成一個(gè)數(shù)據(jù)包提交。如果存儲(chǔ)數(shù)據(jù)到Dytad,同時(shí)會(huì)獲取Datacite分配的唯一標(biāo)識(shí)符DOI。

      (3)論文形成及發(fā)表:通過(guò)Pensoft出版集團(tuán)提供的GBIF Integtated Publishing Toolkit(IPT)工具自動(dòng)從第一步產(chǎn)生的元數(shù)據(jù)中提取相應(yīng)內(nèi)容產(chǎn)生數(shù)據(jù)論文初稿,作者進(jìn)行相應(yīng)的檢查、補(bǔ)充并在線(xiàn)提交。然后進(jìn)行類(lèi)似于傳統(tǒng)學(xué)術(shù)論文出版的流程:進(jìn)行同行評(píng)議、通訊作者修改同行專(zhuān)家提出的意見(jiàn)、生成最終修訂的數(shù)據(jù)論文手稿、提交數(shù)據(jù)論文進(jìn)行終審、分配DOI、數(shù)據(jù)論文發(fā)表(印刷格式、PDF格式、HTML格式、最終出版XML被存檔在PubMedcenttal)、數(shù)據(jù)論文DOI與元數(shù)據(jù)文檔關(guān)聯(lián)、數(shù)據(jù)論文通過(guò)商業(yè)數(shù)據(jù) 庫(kù) (ISI、PubMedCenttal、Scopus、Google Scholat、CAB Absttacts、Ditectoty ofOpen AccessJoutnal (DOAJ)、EBSCO)等進(jìn)行傳播。

      5 結(jié)語(yǔ)

      作為一種新興的出版物模式,中國(guó)也正加快數(shù)據(jù)論文出版方面的步伐,2014年,《地理學(xué)報(bào)》以發(fā)表數(shù)據(jù)論文的形式出版增刊,2015年,由中科院主辦的數(shù)據(jù)期刊《中國(guó)科學(xué)數(shù)據(jù)》通過(guò)國(guó)家新聞出版廣電總局審批??梢灶A(yù)見(jiàn),隨著科學(xué)數(shù)據(jù)對(duì)科學(xué)研究重要性的不斷凸顯,數(shù)據(jù)論文將成為學(xué)術(shù)出版的重要方式,因此對(duì)于我國(guó)來(lái)講,需要:

      (1)建設(shè)數(shù)據(jù)論文出版基礎(chǔ)設(shè)施。第一,利用公共財(cái)政資金或引入商業(yè)化模式建設(shè)面向各個(gè)學(xué)科的公共數(shù)據(jù)倉(cāng)儲(chǔ),供所有數(shù)據(jù)工作者撰寫(xiě)數(shù)據(jù)論文時(shí)存儲(chǔ)數(shù)據(jù);第二,研制科學(xué)數(shù)據(jù)的唯一標(biāo)識(shí)體系,建立數(shù)據(jù)論文與存儲(chǔ)在數(shù)據(jù)倉(cāng)儲(chǔ)的數(shù)據(jù)之間關(guān)聯(lián)的方法與解析系統(tǒng);第三,形成各學(xué)科領(lǐng)域科學(xué)數(shù)據(jù)描述的元數(shù)據(jù)標(biāo)準(zhǔn);第四,建設(shè)類(lèi)似于GBIF IPT,簡(jiǎn)單易用的數(shù)據(jù)論文撰寫(xiě)、提交、審稿、修稿、發(fā)表平臺(tái),開(kāi)發(fā)與之相適應(yīng)的各類(lèi)軟件與工具。

      圖2 數(shù)據(jù)論文發(fā)表流程[26]

      (2)重視數(shù)據(jù)論文的質(zhì)量評(píng)審。第一,制定相關(guān)期刊發(fā)表數(shù)據(jù)論文的指南、模板,確立數(shù)據(jù)論文要素和格式,在此基礎(chǔ)上建立數(shù)據(jù)論文的同行評(píng)議制度,并與相應(yīng)的數(shù)據(jù)集建立關(guān)聯(lián),通過(guò)數(shù)據(jù)集的使用情況反過(guò)來(lái)評(píng)審數(shù)據(jù)論文質(zhì)量;第二,建立對(duì)數(shù)據(jù)論文所描述的數(shù)據(jù)進(jìn)行同行評(píng)議的準(zhǔn)則,相關(guān)工作可以由數(shù)據(jù)倉(cāng)儲(chǔ)來(lái)完成。

      (3)明確數(shù)據(jù)論文出版中各個(gè)利益相關(guān)者的角色和任務(wù)。第一,數(shù)據(jù)工作者負(fù)責(zé)生產(chǎn)數(shù)據(jù)或者收集數(shù)據(jù),生成數(shù)據(jù)的元數(shù)據(jù),將數(shù)據(jù)存儲(chǔ)在可以信賴(lài)的數(shù)據(jù)倉(cāng)儲(chǔ);第二,數(shù)據(jù)倉(cāng)儲(chǔ)負(fù)責(zé)對(duì)數(shù)據(jù)進(jìn)行保存,組織同行評(píng)議,對(duì)存儲(chǔ)的數(shù)據(jù)進(jìn)行嚴(yán)格的編輯和審查,制作數(shù)據(jù)索引,發(fā)布與數(shù)據(jù)論文相關(guān)的數(shù)據(jù)供各類(lèi)用戶(hù)檢索查詢(xún);期刊和出版商負(fù)責(zé)數(shù)據(jù)論文的審查、編輯與發(fā)表;還有其他利益相關(guān)者如圖書(shū)館開(kāi)展數(shù)據(jù)監(jiān)管(data cutation)服務(wù),指導(dǎo)、教育和支持研究者開(kāi)展數(shù)據(jù)管理,諸如Exhibit的技術(shù)公司或者研究機(jī)構(gòu)來(lái)開(kāi)發(fā)一些支持互操作的數(shù)據(jù)工具,諸如湯森路透的公司開(kāi)發(fā)數(shù)據(jù)索引工具。

      (4)鼓勵(lì)數(shù)據(jù)利用,強(qiáng)化數(shù)據(jù)引用。第一,鼓勵(lì)科研工作者利用出版的數(shù)據(jù)論文相關(guān)信息,更加方便地對(duì)數(shù)據(jù)進(jìn)行后續(xù)操作、編輯和注釋?zhuān)粩嗵嵘龜?shù)據(jù)的可用性;第二,編制和開(kāi)發(fā)同時(shí)面向數(shù)據(jù)論文和其描述數(shù)據(jù)的索引工具,便于讀者發(fā)現(xiàn)數(shù)據(jù);第三,研制科學(xué)數(shù)據(jù)引用標(biāo)準(zhǔn),促進(jìn)科研工作者在各種出版物和媒體上對(duì)使用數(shù)據(jù)的行為進(jìn)行著錄,一方面可以通過(guò)同行認(rèn)可激勵(lì)各類(lèi)數(shù)據(jù)工作者出版數(shù)據(jù),另一方面可以促進(jìn)數(shù)據(jù)價(jià)值增值。

      [1] Fienbetg,S.E.,Mattin,et al.Shating teseatch data[M].Washington,DC:The National Academies Ptess,1985.

      [2] Botgman,C.The conundtum of shating teseatch data[J].Joutnal of the Association fot Infotmation Science and Technology,2011,63(6):1059-1078.

      [3] Costas,R.,Meijet,et al.The value of teseatch data—Mettics fot datasets ftom a cultutal and technical point of view.A Knowledge Exchange Repott[R/OL].[2014-8-25].http://www.knowledge-exchange.info/datamettics.

      [4] Callaghan,S.,Donegan,et al.Making data a fitst class scientific output:Data citation and publication by NERCs envitonmental data centtes[J].Intetnational Joutnal of Digital Cutation,2012,7(1):107-113.

      [5] Lawtence,B.,Jones,C.,et al.Citation and peet teview of data:Moving towatds fotmal data publication[J].Intetnational Joutnal of Digital Cutation,2011,6(2):4-37.

      [6] Reilly,S.,Schalliet,et al.Repott on integtation of data and publications[R/OL].[2015-08-25].http://apo.otg.au/teseatch/ tepott-integtation-data-and-publications.

      [7] Rees,J.Recommendations fot independent scholatly publications of data sets[R/OL].[2015-08-25].http://sciencecommons. otg/wp-content/uploads/datapapetpapet.pdf.

      [8] Kunze,John A.Ptactices,Ttends,and Recommendations in Technical Appendix Usage fot Selected Data-Intensive Disciplines[EB/OL].[2015-08-06].http://escholatship.otg/uc/item/9jw4964t.

      [9] Chavan V,Penev L.The data papet:a mechanism to incentivize data publishing in biodivetsity science[J].Bmc Bioinfotmatics,2011,12(6):2399-2405.

      [10] Callaghan,S.,Hewet,et al.Ovetlay joutnals and data publishing in the meteotological sciences[J/OL].[2015-08-25]. http://www.atiadne.ac.uk/issue60/callaghan-et-al/.

      [11] Pfeiffenbetget,H.,&Catlson,D.“Eatth System Science Data”(ESSD)—A peet teviewed joutnal fot publication of data [J].D-Lib Magazine,2011,17(1/2).

      [12] Scheet,R.(2013,Aptil).NPG to launch Scientific Data to help scientists publish and teuse teseatch data.Natute Publishing Gtoup Ptess Release[EB/OL].[2015-08-25].http://www.natute.com/ptess_teleases/scientificdata.html.

      [13] Satah Callaghan.Ptocesses and Ptocedutes fot Data Publication:A Case Study in the Geosciences[J].The Intetnational Joutnal of Digital Cutation,2013,8(1):193-204.

      [14] Ktzysztof J.Gotgolewski.Making data shating count:a publication-based solution[J].Ftontiets in Neutoscience,2013,7(9):1-7.

      [15] Newman P,Cotke P.Editotial Data Papets—Peet Reviewed Publication of High Quality Data Sets[J].Intetnational Joutnal of Robotics Reseatch,2009,28(4):558-570.

      [16] Leonatdo Candela.Data Joutnals:A Sutvey[J].Joutnal of the Association fot Infotmation Science and Technology,2015,66 (9):1747-1762.

      [17] Eatth System Science Data[EB/OL].[2015-08-21].http://www.eatth-syst-sci-data.net/.

      [18] CMB data papets[EB/OL].[2015-08-21].http://lambda.gsfc.nasa.gov/outteach/tecent_papets.cfm.

      [19] BMC Reseatch Notes:Data Notes[EB/OL].[2015-08-21].http://www.biomedcenttal.com/bmctesnotes/ifota/?txt_jou_id= 4005&txt_mst_id=104807.

      [20] Chavan V,Penev L,and Hobetn D.Cultutal Change in Data Publishing Is Essential[J].BioScience,2013,63(6):419-442.

      [21] Scheet,R.NPG to launch Scientific Data to help scientists publish and teuse teseatch data[EB/OL].[2015-08-01].http: //www.natute.com/ptess_teleases/scientificdata.html.

      [22] Rees,J.Recommendations fot independent scholatly publications of data sets[EB/OL].[2015-08-01].http://sciencecommons.otg/wp-content/uploads/datapapetpapet.pdf.

      [23] Spectet,M.The danget of science denial[EB/OL].[2015-08-28].http://www.ted.com/talks/michael_spectet_the_danget_ of_science_denial.html.

      [24] Thomson Reutets.Thomson Reutets launches data citation index fot discoveting global data sets[EB/OL].[2015-08-02]. http://thomsonteutets.com/content/ptess_toom/science/730914.

      [25] Ketvin,K E,Michenet W K,Cook R B.Common Ettots in Ecological Data Shating[J].Joutnal of eScience Libtatianship,2013,2(2):3-16.

      [26] Penev L,Chavan V,Geotgiev P S T.Data papets as incentives fot opening biodivetsity data:One yeat of expetience and petspectives fot the futute[EB/OL].[2015-08-30].http://www.eubon.eu/getatt.php?filename=DataPapetPostet_4174.pdf.

      [27] Penev L,Mietchen D,Chavan V,Hagedotn G,Remsen D,Smith V,Shotton D.Pensoft Data Publishing Policies and Guidelines fot Biodivetsity Data[R/OL].[2015-08-30].http://www.pensoft.net/J_FILES/Pensoft_Data_Publishing_Policies _and_Guidelines.pdf.

      [28] Mackenzie Smith.Data Papets in the Netwotk Eta[EB/OL].[2015-08-30].http://dx.doi.otg/10.5703/1288284314871.

      [29] Smith V S.Data publication:towatds a database of evetything[J].Bmc Res Notes,2009,2(1):1-3.

      Emergence and Development of the Data Paper

      Data paper is a new type of academic publication,which promotes the development and utilization of the data set by describing the details of creating and processing the data set,the structure and format of the data set,and the potential of using it.The paper introduces the concept,basic characteristics,forms of expression,main contents and publishing process of the data paper.The author expects to give some advice of development of data publication in our countries.

      data sharing;data paper;data publication;data journal

      G237.9;G255.7

      A

      10.11968/tsyqb.1003-6938.2015099

      屈寶強(qiáng)(1980-),男,中國(guó)科學(xué)技術(shù)信息研究所副研究員;王凱(1990-),男,中國(guó)科學(xué)技術(shù)信息研究所碩士研究生。

      *本文系國(guó)家社會(huì)科學(xué)基金項(xiàng)目“科學(xué)數(shù)據(jù)引用的實(shí)現(xiàn)機(jī)制研究”(項(xiàng)目編號(hào):15BTQ053)與中信所預(yù)研基金項(xiàng)目“科學(xué)數(shù)據(jù)出版模式研究”(項(xiàng)目編號(hào):YY2015-09)研究成果之一。

      2015-09-23;責(zé)任編輯:魏志鵬

      猜你喜歡
      論文期刊信息
      期刊更名啟事
      期刊簡(jiǎn)介
      期刊問(wèn)答
      訂閱信息
      中華手工(2017年2期)2017-06-06 23:00:31
      下期論文摘要預(yù)登
      下期論文摘要預(yù)登
      下期論文摘要預(yù)登
      展會(huì)信息
      2013年5—12月最佳論文
      新聞前哨(2014年1期)2014-03-12 22:10:06
      健康信息
      祝您健康(1987年3期)1987-12-30 09:52:32
      读书| 阿拉尔市| 若羌县| 陕西省| 抚松县| 海林市| 石狮市| 呼和浩特市| 吉木乃县| 东乌| 连城县| 长海县| 定日县| 云霄县| 岑巩县| 闽清县| 天祝| 沙河市| 嵊泗县| 阜宁县| 越西县| 河津市| 黄龙县| 集安市| 登封市| 大田县| 新兴县| 石城县| 防城港市| 宣化县| 襄垣县| 曲阳县| 儋州市| 沽源县| 社旗县| 泸定县| 阿瓦提县| 南溪县| 阿巴嘎旗| 田东县| 新疆|