田 稷
(浙江大學(xué)圖書館,杭州,310027)
隨著信息技術(shù)的發(fā)展和時(shí)代的進(jìn)步,開(kāi)放科學(xué)日益成為科技與社會(huì)創(chuàng)新的基礎(chǔ)、促進(jìn)科研人員合作與交流的重要環(huán)境。開(kāi)放科學(xué)的重要基礎(chǔ)包括科技論文開(kāi)放獲取與科學(xué)數(shù)據(jù)開(kāi)放共享。數(shù)據(jù)出版作為科學(xué)數(shù)據(jù)開(kāi)放共享非常重要的新模式,近年成為出版界、圖書館界、政府相關(guān)機(jī)構(gòu)、研究人員關(guān)注的熱點(diǎn)。由于數(shù)據(jù)成果并不包括在當(dāng)前的學(xué)術(shù)評(píng)價(jià)體系中、數(shù)據(jù)共享缺乏原生動(dòng)力、數(shù)據(jù)出版增量迅猛引發(fā)評(píng)議瓶頸等,科學(xué)數(shù)據(jù)出版目前仍存在許多需要克服和解決的問(wèn)題和挑戰(zhàn)。
本文提出一種科學(xué)數(shù)據(jù)混合出版新模式:采用混合評(píng)議對(duì)規(guī)?;某霭鏀?shù)據(jù)進(jìn)行質(zhì)量審核;采取免費(fèi)或有條件使用數(shù)據(jù)的靈活機(jī)制來(lái)提升學(xué)術(shù)交流效率,促進(jìn)數(shù)據(jù)交換與共享;將集成出版模式、數(shù)據(jù)倉(cāng)儲(chǔ)出版模式和數(shù)據(jù)期刊獨(dú)立出版模式的功能融合到同一平臺(tái),以提高作者的參與度和認(rèn)可度,并為數(shù)據(jù)期刊提供優(yōu)質(zhì)的稿件來(lái)源。最后探討了高校圖書館在科學(xué)數(shù)據(jù)混合出版中可以發(fā)揮的重要作用。
科學(xué)數(shù)據(jù)出版目前并無(wú)統(tǒng)一的定義。有研究認(rèn)為,科學(xué)數(shù)據(jù)出版是遵循規(guī)范的質(zhì)量管理和控制流程前提下的正式的科學(xué)數(shù)據(jù)發(fā)布。廣義的數(shù)據(jù)出版可包括任何數(shù)據(jù)上傳到網(wǎng)絡(luò)并支持開(kāi)放獲取的行為,但一般更被認(rèn)可的,是指包含數(shù)據(jù)提交、同行評(píng)議、數(shù)據(jù)發(fā)布和永久存儲(chǔ)、數(shù)據(jù)引用、影響力評(píng)價(jià)等具有完整生命周期的學(xué)術(shù)數(shù)據(jù)發(fā)布行為。
目前國(guó)內(nèi)外對(duì)科學(xué)數(shù)據(jù)出版及其模式的研究與實(shí)踐尚處于初級(jí)階段。在研究方面,國(guó)外文獻(xiàn)主要集中在數(shù)據(jù)出版的技術(shù)、安全、隱私保護(hù)等方面,如范登·愛(ài)因登(Van den Eynden)等介紹了社會(huì)科學(xué)研究數(shù)據(jù)自出版系統(tǒng)ReShare,期刊可選擇同行評(píng)審員訪問(wèn)已發(fā)布數(shù)據(jù)集,通過(guò)同行評(píng)議實(shí)行期刊發(fā)表;侯賽尼· K(Al-Hussaeni K)等研究了數(shù)據(jù)出版中不同級(jí)別的隱私保護(hù)技術(shù);賴?yán)≧eilly S)等研究了集中出版模式中生成或重用原始數(shù)據(jù)的研究人員,提供交流機(jī)制的出版商,以及提供并保存支持學(xué)術(shù)交流和已發(fā)表記錄的證據(jù)的“圖書館與數(shù)據(jù)”人員的角色與利益;亞森(Yaseen S)等研究如何在數(shù)據(jù)出版中的隱私安全和應(yīng)用中取得折衷的技術(shù)等。國(guó)內(nèi)文獻(xiàn)主要涉及不同模式的比較研究,如黃國(guó)彬根據(jù)科學(xué)數(shù)據(jù)產(chǎn)生情形,將科學(xué)數(shù)據(jù)出版分為集成出版和獨(dú)立出版兩種模式,得出獨(dú)立出版模式的質(zhì)量審核更為完善的結(jié)論,并討論不同的出版模式的不同費(fèi)用標(biāo)準(zhǔn)和承擔(dān)主體;梁子裕在分析評(píng)價(jià)數(shù)據(jù)論文出版、獨(dú)立出版、合作出版等三種國(guó)外科學(xué)數(shù)據(jù)出版模式的優(yōu)缺點(diǎn)的基礎(chǔ)之上,提出對(duì)我國(guó)數(shù)據(jù)出版模式的借鑒與優(yōu)化策略;張靜蓓等將科學(xué)數(shù)據(jù)出版分為數(shù)據(jù)獨(dú)立出版、數(shù)據(jù)論文出版、合作出版和期刊自行出版四種模式,分析每種模式的數(shù)據(jù)出版流程,研究其引用策略。
在實(shí)踐方面,科學(xué)數(shù)據(jù)出版主要分成如下三種模式。
集成出版:學(xué)術(shù)論文公開(kāi)發(fā)表在傳統(tǒng)期刊或開(kāi)放獲取期刊上,支撐該論文的數(shù)據(jù)則提交給期刊認(rèn)可的知識(shí)庫(kù),這是目前大多數(shù)期刊對(duì)發(fā)表需要數(shù)據(jù)支撐的論文時(shí)采用的模式。如《自然》()、《科學(xué)》()、PLoS等推薦或者強(qiáng)制要求科研人員將論文所涉數(shù)據(jù)提交到指定知識(shí)庫(kù)或公共知識(shí)庫(kù)中。
數(shù)據(jù)期刊獨(dú)立出版:與開(kāi)放獲取期刊類似,只是用數(shù)據(jù)代替了論文。如中國(guó)科學(xué)院的《中國(guó)科學(xué)數(shù)據(jù)》,是目前中國(guó)唯一的專門面向多學(xué)科領(lǐng)域的數(shù)據(jù)學(xué)術(shù)期刊。整個(gè)出版設(shè)計(jì)與傳統(tǒng)期刊類似,有正式的刊號(hào)及具體的期號(hào),經(jīng)同行評(píng)議后正式發(fā)表和公開(kāi)。
數(shù)據(jù)倉(cāng)儲(chǔ)獨(dú)立出版:數(shù)據(jù)也是獨(dú)立存在,但并不要求同行評(píng)審及強(qiáng)制全部公開(kāi),如Figshare和ResearchGate。它們接收作者上傳數(shù)據(jù)、圖表、多媒體、海報(bào)、論文(包括預(yù)印本)和文件等,可以存儲(chǔ)暫時(shí)不想公開(kāi)的數(shù)據(jù)。Figshare強(qiáng)調(diào)體現(xiàn)數(shù)據(jù)的優(yōu)先發(fā)布,平臺(tái)提供瀏覽、下載和引用統(tǒng)計(jì)等功能。
以上三種模式中,集成出版的數(shù)據(jù)僅是期刊論文的支撐,量少且并不一定完整;數(shù)據(jù)期刊獨(dú)立出版的數(shù)據(jù)均通過(guò)同行評(píng)審,質(zhì)量高,但能夠出版的數(shù)據(jù)非常有限。這兩種出版模式能接納數(shù)據(jù)的量都很少,存在數(shù)據(jù)孤島和創(chuàng)新孤島,不利于實(shí)現(xiàn)大規(guī)模的數(shù)據(jù)開(kāi)放與共享。數(shù)據(jù)倉(cāng)儲(chǔ)獨(dú)立出版模式實(shí)現(xiàn)了以存儲(chǔ)和公開(kāi)為主要目的的廣義的數(shù)據(jù)出版,可以實(shí)現(xiàn)大范圍的數(shù)據(jù)共享,但平臺(tái)“重存儲(chǔ),輕利用”,對(duì)數(shù)據(jù)的審核側(cè)重于技術(shù)質(zhì)量和元數(shù)據(jù)的全面性、準(zhǔn)確性,并不審核數(shù)據(jù)的科學(xué)質(zhì)量。這樣,優(yōu)質(zhì)數(shù)據(jù)淹沒(méi)在海量數(shù)據(jù)中,難以辨識(shí)和獲?。欢易髡呖赡芴峁┩耆赓M(fèi)的數(shù)據(jù),也可能僅存儲(chǔ)而不公開(kāi),存在作者與用戶激勵(lì)和平臺(tái)認(rèn)可度等問(wèn)題,對(duì)平臺(tái)的可持續(xù)發(fā)展和深度利用帶來(lái)困擾。針對(duì)這些問(wèn)題,本文以數(shù)據(jù)倉(cāng)儲(chǔ)獨(dú)立出版模式為基礎(chǔ),將上面三種出版模式功能結(jié)合在一起,提出一種能將高質(zhì)量、高價(jià)值數(shù)據(jù)從海量數(shù)據(jù)中顯現(xiàn)出來(lái),促進(jìn)數(shù)據(jù)的利用和共享的科學(xué)數(shù)據(jù)混合出版模式。
科學(xué)數(shù)據(jù)混合出版模式,是將所有能支撐學(xué)術(shù)論文的數(shù)據(jù)、獨(dú)立的研究數(shù)據(jù)或成果等作為出版對(duì)象,用戶、圖書館館員或同行評(píng)議專家均可對(duì)通過(guò)規(guī)范審查的數(shù)據(jù)進(jìn)行有償或無(wú)償?shù)馁|(zhì)量審核,基于免費(fèi)、收費(fèi)、交換或合作署名等機(jī)制共享與利用數(shù)據(jù),通過(guò)數(shù)據(jù)倉(cāng)儲(chǔ)平臺(tái)公開(kāi)或數(shù)據(jù)期刊獨(dú)立公開(kāi)的形式出版數(shù)據(jù)。即所謂混合,是在質(zhì)量評(píng)議、收費(fèi)機(jī)制和出版形態(tài)等方面多種機(jī)制的混合,力爭(zhēng)打造一個(gè)良好的數(shù)據(jù)出版生態(tài)環(huán)境?;旌铣霭婺J降牧鞒倘鐖D1所示。
圖1 科學(xué)數(shù)據(jù)混合出版流程圖
作者向數(shù)據(jù)出版平臺(tái)提交其研究過(guò)程或成果數(shù)據(jù)。簡(jiǎn)單易操作等良好的用戶體驗(yàn)是影響作者選擇平臺(tái)的重要因素。出版平臺(tái)需要提供專門的提交模板,作者只需在模板上按規(guī)定格式填充相關(guān)內(nèi)容即可。除常規(guī)的題名、作者、學(xué)科分類選項(xiàng)、文檔類型(數(shù)據(jù)集、圖表等)、描述、基金、參考文獻(xiàn)鏈接、許可等選項(xiàng)外,混合出版模式的數(shù)據(jù)提交模板還包括質(zhì)量評(píng)議選項(xiàng)、數(shù)據(jù)公開(kāi)條件(免費(fèi)、收費(fèi)或交換)選項(xiàng)、研究要素公開(kāi)選項(xiàng)。
平臺(tái)根據(jù)規(guī)定格式,審核作者提交的內(nèi)容是否符合規(guī)范,如數(shù)據(jù)類型和格式是否符合要求,數(shù)據(jù)描述等必要選項(xiàng)是否完整等。由平臺(tái)管理方和系統(tǒng)完成規(guī)范審核,并不對(duì)數(shù)據(jù)的科學(xué)性和質(zhì)量進(jìn)行評(píng)定。
通過(guò)規(guī)范審核的數(shù)據(jù)在平臺(tái)上公開(kāi)發(fā)布,未通過(guò)審核的返回作者修改。
出版平臺(tái)一旦發(fā)表某一數(shù)據(jù),所有訪問(wèn)數(shù)據(jù)的用戶都可以直接對(duì)之進(jìn)行網(wǎng)絡(luò)評(píng)議、打分、討論等互動(dòng)與交流?;旌铣霭婺J讲捎萌N方式對(duì)數(shù)據(jù)進(jìn)行質(zhì)量評(píng)議,具體包括用戶評(píng)議、圖書館員評(píng)議和同行專家評(píng)議。
用戶評(píng)議:類似豆瓣點(diǎn)評(píng)和淘寶買家評(píng)價(jià),平臺(tái)設(shè)置評(píng)議選項(xiàng),用戶可以對(duì)數(shù)據(jù)的各種要素進(jìn)行打分和評(píng)價(jià),包括內(nèi)容質(zhì)量、應(yīng)用價(jià)值等。此處的用戶包含所有訪問(wèn)數(shù)據(jù)的人,可以是同行,也可以是跨學(xué)科使用的研究者。
圖書館員評(píng)議:圖書館員利用其專業(yè)素養(yǎng),實(shí)現(xiàn):(1)對(duì)用戶評(píng)議的內(nèi)容進(jìn)行整理;(2)利用數(shù)據(jù)的下載量、引用量和Altmetrics指數(shù)等,形成計(jì)量學(xué)意義上的數(shù)據(jù)影響力評(píng)價(jià);(3)通過(guò)對(duì)數(shù)據(jù)的描述文檔進(jìn)行分析,對(duì)數(shù)據(jù)的創(chuàng)新性進(jìn)行評(píng)議。在這些基礎(chǔ)上形成評(píng)議結(jié)論,作為同行專家選擇數(shù)據(jù)并進(jìn)行評(píng)議的重要參考。
同行專家評(píng)議:由平臺(tái)構(gòu)建開(kāi)放性的網(wǎng)絡(luò)同行評(píng)議專家?guī)?,同行專家自愿加入。同行專家主要?duì)數(shù)據(jù)的科學(xué)性和內(nèi)容質(zhì)量進(jìn)行評(píng)議,然后形成供用戶和數(shù)據(jù)期刊選擇優(yōu)質(zhì)數(shù)據(jù)的重要參考意見(jiàn)。
為激勵(lì)更多人參與評(píng)議,評(píng)議行為可以是收費(fèi)方式,也可以是免費(fèi)方式。對(duì)于收費(fèi)評(píng)議,評(píng)議費(fèi)用可由數(shù)據(jù)作者提供、用戶(包括個(gè)人或數(shù)據(jù)期刊)提供和平臺(tái)提供等。
科學(xué)數(shù)據(jù)利用主要涉及數(shù)據(jù)下載和數(shù)據(jù)引用。此外,用戶可能不僅僅對(duì)數(shù)據(jù)本身感興趣,還對(duì)實(shí)驗(yàn)流程、方法、材料、經(jīng)驗(yàn)教訓(xùn)等科學(xué)數(shù)據(jù)研究要素感興趣,由此將催生對(duì)數(shù)據(jù)研究要素的需求和利用。
數(shù)據(jù)可以在平臺(tái)永久保存,實(shí)現(xiàn)自出版;數(shù)據(jù)期刊可以基于數(shù)據(jù)評(píng)議結(jié)果選擇合適的對(duì)象進(jìn)行正式出版。
相對(duì)當(dāng)前主要的數(shù)據(jù)出版模式,數(shù)據(jù)混合出版模式具有如下創(chuàng)新特征和優(yōu)勢(shì):
任何出版都意味著對(duì)出版對(duì)象的內(nèi)容質(zhì)量給以一定程度的認(rèn)可,傳統(tǒng)出版采用同行評(píng)議方式來(lái)實(shí)現(xiàn)。雖然數(shù)據(jù)出版并不需要強(qiáng)制進(jìn)行同行評(píng)議,但同行評(píng)議仍然是保證出版質(zhì)量的最佳方式。但對(duì)于集成出版模式和數(shù)據(jù)倉(cāng)儲(chǔ)獨(dú)立出版模式,數(shù)據(jù)質(zhì)量審核存在缺乏評(píng)議標(biāo)準(zhǔn)、評(píng)議時(shí)間成本高昂(如評(píng)議一份數(shù)學(xué)或物理數(shù)據(jù)需要6—8個(gè)小時(shí))、目前科學(xué)共同體尚未給數(shù)據(jù)同行評(píng)議專家以相應(yīng)的社會(huì)及學(xué)術(shù)認(rèn)可而嚴(yán)重影響評(píng)議者的積極性等困難,特別對(duì)于數(shù)據(jù)倉(cāng)儲(chǔ)獨(dú)立出版模式,最大的困難在于提交給平臺(tái)的數(shù)據(jù)數(shù)量和增長(zhǎng)速度遠(yuǎn)遠(yuǎn)大于傳統(tǒng)出版,數(shù)據(jù)同行評(píng)議的專家嚴(yán)重缺乏,無(wú)法實(shí)現(xiàn)對(duì)規(guī)?;臄?shù)據(jù)進(jìn)行質(zhì)量審核。
混合出版模式的一個(gè)重要特征和優(yōu)勢(shì)就在于它采用混合評(píng)議方式實(shí)現(xiàn)規(guī)?;某霭鏀?shù)據(jù)質(zhì)量審核。數(shù)據(jù)用戶根據(jù)自己對(duì)數(shù)據(jù)的利用情況給以質(zhì)量評(píng)議;圖書館員基于用戶評(píng)議結(jié)果,或者直接基于數(shù)據(jù)的下載量、引用量等計(jì)量學(xué)指標(biāo)表現(xiàn),選擇數(shù)據(jù)并對(duì)之進(jìn)行更深入的創(chuàng)新性和影響力評(píng)價(jià),形成評(píng)價(jià)結(jié)論;同行專家參考圖書館員評(píng)議或數(shù)據(jù)的計(jì)量學(xué)指標(biāo)表現(xiàn),有目的地選擇數(shù)據(jù)進(jìn)行評(píng)價(jià),然后形成可供用戶選擇或數(shù)據(jù)期刊選擇優(yōu)質(zhì)數(shù)據(jù)的推薦意見(jiàn)。由于包括作者與讀者的所有用戶和圖書館員都可參與質(zhì)量評(píng)議,平臺(tái)的同行專家?guī)鞂?duì)所有同行專家開(kāi)放,這種具有社交網(wǎng)絡(luò)屬性的評(píng)議方式時(shí)效性高、參評(píng)人員數(shù)量有保障、評(píng)議完全透明和公開(kāi),混合評(píng)議將在很大程度解決數(shù)據(jù)出版的質(zhì)量評(píng)議瓶頸問(wèn)題。
由于目前科學(xué)數(shù)據(jù)出版平臺(tái)大多是由公共資金支持建設(shè)與運(yùn)維,社會(huì)資金運(yùn)營(yíng)的出版平臺(tái)所收取的費(fèi)用也僅是數(shù)據(jù)存儲(chǔ)與管理費(fèi)用,不能像傳統(tǒng)出版那樣從成熟的產(chǎn)業(yè)鏈中獲得穩(wěn)定利潤(rùn)來(lái)支付同行評(píng)議專家勞動(dòng)報(bào)酬,這樣的資金運(yùn)作方式不能長(zhǎng)遠(yuǎn)支持對(duì)科學(xué)數(shù)據(jù)的同行評(píng)議。
混合評(píng)議將通過(guò)收費(fèi)與免費(fèi)相結(jié)合的評(píng)議方式來(lái)解決此問(wèn)題。用戶、圖書館員和同行專家都可以自愿提供對(duì)數(shù)據(jù)的免費(fèi)評(píng)議,但合理的收費(fèi)機(jī)制將激勵(lì)更多的人參與。如渴望得到質(zhì)量評(píng)議的作者可以主動(dòng)提供費(fèi)用,吸引他人對(duì)自己公開(kāi)的數(shù)據(jù)進(jìn)行質(zhì)量評(píng)議;用戶可以提供評(píng)議費(fèi)用,讓他人幫助自己盡快在海量數(shù)據(jù)中找到想要的優(yōu)質(zhì)數(shù)據(jù);數(shù)據(jù)期刊可以提供評(píng)議費(fèi)用,讓大家?guī)椭x擇和審核自己期刊想組稿發(fā)表的數(shù)據(jù);平臺(tái)管理方也可以有意提供評(píng)議費(fèi)用,吸引更多人評(píng)價(jià)更多的數(shù)據(jù),從而進(jìn)一步提升平臺(tái)的學(xué)術(shù)價(jià)值和影響力,費(fèi)用來(lái)源可以是平臺(tái)廣告費(fèi)、政府或社會(huì)機(jī)構(gòu)支持等。這樣的混合評(píng)議收費(fèi)機(jī)制在極大提升出版數(shù)據(jù)的評(píng)議比例的同時(shí),也為長(zhǎng)遠(yuǎn)解決數(shù)據(jù)出版中的質(zhì)量評(píng)議費(fèi)用問(wèn)題提供有效方案。
雖然出版的科學(xué)數(shù)據(jù)很多是公共資助項(xiàng)目的產(chǎn)物,但也必須認(rèn)可不同科研人員的不同勞動(dòng)與智慧,開(kāi)放科學(xué)并不應(yīng)該總是向所有人員全部無(wú)償開(kāi)放。如果一刀切地要求作者都無(wú)償共享數(shù)據(jù),那么部分人可能會(huì)選擇不發(fā)表或有保留地發(fā)表。筆者曾就此對(duì)浙江大學(xué)4個(gè)學(xué)院10位不同專業(yè)的老師進(jìn)行了訪談?wù){(diào)查,他們都愿意在合適的平臺(tái)上公開(kāi)自己長(zhǎng)期研究積累的各種數(shù)據(jù)。其中2人愿意無(wú)條件公開(kāi),8人表示主要是希望讓人知道這些數(shù)據(jù)的存在,以及存在何處,5人希望是有條件的共享,如數(shù)據(jù)交換、合作署名,或者收取一定費(fèi)用。另一方面,他們表示,如果可以基于別人的數(shù)據(jù)進(jìn)行研究,也愿意通過(guò)類似喜馬拉雅平臺(tái)的知識(shí)付費(fèi)方式滿足自己的數(shù)據(jù)需求。
當(dāng)前主流的數(shù)據(jù)出版模式中,平臺(tái)對(duì)數(shù)據(jù)作者免費(fèi)或收取一定費(fèi)用,數(shù)據(jù)利用方一般并不付費(fèi),這種單向收費(fèi)方式不利于數(shù)據(jù)的完全開(kāi)放與利用。為了鼓勵(lì)更多的人共享與利用數(shù)據(jù),促進(jìn)數(shù)據(jù)的交換和研究人員之間的合作,混合出版模式采取靈活機(jī)制來(lái)多樣性鼓勵(lì)大家利用數(shù)據(jù)。數(shù)據(jù)的下載既可以是免費(fèi)的,也可以是收費(fèi)的,收費(fèi)與否及收費(fèi)多少由作者或傳播者自行確定。數(shù)據(jù)引用則分兩種情況,一種是傳統(tǒng)意義上的引用,另一種是借用作者的數(shù)據(jù)進(jìn)行自己的研究。對(duì)于傳統(tǒng)意義的引用,應(yīng)該是完全免費(fèi);但對(duì)于將別人出版的科學(xué)數(shù)據(jù)作為自己研究的一部分,用戶應(yīng)根據(jù)原數(shù)據(jù)作者或傳播者的要求進(jìn)行免費(fèi)或收費(fèi)引用,或者通過(guò)數(shù)據(jù)交換或共同署名的方式進(jìn)行引用。
開(kāi)放科學(xué)環(huán)境下,科研人員擔(dān)心各種開(kāi)放模式帶來(lái)的變化有可能影響到對(duì)他們的學(xué)術(shù)認(rèn)可與評(píng)價(jià)。混合出版模式融合了數(shù)據(jù)倉(cāng)儲(chǔ)出版和數(shù)據(jù)期刊出版功能,平臺(tái)可以根據(jù)混合評(píng)議及數(shù)據(jù)利用的綜合表現(xiàn),向數(shù)據(jù)期刊推薦數(shù)據(jù)。數(shù)據(jù)期刊選擇表現(xiàn)優(yōu)秀的數(shù)據(jù),進(jìn)行同行評(píng)議或直接在數(shù)據(jù)期刊上正式發(fā)表,這個(gè)過(guò)程讓作者得到了學(xué)術(shù)共同體的認(rèn)可。而對(duì)于未能在數(shù)據(jù)期刊上發(fā)表的數(shù)據(jù),平臺(tái)不僅提供永久的公開(kāi)與保存,而且由于有用戶評(píng)議和圖書館評(píng)議機(jī)制的保障,高質(zhì)量數(shù)據(jù)的可發(fā)現(xiàn)性將得以大幅度提升,進(jìn)而提高平臺(tái)的社會(huì)認(rèn)可度。學(xué)術(shù)認(rèn)可度與社會(huì)認(rèn)可度的提升將吸引更多作者將自己的研究成果公開(kāi)到平臺(tái)上出版,以及更多的用戶關(guān)注和利用平臺(tái)數(shù)據(jù)。
開(kāi)放科學(xué)為圖書館事業(yè)的發(fā)展帶來(lái)了新的挑戰(zhàn)和要求,也帶來(lái)了新興機(jī)遇。圖書館深度參與科學(xué)數(shù)據(jù)出版,是未來(lái)高校圖書館的發(fā)展趨勢(shì)之一。
館員的職業(yè)素養(yǎng)為圖書館參與科學(xué)數(shù)據(jù)出版打下了堅(jiān)實(shí)的基礎(chǔ)。開(kāi)放科學(xué)環(huán)境下,出版商、圖書館、集成商和作者將在信息的創(chuàng)造和傳播過(guò)程中進(jìn)一步融合,圖書館館員在科學(xué)數(shù)據(jù)的描述、組織、選擇、評(píng)價(jià)、服務(wù)等過(guò)程中都可以發(fā)揮重要作用,如制定數(shù)據(jù)規(guī)范與標(biāo)準(zhǔn)、質(zhì)量評(píng)議、數(shù)據(jù)分析與服務(wù)、永久存儲(chǔ)與管理等:
元數(shù)據(jù)是推進(jìn)科學(xué)數(shù)據(jù)共享、實(shí)現(xiàn)數(shù)據(jù)出版、支持?jǐn)?shù)據(jù)的可發(fā)現(xiàn)和利用的重要基礎(chǔ)。目前的數(shù)據(jù)倉(cāng)儲(chǔ)獨(dú)立出版平臺(tái)(如圖文數(shù)據(jù)共享(Figshare))上數(shù)據(jù)的元數(shù)據(jù)只是按都柏林核心(Dublin Core,DC)元數(shù)據(jù)標(biāo)準(zhǔn)創(chuàng)建后,由作者進(jìn)行核查和修改,這樣簡(jiǎn)單的元數(shù)據(jù)并不能很好地支持對(duì)數(shù)據(jù)的深度揭示與利用。另一方面,科學(xué)數(shù)據(jù)有實(shí)驗(yàn)數(shù)據(jù)、測(cè)量數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)、觀察數(shù)據(jù)、調(diào)查數(shù)據(jù)等,各個(gè)學(xué)科特點(diǎn)不盡相同,數(shù)據(jù)種類和格式存在多樣性和復(fù)雜性,給數(shù)據(jù)出版的平臺(tái)設(shè)計(jì)和數(shù)據(jù)的共享與利用帶來(lái)挑戰(zhàn)。而且相對(duì)學(xué)術(shù)論文而言,科學(xué)數(shù)據(jù)缺乏獨(dú)立性,為了使數(shù)據(jù)更易于獲取、互連和可發(fā)現(xiàn),需要高質(zhì)量的元數(shù)據(jù)來(lái)幫助理解和使用。高校圖書館在元數(shù)據(jù)標(biāo)準(zhǔn)制定與數(shù)據(jù)標(biāo)引方面具有極其豐富的經(jīng)驗(yàn)和專業(yè)的人才隊(duì)伍,館員可以制定更為專業(yè)和科學(xué)的元數(shù)據(jù)標(biāo)準(zhǔn),借助工具和技術(shù),實(shí)現(xiàn)對(duì)大規(guī)模數(shù)據(jù)的有效標(biāo)引。
由于混合出版模式中數(shù)據(jù)質(zhì)量評(píng)議的開(kāi)放性和眾包性,數(shù)據(jù)出版平臺(tái)將匯集各種反饋意見(jiàn)和積淀各種利用數(shù)據(jù)。高校圖書館近年引進(jìn)了大量具有一定學(xué)科背景的高學(xué)歷館員,可以利用他們的專業(yè)知識(shí)和職業(yè)素養(yǎng)對(duì)這些信息進(jìn)行梳理與挖掘,基于用戶利用信息進(jìn)行質(zhì)量評(píng)議;可根據(jù)數(shù)據(jù)的關(guān)注度、下載量、引用量等的統(tǒng)計(jì)分析出數(shù)據(jù)的受眾面、影響力等,構(gòu)建相應(yīng)的質(zhì)量評(píng)價(jià)等級(jí)標(biāo)準(zhǔn),對(duì)數(shù)據(jù)進(jìn)行分類分級(jí);可以利用科技查新等技能深入分析數(shù)據(jù)描述文檔,對(duì)數(shù)據(jù)內(nèi)容的創(chuàng)新性給以評(píng)價(jià),為數(shù)據(jù)的后續(xù)利用提供指導(dǎo)性意見(jiàn)。而且,可以借鑒文獻(xiàn)傳遞機(jī)制,以聯(lián)盟的形式制定統(tǒng)一的評(píng)議標(biāo)準(zhǔn),讓眾多圖書館及館員參與,從而實(shí)現(xiàn)數(shù)據(jù)質(zhì)量評(píng)議的標(biāo)準(zhǔn)化和規(guī)?;?。
科學(xué)數(shù)據(jù)混合出版模式不僅實(shí)現(xiàn)數(shù)據(jù)的公開(kāi)與長(zhǎng)期保存,更關(guān)注如何進(jìn)行有效的利用。高校圖書館可以借助其服務(wù)師生和科研人員的專業(yè)知識(shí)與技能,在科學(xué)數(shù)據(jù)利用與服務(wù)方面發(fā)揮重要作用。如引導(dǎo)師生積極出版自己的科研數(shù)據(jù),幫助查找和使用研究數(shù)據(jù);幫助研究人員發(fā)現(xiàn)與尋找合作對(duì)象,促進(jìn)科研合作與交流、學(xué)科交叉與科學(xué)創(chuàng)新。
科學(xué)數(shù)據(jù)蘊(yùn)含巨大的應(yīng)用價(jià)值,圖書館館員可以開(kāi)展針對(duì)科學(xué)數(shù)據(jù)的多種增值服務(wù)。如根據(jù)研究人員、課題組或?qū)W科需求,檢索收集專題數(shù)據(jù)并按主題或?qū)W科進(jìn)行二次分類、標(biāo)引等,形成特定數(shù)據(jù)集,幫助用戶在海量數(shù)據(jù)集中專注跟蹤了解自己的研究領(lǐng)域;對(duì)特定數(shù)據(jù)集進(jìn)行數(shù)據(jù)挖掘與可視化關(guān)聯(lián)分析,幫助用戶對(duì)數(shù)據(jù)進(jìn)行深層利用,使其隱藏的重要價(jià)值得以顯現(xiàn);幫助交叉學(xué)科項(xiàng)目收集、整理數(shù)據(jù),形成相應(yīng)的交叉學(xué)科數(shù)據(jù)利用平臺(tái);跟蹤收集與整理失敗數(shù)據(jù),形成極具利用價(jià)值的失敗數(shù)據(jù)檢索與利用平臺(tái)等等。
科學(xué)數(shù)據(jù)將與傳統(tǒng)文獻(xiàn)一樣,成為人類發(fā)展歷程中非常重要的知識(shí)類型。圖書館一直擔(dān)負(fù)著人類知識(shí)積淀與傳承的重要?dú)v史使命,必然將這一新型知識(shí)納入圖書館統(tǒng)一收藏、管理、揭示與應(yīng)用。目前科學(xué)數(shù)據(jù)出版平臺(tái)的承建主體和運(yùn)維經(jīng)費(fèi)來(lái)源多種多樣,有的承建主體是政府或行業(yè)學(xué)會(huì)、協(xié)會(huì)等(如《中國(guó)科學(xué)數(shù)據(jù)》),也有承建主體是社會(huì)資本支持的商業(yè)機(jī)構(gòu)(如圖文數(shù)據(jù)共享);出版數(shù)據(jù)的學(xué)科領(lǐng)域、要求、標(biāo)準(zhǔn)等也各不相同,在平臺(tái)連續(xù)性、永久性、標(biāo)準(zhǔn)統(tǒng)一性等多方面都存在問(wèn)題。解決這些問(wèn)題,需要數(shù)據(jù)出版平臺(tái)最終從多元化向歸核化轉(zhuǎn)變。而科學(xué)數(shù)據(jù)混合出版模式由于有圖書館的多重參與,無(wú)論平臺(tái)的承建主體是誰(shuí)、運(yùn)維經(jīng)費(fèi)來(lái)源何處,由圖書館永久保存數(shù)據(jù),將可以最大程度地保障科學(xué)數(shù)據(jù)出版的完整性、連續(xù)性、公共性和服務(wù)性。
過(guò)去兩年產(chǎn)生了全球迄今為止50%的數(shù)據(jù),但僅有2%的數(shù)據(jù)得到了分析??茖W(xué)數(shù)據(jù)混合出版模式采用開(kāi)放性的混合評(píng)議機(jī)制,大大提升數(shù)據(jù)的質(zhì)量評(píng)議比例,將更多的高質(zhì)量數(shù)據(jù)從海量數(shù)據(jù)中突顯出來(lái),為用戶選擇和使用數(shù)據(jù)提供了有效參考;設(shè)置免費(fèi)、收費(fèi)、數(shù)據(jù)交換與共同署名等靈活多樣的激勵(lì)機(jī)制,可以提升數(shù)據(jù)出版內(nèi)生動(dòng)力,實(shí)現(xiàn)平臺(tái)運(yùn)維的自主造血,從而打造一個(gè)能長(zhǎng)效運(yùn)行的數(shù)據(jù)出版生態(tài)環(huán)境,積極推進(jìn)開(kāi)放科學(xué)環(huán)境下數(shù)據(jù)出版的健康長(zhǎng)遠(yuǎn)發(fā)展?;旌铣霭婺J郊哿水?dāng)前主流數(shù)據(jù)出版模式的優(yōu)點(diǎn),克服了它們的弊端。文章尚未對(duì)混合數(shù)據(jù)出版模式中涉及到的法律與隱私,收費(fèi)的實(shí)現(xiàn)方法及其可能帶來(lái)的其他問(wèn)題,圖書館評(píng)議與打分標(biāo)準(zhǔn)、專家評(píng)議標(biāo)準(zhǔn),科學(xué)數(shù)據(jù)的增值服務(wù)中包含的知識(shí)產(chǎn)權(quán)問(wèn)題,圖書館如何實(shí)現(xiàn)永久保存等問(wèn)題進(jìn)行深層次的探討,有待今后進(jìn)一步研究。但無(wú)論如何,作為數(shù)據(jù)出版體系中一個(gè)重要角色,高校圖書館需要未雨綢繆并積極參與,才能為其在數(shù)據(jù)時(shí)代的轉(zhuǎn)型升級(jí)贏得更強(qiáng)的競(jìng)爭(zhēng)力。
注 釋
[1][11]黃國(guó)彬,王舒,屈亞杰.科學(xué)數(shù)據(jù)出版模式比較研究[J].大學(xué)圖書館學(xué)報(bào),2018,36(1):34-40+33
[2]何琳,常穎聰.國(guó)內(nèi)外科學(xué)數(shù)據(jù)出版研究進(jìn)展[J].圖書情報(bào)工作,2014,58(5):104-110
[3]Eynden V,Corti L.Advancing research data publishing practices for the social sciences: from archive activity to empowering researchers[J].,2017,18(2):113-121
[4]Al-Hussaeni K,F(xiàn)ung B C M,Iqbal F,et al.Differentially private multidimensional data publishing[J].,2018,56(3):717-752
[5]Reilly S,Schallier W,et al.Report on integration of data and publication [EB/OL].[2019-10-07].https://zenodo.org/record/8307#.XZqkmWZ5vIU
[6]Yaseen S,Abbas S M A,Anjum A,et al.Improved Generalization for Secure Data Publishing[J].,2018,6:27156-27165
[7]梁子裕.國(guó)外科研數(shù)據(jù)出版模式研究[J].出版發(fā)行研究,2017(3):82-85
[8]張靜蓓,任樹(shù)懷.科研數(shù)據(jù)出版模式、流程及引用策略研究[J].圖書情報(bào)工作,2015,59(9):21-27
[9]《中國(guó)科學(xué)數(shù)據(jù)》編輯部.中國(guó)科學(xué)數(shù)據(jù)[EB/OL].[2019-03-04].http://www.csdata.org/
[12]Figshare[EB/OL].https:// figshare.com/
[13][14]劉鳳紅,張?zhí)?開(kāi)放科學(xué)背景下新興學(xué)術(shù)論文出版類型:研究要素出版[J].中國(guó)科技期刊研究,2017,28(02):138-144
[15]屈寶強(qiáng),王凱.數(shù)據(jù)出版視角下的科學(xué)數(shù)據(jù)同行評(píng)議[J].圖書館雜志,2017,36(10):71-77
[16]frontier[EB/OL].[2019-04-04].https://www.frontiersin.org/
[17]BahlaiCA,BartlettLJ,et al.Open Science Isn't Always Open to All Scientists[J].American Scientist,2019,107(2):78-82
[18]國(guó)際科學(xué)編輯.中國(guó)相關(guān)機(jī)構(gòu)明確力挺論文開(kāi)放獲取、支持S計(jì)劃[EB/OL].[2019-10-08].http://m.sohu.com/a/281258891_100191228
[19]科塔學(xué)術(shù).Figshare 數(shù)據(jù)知識(shí)庫(kù)[EB/OL].[2019-08-08].https://www.sciping.com/18605.html
[20]Purohit S,Chappell A.Effective Tooling for Linked Data Publishing in Scientific Research[C].2016 IEEE Tenth International Conference on Semantic Computing(ICSC),2016:24-31
[21]Smith M.Communicating with data : new roles for scientists,publishers and librarians[J].,2011,24(3): 203-205
[22]Paige.「上云」不是終點(diǎn),釋放數(shù)據(jù)價(jià)值才是數(shù)字經(jīng)濟(jì)時(shí)代的「加油站」[EB/OL].[2019-10-07].https://www.geek-share.com/detail/2780650703.html