楊園利 趙旭 荀雪蓮 劉亞寧
【摘? 要】數(shù)字環(huán)境下數(shù)據(jù)已成為發(fā)展的主體,數(shù)據(jù)開放研究是當(dāng)前研究的熱點(diǎn)之一,本文主要針對科研數(shù)據(jù)開放服務(wù)展開研究,圖書館作為信息資源重要收藏和服務(wù)機(jī)構(gòu),科研數(shù)據(jù)開放服務(wù)是其新的發(fā)展方向,從數(shù)據(jù)獲取、整理、分析、使用、數(shù)據(jù)保護(hù)等方面研究數(shù)據(jù)開放可行性,并構(gòu)建以圖書館為主體參與的科研數(shù)據(jù)開放服務(wù)新模式。
【關(guān)鍵詞】數(shù)據(jù)開放;科研數(shù)據(jù)開放
引言
數(shù)字環(huán)境下,數(shù)據(jù)就是生產(chǎn)力,推動各界飛速發(fā)展,科研不再只是對于成果的需求,已經(jīng)深入到對于研究過程研究數(shù)據(jù)的需求。不同主體不同視角下的數(shù)據(jù)會被挖掘出不同價值,封閉式創(chuàng)新正走向開放式創(chuàng)新。但是受限于以期刊論文為典型的研究成果展現(xiàn)形式,作為研究支撐證據(jù)的數(shù)據(jù)不得不被精簡省略,海量數(shù)據(jù)被忽略甚至流失。加上權(quán)益限制,科研數(shù)據(jù)分散于個體或組織內(nèi)部,形成數(shù)據(jù)孤島。這就造成數(shù)據(jù)浪費(fèi),價值被埋沒。如何建立數(shù)據(jù)孤島間的聯(lián)系網(wǎng),防止一次性數(shù)據(jù)發(fā)生,提高數(shù)據(jù)利用率及價值,使得各方科研數(shù)據(jù)變得可獲取、可重用,數(shù)據(jù)開放共享迫在眉睫,數(shù)據(jù)開放服務(wù)的出現(xiàn)也成為必然。
1.數(shù)據(jù)生命周期
我們科研發(fā)展的方方面面與數(shù)據(jù)密切相連,產(chǎn)生數(shù)據(jù)并利用數(shù)據(jù)。數(shù)據(jù)如同資產(chǎn)產(chǎn)品一樣有其一定的生命周期。了解數(shù)據(jù)的生命周期是管理數(shù)據(jù)的前提。
數(shù)據(jù)生命周期理論:
什么是數(shù)據(jù)生命周期,簡單的說即是數(shù)據(jù)整個的流動過程,一般指的是從產(chǎn)生到利用到消除。數(shù)據(jù)生命周期具體到不同類別的數(shù)據(jù)又會經(jīng)歷不同的生命周期。一般數(shù)據(jù)生命周期包含以下幾個階段。
(1)數(shù)據(jù)生成期:數(shù)據(jù)生成一直都在進(jìn)行中,如果沒有人為干預(yù)或者事先設(shè)計(jì)好數(shù)據(jù)生成規(guī)則任務(wù)等,數(shù)據(jù)生成將難以控制,從而生成的數(shù)據(jù)質(zhì)量和數(shù)量都將失控,數(shù)據(jù)安全性將無法保障。數(shù)據(jù)生成規(guī)則應(yīng)包含生成人、生成時間、生成地點(diǎn)、生成方式幾大因素。
(2)數(shù)據(jù)運(yùn)行期:生成后的數(shù)據(jù)將被用于查詢、應(yīng)用、復(fù)制、分析、驗(yàn)證等,但不是所有的數(shù)據(jù)都會經(jīng)歷運(yùn)行期,有些數(shù)據(jù)不被運(yùn)行直接步入下一階段,例如日志數(shù)據(jù)。
(3)數(shù)據(jù)衰弱期:數(shù)據(jù)運(yùn)行一定時間后,價值發(fā)揮殆盡,如果沒有新的價值被發(fā)現(xiàn)挖掘,將步入衰弱期。
(4)數(shù)據(jù)銷毀期:當(dāng)數(shù)據(jù)進(jìn)入衰弱期不再被發(fā)現(xiàn)、更新利用,為了數(shù)據(jù)的安全性和隱私性將被永久性銷毀。
2.科研數(shù)據(jù)生命周期
數(shù)字環(huán)境下數(shù)據(jù)在科研中的地位越來越重要,科研數(shù)據(jù)參與科研的整個過程,經(jīng)過收集分析整理可以用于生成結(jié)果、支持決策、驗(yàn)證成果等??蒲袛?shù)據(jù)的產(chǎn)生都是經(jīng)過科學(xué)研究者精心設(shè)計(jì)獲取的價值較大的數(shù)據(jù),而目前科研數(shù)據(jù)已經(jīng)不再局限于一個科研項(xiàng)目或?qū)B氂谝粋€領(lǐng)域的研究,科研數(shù)據(jù)價值再開發(fā)重復(fù)再利用才是對科研工作者的尊重。所以,科研數(shù)據(jù)開放共享是數(shù)字環(huán)境下發(fā)展的共同需求,科研數(shù)據(jù)生命周期具有豐富性和動態(tài)化特征。筆者認(rèn)為科研數(shù)據(jù)生命周期包含以下幾個階段,如圖1所示:
科研數(shù)據(jù)設(shè)計(jì)采集期:根據(jù)科研工作者需求制定一定的采集規(guī)則,收集新的數(shù)據(jù)或者對原有數(shù)據(jù)進(jìn)行更新。
科研數(shù)據(jù)處理分析期:針對收集到的數(shù)據(jù)進(jìn)行存儲、整理、分類、組合、分析等,從中提取有價值信息,進(jìn)行二次加工,從而形成支持研究的情報(bào)。
科研數(shù)據(jù)運(yùn)行使用期:數(shù)據(jù)運(yùn)行使用有一定的曲線波動,情報(bào)數(shù)據(jù)產(chǎn)生后,在研究熱點(diǎn)期使用波動強(qiáng)度較大,隨著研究熱點(diǎn)改變轉(zhuǎn)移,數(shù)據(jù)使用波動會減弱。
科研數(shù)據(jù)安全保護(hù)期:數(shù)據(jù)是資產(chǎn)的話,那么科研數(shù)據(jù)就是流動資產(chǎn),相較于其他數(shù)據(jù)來說科研數(shù)據(jù)的使用價值更大,更新速度更快,更需要安全性保障。
科研數(shù)據(jù)歸檔銷毀期:科研數(shù)據(jù)是可以更新循環(huán)使用的,所以對于活動衰弱但是有潛在價值的科研數(shù)據(jù)的歸檔保存,安全維護(hù)是很重要的。而對于零價值科研數(shù)據(jù)的銷毀也是必要的。
3.科研數(shù)據(jù)開放共享服務(wù)
數(shù)字環(huán)境下,科學(xué)研究已經(jīng)進(jìn)入了數(shù)據(jù)驅(qū)動時代,數(shù)據(jù)將推動科研飛速發(fā)展。不同主體不同視角對于數(shù)據(jù)的分析使用將迸發(fā)出不同的新鮮主題及成果,數(shù)據(jù)開放共享融合使用將成為必然也是當(dāng)前科研迫切需要。
3.1科研數(shù)據(jù)開放共享的意義
科研方法從早期的實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)發(fā)展到現(xiàn)在的數(shù)據(jù)密集型科學(xué),以數(shù)據(jù)為中心的科研探索成為主流科研手段。讀者對于科研成果需求也從早期了解科研結(jié)論發(fā)展到現(xiàn)在對于研究過程研究數(shù)據(jù)的了解需求。從采集獲取數(shù)據(jù)來思考研究方向,科研創(chuàng)新也是更多依賴于海量數(shù)據(jù)的分析整理。數(shù)據(jù)不僅是為科研提供有力支撐,也是科研成果的重要組成部分。
早期階段數(shù)據(jù)開放研究更多指向的是政府公共數(shù)據(jù)開放,開放的是數(shù)據(jù)本身承載的知情權(quán)屬性,政府公共數(shù)據(jù)是所有人的勞動成果,為了更好的服務(wù)社會理應(yīng)開放。目前階段數(shù)據(jù)開放研究指向的是開放數(shù)據(jù)的使用權(quán),把數(shù)據(jù)所有權(quán)歸還給研究者本人,他們有權(quán)進(jìn)行研究成果分享交流,也有權(quán)對研究數(shù)據(jù)進(jìn)行互通有無,那么研究數(shù)據(jù)不再只是研究成果的支撐,也會變成檢驗(yàn)研究成果的證據(jù)。通過數(shù)據(jù)開放為科研思想提供新的內(nèi)容,進(jìn)而推動其多方向發(fā)展創(chuàng)新。
3.2科研數(shù)據(jù)開放共享服務(wù)
通過對數(shù)據(jù)生命周期各階段的理解認(rèn)識,根據(jù)科研數(shù)據(jù)的實(shí)際特征,聯(lián)想出科研數(shù)據(jù)生命周期幾大階段?;诳蒲袛?shù)據(jù)生命周期設(shè)計(jì)科研數(shù)據(jù)開放共享服務(wù)幾大模塊。
①科研數(shù)據(jù)開放采集模塊??蒲袛?shù)據(jù)開放,是為科研工作者提供一個自由交流數(shù)據(jù)的開放平臺,從科研成果發(fā)表開始,可以以單位或者以專業(yè)為主體進(jìn)行采集,明確主體責(zé)任,明確采集規(guī)則程序,通過數(shù)據(jù)使用價值曲線波動情況分析采集不同類別數(shù)據(jù)。
②科研數(shù)據(jù)開放整理模塊。對采集到的科研數(shù)據(jù)進(jìn)行加工、整理、分類、匯交、組合、分析等過程,建立分類檢索導(dǎo)航,可以以專業(yè)或研究方向劃分,也可以按照數(shù)據(jù)發(fā)揮作用劃分比如驗(yàn)證型數(shù)據(jù)、支持決策數(shù)據(jù)、結(jié)果證明數(shù)據(jù)、元數(shù)據(jù)、二次數(shù)據(jù)、過程數(shù)據(jù)等等;可以挖掘不同數(shù)據(jù)的共同價值聚合整理;可以把同一數(shù)據(jù)分析出不同價值;在數(shù)據(jù)整理模塊需要投入更高的分析技術(shù)和專業(yè)型人才。
③科研數(shù)據(jù)開放安全保護(hù)模塊。科研數(shù)據(jù)開放共享并不是完全無條件的,所有的自由都是相對而言的,科研數(shù)據(jù)相較于一般數(shù)據(jù)來說更具有使用研究價值也更具隱私保密性,需要較好的安全維護(hù)。針對科研數(shù)據(jù)的安全,可以對其進(jìn)行權(quán)限劃分,比如一般的過程數(shù)據(jù)、網(wǎng)絡(luò)公共數(shù)據(jù)、顯性數(shù)據(jù)可以開放自由使用,而一些具有專業(yè)加工性質(zhì)的科研數(shù)據(jù),所有者可以要求使用權(quán)限設(shè)置,科研工作者通過注冊申請平臺,可以上傳自己的科研數(shù)據(jù),并設(shè)置權(quán)限屬性,也可以提出共享需求對高級權(quán)限科研數(shù)據(jù)進(jìn)行交互分享,當(dāng)然科研數(shù)據(jù)開放共享不僅僅是下載使用,還為用戶提供科研數(shù)據(jù)成果交流二次創(chuàng)造平臺。做好科研數(shù)據(jù)安全保護(hù)是尤為重要的一個環(huán)節(jié)。
④科研數(shù)據(jù)開放使用模塊??蒲袛?shù)據(jù)開放使用,提供科研數(shù)據(jù)存儲、科研數(shù)據(jù)上傳、科研數(shù)據(jù)查詢、科研數(shù)據(jù)下載、科研數(shù)據(jù)需求申請、科研數(shù)據(jù)復(fù)制、科研數(shù)據(jù)更新等服務(wù),用戶可以根據(jù)自己的需求情況進(jìn)行使用。
⑤科研數(shù)據(jù)開放歸檔銷毀模塊。科研數(shù)據(jù)流動性時效性是非常強(qiáng)的,每個數(shù)據(jù)都有自己的活動曲線,曲線的趨勢緊跟科研數(shù)據(jù)的使用價值發(fā)揮情況,而科研數(shù)據(jù)的使用價值又與科研熱點(diǎn)息息相關(guān),盡可能的通過分類分析加工組合等手段挖掘科研數(shù)據(jù)的顯性隱性價值是科研數(shù)據(jù)開放共享平臺的服務(wù)宗旨,對于有潛在價值的科研數(shù)據(jù)進(jìn)行歸檔留存,而對于價值衰退的科研數(shù)據(jù)為了保密和隱私進(jìn)行銷毀也是必要程序。
除了以上五大模塊,從建立數(shù)據(jù)采集獲取模塊,進(jìn)而對這些數(shù)據(jù)進(jìn)行整理分類分析建立可供檢索的數(shù)據(jù)分類導(dǎo)航模塊。并構(gòu)想科研數(shù)據(jù)保護(hù)規(guī)則,區(qū)分隱私保護(hù)、授權(quán)共享、無限制開放及使用條件設(shè)置,最后安全儲存銷毀科研數(shù)據(jù),科研數(shù)據(jù)開放共享平臺還可以為用戶提供交流反饋建議,以期更好地為科研服務(wù)。
4.結(jié)語
科研數(shù)據(jù)是科研工作者努力的結(jié)晶,被科研工作者看做私人財(cái)產(chǎn),大部分科研工作者對于科研數(shù)據(jù)開放共享還有一定的不舍情緒,會存在勝利果實(shí)被竊取的感覺。但是,越來越多的科研工作者發(fā)現(xiàn)科研數(shù)據(jù)存在重復(fù)、老化、費(fèi)時費(fèi)力費(fèi)錢等問題,甚至有些科研過程完全沒有必要,造成各種成本的浪費(fèi),數(shù)據(jù)孤島現(xiàn)象依然存在。如何讓科研數(shù)據(jù)重復(fù)利用起來,如何打破數(shù)據(jù)孤島現(xiàn)象,如何更好的發(fā)揮科研數(shù)據(jù)應(yīng)有的價值,科研小圈子中已經(jīng)有科研工作者通過努力和不同方式嘗試對于科研數(shù)據(jù)進(jìn)行了開放共享,這種觀念的轉(zhuǎn)變將促進(jìn)科研工作者踴躍參與開放共享科研數(shù)據(jù)中來,也更能推動各種科研數(shù)據(jù)開放共享平臺的建設(shè)發(fā)展??蒲袛?shù)據(jù)開放共享服務(wù)將成為現(xiàn)在乃至未來科研界必備服務(wù)。
參考文獻(xiàn)
[1]劉金亞,顧立平,張瀟月,陳新蘭. 開放科研數(shù)據(jù)環(huán)境下科研人員的數(shù)據(jù)倫理框架研究[J]. 情報(bào)理論與實(shí)踐,,:1-10.
[2]劉桂鋒,張?jiān)#K文成,宋新平. 高??蒲袛?shù)據(jù)平臺功能定位與優(yōu)化研究——基于眼動追蹤實(shí)驗(yàn)[J]. 情報(bào)理論與實(shí)踐,,:1-11.
[3]王丹丹,吳思潔. 英國科研數(shù)據(jù)開放共享的關(guān)鍵問題思考[J]. 情報(bào)雜志,2020,39(09):163-167+182.
[4]姜鑫,馬海群,王德莊. 國外科研機(jī)構(gòu)開放科學(xué)數(shù)據(jù)與個人數(shù)據(jù)保護(hù)的政策協(xié)同研究——基于愛丁堡大學(xué)《數(shù)據(jù)保護(hù)政策》的案例分析[J]. 檔案學(xué)研究,2020,(04):135-143.
[5]顧立平,陳新蘭,張瀟月,劉金亞. 開放科研數(shù)據(jù)中的數(shù)據(jù)價值提升策略[J]. 圖書館論壇,2020,40(09):115-124.
基金項(xiàng)目:北華航天工業(yè)學(xué)院科研基金項(xiàng)目;項(xiàng)目編號:KY-2020-36
項(xiàng)目名稱:數(shù)字環(huán)境下科研數(shù)據(jù)開放共享服務(wù)研究
作者簡介:楊園利(1987.09-),女,河北廊坊人,碩士研究生,館員,研究方向?yàn)楦偁幥閳?bào)、信息管理。