馮銳
【摘 要】從背景、技術(shù)實現(xiàn)與決定要素三個角度,論述了高校圖書館服務(wù)延伸工作的嶄新領(lǐng)域——科研數(shù)據(jù)管理。提出開展該服務(wù)的幾項可操作性技術(shù)保障,并從責(zé)任、運維、協(xié)作的角度客觀評價了開展科研數(shù)據(jù)管理的決定因素,以期為實際建設(shè)此項服務(wù)提供有益的參考。
【關(guān)鍵詞】高校圖書館 數(shù)據(jù)管理 知識服務(wù)
1 科研數(shù)據(jù)管理的背景
當(dāng)前,數(shù)據(jù)管理(Digital Curation)已經(jīng)進(jìn)入數(shù)據(jù)庫系統(tǒng)的發(fā)展階段。隨著高校圖書館數(shù)字化設(shè)施的全面普及,信息技術(shù)應(yīng)用更加深入,在資源建設(shè)、平臺再造服務(wù)提升、管理優(yōu)化、協(xié)同創(chuàng)新等方面拾級而上,已成為支撐和保障高校科研的基礎(chǔ)信息設(shè)施。國外一些研究型圖書館已經(jīng)建立數(shù)據(jù)中心(Data Center),而國內(nèi)這一工作是由大學(xué)科研產(chǎn)業(yè)處或者研究機構(gòu)層面在做,圖書館參與的很少且過多的側(cè)重于科研項目和科研環(huán)境的服務(wù),在科研數(shù)據(jù)管理上成為了高校圖書館的服務(wù)盲區(qū),造成許多正式或非正式出版但屬于研究成果的資料,如在研究過程中產(chǎn)生的課件、報告、ppt、圖像等科研數(shù)據(jù)[1],分散在研究者或科研部門手中,缺少集成化的組織和管理。實際上這些數(shù)據(jù)也具有價值,高校圖書館應(yīng)該提高認(rèn)識,依賴多年來圖書館積累下來的信息存儲經(jīng)驗,將這些資料保存起來,加強對科研數(shù)據(jù)有效組織、合理開發(fā)。
2 科研數(shù)據(jù)管理的技術(shù)實現(xiàn)
高校圖書館將科研數(shù)據(jù)存儲到磁盤或其他持久存儲設(shè)備,其核心內(nèi)容是元數(shù)據(jù)存儲位置的映射,承載了數(shù)據(jù)對象本身歸屬、大小、校驗值等元信息,用于記賬、校對、修復(fù)和分析等輔助操作[2]。
2.1 數(shù)據(jù)運行平臺
打造開放平臺,既為科研人員提供豐富高質(zhì)的服務(wù)內(nèi)容,又讓他們自身研究的科研成果在平臺上得以呈現(xiàn),進(jìn)而更加樂于關(guān)注停留在平臺。高校圖書館可以通過建立起類似騰訊CKV(Cloud KeyValue)海量分布式存儲系統(tǒng),打造特色的科研數(shù)據(jù)管理平臺,對本校科研數(shù)據(jù)進(jìn)行集中管理。
2.2 數(shù)據(jù)存儲
科研數(shù)據(jù)可以采取批處理+實時數(shù)據(jù)傳輸兩種方式進(jìn)行存儲,同時提供臨時數(shù)據(jù)緩存功能,創(chuàng)建時指定保存時間。這樣,過期的臨時數(shù)據(jù)則由系統(tǒng)的管理中心自動進(jìn)行刪除,對于重復(fù)的數(shù)據(jù)進(jìn)行及時清理,保證磁盤留有足夠的存儲空間。
2.3 數(shù)據(jù)壓縮
利用輕量級的高效壓縮技術(shù)如Delta Encoding[3],提高存儲科研數(shù)據(jù)的壓縮率,過濾一些無關(guān)數(shù)據(jù)從而減小所占內(nèi)存空間,提升聚合查詢的查詢速度。
2.4 數(shù)據(jù)查詢
科研數(shù)據(jù)查詢系統(tǒng)主要包括存儲層與查詢層,為了滿足數(shù)據(jù)查詢的需求,需要為用戶提供統(tǒng)一的元數(shù)據(jù)訪問和管理接口,支持按照各種維度分層的元數(shù)據(jù),并為異構(gòu)數(shù)據(jù)源提供標(biāo)準(zhǔn)的查詢訪問接口。
2.5 數(shù)據(jù)再利用
通過科研數(shù)據(jù)存儲注冊服務(wù),高校圖書館為社會企業(yè)生產(chǎn)部門、科研機構(gòu)等提供數(shù)據(jù)挖掘、知識發(fā)現(xiàn)和知識推送服務(wù)鏈接,有效提高科研數(shù)據(jù)的再開發(fā)、再利用,使科研數(shù)據(jù)成為支撐知識服務(wù)的知識化資源。
3科研數(shù)據(jù)管理的決定要素
3.1 責(zé)任決定集中的效率
在開展科研數(shù)據(jù)管理延展服務(wù)前,高校圖書館管理者應(yīng)該用更高程度的理性代替高昂的激情,集思廣益,明晰科研數(shù)據(jù)集中管理涉及法律、技術(shù)和政策等多維度因素,及需要承擔(dān)的相應(yīng)責(zé)任,正所謂居安思危,有備無患。在開展服務(wù)時,注重加強知識產(chǎn)權(quán)保護(hù)意識,避免數(shù)據(jù)使用中的侵權(quán)風(fēng)險??蒲袛?shù)據(jù)在一定程度上包含了科研人員的心血,必然有部分人員不舍得將科研數(shù)據(jù)放到平臺,因此圖書館應(yīng)該讓他們有控制感,甚至設(shè)置私人定制密碼,加以權(quán)限保護(hù),給予信任和依賴者以足夠的安全感,及向社會科研企業(yè)推送科研項目信息以提高合作的機率。
3.2 運維決定服務(wù)的品質(zhì)
高校圖書館數(shù)據(jù)庫長期不間斷的運行,服務(wù)器突然掉電、磁盤的失效、磁道老化以及人為操作失誤等,都可能造成數(shù)據(jù)存儲對象的損壞甚至丟失,因此建立一套應(yīng)急機制預(yù)案,及時應(yīng)對宕機的出現(xiàn),保障數(shù)據(jù)庫運行的穩(wěn)定性與可維護(hù)性,保證科研數(shù)據(jù)的安全性對整個服務(wù)延伸過程顯得尤為重要。
3.3 協(xié)作決定延展的廣度
高校圖書館開展科研數(shù)據(jù)管理首先需要跨越不同功能部門的藩籬,科研生產(chǎn)處負(fù)責(zé)學(xué)??蒲辛㈨?、科研經(jīng)費管理及科研成果鑒定等,各院系部負(fù)責(zé)科研人員考核、科研任務(wù)考核等,因而在學(xué)校統(tǒng)一協(xié)調(diào)下,加大高校圖書館與其他部門的協(xié)同服務(wù)機制,組織上各有側(cè)重,功能上各具特色。不同部門之間相互合作,相互促進(jìn),共同推動高??蒲泄ぷ鲾?shù)字化發(fā)展。
4結(jié)語
目前,我國高校圖書館科研數(shù)據(jù)管理不夠成熟,目前尚在孵化階段,但是正如大數(shù)據(jù)改變著世界一樣,科研數(shù)據(jù)管理將推動新一輪高校圖書館服務(wù)的進(jìn)化,只要圖書館凝心聚力,從細(xì)微處著眼,發(fā)現(xiàn)每一個知識化服務(wù)的節(jié)點,從海量數(shù)據(jù)中實時、高效地分析和挖掘出有價值的信息,前瞻未來,也許重要的變革機遇就蘊藏在科研數(shù)據(jù)管理與數(shù)據(jù)發(fā)現(xiàn)中。
參考文獻(xiàn):
[1] 吳建中.大學(xué)圖書館的昨天、今天和明天[J].圖書館雜志,2014(12).
[2] 莫華楓.云存儲的黑暗面:元數(shù)據(jù)保障(上)[J].程序員,2014(4):92-95.
[3] 梁堰波,楊卓犖.基于Impala構(gòu)建實時大數(shù)據(jù)查詢系統(tǒng)實踐[J].程序員,2014(2):52-56.