滑珊
摘 要:近年來(lái),隨著信息基礎(chǔ)設(shè)施的完善與互聯(lián)網(wǎng)現(xiàn)代信息技術(shù)的發(fā)展,電商、社交網(wǎng)絡(luò)等電子網(wǎng)絡(luò)服務(wù)迅速普及,人類(lèi)進(jìn)入大數(shù)據(jù)時(shí)代。2008年,大數(shù)據(jù)概念正式提出,在政府管理、社會(huì)保障等多行業(yè)領(lǐng)域得到廣泛應(yīng)用。圖書(shū)館的建設(shè)受到嚴(yán)重沖擊,大數(shù)據(jù)時(shí)代的新理念對(duì)圖書(shū)館資源建設(shè)及其生存發(fā)展產(chǎn)生重大影響。大數(shù)據(jù)時(shí)代下,建設(shè)數(shù)字圖書(shū)館已成為必然。
關(guān)鍵詞:大數(shù)據(jù)時(shí)代 數(shù)字圖書(shū)館 網(wǎng)絡(luò) 信息
中圖分類(lèi)號(hào):G25 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-9082(2019)02-00-01
信息時(shí)代的發(fā)展使得網(wǎng)絡(luò)信息數(shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng)。2008年,《Nature》雜志正式提出大數(shù)據(jù)一詞,迅速引起業(yè)界與學(xué)界的廣泛關(guān)注,2012年被稱(chēng)為世界大數(shù)據(jù)年,2013年被成為中國(guó)統(tǒng)計(jì)的大數(shù)據(jù)元年,大數(shù)據(jù)在我國(guó)的發(fā)展已勢(shì)不可擋。資源建設(shè)是圖書(shū)館開(kāi)展各項(xiàng)業(yè)務(wù)工作的基礎(chǔ),數(shù)字資源成為圖書(shū)館資源的重要部分。如何利用已有數(shù)字資源,轉(zhuǎn)化為有用的知識(shí)規(guī)則,對(duì)促進(jìn)數(shù)字圖書(shū)館建設(shè)發(fā)展,實(shí)現(xiàn)圖書(shū)館永續(xù)發(fā)展具有重要意義。
一、大數(shù)據(jù)時(shí)代對(duì)數(shù)字圖書(shū)館建設(shè)的影響
大數(shù)據(jù)一般都是以數(shù)量巨大,種類(lèi)繁多存在的非結(jié)構(gòu)性數(shù)據(jù),在百科中也被稱(chēng)為海量數(shù)據(jù),巨量數(shù)據(jù),簡(jiǎn)單說(shuō)就是涉及的數(shù)據(jù)量非常巨大,無(wú)法采用人工的方式進(jìn)行數(shù)據(jù)的處理和截取,也不能根據(jù)人們的實(shí)際要求進(jìn)行信息的解讀。大數(shù)據(jù)是一場(chǎng)數(shù)據(jù)革命,是一場(chǎng)思維變革,大數(shù)據(jù)時(shí)代下,數(shù)據(jù)已成為一種重要的戰(zhàn)略資源,可通過(guò)巧妙的應(yīng)用激發(fā)新產(chǎn)品服務(wù)。創(chuàng)造更大的價(jià)值。數(shù)字資源是數(shù)字化技術(shù)與電子出版技術(shù)發(fā)展的產(chǎn)物,是現(xiàn)代文獻(xiàn)信息的主要形式之一,狹義上說(shuō),數(shù)字資源是以數(shù)字化將文字、圖像等形式信息存在在非印刷介質(zhì)上,通過(guò)計(jì)算機(jī)設(shè)備再現(xiàn)的信息資源。
數(shù)字資源是圖書(shū)館現(xiàn)代館藏中發(fā)展最快與最靈活的資源載體,具有內(nèi)容動(dòng)態(tài)性,容易獲取性等特點(diǎn)。大數(shù)據(jù)時(shí)代的到來(lái)賦予了圖書(shū)館數(shù)字資源新的內(nèi)涵。大數(shù)據(jù)環(huán)境下,以文本為主的結(jié)構(gòu)化學(xué)術(shù)資源不能滿(mǎn)足用戶(hù)需求,用戶(hù)在使用移動(dòng)圖書(shū)館中會(huì)產(chǎn)生大量非結(jié)構(gòu)化數(shù)據(jù)信息。圖書(shū)館對(duì)數(shù)字資源進(jìn)行加工取舍,以專(zhuān)業(yè)信息推送服務(wù)方式傳達(dá)給用戶(hù)。圖書(shū)館可向社會(huì)提供大批結(jié)構(gòu)規(guī)范的數(shù)字文獻(xiàn)信息。圖書(shū)館可對(duì)業(yè)務(wù)流程數(shù)據(jù)進(jìn)行挖掘分析整理。實(shí)現(xiàn)館藏文獻(xiàn)資源與讀者服務(wù)的最佳結(jié)合。
大數(shù)據(jù)環(huán)境下,海量數(shù)據(jù)收集的條件與能力得到很大提高。數(shù)據(jù)總量的爆炸式增長(zhǎng)帶來(lái)了數(shù)據(jù)雜、垃圾數(shù)據(jù)多等新的問(wèn)題。有效收集利用有價(jià)值的數(shù)據(jù)成為促進(jìn)數(shù)字圖書(shū)館更好發(fā)展的重要途徑。圖書(shū)館數(shù)字資源融合強(qiáng)調(diào)基于同一平臺(tái)的異構(gòu)融合,跨越時(shí)空與不同類(lèi)型圖書(shū)館的界限,實(shí)現(xiàn)技術(shù)與服務(wù)的融合。大數(shù)據(jù)時(shí)代,圖書(shū)館數(shù)據(jù)資源來(lái)源廣泛,只有在實(shí)現(xiàn)數(shù)據(jù)資源庫(kù)全面開(kāi)放的前提下才能獲取有價(jià)值的完整數(shù)據(jù)。
數(shù)字資源由數(shù)字資源集成整合演變而來(lái),在數(shù)字資源建設(shè)共享中發(fā)揮重要的作用。數(shù)字資源整合是圖書(shū)情報(bào)領(lǐng)域的重要研究?jī)?nèi)容,數(shù)字資源整合是大數(shù)據(jù)環(huán)境下集成發(fā)展的新方向。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)字資源范圍不斷拓展。大數(shù)據(jù)環(huán)境下,完整的數(shù)據(jù)化大數(shù)據(jù)成為數(shù)字資源融合的主要對(duì)象。
大數(shù)據(jù)時(shí)代,在云計(jì)算技術(shù)的推動(dòng)下,數(shù)據(jù)處理能力不斷提高,圖書(shū)館數(shù)據(jù)資源融合是完整的所有數(shù)據(jù)化的圖書(shū)館大數(shù)據(jù)的融合。將所有與圖書(shū)館相關(guān)的數(shù)據(jù)信息組合成完整的有機(jī)體,以獲得更多大的價(jià)值。圖書(shū)館數(shù)據(jù)資源融合包括同一主題不同來(lái)源的數(shù)據(jù)融合,與其他信息機(jī)構(gòu)的數(shù)據(jù)融合等。
二、數(shù)字圖書(shū)館資源融合措施
大數(shù)據(jù)環(huán)境下,圖書(shū)館數(shù)字資源融合平臺(tái)通過(guò)融合完整圖書(shū)館大數(shù)據(jù),有利于促進(jìn)圖書(shū)館所有數(shù)據(jù)資源的共享共建。最終應(yīng)用于圖書(shū)館業(yè)務(wù)流程改善與信息服務(wù)提供。業(yè)務(wù)數(shù)據(jù)是圖書(shū)館大數(shù)據(jù)的重要部分,通過(guò)分析采集的數(shù)字圖書(shū)館數(shù)據(jù)融合,可總結(jié)出圖書(shū)館業(yè)務(wù)開(kāi)展中存在的規(guī)律問(wèn)題。通過(guò)分析圖書(shū)館流通數(shù)據(jù)檢索,可對(duì)檢索工具的簡(jiǎn)易性與檢索結(jié)果的準(zhǔn)確性進(jìn)行評(píng)價(jià)。
大數(shù)據(jù)時(shí)代下,大規(guī)模的數(shù)據(jù)需用更加先進(jìn)的技術(shù)工具進(jìn)行數(shù)據(jù)處理分析,發(fā)現(xiàn)提取海量數(shù)據(jù)中隱藏的有價(jià)值的信息,利用流量數(shù)據(jù)分析、預(yù)測(cè)預(yù)警模型等多方面,成為近年來(lái)各行業(yè)的關(guān)注熱點(diǎn)。
圖書(shū)館大數(shù)據(jù)獲取指通過(guò)RFID射頻識(shí)別、閱讀終端設(shè)備、移動(dòng)互聯(lián)網(wǎng)及圖書(shū)館數(shù)字資源融合平臺(tái)的數(shù)據(jù)接口,實(shí)現(xiàn)完整的圖書(shū)館大數(shù)據(jù)處理工作。圖書(shū)館大數(shù)據(jù)獲取主要包括對(duì)圖書(shū)館資源數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)等數(shù)據(jù)獲取,采集圖書(shū)館大數(shù)據(jù)中,數(shù)據(jù)類(lèi)型復(fù)雜多樣,需利用ETL工具對(duì)圖書(shū)館大數(shù)據(jù)進(jìn)行預(yù)留處理,以提高數(shù)字圖書(shū)館數(shù)據(jù)收集的可靠性與準(zhǔn)確性。
圖書(shū)館大數(shù)據(jù)存儲(chǔ)指將批量的不同來(lái)源的圖書(shū)館大數(shù)據(jù)經(jīng)抽取、轉(zhuǎn)換等預(yù)處理工作后存儲(chǔ)到不同介質(zhì)中。
以便圖書(shū)館大數(shù)據(jù)的處理應(yīng)用。大數(shù)據(jù)時(shí)代的圖書(shū)館數(shù)字資源融合平臺(tái)采取分布式存儲(chǔ)方式,將圖書(shū)館數(shù)據(jù)資源存儲(chǔ)到Hadoop平臺(tái)上,提供海量數(shù)據(jù)的分布式存儲(chǔ)。Hadoop集群實(shí)現(xiàn)低成本的存儲(chǔ)與高并發(fā)的查詢(xún)能力。
圖書(shū)館大數(shù)據(jù)的應(yīng)用指將圖書(shū)館大數(shù)據(jù)分析結(jié)果應(yīng)用于圖書(shū)館業(yè)務(wù)開(kāi)展中,以拓展圖書(shū)館服務(wù)內(nèi)容形式。大數(shù)據(jù)的核心是建立在相關(guān)分析基礎(chǔ)上的預(yù)測(cè),圖書(shū)館可同融合關(guān)聯(lián)數(shù)據(jù)為用戶(hù)提供預(yù)測(cè)服務(wù),為企業(yè)制定競(jìng)爭(zhēng)策略提供支持。
結(jié)語(yǔ)
大數(shù)據(jù)時(shí)代的發(fā)展為數(shù)字圖書(shū)館的資源建設(shè)與信息服務(wù)產(chǎn)生重大影響,要實(shí)現(xiàn)數(shù)字圖書(shū)館更好的發(fā)展,必須融合所有完整的數(shù)據(jù),通過(guò)大數(shù)據(jù)技術(shù)進(jìn)行數(shù)據(jù)挖掘分析,發(fā)現(xiàn)數(shù)字圖書(shū)館大數(shù)據(jù)潛在的價(jià)值,以改善信息服務(wù)。圖書(shū)館數(shù)字資源融合通過(guò)數(shù)據(jù)公開(kāi)共享,實(shí)現(xiàn)數(shù)據(jù)技術(shù)平臺(tái)的融合,為其發(fā)展提供更好的條件支持。
參考文獻(xiàn)
[1]丘莉莉.我國(guó)高校數(shù)字圖書(shū)館知識(shí)服務(wù)現(xiàn)狀及發(fā)展策略研究[J].赤子(上中旬),2014(21):271+32.
[2]黃寅焱,霍麗麗.探索中國(guó)數(shù)字圖書(shū)館建設(shè)發(fā)展之路——評(píng)《數(shù)字圖書(shū)館建設(shè)研究》[J].黑龍江檔案,2016(05):102.
[3]胡昌平,谷斌.數(shù)字圖書(shū)館建設(shè)及其業(yè)務(wù)拓展戰(zhàn)略——國(guó)家可持續(xù)發(fā)展中的圖書(shū)情報(bào)戰(zhàn)略分析(4)[J].中國(guó)圖書(shū)館學(xué)報(bào),2005(05):13-16+33.
[4]柯珠華.網(wǎng)絡(luò)信息技術(shù)發(fā)展對(duì)高校圖書(shū)館知識(shí)服務(wù)影響研究[J].福建師大福清分校學(xué)報(bào),2017(03):91-96.
[5]秦虹.堅(jiān)持科學(xué)發(fā)展觀(guān) 加快黨校數(shù)字圖書(shū)館建設(shè)步伐——“全國(guó)黨校系統(tǒng)數(shù)字圖書(shū)館建設(shè)工作會(huì)議”召開(kāi)[J].情報(bào)資料工作,2006(01):109-110.