吳曉陽
(南陽醫(yī)學高等??茖W校,河南 南陽 473000)
大數(shù)據(jù)作為一種抽象的概念,目前隨著時代的發(fā)展,大數(shù)據(jù)技術(shù)也越來越完善,以自身具有的體量大、處理速度快、價值高等特點來保障各種信息的有效篩選,為某一決策提供海量的信息。那么將大數(shù)據(jù)應用在圖書館中,通過數(shù)據(jù)采集、信息處理、等多平臺進行信息整合和篩選,有效的提高圖書館的工作效率,同時還能增加圖書館服務種類,此外還能借助大數(shù)據(jù)進行圖書管理制度等的創(chuàng)新,以下對此做出具體分析。
大數(shù)據(jù)的基本特征主要包括以下幾點:1.體量大,以普通計算機為例,其硬盤的容量通常都是TB量級,有些特殊的行業(yè),因?qū)?shù)據(jù)的需求較大,數(shù)據(jù)量已達到EB量級。1EB=1024PB,1PB=1024TB。2.類型復雜,大數(shù)據(jù)中包含了大量的非結(jié)構(gòu)化數(shù)據(jù),并且隨著不斷的發(fā)展,數(shù)據(jù)信息類型逐漸增多,如今已趨向完善,例如音頻、圖片圖像等等,但由于數(shù)據(jù)類型較為復雜,因此必須要確保數(shù)據(jù)處理能力。3.處理速度較高,大數(shù)據(jù)不僅擁有強大的數(shù)據(jù)儲存空間,同時還擁有非常大的信息庫,因此他們的分析處理能力也非常高效,相比其他數(shù)據(jù)來說,大數(shù)據(jù)的處理速度更加高效。4.價值高,大數(shù)據(jù)中可以有效地搜索信息,同時還可以通過篩選,針對性地選出有價值信息,這對項目和管理來說有著非常重要的意義。具體來說,大數(shù)據(jù)的價值不能從單個角度來看,需要全面地進行了解,也正是因為大數(shù)據(jù)所具備的這些特征,才能使其得到廣泛的應用。那么以下則對此做出具體分析。
大數(shù)據(jù)時代的到來為多數(shù)企業(yè)迎來了發(fā)展機遇,同時對圖書館來說也是一個關(guān)鍵性的改變,那么在這一背景下多數(shù)圖書館也在積極做出改變,例如擯棄傳統(tǒng)的管理理念,并加入大數(shù)據(jù)等的信息化建設,以此提高圖書館的整體發(fā)展,此外還需不斷的創(chuàng)新管理制度,增加館內(nèi)的圖書資源,最大程度的滿足用戶的多樣性需求。其次還需要在滿足用戶體驗的同時,對數(shù)字資源進行整合,并根據(jù)大數(shù)據(jù)的特點來完成資源整合,以下對此做出列舉。
圖書館加入大數(shù)據(jù)時,首先可借助大數(shù)據(jù)進行資源整合,將所需數(shù)據(jù)錄入到相關(guān)平臺中,但由于內(nèi)容較多且較為復雜,這就需要對數(shù)據(jù)進行有效的篩選,保留價值信息。因此,在采集過程中應首先對采集數(shù)據(jù)進行預處理,借助ETL工具完成這一環(huán)節(jié)的預處理工作,以此來保證大數(shù)據(jù)中獲取信息的有效性。在進行預處理流程時可通過相關(guān)平臺進行數(shù)據(jù)加載,并通過有關(guān)流程進行數(shù)據(jù)篩選。從數(shù)據(jù)源中進行數(shù)據(jù)抽取,再進行轉(zhuǎn)換,最后將目標數(shù)據(jù)存與平臺中。
圖書館數(shù)字資源進行整合時,可借助相關(guān)平臺進行存儲,例如Hadoop平臺,擁有較大的數(shù)據(jù)存儲空間,使其在進行存儲時大大降低存儲成本,可以有效的幫助圖書館數(shù)字資源進行整合,而且Hadoop平臺擁有較低的延時,并發(fā)高,同時還具有非常強大的查詢能力。此外,圖書館在進行數(shù)據(jù)存儲時,通過相關(guān)操作還可以實現(xiàn)分級存儲,形成多級數(shù)據(jù)庫,并且數(shù)據(jù)庫之間不需要進行關(guān)聯(lián)操作,只需要對數(shù)據(jù)進行匯總和分布計算,就可以完成向主數(shù)據(jù)倉庫的數(shù)據(jù)輸出,這樣一來可以大大降低存儲壓力,還能提高數(shù)據(jù)質(zhì)量。
為了實現(xiàn)大數(shù)據(jù)處理這一目標,圖書館可借助大數(shù)據(jù)特點完成,對其進行相關(guān)的數(shù)據(jù)處理,在根據(jù)用戶需求的基礎上對數(shù)據(jù)進行分析和挖掘,此外,大數(shù)據(jù)處理需要較高的時效性,那么這在一定程度內(nèi)增加了處理難度,據(jù)此,可通過MapReduce編程模型對超過1TB的數(shù)據(jù)體量進行運算,最大程度的實現(xiàn)資源的優(yōu)化,使數(shù)據(jù)處理速度得到顯著提升。此外,該模型中Map即分解,有效的將計算任務進行拆分,而Reduce即合并,同時還可以對Map的輸出結(jié)果進行有效匯總。
大數(shù)據(jù)在圖書館的應用中主要具有兩種優(yōu)勢:借助大數(shù)據(jù)特點開展相關(guān)的業(yè)務和服務的創(chuàng)新。通過大數(shù)據(jù)進行服務的創(chuàng)新工作以及服務內(nèi)容的制定。此外,通過大數(shù)據(jù)對圖書館的創(chuàng)新工作,還可以進一步的使圖書館和多種數(shù)據(jù)進行關(guān)聯(lián)融合,最大程度的滿足用戶的多樣化需求。在圖書館圖書資源的采購中,還可以通過多種資源數(shù)據(jù)的管理進行分析,充分了解用戶對采購資源的需求,以此來分析出所購資源是否滿足用戶的實際需求。此外,還可以借助大數(shù)據(jù)推出個性化定制服務,通過數(shù)據(jù)平臺的融合,實現(xiàn)用戶的深層次挖掘和分析,依此來有效的預測出每個用戶的行為目的,并按照預測結(jié)果來為用戶提供個性化的定制服務。與此同時,圖書館還可以借助大數(shù)據(jù)中的可視化操作提供可視化服務,具體來說是將數(shù)據(jù)分析結(jié)果直接展示給用戶,這里的數(shù)據(jù)是指各個領(lǐng)域的研究成果、研究進展等,同時根據(jù)用戶的個人需求,提供個性化的可視化方案。除此之外,圖書館還可以和數(shù)字資源進行融合,為客戶提供一站式的服務,例如數(shù)據(jù)開發(fā)、數(shù)據(jù)分析、數(shù)據(jù)挖掘等。
以上對大數(shù)據(jù)技術(shù)下的圖書館運用做出了分析,通過以上分析可知,大數(shù)據(jù)時代下的圖書館應順應時代的潮流發(fā)展,將圖書館的管理以及功能中加入信息化和數(shù)字化建設,并在此過程中,加入大數(shù)據(jù)技術(shù),使其和圖書館的運營進行有效整合,這樣以來不僅可以提高圖書館的管理水平,同時還能拓展圖書館的服務業(yè)務,最大程度的滿足用戶的資源需求。因此這就需要,相關(guān)行業(yè)重視此方面的整合運用,根據(jù)圖書館的特點加大相關(guān)技術(shù)的研究力度,促進圖書館的良好發(fā)展,使其更好的服務于人民。