周玉華
摘 要:網(wǎng)絡時代的迅速發(fā)展使得人們的生活有了質(zhì)的飛躍,同時網(wǎng)絡的廣泛應用也使其產(chǎn)生了繁多的網(wǎng)絡大數(shù)據(jù),通過大數(shù)據(jù)分析可以決策出用戶的消費習慣、消費比例等,從而預測出企業(yè)重點發(fā)展的方向,因此,大數(shù)據(jù)分析是十分重要且有價值的?,F(xiàn)如今,大數(shù)據(jù)分析已經(jīng)被廣泛應用于各個行業(yè)領域,也能夠為各領域做出合理的預判和決策,一定程度幫助企業(yè)更好地發(fā)展,這就使得圖書館管理中通過大數(shù)據(jù)分析用戶喜歡的圖書類型數(shù)據(jù)成為必然趨勢。
關鍵詞:大數(shù)據(jù)分析;圖書館管理與服務;應用
圖書館的圖書種類、借閱和歸還記錄數(shù)據(jù)均種類繁多且復雜,圖書館管理員對此類數(shù)據(jù)的整理挖掘工作不僅耗費時間同時也耗費人力、物力,大數(shù)據(jù)分析技術(shù)能很好地解決這一問題,且其對數(shù)據(jù)的挖掘更為精準和高效。大數(shù)據(jù)分析技術(shù)將分析出的數(shù)據(jù)通過可視化圖形界面展示,以供圖書管理工作者分析和管理滿足用戶需求的書籍,使得人們在快節(jié)奏的生活中能得到解脫,暢游在書本中。
一、大數(shù)據(jù)的發(fā)展
以史為鑒可以知興替,因此想要深入了解互聯(lián)網(wǎng)技術(shù),就必須清楚知曉其發(fā)展變化史,大數(shù)據(jù)亦是如此。
首先大數(shù)據(jù)概念和技術(shù)提出于20世紀初期,與之對應的數(shù)據(jù)模型mapreduce應用而生,同年,谷歌完成了基于此模型的開源實現(xiàn),即handoop的產(chǎn)生,mapreduce模型提出初期并未被業(yè)內(nèi)人士所關注和重視,同樣的handoop平臺未被廣泛且全面的使用,主要原因是當時大數(shù)據(jù)概念提出和其價值探索正處于萌芽階段,人們對大數(shù)據(jù)沒有深入的概念認知和了解,同樣也不會關注大數(shù)據(jù)挖掘平臺。
2008年第一家以大數(shù)據(jù)挖掘為理論基礎,以handoop為開發(fā)平臺的企業(yè)誕生了,當時大數(shù)據(jù)挖掘和其價值性還處于探索中,因此其只為部分的中小型企業(yè)提供大數(shù)據(jù)解決方案。2009年3月,該企業(yè)發(fā)布了第一款基于handoop開發(fā)平臺的分部式數(shù)據(jù)挖掘系統(tǒng),同年,大數(shù)據(jù)發(fā)展迎來了曙光,迎來了業(yè)內(nèi)人士的關注和重視,多數(shù)企業(yè)開始躍躍欲試。
2008年以后,第一家啟用handoop分布式開發(fā)平臺進行大數(shù)據(jù)挖掘的企業(yè)嘗到了甜頭,同時也通過企業(yè)的努力和對技術(shù)的探索向互聯(lián)網(wǎng)企業(yè)和業(yè)內(nèi)人士證明了大數(shù)據(jù)的挖掘價值,當時有兩家互聯(lián)網(wǎng)企業(yè)也投入到handoop的數(shù)據(jù)挖掘中。
發(fā)展至今,大數(shù)據(jù)已經(jīng)成為耳熟能詳?shù)募夹g(shù),也成為人盡皆知的詞匯,這一切都離不開業(yè)內(nèi)人士和相關互聯(lián)網(wǎng)企業(yè)對技術(shù)的探索和對市場的定位。如今,大數(shù)據(jù)提高了各種領域、各類企業(yè)的數(shù)據(jù)處理效率和精準度,同時也依據(jù)互聯(lián)網(wǎng)數(shù)據(jù)準確的預測出市場變動和市場需要。如大數(shù)據(jù)挖掘會依據(jù)淘寶平臺的搜索記錄推薦用戶需要購買或可能購買的物品;再如,商場的人流量數(shù)據(jù)可以挖掘出商場應該拓展的業(yè)務,使其更好的服務于消費者。這一切都來源大數(shù)據(jù)技術(shù),其對人們的生活帶來了本質(zhì)的改變和極大的便利。
二、大數(shù)據(jù)技術(shù)
大數(shù)據(jù)是指人們使用網(wǎng)絡工具所產(chǎn)生的數(shù)據(jù),如淘寶、京東、醫(yī)療數(shù)據(jù)、多媒體數(shù)據(jù)等,此類數(shù)據(jù)對用戶是不可見的,但電商平臺或網(wǎng)絡企業(yè)會通過一定的采集技術(shù)獲取用戶的搜索記錄或瀏覽記錄,將數(shù)據(jù)按照一定的格式存儲在數(shù)據(jù)倉庫,然后通過計算機軟件進行分析和處理,進而得出用戶的消費記錄或有利于企業(yè)發(fā)展的預測數(shù)據(jù)。大數(shù)據(jù)的發(fā)展也使得各領域企業(yè)能夠適應用戶需求而發(fā)展進步,也因其對數(shù)據(jù)的預測功能被廣泛應用于媒體行業(yè),以預測用戶需求。
1.數(shù)據(jù)集成
大數(shù)據(jù)類型繁多且復雜,不同企業(yè)需要采集的大數(shù)據(jù)也各有不同,這就使得大數(shù)據(jù)集成極為困難,統(tǒng)一的工具很難滿足不同企業(yè)的應用數(shù)據(jù),因此大數(shù)據(jù)平臺對其分門別類,對不同的數(shù)據(jù)類型使用不同的集成工具。如采集企業(yè)事物數(shù)據(jù)的ETL工具、采集網(wǎng)頁瀏覽數(shù)據(jù)的Spider爬蟲工具、采集企業(yè)產(chǎn)品運行的日志工具、采集結(jié)構(gòu)化數(shù)據(jù)的文件數(shù)據(jù)集成工具、采集實時數(shù)據(jù)的集成工具等。
2.大數(shù)據(jù)保存引擎
數(shù)據(jù)類型不同存儲的引擎方式不同,如企業(yè)大數(shù)據(jù)使用數(shù)據(jù)庫引擎保存事務型數(shù)據(jù),對地圖大數(shù)據(jù)多采用實時搜索和分析引擎存儲,對于普通數(shù)據(jù)、視頻數(shù)據(jù)等多采用數(shù)據(jù)倉庫存儲,數(shù)據(jù)倉庫會按照數(shù)據(jù)類別分門別類的保存數(shù)據(jù),以供計算機軟件分析和處理。
3.大數(shù)據(jù)分析處理
數(shù)據(jù)的集成和存儲就是為了更好的分析數(shù)據(jù),大數(shù)據(jù)經(jīng)過分析處理以后就非常具有商業(yè)價值,能夠為企業(yè)、電商平臺、商場等提供可以參考的預判數(shù)據(jù)。大數(shù)據(jù)處理分析多使用計算機相關軟件,如地圖數(shù)據(jù)使用EMC的GreenPlum、Oracle的Exadata,數(shù)據(jù)實時性要求不高時可使用MySQL的列式存儲Infobright、視頻音頻文件等大數(shù)據(jù)可使用Hadoop。這些都是技術(shù)較為成熟的數(shù)據(jù)分析軟件,這些軟件可以根據(jù)企業(yè)需求設定預先目標,對數(shù)據(jù)進行分析處理以供數(shù)據(jù)挖掘。
三、大數(shù)據(jù)的價值
1.技術(shù)價值
大數(shù)據(jù)開發(fā)的技術(shù)價值不言而喻,其互聯(lián)網(wǎng)技術(shù)涵蓋范圍極為廣泛。首先是數(shù)據(jù)采集工作,各類互聯(lián)網(wǎng)數(shù)據(jù)或企業(yè)數(shù)據(jù)大多繁雜,且數(shù)據(jù)產(chǎn)生多具有實時性,因此其采集工作極為復雜,要求必須保證數(shù)據(jù)的可靠性、完整性以及時效性,且需要對重復性數(shù)據(jù)進行合理有效的過濾。目前,數(shù)據(jù)采集主要依靠于運營數(shù)據(jù)庫、社交網(wǎng)絡和傳感設備等,不同的數(shù)據(jù)需要的采集技術(shù)也不盡相同。這對技術(shù)人員和計算機技術(shù)是極大的挑戰(zhàn)。其次,數(shù)據(jù)預處理階段則主要針對數(shù)據(jù)的遺漏值、噪音數(shù)據(jù)、類型不一致數(shù)據(jù)等的處理,遺漏數(shù)據(jù)多采用忽略處理或選取平均屬性處理;降噪處理多選用平滑處理或計算機人工檢查等,類型不一致數(shù)據(jù)則直接采用手動更改即可。最后,數(shù)據(jù)挖掘則采用以mepreduce模型實現(xiàn)的開源的handoop分布式平臺進行開發(fā),語言多采用java程序設計語言,這對專業(yè)技術(shù)類人才有較高的要求,必須了解各類開發(fā)語言。因此,大數(shù)據(jù)技術(shù)極大推進了互聯(lián)網(wǎng)技術(shù)的發(fā)展和新型技術(shù)的變革。
2.商業(yè)價值
大數(shù)據(jù)并非只是淺顯的互聯(lián)網(wǎng)數(shù)據(jù),其背后蘊藏著巨大的商機,大數(shù)據(jù)可以挖掘出任何潛在信息,如客流統(tǒng)計、客戶定位人群、企業(yè)營業(yè)額、商場店鋪人群等多種與企業(yè)發(fā)展相關的數(shù)據(jù),以此為依據(jù)可以有效的幫助企業(yè)決策和發(fā)展。數(shù)據(jù)不僅是度量方式,對其進行合理有效的挖掘能夠?qū)κ袌鰻I業(yè)狀況進行合理的推測和決策,有助于企業(yè)進一步了解市場需要和客戶需求,從而推算出潛在客戶。大數(shù)據(jù)的商業(yè)價值在于企業(yè)的運營具備更高的效率、更低的市場營銷成本、更為可靠和準確的市場調(diào)研及產(chǎn)品定位,長遠來看,其商業(yè)價值不可估量。
四、大數(shù)據(jù)在圖書管理中的現(xiàn)狀
1.圖書管理工作者無法摒棄傳統(tǒng)管理方式
圖書館的管理對象是書籍,多數(shù)圖書館均依照傳統(tǒng)的編碼方式對書籍進行統(tǒng)計管理,且圖書管理工作者多為年長的教育工作者,其很難摒棄傳統(tǒng)的管理方式而借助先進的信息技術(shù),因此圖書館的運營模式整體依舊保留傳統(tǒng)的管理方式,甚至在引入大數(shù)據(jù)技術(shù)后管理者依然難以接受新生事物,造成資源浪費,排斥先進技術(shù)是目前多數(shù)圖書館管理中存在的問題。
2.缺乏綜合性管理人才
目前,圖書館引入大數(shù)據(jù)挖掘技術(shù)的重要阻礙就是人員素質(zhì)問題。大數(shù)據(jù)技術(shù)中搜索、查詢等技術(shù)需要工作人員具備一定的計算機基礎,或?qū)Υ髷?shù)據(jù)技術(shù)有一定的了解,尤其是在處理繁多復雜的圖書書籍和借閱數(shù)據(jù)時,大數(shù)據(jù)技術(shù)的處理效率和精度遠高于人工處理時效,因此圖書管理工作者必須會利用大數(shù)據(jù)技術(shù)管理圖書數(shù)據(jù)。提高圖書管理工作者的綜合素質(zhì)是當務之急。
3.缺乏完善的管理體系
目前,圖書館管理服務極為落后,圖書查找仍依靠人工和編碼校對,大數(shù)據(jù)技術(shù)引入后管理體系正處于發(fā)展和變革階段,管理體系尚未完善,同時,管理人員也缺乏基礎的計算機技術(shù)。大數(shù)據(jù)技術(shù)的引入也并未得到管理工作人員的重視,使得其顯得格格不入,不能被真正的發(fā)揮數(shù)據(jù)管理方面的作用。
五、大數(shù)據(jù)在圖書館管理中應用
大數(shù)據(jù)采集、存儲、分析技術(shù)恰好能夠適應圖書館管理工作中繁多且復雜的數(shù)據(jù)類型,通過大數(shù)據(jù)分析技術(shù)能挖掘出讀者喜歡的書籍類型,形成大數(shù)據(jù)分析報告,同時也能為圖書館管理工作做出適當?shù)臎Q策和業(yè)務分析。
1.精準分析讀者的閱讀興趣
圖書館管理服務中可以通過搭建大數(shù)據(jù)平臺對讀者喜愛的書籍類型進行定位和分析,數(shù)據(jù)采集渠道可通過讀者借閱信息和書籍借閱流量等數(shù)據(jù)作為分析數(shù)據(jù),進而對其集成存儲,通過計算機軟件分析統(tǒng)計,挖掘出有價值的數(shù)據(jù)線索,以供管理工作者定位分析。此類平臺都有可以滿足圖書館管理工作者參考的可視化界面,上層數(shù)據(jù)是大數(shù)據(jù)挖掘出的可用數(shù)據(jù),底層是相關數(shù)據(jù)分析軟件。大數(shù)據(jù)可以幫助圖書館管理工作者分析讀者喜愛的書籍種類,同時也可幫助整理讀書資料等,以便讀者借閱。
2.振興書籍閱讀
圖書館管理工作中引入大數(shù)據(jù)挖掘技術(shù)對通過書籍閱讀的方式產(chǎn)生了巨大的沖擊,電子書的智能性、數(shù)字化、易攜帶等優(yōu)勢使得書籍閱讀的讀者數(shù)量逐年遞減,毫無疑問在閱讀方式的比拼中,書本閱讀的方式遠不及電子書籍。大數(shù)據(jù)技術(shù)的引入使得書本閱讀的方式有了很好的轉(zhuǎn)機。大數(shù)據(jù)技術(shù)為書本閱讀方式提供了迅速變革的新想法也提供了相應的技術(shù)手段,同時大數(shù)據(jù)技術(shù)在圖書館管理員服務中的應用使的書本閱讀和電子書本閱讀可以進行優(yōu)勢互補、信息共享,極大程度提升書籍閱讀的競爭力,這需要相關工作部門和專業(yè)類人才勇于探索實踐,為振興書籍閱讀開辟出一條成功發(fā)展之路。大數(shù)據(jù)技術(shù)支撐的圖書館管理工作應該具有數(shù)據(jù)收集能力和數(shù)據(jù)分析處理能力,不論是書籍數(shù)據(jù)、借閱和歸還數(shù)據(jù)、管理人員信息等都需要具體的數(shù)據(jù)做支撐。
圖書館管理員人員也需要摒棄傳統(tǒng)的管理理念和管理方式,尤其是圖書館的領導者,更應該摒棄傳統(tǒng)的思維模式和觀念,放棄保守、落后的管理方式,與時俱進,保證圖書管理工作的先進性和社會性。真正將大數(shù)據(jù)技術(shù)引入圖書館管理工作中,切實可靠的發(fā)揮信息技術(shù)的真正作用,形成大數(shù)據(jù)背景下新型的圖書管理模式,從而吸引更多熱愛閱讀的讀者,使得大數(shù)據(jù)技術(shù)真正服務于民生。如果管理人員依然保留傳統(tǒng)的觀念和思維方式,拒絕接受新鮮事物則會一定程度延誤書本閱讀方式的發(fā)展和機遇。
3.完善圖書館管理系統(tǒng)
傳統(tǒng)的圖書管理系統(tǒng)只提供圖書出版商、供應商、出版商等數(shù)據(jù)查詢檢索等,并未完成平臺一體化的數(shù)據(jù)分析,后臺的支撐數(shù)據(jù)也多為數(shù)據(jù)庫中固有的、由工作人員定期管理的圖書數(shù)據(jù)。傳統(tǒng)的圖書管理平臺的時效性極差,圖形界面也只為讀者提供了非常簡單的界面和查詢窗口,讀者也只能進行簡單的操作,非常不符合與時俱進的信息技術(shù)規(guī)范,也無法滿足讀者的需求。因此,傳統(tǒng)的圖書管理系統(tǒng)中引入大數(shù)據(jù)技術(shù)作為后臺數(shù)據(jù)支撐已經(jīng)成為時代發(fā)展的必然趨勢。引入大數(shù)據(jù)技術(shù)的圖形管理界面更為人性化,更能滿足讀者的各項需求,同時板塊設計中有依據(jù)大數(shù)據(jù)決策而出的讀者喜愛書籍分類。讀者在借閱和查詢圖書時能夠全面掌握圖書信息,大數(shù)據(jù)挖掘也會依據(jù)讀者的搜索記錄為讀者提供相關的同類書籍以供讀者參考。大數(shù)據(jù)技術(shù)也完善了固有的書籍數(shù)據(jù)庫,摒棄了傳統(tǒng)的依靠人工修改數(shù)據(jù)庫的模式,而且使用大數(shù)據(jù)采集和存儲的相關計算機技術(shù)將書籍數(shù)據(jù)保存至數(shù)據(jù)庫中,并由軟件控制定期更新數(shù)據(jù)庫,從而減少了人力成本。
4.為圖書館管理工作帶來變革
大數(shù)據(jù)從對圖書館書籍數(shù)據(jù)和借閱歸還數(shù)據(jù)進行全面分析,將分析后的數(shù)據(jù)通過可視化界面展示給圖書館管理工作者,以供管理工作者做出數(shù)據(jù)分析,選擇讀者感興趣的書籍分類,從而為數(shù)據(jù)存儲做出合理規(guī)范的決策。此種數(shù)據(jù)分析方式徹底摒棄了傳統(tǒng)分散、獨立的資源整合流程,同時也融合了之前分散的書籍管理方式。當然,大數(shù)據(jù)的精準化、信息化能夠在提高書籍管理效率的同時解放人力,提升了圖書館管理的經(jīng)濟效益,使得圖書館更好地發(fā)展。
圖書館管理工作中引入大數(shù)據(jù)技術(shù)是時代發(fā)展的必然趨勢,大數(shù)據(jù)技術(shù)會以書籍數(shù)據(jù)為依托,搭建數(shù)據(jù)管理平臺,建立完整的數(shù)據(jù)庫,并在此基礎上不斷的擴展變革,從而建立健全完善的管理體系,并協(xié)調(diào)各環(huán)節(jié)的發(fā)展變化和統(tǒng)一。同時,新技術(shù)的引入離不開人才建設,因此相關部門需要培養(yǎng)和打造信息技術(shù)過硬的專業(yè)型人才隊伍,尤其的需要培養(yǎng)適合于圖書管理工作特點的數(shù)據(jù)分析師,全面為振興書籍閱讀方式增添色彩。
六、結(jié)束語
綜上,圖書館管理和服務引入大數(shù)據(jù)分析技術(shù)能為其帶來全方位的改革,當然兩者融合不是一蹴而就的,大數(shù)據(jù)分析技術(shù)在圖書館管理中的應用也不僅僅局限于文章提到的方面,相關工作人員需要不斷地探索實踐,充分發(fā)揮大數(shù)據(jù)分析技術(shù)在圖書館管理工作中的應用,以保證圖書館的經(jīng)濟效益和讀者的需求。
參考文獻:
[1]王 雁.論大數(shù)據(jù)在圖書館管理與服務中的應用[J].科技經(jīng)濟市場,2018
[2]徐寅哲.大數(shù)據(jù)在圖書館管理與服務中的應用[J].科技資訊,2017
[3]張 琦.論大數(shù)據(jù)在圖書館管理與服務中的應用[J].統(tǒng)計與管理,2017
[4]孜亞大汗·拜依孜拉.論大數(shù)據(jù)在圖書館管理與服務中的應用[J];現(xiàn)代職業(yè)教育,2018
[5]李東燕.基于大數(shù)據(jù)在圖書館管理與服務中的應用分析[J];科技經(jīng)濟導刊,2019
[6]陳 風.大數(shù)據(jù)在圖書館管理與服務中的應用[J];科技資訊,2018
(作者單位:廣東省深圳圖書館)