胡燕紅
[摘 要] 對大數(shù)據(jù)概念及大數(shù)據(jù)產(chǎn)生的背景進行了介紹,對大數(shù)據(jù)時代高職院校圖書館工作遇到的機遇與挑戰(zhàn)進行了探討,提出了高職院校圖書館在大數(shù)據(jù)環(huán)境下的發(fā)展策略。
[關(guān) 鍵 詞] 高職院校圖書館;大數(shù)據(jù);發(fā)展策略
[中圖分類號] G717 [文獻標志碼] A [文章編號] 2096-0603(2018)21-0196-02
隨著以博客、微博、微信、社交網(wǎng)絡(luò)、基于位置的服務(wù)、LBS為代表的新型信息發(fā)布方式的出現(xiàn),以及云計算、物聯(lián)網(wǎng)技術(shù)的興起,數(shù)據(jù)正以前所未有的速度增長和累積,大數(shù)據(jù)時代已經(jīng)來到。大數(shù)據(jù)時代,大學圖書館將在數(shù)據(jù)存儲、數(shù)據(jù)挖掘、數(shù)據(jù)分析等各個方面面臨挑戰(zhàn)與考驗。大學圖書館必須采用更好的發(fā)展策略才能實現(xiàn)自身功能。
一、大數(shù)據(jù)的基本概念、產(chǎn)生與應(yīng)用
(一)大數(shù)據(jù)的基本概念
大數(shù)據(jù)(Big Data)是一個抽象的概念,從英文字面來看,它表示龐大規(guī)模的數(shù)據(jù)。對于大數(shù)據(jù)(Big Date)學術(shù)界沒有一個公認的定義。一般都是試圖通過大數(shù)據(jù)特征的闡述和歸納給出定義。在這些定義中,認為大數(shù)據(jù)需滿足3個V特點,即滿足規(guī)模性(Volume)、多樣性(Variety)和高速性(Velocity)。除此之外,還有提出第4個V,有機構(gòu)認為大數(shù)據(jù)還應(yīng)當具有價值性Value。維基百科對大數(shù)據(jù)的定義則簡單明了:大數(shù)據(jù)是指利用常用軟件工具捕獲的,管理和處理數(shù)據(jù)所耗時間超過可容忍時間的數(shù)據(jù)集。筆者傾向考慮4V特性闡述的定義,即大數(shù)據(jù)是通過多種工具捕獲的,存在于不同服務(wù)器上可以利用的大規(guī)模的結(jié)構(gòu)與非結(jié)構(gòu)化數(shù)據(jù)。
(二)大數(shù)據(jù)的產(chǎn)生與應(yīng)用
從采用數(shù)據(jù)庫作為數(shù)據(jù)管理的主要方式開始,大數(shù)據(jù)開始產(chǎn)生,數(shù)據(jù)產(chǎn)生方式大致經(jīng)歷了3個階段。
1.運營系統(tǒng)產(chǎn)生數(shù)據(jù)階段
計算機軟件數(shù)據(jù)庫的出現(xiàn),使數(shù)據(jù)管理復(fù)雜度下降,這個階段數(shù)據(jù)庫主要是被運營系統(tǒng)所采用。例如,超市的銷售記錄系統(tǒng)、銀行與證券公司的交易系統(tǒng)、各類醫(yī)院病人的醫(yī)療記錄系統(tǒng)等。這個階段數(shù)據(jù)是由運營活動產(chǎn)生,并記錄在數(shù)據(jù)庫中。比如超市每銷售出一件產(chǎn)品,在數(shù)據(jù)庫中則會產(chǎn)生相應(yīng)的銷售記錄數(shù)據(jù)。這種數(shù)據(jù)的產(chǎn)生方式是被動的。
2.用戶原創(chuàng)內(nèi)容產(chǎn)生數(shù)據(jù)階段
互聯(lián)網(wǎng)的誕生是促使社會產(chǎn)生大量數(shù)據(jù),出現(xiàn)大量數(shù)據(jù)的第二次飛躍。數(shù)據(jù)大規(guī)模產(chǎn)生爆發(fā)于Web2.0時代,而Web2.0的主要標志就是用戶原創(chuàng)內(nèi)容(user generated content)。這類數(shù)據(jù)爆炸性增長有兩大原因,首先,以博客、微博、微信等為代表的新型社交網(wǎng)絡(luò)與工具的出現(xiàn)與發(fā)展,使用戶產(chǎn)生數(shù)據(jù)內(nèi)容的意愿更加強烈。其次,智能手機、平板電腦等移動設(shè)備的出現(xiàn),并可隨時接入網(wǎng)絡(luò),使用戶產(chǎn)生數(shù)據(jù)的途徑更為便捷,數(shù)據(jù)的產(chǎn)生是用戶的主動行為。
3.感知系統(tǒng)產(chǎn)生數(shù)據(jù)階段
人類社會數(shù)據(jù)量產(chǎn)生規(guī)模的第三次飛躍導(dǎo)致了大數(shù)據(jù)的產(chǎn)生,而我們現(xiàn)在正處于這個階段。人們制造的極其微小的帶有處理功能的數(shù)量與種類繁多的傳感器,廣泛地布置于社會的各個角落,這些設(shè)備會源源不斷地自動產(chǎn)生新數(shù)據(jù),這種數(shù)據(jù)的產(chǎn)生方式是自動的。這是大數(shù)據(jù)的主要來源。
二、大數(shù)據(jù)時代下圖書館發(fā)生的變化與面臨的挑戰(zhàn)
(一)用戶對圖書館提供的信息服務(wù)需求發(fā)生了變化
傳統(tǒng)的圖書館信息服務(wù)僅限于為用戶提供數(shù)據(jù)或信息,但在大數(shù)據(jù)時代下,用戶更在意圖書館是否能為自己解決具體問題。大數(shù)據(jù)時代下,用戶不再滿足于圖書館提供整篇的相關(guān)文獻、資料或其他知識產(chǎn)品,而非結(jié)構(gòu)化的數(shù)據(jù)、學科態(tài)勢分析、熱點分析,關(guān)于某一專題不同載體的信息源或經(jīng)過加工的知識產(chǎn)品將會更加受用戶歡迎。
(二)圖書館提供服務(wù)的數(shù)據(jù)規(guī)模與類型擴大
當前,數(shù)據(jù)規(guī)模從以前的TB級別躍升到PB級別,而數(shù)據(jù)類型也更加繁多,如,網(wǎng)絡(luò)日志、音頻、視頻圖片、地理位置信息等。大量非結(jié)構(gòu)化數(shù)據(jù)的出現(xiàn)更是對傳統(tǒng)信息處理能力的極大挑戰(zhàn)。
在圖書館界,非結(jié)構(gòu)化數(shù)據(jù)雖然一直存在,但是圖書館對于非結(jié)構(gòu)化數(shù)據(jù)并不重視也不進行研究。在大數(shù)據(jù)時代,只有將結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)相結(jié)合進行分析,才能充分發(fā)揮大數(shù)據(jù)的功能,發(fā)現(xiàn)其中的價值。
(三)圖書館的信息采集模式和方法受到?jīng)_擊
信息采集是信息處理的第一步,然后再進行數(shù)據(jù)集成、數(shù)據(jù)分析與數(shù)據(jù)管理,傳統(tǒng)的信息采集主要依靠網(wǎng)絡(luò)蜘蛛或其他網(wǎng)絡(luò)信息采集軟件。但是,大數(shù)據(jù)時代下多種類型的數(shù)據(jù)大多用非結(jié)構(gòu)化數(shù)據(jù)庫來解決。因此,圖書館也必須挑戰(zhàn)信息采集模式,重新選擇,定義信息源、采集內(nèi)容、采集頻率、采集量、采集工具等。
(四)信息存儲與處理能力不夠
在大數(shù)據(jù)時代來臨之際,圖書館面臨挑戰(zhàn)以及數(shù)據(jù)存儲與處理問題,全球數(shù)據(jù)量每18個月翻一番,全球數(shù)據(jù)的存儲和處理能力已遠落后于數(shù)據(jù)的增長幅度,對海量數(shù)據(jù)存儲系統(tǒng)擴展能力的要求也會很高,而圖書館的數(shù)據(jù)存儲由于非結(jié)構(gòu)化數(shù)據(jù)來源的不斷增加,數(shù)據(jù)存儲與處理能力嚴重不足。
(五)圖書館信息組織模式發(fā)生變化
傳統(tǒng)的信息組織模式是為用戶提供通用的信息服務(wù)的,而大數(shù)據(jù)時代下的信息組織模式則是為用戶提供個性化、精準化知識服務(wù)為目的,一方面可以對采集、存取的數(shù)據(jù)進行分析和挖掘,通過深入分析和挖掘得出具有價值的信息,從而為決策提供支持;另一方面大數(shù)據(jù)時代圖書館的組織和分析比傳統(tǒng)的信息組織更加重視用戶信息的分析和挖掘,通過分析用戶顯性行為和挖掘隱性行為,從而為用戶提供個性化、精準化的知識服務(wù)。
(六)信息服務(wù)方式和內(nèi)容發(fā)生改變
傳統(tǒng)的信息服務(wù)模式和內(nèi)容雖然能滿足用戶的基本要求,但在大數(shù)據(jù)時代,由于信息源和信息處理技術(shù)的發(fā)展,圖書館的競爭力已不再是其所占信息資源的數(shù)量、范圍等因素,而在于所提供的信息產(chǎn)品的信息化、知識化及其基于知識的創(chuàng)新力。
三、大數(shù)據(jù)時代高職院校圖書館工作思路轉(zhuǎn)變與發(fā)展策略
高職院校圖書館長期為高職教育教學和產(chǎn)學研服務(wù),對高職院校師生的文獻信息需求非常了解,探索出了一系列有針對性的服務(wù)項目。一般來說,高職圖書館信息與數(shù)據(jù)能力建設(shè)資金欠缺,技術(shù)實力較弱,信息處理能力不強,而服務(wù)對象又對前沿技術(shù)追蹤比較緊密。高職院校圖書館在應(yīng)對大數(shù)據(jù)時代的挑戰(zhàn)時,工作思路轉(zhuǎn)變與發(fā)展策略與一般高校圖書館有共性,更有其特殊之處。
(一)增強收集數(shù)據(jù)的意識,特別是對非結(jié)構(gòu)化數(shù)據(jù)的提取
大規(guī)模、高度信息化的數(shù)據(jù)收集和分析將改變科學技術(shù)的開發(fā)和研究,大數(shù)據(jù)中有相當大一部分是非結(jié)構(gòu)化數(shù)據(jù),比如圖片、聲音、視頻等,面對這些海量的數(shù)據(jù),高職院校的圖書館員應(yīng)該認識到將數(shù)據(jù)轉(zhuǎn)換成知識才能滿足服務(wù)師生的需求。獲取非結(jié)構(gòu)化的數(shù)據(jù)并對其進行分析,可以揭示之前很難或無法確定的重要相互關(guān)系,提高圖書館的知識服務(wù)能力和智能輔助決策能力。
(二)大力發(fā)展數(shù)字圖書館及數(shù)字圖書館聯(lián)盟
高校圖書館對大數(shù)據(jù)而言,通常有三種角色:大數(shù)據(jù)的使用者或受益者,大數(shù)據(jù)的提供者或開發(fā)者,以及大數(shù)據(jù)的運營者或維護者。高校圖書館應(yīng)該加強相互間的聯(lián)盟合作,特別是發(fā)展數(shù)字圖書館聯(lián)盟,發(fā)展跨領(lǐng)域合作與國際合作。特別是對于高職圖書館,因為其缺少資金,且對前沿技術(shù)追蹤緊密。數(shù)字圖書館及數(shù)字圖書館聯(lián)盟,將大大提高圖書館的數(shù)據(jù)分析與數(shù)據(jù)整合能力。
(三)與出版社、數(shù)據(jù)庫公司、學術(shù)研究者等合作
出版社和圖書館如何面對大數(shù)據(jù)時代的到來是近幾年來專家學者討論的熱點。高校圖書館要不要擴大數(shù)據(jù)圖書館成為目前要思考的問題。高校圖書館與出版社、學術(shù)研究者、數(shù)據(jù)庫公司等開展合作是其中一個可行性路線。在大數(shù)據(jù)時代,學術(shù)圖書館和出版社必須加強對話與合作,如果缺乏溝通,學術(shù)信息的生產(chǎn)與傳播將無從談起。只有通過對海量數(shù)據(jù)、龐大數(shù)據(jù)庫的有效管理,才能將圖書館的服務(wù)智能化,才能智能地挖掘、匹配讀者的閱讀興趣,為讀者的沉浸閱讀、深入學習提供內(nèi)容和工具。
(四)尋求技術(shù)創(chuàng)新與服務(wù)創(chuàng)新
近年來,隨著云計算、大數(shù)據(jù)技術(shù)的發(fā)掘與應(yīng)用,讀者需求也在不斷變化,讀者要求在獲取知識的途徑和時間上更簡單快捷,過去高校圖書館的數(shù)據(jù)庫都是獨立的,讀者要在多個系統(tǒng)中多次登錄,而現(xiàn)在發(fā)展到一個讀者賬號實現(xiàn)跨數(shù)據(jù)庫檢索。用戶需要的是有準確來源的數(shù)據(jù)和最直接可信的答案,而不是成千上萬篇文獻,因此要為他們提供最好的服務(wù),還需要我們對新技術(shù)不斷進行探索,同時要有與新技術(shù)相適應(yīng)的新服務(wù)內(nèi)容與形式??梢哉f技術(shù)是最基本的支撐,而服務(wù)是高校圖書館的靈魂,二者必須同時發(fā)展。
四、結(jié)語
大數(shù)據(jù)的出現(xiàn),將改變我們對數(shù)據(jù)的看法與認識,人們將透過大數(shù)據(jù)找到隱藏在大量數(shù)據(jù)背后的規(guī)律與知識。然而大數(shù)據(jù)的應(yīng)用是技術(shù)難度極高的集成應(yīng)用,如需要集成人工智能、商業(yè)智能、數(shù)學算法、自然語言理解、信息技術(shù)等多個跨學科領(lǐng)域的技術(shù)成果,圖書館作為社會信息服務(wù)的中心,在面臨這些較高的技術(shù)和管理風險的同時,還面臨著內(nèi)外部環(huán)境的挑戰(zhàn)與競爭。對內(nèi),除上述存在的主要挑戰(zhàn)之外,基礎(chǔ)設(shè)施,人力資源、運行經(jīng)費管理體制都會是不得不面對的挑戰(zhàn)因素。對外,IT廠商與信息服務(wù)機構(gòu)的大數(shù)據(jù)研究應(yīng)用已捷足先登。高校圖書館特別是高職院校圖書館應(yīng)該仔細分析大數(shù)據(jù)時代圖書館存在的挑戰(zhàn),采用更好的發(fā)展策略,為院校師生的信息需求提供更好的服務(wù)。
參考文獻:
[1]羅彬,陽靜,袁赟.數(shù)字圖書館中大數(shù)據(jù)存儲的應(yīng)用研究[J].科技與企業(yè),2013(18).
[2]韓翠峰.大數(shù)據(jù)時代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館,2013(1).