張文華
摘 要:隨著云時代的來臨,大數(shù)據(jù)也吸引了越來越多的關注,大數(shù)據(jù)是信息通信技術發(fā)展積累至今,按照自身技術發(fā)展邏輯,從提高生產效率向更高級智能階段的自然生長。無處不在的信息感知和采集終端為我們采集了海量的數(shù)據(jù),而以云計算為代表的計算技術的不斷進步,為我們提供了強大的計算能力。在大數(shù)據(jù)的環(huán)境下,圖書館的數(shù)據(jù)處理和服務將會隨著圖書館服務的創(chuàng)新而發(fā)生重大的改變。
關鍵詞:大數(shù)據(jù);云計算;圖書館服務
現(xiàn)在科技的發(fā)展,尤其是大數(shù)據(jù)和云計算時代的到來,影響著每個行業(yè)的發(fā)展。而所謂大數(shù)據(jù),指的是所涉及的資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助管理者經營決策更積極目的的資訊,需要新的處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息量。大數(shù)據(jù)通常用來形容一個體系創(chuàng)造的大量非結構化和半結構化數(shù)據(jù),大數(shù)據(jù)分析常和云計算聯(lián)系到一起,因為實時的大型數(shù)據(jù)集分析需要框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。數(shù)據(jù)是很容易與數(shù)字混淆,但二者是截然不同的。數(shù)字是一種符號,用來表示某種特征的程度或狀態(tài)。而數(shù)據(jù)是對客觀事物的邏輯歸納,是信息的表現(xiàn)形式和載體,所以數(shù)據(jù)與信息是分不開的,數(shù)據(jù)是信息的表達,信息是數(shù)據(jù)的內涵。大數(shù)據(jù)要求圖書館不僅需要通過結構化數(shù)據(jù)了解現(xiàn)在客戶享受了哪些圖書館服務,從而產生更多非結構化或半結構的用戶數(shù)據(jù),使得數(shù)據(jù)快速增長,也更需要利用大量的非結構化數(shù)據(jù)、半結構化數(shù)據(jù)在圖書館用戶的服務關系中去挖掘正在發(fā)生什么、預測和分析將來會發(fā)生什么,以便對于圖書館的服務有更進一步的創(chuàng)新和提高。
1.大數(shù)據(jù)環(huán)境的相關分析和探索
大數(shù)據(jù)環(huán)境不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理。換言之,如果把大數(shù)據(jù)比作一種產業(yè),那么這種產業(yè)實現(xiàn)盈利的關鍵,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。所以,“大數(shù)據(jù)”并不是一種新技術潮流,而是在信息技術高度發(fā)展之后,人們如何開發(fā)利用數(shù)據(jù)為社會發(fā)展奠定基礎的過程,是一種基于新工具的新的解決問題思路。大數(shù)據(jù)的價值往往呈現(xiàn)稀疏性。從這點上來講,我國在大數(shù)據(jù)時代還面臨巨大挑戰(zhàn)。我國是目前世界上的人口大國、互聯(lián)網(wǎng)大國、手機大國。這些大國稱號來自于一串串龐大的數(shù)字。然而,在這讓國人為之驕傲的數(shù)字背后,卻隱藏著我國在大數(shù)據(jù)時代的落后現(xiàn)實,目前我國只能算是數(shù)字大國,還不是數(shù)據(jù)大國。造成現(xiàn)狀的原因,一是因為我國的數(shù)據(jù)技術起步晚,發(fā)展時間短。我國一年的數(shù)據(jù)新增量還不及美國的十分之一,而且以小數(shù)據(jù)集為主。二是缺少收集數(shù)據(jù)的意識。因為數(shù)據(jù)量,數(shù)據(jù)結構的變化引起的。通過對大數(shù)據(jù)環(huán)境下,數(shù)字圖書館信息服務內容變化的描述,嘗試著構建基于大數(shù)據(jù)的數(shù)字圖書館信息服務的模式。
2.大數(shù)據(jù)環(huán)境下的數(shù)字圖書館
圖書館作為學校輔助教育部門,日常的工作中會產生大量的數(shù)據(jù),數(shù)字圖書館的資源數(shù)據(jù)結構有多種,不光有結構化的數(shù)據(jù)如數(shù)目信息,聲像數(shù)據(jù)等,還有用戶信息、用戶訪問信息以及對用戶的服務信息過半結構化數(shù)據(jù)和非結構化數(shù)據(jù)。通過對于這些數(shù)據(jù)的分析使數(shù)字圖書館的信息服務要求在不斷地提高。大數(shù)據(jù)實實在在存在于我們周圍,不管你認不認識,研不研究,它就在那里,并且發(fā)揮著巨大的作用,推動社會的飛速發(fā)展。得數(shù)據(jù)者得天下,要想迎頭趕上,并走在世界的前列,就必須積極應對巨大挑戰(zhàn)。教育,更是如此。數(shù)字圖書館信息服務是指利用各種技術對信息資源進行采集、組織、檢索和傳播等業(yè)務進行處理的一種活動。數(shù)字圖書館對傳統(tǒng)圖書館的資源進行了數(shù)字化,使其更加易于獲取,并采用個人圖書館平臺對圖書館可提供的服務類型進行整合,提供簡單的信息推送服務,用戶不僅可以得到二次文獻,還可以得到文獻全文以及多媒體信息。
挖掘大數(shù)據(jù)的價值與隱藏在其背后的世界,簡單的定性、定量分析都不能發(fā)揮作用,技術工具的作用將得到進一步放大。因此,圖書館對技術、工具的應用需求也將更為迫切,這也對圖書館的技術應用水平提出了新的要求、探索和創(chuàng)新。目前,傳統(tǒng)出版業(yè)和圖書館尚在數(shù)字化轉型,內容數(shù)字化、閱讀數(shù)字化、服務數(shù)字化和管理信息化等都已經進行到不同程度,但是“數(shù)字革命”遠未成功,“大數(shù)據(jù)”又來了。傳統(tǒng)出版業(yè)將面對更艱巨的“從數(shù)字化到數(shù)據(jù)化”——深度信息化轉型任務:從內容數(shù)字化到內容數(shù)據(jù)化、從數(shù)字化閱讀到閱讀數(shù)據(jù)化、從數(shù)字化服務到服務數(shù)據(jù)化、從管理信息化到管理數(shù)據(jù)化。這個過程還相當漫長,且困難重重——傳統(tǒng)出版業(yè)的數(shù)字化服務平臺與模式遠未成熟。但我認為,出版行業(yè)要抓住大數(shù)據(jù)機遇,首先需要將數(shù)字化進行到底。根據(jù)普華永道咨詢公司最新的全球娛樂和媒體產業(yè)研究報告,全球范圍內電子書占全部圖書銷售額的比例將從2012年的9%增長到2017年的22%左右。可見圖書內容數(shù)字化的進程尚有時日,況且圖書的數(shù)字化,并不是簡單地將紙質圖書掃描成PDF格式這么簡單,就像中文電子書城“字節(jié)社”的宗旨所言:“創(chuàng)造數(shù)字閱讀新境界,提供數(shù)字閱讀新體驗”,僅僅“內容數(shù)字化”環(huán)節(jié)還有很大的創(chuàng)新發(fā)展空間。
3.大數(shù)據(jù)時代圖書館的服務體系的創(chuàng)新
目前大多數(shù)圖書館憑借本館內的資源或圖書館聯(lián)盟的圖書、期刊、數(shù)據(jù)庫等資源提供服務,對網(wǎng)絡上大量的非結構化信息資源較少涉及。通過對技術的改變和服務的改善,大數(shù)據(jù)環(huán)境下的圖書館服務方式、模式和途徑都會發(fā)生改變。隨著大數(shù)據(jù)在日常的生活和科學研究中發(fā)揮的作用越來越明顯,用戶也渴望通過圖書館統(tǒng)一檢索的平臺獲取對他們有用的各類結構化、非結構化信息。在對于調整文獻服務、參考咨詢服務、學科服務以及信息的推送服務起到重大的改變。為滿足用戶需求,圖書館界有必要對大數(shù)據(jù)展開研究,提供復雜信息資源分析處理的服務。在大數(shù)據(jù)環(huán)境下對于信息的分析和處理將成為圖書館的主要業(yè)務,圖書館資源數(shù)據(jù)量的擴展,服務策咯的改變和質量的提升不僅是依靠一些數(shù)據(jù)共享,資源共享,而且還必須從大量數(shù)據(jù)中找出規(guī)律,找出其潛在的價值。事實上,數(shù)據(jù)分析所依賴的大量數(shù)據(jù)資源中,圖書館具有所有權的數(shù)據(jù)資源數(shù)量比較少,從而成為限制這種服務發(fā)展的瓶頸。圖書館如何與數(shù)據(jù)庫供應商以及其他與用戶相關聯(lián)的數(shù)據(jù)擁有者合作,共同開發(fā)和維護數(shù)據(jù)資源,將成為圖書館為用戶提供個性化服務的關鍵。
大數(shù)據(jù)環(huán)境下,數(shù)字圖書館利用各種技術對網(wǎng)上的信息資源進行處理,將處理后的數(shù)據(jù)整合在一起形成數(shù)據(jù)倉庫,通過查找數(shù)據(jù)倉庫檢索信息資源來滿足用戶的個性化信息需求。圖書館服務是其價值體現(xiàn)的核心,也是其存在的價值與意義所在,技術的發(fā)展與社會的進步都為圖書館服務的發(fā)展注入了新的活力與動力。(作者單位:長春工程學院圖書館)
參考文獻:
[1] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術與挑戰(zhàn)[J].計算機研究與發(fā)展,2013(01):146-169.
[2] 何毅.資源發(fā)現(xiàn)知識導航——大數(shù)據(jù)時代圖書館的獅子資源建設與服務[J].中國索引,2012(06):23-27.
[3] 張文彥,武瑞原,于潔.大數(shù)據(jù)時代的圖書館初探[J].圖書與情報.2012(06):15-21.
[4] 樊偉紅,李晨暉,張興旺,秦曉珠,郭自寬.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012(11):63-71.
[5] 韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報,2012(05): 37-40.