劉 荻
南陽醫(yī)學(xué)高等??茖W(xué)校圖書館
“大數(shù)據(jù)”是信息科技領(lǐng)域繼web.2.0 和云計算之后又一令人矚目的熱點。本文介紹了大數(shù)據(jù)的概念和基本特點,指出了圖書館利用大數(shù)據(jù)技術(shù)的必要性,并探討了圖書館應(yīng)對“大數(shù)據(jù)”時代的具體措施。
隨著信息技術(shù)的快速發(fā)展,數(shù)據(jù)的組成結(jié)構(gòu)、存在形式等越來越復(fù)雜,數(shù)據(jù)量快速增加,社會已步入了“大數(shù)據(jù)時代”。“大數(shù)據(jù)”成為信息科技領(lǐng)域繼web.2.0 和云計算之后又一令人矚目的熱點。最早提出“大數(shù)據(jù)”概念的是全球知名咨詢公司麥肯錫,它指出“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對于海量數(shù)據(jù)的挖掘和運用,預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來?!贝髷?shù)據(jù)時代的到來.意味著我們進(jìn)入到了一個以密集型數(shù)據(jù)的相關(guān)挖掘、分析、處理來推動社會創(chuàng)新發(fā)展的時代。各大IT 公司、研究機(jī)構(gòu)、學(xué)術(shù)界等相關(guān)機(jī)構(gòu)對于大數(shù)據(jù)開展了大量的研究。但是至今為止,大數(shù)據(jù)并沒有一個統(tǒng)一的定義,但是,對大數(shù)據(jù)基本有這樣的共識:那就是在數(shù)量巨大的數(shù)據(jù)中快速獲取有用的信息。
大數(shù)據(jù)有以下幾個特點。
1.數(shù)據(jù)規(guī)模大。大數(shù)據(jù)一般指的是10TB 規(guī)模以上數(shù)據(jù)量。當(dāng)今世界,是一個巨大的網(wǎng)絡(luò)世界。數(shù)不清的電腦、移動設(shè)備、社交平臺、在線交易每時每刻都在產(chǎn)生大量數(shù)據(jù)。大數(shù)據(jù)的影響已擴(kuò)展到各行各業(yè)。多個用戶把多個數(shù)據(jù)集集中在一起,數(shù)據(jù)級別也就發(fā)生了變化,從TB 級別上升到PB 級別。
2.數(shù)據(jù)類型多。大數(shù)據(jù)背景下,數(shù)據(jù)已不僅僅是單一的文本形式,數(shù)據(jù)類型繁多,且多數(shù)為半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),包括了網(wǎng)絡(luò)日志、微博、視頻、音頻、圖片、郵件等。
3.數(shù)據(jù)處理速度快。傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)已無法適應(yīng)海量的數(shù)據(jù)環(huán)境,只有實時分析,快速處理,才能快速制定合適的應(yīng)對策略。
4.數(shù)據(jù)價值密度低。大量的數(shù)據(jù)信息里,有價值的信息并不多,有很多是垃圾信息,這就需要對數(shù)據(jù)進(jìn)行挖掘分析。
近年來,隨著信息技術(shù)的發(fā)展,數(shù)字圖書館已成為各個高校圖書館的重點建設(shè)項目,到目前為止,已基本完成了數(shù)字化建設(shè)任務(wù)。圖書館現(xiàn)在擁有大量的數(shù)字化資源,專業(yè)數(shù)據(jù)庫、電子書、各種教學(xué)音頻、視頻、考試題庫等組成了圖書館的大數(shù)據(jù)。同時,學(xué)生使用數(shù)據(jù)庫的檢索記錄、瀏覽歷史等個人信息也構(gòu)成了大數(shù)據(jù)的一部分。隨著智能手機(jī)、高速網(wǎng)絡(luò)的進(jìn)一步使用,現(xiàn)有數(shù)據(jù)量還會呈現(xiàn)快速增長的趨勢。身處大數(shù)據(jù)時代,圖書館要積極行動起來,進(jìn)一步完善信息服務(wù)體系,利用好大數(shù)據(jù)分析技術(shù),提高為讀者服務(wù)的能力。圖書館可以將通過手機(jī)、電腦等各種設(shè)備收集到的讀者個人信息、搜索歷史進(jìn)行收集整理,從中獲取有價值的信息,分析出讀者的閱讀偏好與關(guān)注熱點,為開展跟蹤服務(wù)、個性化服務(wù)打下良好的基礎(chǔ),從而提高圖書館在信息時代的競爭力與影響力。
大數(shù)據(jù)時代,圖書館的競爭力不僅體現(xiàn)在館藏資源、服務(wù)質(zhì)量上,還體現(xiàn)在擁有的數(shù)據(jù)量以及對巨大數(shù)據(jù)的挖掘與分析能力上。圖書館要緊跟時代的發(fā)展步伐,改變傳統(tǒng)的服務(wù)方式,提高基于云服務(wù)平臺的大數(shù)據(jù)采集分析能力,保證圖書館大數(shù)據(jù)環(huán)境的科學(xué)性、可操作性、可控性,建立符合讀者需求、快速有效的新型服務(wù)模式。只有這樣,圖書館才能掌握發(fā)展的主動權(quán),不至于在新的技術(shù)浪潮中落伍。
大數(shù)據(jù)時代背景下,培養(yǎng)一支懂技術(shù)、會管理的專業(yè)人才隊伍是提升服務(wù)能力的重要保證。專業(yè)館員不僅要掌握必備的信息檢索、信息分析、信息組織等基本素質(zhì),還要掌握大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘與分析的知識與技能。面對這種挑戰(zhàn),館員要改變思想觀念,樹立主動服務(wù)的理念,熟悉各種網(wǎng)絡(luò)工具檢索功能,努力掌握數(shù)據(jù)挖掘與分析技術(shù),通過數(shù)據(jù)處理技術(shù)對信息資源進(jìn)行整理分析,發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的讀者需求,從而制定出準(zhǔn)確有效的個性化服務(wù)方案,為讀者提供深層次的信息服務(wù)。圖書館也要要重視館員的業(yè)務(wù)學(xué)習(xí)與培訓(xùn),努力提高館員的專業(yè)技術(shù)素質(zhì)。
隨著網(wǎng)絡(luò)的普及,圖書館已不是獲取資源的唯一途徑,讀者可以通過其他途徑來獲取所需資源。因此,在信息技術(shù)日益發(fā)達(dá)的今天,如何將將豐富的信息資源傳遞給讀者,將讀者吸引到圖書館來,避免讀者流失,是圖書館工作重心所在。大數(shù)據(jù)技術(shù)的成熟,為圖書館開展個性化服務(wù)開辟了新的道路。圖書館可以通過收集匯總讀者的個人信息、瀏覽歷史等用戶數(shù)據(jù),對讀者的閱讀需求與閱讀行為進(jìn)行深度分析,根據(jù)分析結(jié)果,對圖書館的服務(wù)目的、內(nèi)容、方法做出科學(xué)合理的安排,從而開展跟蹤服務(wù)、推送式個服務(wù),提高信息服務(wù)的質(zhì)量與內(nèi)涵。同時,還可以利用論壇、微博、微信、電子郵箱等多種信息傳送渠道,為讀者提供優(yōu)質(zhì)服務(wù),提高讀者的滿意度。
開展大數(shù)據(jù)評估工作是保證圖書館大數(shù)據(jù)工作開展的有力保證。只用進(jìn)行有效的評估,才能更好地發(fā)揮大數(shù)據(jù)在讀者服務(wù)模式變革、服務(wù)模式技術(shù)保障等方面的積極作用。評估的重點要放在圖書館的大數(shù)據(jù)能力上,如:數(shù)據(jù)采集、數(shù)據(jù)過濾、快速處理、科學(xué)決策等方面,要及時發(fā)現(xiàn)在工作中出現(xiàn)的不足,并及時提出解決的方案。另外,還要評估圖書館在大數(shù)據(jù)環(huán)境中服務(wù)系統(tǒng)的安全性和穩(wěn)定性,保證圖書館數(shù)據(jù)類型和應(yīng)用過程符合網(wǎng)絡(luò)安全規(guī)范。信息技術(shù)的發(fā)展,使圖書館服務(wù)系統(tǒng)的安全防御難度不斷增加。要利用大數(shù)據(jù)平臺等先進(jìn)技術(shù)手段,加強(qiáng)圖書館服務(wù)系統(tǒng)的安全性,為用戶提供高質(zhì)量的服務(wù)。
為了開展個性化服務(wù),圖書館大數(shù)據(jù)包括大量讀者信息、搜素歷史、地理位置等非結(jié)構(gòu)性信息。這一方面促進(jìn)了個性化服務(wù)的深度,但另一方面,也帶來了讀者個人隱私泄露的問題。圖書館應(yīng)加大對讀者隱私權(quán)的保護(hù)力度,制定詳細(xì)的管理員閱讀權(quán)限和數(shù)據(jù)保密、數(shù)據(jù)傳輸制度。管理員在采集讀者數(shù)據(jù)時,要嚴(yán)格工作流程,科學(xué)合理的對讀者數(shù)據(jù)進(jìn)行分析。同時,也要做好網(wǎng)絡(luò)安全工作,杜絕非法用戶入侵,利用大數(shù)據(jù)采集和分析讀者數(shù)據(jù),導(dǎo)致讀者隱私外泄。
由于大數(shù)據(jù)是一項前沿技術(shù),實際操作需要有多學(xué)科知識作基礎(chǔ),因此,圖書館開展大數(shù)據(jù)工作有一定的技術(shù)難度。
微軟的一位工程師Chistian Huitem a指出,人類要做到從大數(shù)據(jù)集中熟練提取真正的知識.還需再經(jīng)歷十年以上的時間?,F(xiàn)在大數(shù)據(jù)存在的主要問題在于可靠性、易用性和成本等方面。圖書館采取措施培訓(xùn)專業(yè)人才,及時關(guān)注大數(shù)據(jù)發(fā)展動向,及時開展探索性實踐,以提升大數(shù)據(jù)技術(shù)水平。