石艷麗 劉欣
摘要: 基于大數(shù)據(jù)認(rèn)識和六大特征上,探討大數(shù)據(jù)環(huán)境下信息分析工作模式,分析大數(shù)據(jù)時代信息服務(wù)的機遇和挑戰(zhàn),從機遇和挑戰(zhàn)兩個方面討論大數(shù)據(jù)對圖書館信息服務(wù)的影響,應(yīng)用大數(shù)據(jù)思維開展信息服務(wù)的三個方向,詮釋大數(shù)據(jù)思維下信息服務(wù)的新功能。最后提出要用大數(shù)據(jù)思維創(chuàng)新信息服務(wù)模式,并從培養(yǎng)大數(shù)據(jù)思維、實施數(shù)據(jù)開放合作戰(zhàn)略、統(tǒng)一標(biāo)準(zhǔn)等方面思考大數(shù)據(jù)環(huán)境下的圖書館的信息服務(wù)。提出如何應(yīng)用大數(shù)據(jù)思維構(gòu)建圖書館信息服務(wù),以提高圖書館創(chuàng)新服務(wù)與管理能力。
Abstract: Based on big data understanding and six characteristics of big data, the paper discussed the mode of information analysis in large data environment, and analyzed the opportunities and challenges of information services in the era of big data. Then it discussed the impact of big data on library information service from two aspects of opportunity and challenge, three directions of information service based on large data thinking, and explained new functions of information services under large data thinking. At the end of the paper, use big data thinking innovating information service mode was pus forward, information service under the environment of big data from aspects of cultivating big data thinking was thought about from aspects of implementing data open, cooperation strategy and unifying standards. How to use big data thinking to construct library information service was pus forward in order to improve library innovation service and management ability.
關(guān)鍵詞: 大數(shù)據(jù)思維;信息服務(wù);圖書館服務(wù)與管理
Key words: big data thinking;information service;library service and management
中圖分類號:G251 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-4311(2018)17-0114-03
0 引言
近年來,互聯(lián)網(wǎng)進(jìn)入了飛速發(fā)展階段,伴隨而來的大數(shù)據(jù)時代也走進(jìn)了人類世界。2008年9月《自然》雜志發(fā)布了大數(shù)據(jù),首次提出了大數(shù)據(jù)概念,專輯主要介紹了大數(shù)據(jù)問題的產(chǎn)生及對各個領(lǐng)域的影響[1]。美國奧巴馬政府于2012年 3月29日提出“大數(shù)據(jù)研發(fā)計劃”,在此項目中投資了超兩億美元,希望能夠提高從龐大的數(shù)據(jù)中提取知識的能力,從而為政府解決更多的問題,并鼓勵研究大數(shù)據(jù)核心技術(shù),以便促進(jìn)和加快人類對大數(shù)據(jù)的探索腳步,同時這也意味著人類社會發(fā)生了巨大變化,過去是信息和知識時代,未來將向智能時代邁進(jìn)。2014 年3月全國“兩會”期間,我國多位相關(guān)專家和學(xué)者建議把大數(shù)據(jù)加入到國家發(fā)展戰(zhàn)略中。關(guān)于大數(shù)據(jù)的應(yīng)用研究開始被越來越多的企業(yè)重視,尤其是一些大型企業(yè),比如騰訊、百度等,紛紛出資建立自身的大數(shù)據(jù)存儲與處理中心[2]。由此我們發(fā)現(xiàn),社會各行各業(yè)都意識到了大數(shù)據(jù)研究及應(yīng)用的重要性,圖書館界亦是如此,通過轉(zhuǎn)變自身觀念,在圖書館管理及運營中加入大數(shù)據(jù)技術(shù),大大提高了圖書館運行效率和質(zhì)量。基于此,本文結(jié)合大數(shù)據(jù)特征,在分析大數(shù)據(jù)對圖書館信息服務(wù)的影響的基礎(chǔ)上,提出用大數(shù)據(jù)思維指導(dǎo)信息服務(wù)發(fā)展的新趨勢,同時針對在此過程中存在的問題采取有效的應(yīng)對措施。
1 大數(shù)據(jù)認(rèn)識
1.1 認(rèn)識大數(shù)據(jù)
大數(shù)據(jù)至今為止并未有一個統(tǒng)一的說法,它并不是一個新概念,它是伴隨著近年來龐大的信息增長而來的。當(dāng)前社會無時無刻都充斥著各類信息,在互聯(lián)網(wǎng)上,每天淘寶網(wǎng)站的交易數(shù)高達(dá)千萬筆、百度每天的搜索請求量大約高達(dá)幾十億次、新浪微博的每天用戶發(fā)博量會超過一億條等等,這些都是大數(shù)據(jù),但大數(shù)據(jù)究竟是什么?并沒有一個統(tǒng)一的說法,一般是指涉及的資料量巨大,無法在合理時間內(nèi)用當(dāng)前的主流軟件工具擷取、管理、處理并整理成為供決策參考的資訊。
大數(shù)據(jù)的來源主要有三類:一是各類數(shù)字設(shè)備產(chǎn)生的數(shù)據(jù),包括智能手機、物聯(lián)網(wǎng)設(shè)備、各類傳感器等;二是網(wǎng)站用戶創(chuàng)造的信息,包括人人、推特等社交網(wǎng)絡(luò);三是服務(wù)器生成的數(shù)據(jù),比如各類日志文件等,大數(shù)據(jù)是超過通常數(shù)據(jù)庫系統(tǒng)處理能力的數(shù)據(jù)。
一般情況下,大數(shù)據(jù)具有四個“V”的特征:一是Volume(海量)。體量巨大的數(shù)據(jù),TB級別躍升到PB 級別;二是Variety(多樣性)。類型形式更加多樣,包括電子商務(wù)(淘寶、支付信息)、即時通訊(QQ、微信、飛信)、社會網(wǎng)絡(luò)(微博、SNS)、網(wǎng)絡(luò)日志、傳感器網(wǎng)絡(luò)、鏈接、位置、視頻、音頻、圖像、文本等,不僅包括結(jié)構(gòu)化數(shù)據(jù),也包括非結(jié)構(gòu)化數(shù)據(jù),其中超80%的數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù);三是Velocity(高速)。一秒定律,處理速度極快;四是Value(價值)。價值密度低,商業(yè)價值高。比如視頻,在無數(shù)個監(jiān)控視頻中有用的數(shù)據(jù)可能只有一兩秒。
所謂大數(shù)據(jù)技術(shù)是指從各類類型的數(shù)據(jù)中快速獲取有價值信息的能力。大數(shù)據(jù)技術(shù)的發(fā)展、推進(jìn)對于信息技術(shù)領(lǐng)域而言跟云計算、物聯(lián)網(wǎng)同樣重要,大數(shù)據(jù)作為一種先進(jìn)的數(shù)據(jù)分析技術(shù),未來將在多個領(lǐng)域發(fā)揮巨大影響力,包括政治、經(jīng)濟、文化等[4]。
1.2 大數(shù)據(jù)的應(yīng)用
關(guān)注大數(shù)據(jù)應(yīng)用的目的是分析如何通過利用數(shù)據(jù)來更有效地解決現(xiàn)實問題,預(yù)測是應(yīng)用的核心,對龐大數(shù)據(jù)的獲取、分析和應(yīng)用能力是關(guān)鍵。相關(guān)資料表明,我國的大數(shù)據(jù)應(yīng)用還存在巨大的進(jìn)步空間,當(dāng)前僅處于起步階段[5]。當(dāng)前社會應(yīng)用大數(shù)據(jù)技術(shù)最廣泛的領(lǐng)域有市場營銷、公共服務(wù)及商業(yè)智能等。最先開始應(yīng)用大數(shù)據(jù)技術(shù)的用戶是一些互聯(lián)網(wǎng)巨頭企業(yè),比如騰訊、百度、淘寶等,其利用方式主要是基于自身開源軟件自主開發(fā)大數(shù)據(jù)應(yīng)用。之后大數(shù)據(jù)技術(shù)開始被廣泛應(yīng)用到銀行業(yè)和電信行業(yè)中?,F(xiàn)階段互聯(lián)網(wǎng)廣告營銷是大數(shù)據(jù)應(yīng)用最成熟的領(lǐng)域,我們經(jīng)常發(fā)現(xiàn)自己在搜索或瀏覽網(wǎng)頁時出現(xiàn)的廣告基本就是自己需要的或者自己可能喜歡的,這是因為廣告商利用大數(shù)據(jù)技術(shù)對我們個人上網(wǎng)記錄進(jìn)行了分析,在掌握了我們個人需求的基礎(chǔ)上進(jìn)行的廣告精準(zhǔn)投放。
大數(shù)據(jù)在我國還處于起步階段,這意味著每個人都在起跑線上,人人都有機會,就看誰做好了準(zhǔn)備。早在2012年Harvard library便開始嘗試將大數(shù)據(jù)服務(wù)引入圖書館。對于公共文化服務(wù)體系而言,圖書館是其不可缺少的組成部分,為適應(yīng)高速發(fā)展的社會,通過將大數(shù)據(jù)技術(shù)應(yīng)用在圖書館中,不僅拓展了圖書館服務(wù)范疇,更對提升圖書館信息服務(wù)能力存在巨大推動意義,同時創(chuàng)新了圖書館資源建設(shè),十分有助于圖書館的長效發(fā)展[6]。
2 大數(shù)據(jù)對圖書館管理與服務(wù)帶來的機遇
人們在閱讀研究、實驗操作等期間都會產(chǎn)生信息及數(shù)據(jù),隨著大數(shù)據(jù)時代的來臨,這些信息和數(shù)據(jù)會被數(shù)字化記錄下來,通過分析和處理這些數(shù)據(jù)可重構(gòu)信息服務(wù)模式。本文在討論大數(shù)據(jù)對圖書館管理與服務(wù)帶來的機遇時重點討論了Web2.0和云計算技術(shù)。
2.1 信息分析服務(wù)
在Web2.0環(huán)境下,網(wǎng)絡(luò)用戶協(xié)同創(chuàng)作與資源共享是最受歡迎的運營模式之一。社交媒體每天都在生產(chǎn)大量的數(shù)據(jù),這些數(shù)據(jù)必然具有重要價值,如何找到并利用其價值是一門重要課題,大數(shù)據(jù)分析愈加重要,正在成為一種新的服務(wù)內(nèi)容和方式。關(guān)于該趨勢美國有位學(xué)者達(dá)文波特對此進(jìn)行過研究,達(dá)文波特提出應(yīng)將分析嵌入產(chǎn)品生產(chǎn)與服務(wù)的過程[7]。近年來,信息分析的發(fā)展越來越快,且呈現(xiàn)愈加細(xì)致的趨勢,基于此,筆者提出應(yīng)以信息分析人物或項目為導(dǎo)向,通過建立大數(shù)據(jù)分析處理平臺,結(jié)合情報機構(gòu)知識庫和專題情報分析,建立一種大數(shù)據(jù)環(huán)境下的信息分析工作模式,如圖1所示。但需要注意的是,該工作模式并不是一成不變的,它需要依據(jù)任務(wù)或者項目的實際情況,隨機應(yīng)變,靈活應(yīng)對各項操作,構(gòu)建適宜自身實際情況的信息分析模式。
2.2 多源信息服務(wù)
云計算作為一項網(wǎng)絡(luò)服務(wù),其兩大特征是高度虛擬化和高度可擴展性,它兼具數(shù)據(jù)存儲和數(shù)據(jù)分析的功能,但同時將該兩項功能變的更加便捷[8]。圖書館需要對獲取的龐大信息資源進(jìn)行有效整合,為提高整合效率和質(zhì)量,應(yīng)建立類型多樣的數(shù)據(jù)庫和知識系統(tǒng),構(gòu)建功能全面的云計算平臺,從而實現(xiàn)資源共享,為用戶提供更好的知識服務(wù)。
2.3 決策輔助
隨著智能分析技術(shù)和數(shù)字技術(shù)的不斷發(fā)展和完善,為掌握個人及群體需求提供了便利及工具。情報機構(gòu)應(yīng)充分利用先進(jìn)信息技術(shù),將用戶的真正需求挖掘出來,有的放矢的采取相應(yīng)運營決策,以便為用戶提供更優(yōu)良的服務(wù)。
3 大數(shù)據(jù)對圖書館管理與服務(wù)應(yīng)用的挑戰(zhàn)
3.1 圖書館如何獲取數(shù)據(jù)資源
當(dāng)前社會無時無刻都在生產(chǎn)信息,且信息來源十分復(fù)雜,在指數(shù)級增長的數(shù)據(jù)大背景下,大數(shù)據(jù)技術(shù)應(yīng)運而生,其目標(biāo)便是從龐大的數(shù)據(jù)中挖掘信息、判斷趨勢、提高效益。大數(shù)據(jù)時代,圖書館的管理和服務(wù)離不開大數(shù)據(jù)的支持,只有做好大量數(shù)據(jù)的收集、整理、分析等工作,才能真正掌握數(shù)據(jù),同時掌握自身與其他行業(yè)的競爭優(yōu)勢。對于圖書館而言獲取數(shù)據(jù)資源的方式眾多,圖書館收集的數(shù)據(jù)既包括結(jié)構(gòu)化數(shù)據(jù),比如網(wǎng)絡(luò)資源、數(shù)字資源、文獻(xiàn)資源等,同時也包括一些非結(jié)構(gòu)化數(shù)據(jù),比如用戶信息行為數(shù)據(jù)等,只有在充分分析各類數(shù)據(jù)信息的基礎(chǔ)上不斷挖掘數(shù)據(jù)信息背后的價值,才能促進(jìn)圖書館的長遠(yuǎn)可持續(xù)發(fā)展。然而,需要注意的是圖書館目前對非結(jié)構(gòu)化數(shù)據(jù)的收集存在一定限制,無法完整的收集相關(guān)數(shù)據(jù)信息。為獲取更多更優(yōu)質(zhì)的數(shù)據(jù)資源,圖書館應(yīng)考慮以下幾個方面:一是全面收集各類、各途徑數(shù)據(jù)信息,包括非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)等;二是實現(xiàn)整個圖書館行業(yè)的數(shù)據(jù)資源共享;三是與圖書館相關(guān)行業(yè)的各類關(guān)聯(lián)數(shù)據(jù)資源,包括出版社相關(guān)數(shù)據(jù)資源、圖書館所在地區(qū)網(wǎng)絡(luò)運營商的相關(guān)數(shù)據(jù)資源。不可否認(rèn)當(dāng)前社會大數(shù)據(jù)技術(shù)的存在為圖書館發(fā)展帶來了良好機遇,但要想把握住機會,圖書館必須重視數(shù)據(jù)資源的收集及整理分析,只有這樣才能促進(jìn)圖書館的長效發(fā)展。
3.2 圖書館如何提高現(xiàn)有的技術(shù)能力
大數(shù)據(jù)是一種先進(jìn)的數(shù)據(jù)分析技術(shù),將大數(shù)據(jù)技術(shù)應(yīng)用在圖書館中益處頗多,但同時大數(shù)據(jù)對圖書館的數(shù)據(jù)計算能力和存貯能力有較高要求,因此,如此提高自身的現(xiàn)有技術(shù)能力是圖書館大數(shù)據(jù)應(yīng)用的當(dāng)務(wù)之急。現(xiàn)階段多數(shù)圖書館較為擅長對結(jié)構(gòu)化數(shù)據(jù)的組織和管理,對非結(jié)構(gòu)化數(shù)據(jù)的組織和管理能力有限,但非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)占到數(shù)據(jù)總量的80%以上,基于此,圖書館必須采取相應(yīng)措施彌補自身短處,加大資金投入,加強圖書館專業(yè)人才培養(yǎng),提高自身現(xiàn)有技術(shù)能力。
3.3 如何為數(shù)據(jù)集創(chuàng)建元數(shù)據(jù)
大數(shù)據(jù)的益處顯而易見,但如何真正充分有效的利用大數(shù)據(jù)是一項重大課題,為優(yōu)化、保護及利用大數(shù)據(jù),應(yīng)采取大數(shù)據(jù)治理計劃,關(guān)注譬如如何創(chuàng)建可靠的元數(shù)據(jù),避免數(shù)據(jù)重復(fù)標(biāo)引等問題,因為不同的名稱存儲在不同的存儲庫里勢必會造成浪費。圖書館的優(yōu)勢是整理和標(biāo)識信息或數(shù)據(jù),但同時其劣勢是現(xiàn)有技術(shù)無法滿足大數(shù)據(jù)需求,因此應(yīng)思考如何借助新的技術(shù)手段來進(jìn)行數(shù)據(jù)加工、整理和標(biāo)識。
4 用大數(shù)據(jù)思維創(chuàng)新圖書館信息服務(wù)模式
維克托·邁爾·舍恩伯格在自己的《大數(shù)據(jù)時代》中將大數(shù)據(jù)理念的革命精髓歸結(jié)為三點:一是更關(guān)注相關(guān)性,而不是因果性;二是更關(guān)注數(shù)據(jù)的紛繁復(fù)雜,而不是數(shù)據(jù)的精準(zhǔn);三是全部數(shù)據(jù),而不是抽樣數(shù)據(jù)。隨著社會的發(fā)展,龐大的數(shù)據(jù)及信息每天接觸而至,隨之而來的還有數(shù)據(jù)鴻溝、信息孤島等問題,如何利用大數(shù)據(jù)技術(shù)提高圖書館信息服務(wù)的效率和質(zhì)量是其重要課題。有資料顯示,當(dāng)前人類生產(chǎn)的數(shù)據(jù)僅有5%是結(jié)構(gòu)化,被用于傳統(tǒng)數(shù)據(jù)庫分析和挖掘,其余的大部分信息都被認(rèn)為是沒有價值的,事實上任何信息都必然存在一定價值,區(qū)別在于是否被發(fā)現(xiàn)價值,大數(shù)據(jù)技術(shù)利用各信息的相關(guān)關(guān)系分析,可使所有信息都發(fā)揮了其價值,從而實現(xiàn)了其預(yù)測功能,因此應(yīng)加強基于關(guān)系網(wǎng)絡(luò)的創(chuàng)新服務(wù)模式研究。
4.1 要進(jìn)行知識超網(wǎng)絡(luò)環(huán)境下的深度開發(fā)
本文所指的知識網(wǎng)絡(luò)是指信息網(wǎng)絡(luò)和社會網(wǎng)絡(luò)的有機結(jié)合,它是一種側(cè)重多層次、多主體關(guān)聯(lián)結(jié)構(gòu)的超網(wǎng)絡(luò)。該超網(wǎng)絡(luò)包括三個層次,分別是知識資源網(wǎng)絡(luò)、人際關(guān)系網(wǎng)絡(luò)、技術(shù)網(wǎng)絡(luò),其優(yōu)勢是知識數(shù)量豐富,但劣勢是知識整理偏低。基于此,應(yīng)進(jìn)行知識超網(wǎng)絡(luò)環(huán)境下的深入開發(fā),將知識共享和知識優(yōu)化結(jié)合起來,為在豐富的基礎(chǔ)上為用戶提供更加優(yōu)質(zhì)的知識共享服務(wù)。
4.2 知識服務(wù)要注重對“弱信息”的挖掘
“弱信息”是指隨機的、隱性的、非主流的信息。當(dāng)前時代網(wǎng)絡(luò)化、數(shù)字化明顯,科研人員在分析重大復(fù)雜的科學(xué)問題時通常都會選擇“戰(zhàn)略性閱讀”來幫助自己解決問題。但需要注意的是“戰(zhàn)略性閱讀”并不是為了解決某個具體知識問題,其作用主要體現(xiàn)在通過學(xué)術(shù)檢索可讓科研人員從海量的數(shù)據(jù)信息中獲得“元知識”。而“元知識”的增長可更新科研人員的知識結(jié)構(gòu)體系,提出科學(xué)假設(shè)。因此挖掘“弱信息”至關(guān)重要。
4.3 個性化信息服務(wù)應(yīng)關(guān)注用戶興趣
大數(shù)據(jù)背景下,“感知”是信息服務(wù)的關(guān)鍵。通過對海量實時數(shù)據(jù)進(jìn)行分析,可感知到信息服務(wù)熱點問題,從而預(yù)測用戶的信息需求,然后利用信息需求的多層次細(xì)分,將自身的信息服務(wù)能力提高,使自身的信息服務(wù)更具有針對性。因此,為提高用戶的服務(wù)體驗,應(yīng)采取合理方式引導(dǎo)用戶信息需求,通過建立互動體系,提高個性化信息服務(wù),增加用戶粘性。
總而言之,大數(shù)據(jù)背景下的信息服務(wù)應(yīng)關(guān)注關(guān)系網(wǎng)絡(luò),注重用戶體驗,盡量滿足用戶需求;通過信息技術(shù)將信息價值充分發(fā)揮出來。如圖2所示,其信息服務(wù)功能如下:核心層是決策支持功能,通過“數(shù)據(jù)驅(qū)動決策”實現(xiàn)信息服務(wù)需求滿足;支持層則保障核心層和表現(xiàn)層功能的實現(xiàn),其功能主要包括系統(tǒng)安全保障、跟蹤反饋、深入分析、深度挖掘、信息檢索等;表現(xiàn)層是核心層與支持層功能的外在和具體表現(xiàn),其功能主要包括趨勢預(yù)測、自動推送、信息可視化、智慧服務(wù)等。
總而言之,隨著社會的進(jìn)步和技術(shù)的發(fā)展,圖書館發(fā)展面臨的機遇和挑戰(zhàn)共存,大數(shù)據(jù)技術(shù)在為圖書館發(fā)展帶來變革式有益影響的同時,也對其現(xiàn)有技術(shù)和服務(wù)提出了更高的要求。基于此,圖書館應(yīng)與時俱進(jìn)抓住時代和技術(shù)發(fā)展的契機,不懼挑戰(zhàn)和困難,積極完善自身服務(wù)方式和大數(shù)據(jù)創(chuàng)新,從而提升圖書館的綜合競爭力。
參考文獻(xiàn):
[1]陳超.圖書館如何迎接大數(shù)據(jù)時代?[J].圖書館雜志,2014(1) : 4-7.
[2]容春琳.公共圖書館應(yīng)用大數(shù)據(jù)的策略研究[J].圖書館建設(shè),2013(7):91-95.
[3]姜山,王剛.大數(shù)據(jù)對圖書館的啟示[J].圖書館工作與研究,2013(4):52-54,79.
[4]何毅.資源發(fā)現(xiàn)知識導(dǎo)航--大數(shù)據(jù)時代圖書館的數(shù)字資源建設(shè)與服務(wù)[J].中國索引,2013(4):23-27.
[5]劉煒,夏翠娟,張春景.大數(shù)據(jù)與關(guān)聯(lián)數(shù)據(jù):正在到來的數(shù)據(jù)技術(shù)革命[J].現(xiàn)代圖書情報技術(shù),2013(2):8-9.
[6]張信學(xué).網(wǎng)絡(luò)環(huán)境下情報信息基礎(chǔ)建設(shè)[D].中國國防科技技術(shù)信息學(xué)會,2015(6):126-128.
[7]胡大海.網(wǎng)絡(luò)信息時代情報研究工作滯后的思考[J].科技視界,2012(9):52-53.
[8]焦健,李琦.一種分布式網(wǎng)絡(luò)情報框架的模型[J].計算機應(yīng)用研究,2012(8):54-55.