關(guān)鍵詞:大數(shù)據(jù);圖書館服務(wù);數(shù)據(jù)處理;隱私保護(hù)
摘 要:文章簡述了大數(shù)據(jù)的內(nèi)涵,分析了大數(shù)據(jù)給圖書館帶來的機(jī)遇和挑戰(zhàn),提出了圖書館建設(shè)大數(shù)據(jù)服務(wù)平臺(tái)的思路。
中圖分類號(hào):G253文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2019)11-0053-03
1 背景
全球已經(jīng)進(jìn)入大數(shù)據(jù)時(shí)代,互聯(lián)網(wǎng)上的數(shù)據(jù)量每兩年會(huì)翻一番。大數(shù)據(jù)作為信息時(shí)代新的財(cái)富增長點(diǎn),受到國內(nèi)外眾多知名信息企業(yè)的青睞,對(duì)大數(shù)據(jù)的研究與應(yīng)用層出不窮。2011年5月,麥肯錫公司在《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個(gè)前沿領(lǐng)域》中首次提出了大數(shù)據(jù)的概念,并指出數(shù)據(jù)已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。2012年3月22日,奧巴馬宣布美國政府投資2億美元啟動(dòng)大數(shù)據(jù)研究和發(fā)展計(jì)劃,將大數(shù)據(jù)研究上升為國家戰(zhàn)略。2017年5月14日,習(xí)近平在“一帶一路”國際合作高峰論壇講話中提到,要堅(jiān)持創(chuàng)新驅(qū)動(dòng)發(fā)展,加強(qiáng)在數(shù)字經(jīng)濟(jì)、人工智能、納米技術(shù)、量子計(jì)算機(jī)等前沿領(lǐng)域的合作,推動(dòng)大數(shù)據(jù)、云計(jì)算、智慧城市建設(shè),連接成21世紀(jì)的數(shù)字絲綢之路。黨的十九大也明確提出推動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能與實(shí)體經(jīng)濟(jì)深度融合。大數(shù)據(jù)研究已逐漸上升為我國國家戰(zhàn)略。
2 大數(shù)據(jù)的內(nèi)涵
大數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和分結(jié)構(gòu)化數(shù)據(jù)的綜合,其特點(diǎn)主要體現(xiàn)在以下幾點(diǎn):①數(shù)據(jù)集合規(guī)模不斷擴(kuò)大。②數(shù)據(jù)類型繁多、數(shù)據(jù)多樣化。③數(shù)據(jù)傳輸速度快。④數(shù)據(jù)多以數(shù)據(jù)流的形式動(dòng)態(tài)產(chǎn)生,具有很強(qiáng)的時(shí)效性。人、機(jī)、物的高度融合引發(fā)數(shù)據(jù)規(guī)模的爆炸式增長和數(shù)據(jù)模式的高度復(fù)雜化,全球已進(jìn)入網(wǎng)絡(luò)化的大數(shù)據(jù)時(shí)代。大數(shù)據(jù)的增長來源主要包括:一是對(duì)以數(shù)據(jù)為中心的傳統(tǒng)學(xué)科(如基因組學(xué)、蛋白組學(xué)、天體物理學(xué)和腦科學(xué)等)的研究所產(chǎn)生的數(shù)據(jù),尤其是互聯(lián)網(wǎng)的發(fā)展使實(shí)驗(yàn)室之間大量傳輸?shù)臄?shù)據(jù)呈幾何級(jí)增長。二是互聯(lián)網(wǎng)?;ヂ?lián)網(wǎng)與人們的生活緊密聯(lián)系,由此產(chǎn)生的數(shù)據(jù)呈爆炸式增長?!?017年全球數(shù)字報(bào)告》顯示,全球各種社交網(wǎng)絡(luò)的總用戶規(guī)模為30.28億人,全世界有40%的人口在使用社交網(wǎng)絡(luò),龐大的互聯(lián)網(wǎng)用戶群產(chǎn)生的數(shù)據(jù)量是驚人的。IDC發(fā)布的《數(shù)據(jù)時(shí)代2025》白皮書預(yù)測,2025年全球的數(shù)據(jù)量將達(dá)到163ZB,是目前的10倍。三是傳感器和物聯(lián)網(wǎng)行業(yè)的蓬勃發(fā)展。智能家居、智能交通、智能電網(wǎng)、智能工業(yè)、智能農(nóng)業(yè)等的蓬勃發(fā)展都在網(wǎng)絡(luò)上產(chǎn)生了大量的數(shù)據(jù)。
3 大數(shù)據(jù)給圖書館帶來的挑戰(zhàn)和影響
大數(shù)據(jù)的“大”不僅體現(xiàn)在存儲(chǔ)數(shù)據(jù)多,更體現(xiàn)在對(duì)海量數(shù)據(jù)的挖掘和應(yīng)用上。大數(shù)據(jù)之“大”,并不僅僅指“容量大”,其意義更在于通過對(duì)海量數(shù)據(jù)的交換、整合和分析發(fā)現(xiàn)新的知識(shí)、創(chuàng)造新的價(jià)值,帶來“大知識(shí)”“大科技”“大利潤”和“大發(fā)展”。因此,圖書館在數(shù)據(jù)化進(jìn)程中一定要以用戶為中心提高數(shù)據(jù)的使用效率,并通過分析用戶習(xí)慣實(shí)現(xiàn)數(shù)據(jù)的精準(zhǔn)推送。
3.1 大數(shù)據(jù)的質(zhì)量是圖書館不可回避的問題
大數(shù)據(jù)時(shí)代,圖書館的數(shù)據(jù)來源呈現(xiàn)多樣化,數(shù)據(jù)量不斷增加,圖書館要實(shí)現(xiàn)數(shù)字到數(shù)據(jù)的轉(zhuǎn)變必須解決數(shù)字資源的合理配置和利用,最終提升其服務(wù)質(zhì)量。圖書館將數(shù)字化資源轉(zhuǎn)化為可利用的數(shù)據(jù)資源,不僅可以方便用戶獲取,同時(shí)還能避免出現(xiàn)“數(shù)字孤島”。近年來,隨著我國圖書館事業(yè)的發(fā)展,數(shù)字化、網(wǎng)絡(luò)化、智能化等服務(wù)已成為圖書館服務(wù)的主要內(nèi)容,國家數(shù)字圖書館工程、中國高等教育文獻(xiàn)保障系統(tǒng)(CALIS)、大學(xué)數(shù)字圖書館國際合作計(jì)劃(CADAL)等數(shù)字資源建設(shè)共享項(xiàng)目及自建特色數(shù)據(jù)庫、機(jī)構(gòu)庫等都豐富了我國圖書館的館藏?cái)?shù)字資源,為圖書館拓展服務(wù)提供了資源基礎(chǔ)和機(jī)制保障。相關(guān)調(diào)查發(fā)現(xiàn),目前我國圖書館的數(shù)字化服務(wù)還是以數(shù)據(jù)庫和紙質(zhì)資源的數(shù)字化為主,大多為結(jié)構(gòu)化數(shù)據(jù),對(duì)后期數(shù)據(jù)處理及信息挖掘的可利用性不高,不能滿足數(shù)據(jù)分析的要求。
3.2 大數(shù)據(jù)的處理和挖掘是圖書館提升服務(wù)的基礎(chǔ)
大數(shù)據(jù)時(shí)代,圖書館面臨向知識(shí)服務(wù)和知識(shí)共享轉(zhuǎn)型的挑戰(zhàn)。用戶對(duì)知識(shí)和服務(wù)的精準(zhǔn)化需求,促使圖書館構(gòu)建以互聯(lián)網(wǎng)信息搜索和查詢?yōu)榛A(chǔ)的知識(shí)信息服務(wù)模式。不論是簡單的知識(shí)信息服務(wù)還是集信息檢索、組織、分析等高級(jí)業(yè)務(wù)素養(yǎng)的知識(shí)信息服務(wù),都是圖書館以數(shù)據(jù)為基礎(chǔ)開展的服務(wù)。圖書館不僅需通過結(jié)構(gòu)化數(shù)據(jù)了解用戶的當(dāng)前需求,同時(shí)更需利用大量的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)對(duì)用戶的未來需求進(jìn)行挖掘、分析和預(yù)測,從而提供更好的服務(wù)模式。
3.3 大數(shù)據(jù)時(shí)代用戶的隱私信息保護(hù)問題
大數(shù)據(jù)時(shí)代,圖書館若想提供精準(zhǔn)化的服務(wù),就不可避免地需要掌握用戶的身份、閱讀偏好等個(gè)人數(shù)據(jù)信息。用戶數(shù)據(jù)信息采集的完整性、挖掘的深度及分析利用的程度在一定意義上決定了圖書館服務(wù)的準(zhǔn)確性和易接受性。圖書館通過用戶個(gè)人信息采集、傳感器采集、用戶社交網(wǎng)絡(luò)互動(dòng)及與其他數(shù)據(jù)平臺(tái)資源共享等方式獲得用戶的隱私數(shù)據(jù),且多是圖書館主動(dòng)采集、用戶被動(dòng)接受,用戶隱私數(shù)據(jù)的所有權(quán)、使用權(quán)、控制權(quán)和監(jiān)督權(quán)等都十分模糊,給讀者隱私安全帶來隱患。因此,圖書館不能為了追求服務(wù)質(zhì)量和個(gè)性化服務(wù)效果而忽視對(duì)用戶數(shù)據(jù)信息的保護(hù),應(yīng)加強(qiáng)對(duì)用戶數(shù)據(jù)信息的使用目的和方式的監(jiān)管,并保證用戶對(duì)使用其隱私數(shù)據(jù)的知情權(quán)。
4 圖書館大數(shù)據(jù)服務(wù)平臺(tái)的設(shè)計(jì)
4.1 泛在化設(shè)計(jì)理念
泛在化服務(wù)是一種面向用戶提供全方位、智能化的無處不在的服務(wù)理念和模式,倡導(dǎo)用戶在哪里服務(wù)就在哪里。泛在化服務(wù)理念對(duì)圖書館的信息資源建設(shè)和組織提出了新的要求,圖書館要有效利用現(xiàn)有資源,強(qiáng)化特色資源建設(shè),積極實(shí)現(xiàn)資源共享,構(gòu)建多元立體的資源利用體系。用戶的滿意度和認(rèn)可度是圖書館建設(shè)的最終目標(biāo),“互聯(lián)網(wǎng)+”、物聯(lián)網(wǎng)及傳感器技術(shù)等可幫助圖書館實(shí)現(xiàn)面向用戶的精確推送和個(gè)性化服務(wù),其泛在化服務(wù)應(yīng)始終以用戶為中心。因此,圖書館的大數(shù)據(jù)平臺(tái)設(shè)計(jì)應(yīng)堅(jiān)持“用戶至上、需求推動(dòng)服務(wù)”的理念,用技術(shù)滿足需求,以發(fā)展提升服務(wù)。
4.2 基礎(chǔ)平臺(tái)設(shè)計(jì)
大數(shù)據(jù)作為一種新興技術(shù),目前尚未形成完備的標(biāo)準(zhǔn)技術(shù)體系。筆者結(jié)合圖書館與大數(shù)據(jù)的融合方式提出了圖書館大數(shù)據(jù)建設(shè)的參考架構(gòu),該參考架構(gòu)由八個(gè)層面、兩大體系及外部支撐構(gòu)成。其中,八個(gè)層面由平臺(tái)基礎(chǔ)設(shè)施層、數(shù)據(jù)源層、數(shù)據(jù)集成層、數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)管理層、數(shù)據(jù)應(yīng)用層、展示層、用戶層等組成;兩大體系包括標(biāo)準(zhǔn)規(guī)范體系和安全管理體系。
從構(gòu)成上看,該參考架構(gòu)是由不同概念層級(jí)的邏輯構(gòu)件組成,這些邏輯構(gòu)件被劃分為三個(gè)層級(jí),從高到低依次為角色、活動(dòng)和功能組件。最高層級(jí)的邏輯構(gòu)件是角色,包括系統(tǒng)協(xié)調(diào)者、數(shù)據(jù)提供者、大數(shù)據(jù)應(yīng)用提供者、大數(shù)據(jù)框架提供者、數(shù)據(jù)消費(fèi)者等;第二層級(jí)的邏輯構(gòu)件是每個(gè)角色執(zhí)行的活動(dòng);第三層級(jí)的邏輯構(gòu)件是執(zhí)行每個(gè)活動(dòng)需要的功能組件。一方面,圖書館應(yīng)加強(qiáng)大數(shù)據(jù)平臺(tái)的硬件建設(shè),提升數(shù)據(jù)采集和存儲(chǔ)能力。硬件建設(shè)是圖書館大數(shù)據(jù)平臺(tái)的基礎(chǔ)工程,負(fù)責(zé)處理與數(shù)據(jù)提供者的接口和數(shù)據(jù)引入,實(shí)現(xiàn)與用戶及相關(guān)網(wǎng)站的資源交互,保障平臺(tái)的穩(wěn)定性和流暢性。另一方面,圖書館應(yīng)建設(shè)滿足大數(shù)據(jù)應(yīng)用和符合大數(shù)據(jù)技術(shù)特點(diǎn)的數(shù)據(jù)中心,利用ETL、實(shí)時(shí)數(shù)據(jù)采集、云計(jì)算、云存儲(chǔ)、HADOOP體系架構(gòu)等技術(shù)構(gòu)建數(shù)據(jù)集市和數(shù)據(jù)倉庫,實(shí)現(xiàn)數(shù)據(jù)的快速獲取與應(yīng)用,為大數(shù)據(jù)應(yīng)用提供技術(shù)支撐。同時(shí),圖書館還應(yīng)構(gòu)建滿足大數(shù)據(jù)應(yīng)用的數(shù)據(jù)資源管理體系,加快數(shù)據(jù)匹配與對(duì)外接口的數(shù)據(jù)融合,實(shí)現(xiàn)數(shù)據(jù)資源的共享;加快數(shù)據(jù)資源整合,促進(jìn)數(shù)據(jù)共享,形成統(tǒng)一規(guī)范的數(shù)據(jù)定義,消除“信息孤島”;建立數(shù)據(jù)資產(chǎn)處理制度、數(shù)據(jù)資產(chǎn)分析規(guī)則及數(shù)據(jù)資產(chǎn)元數(shù)據(jù)標(biāo)準(zhǔn),規(guī)范數(shù)據(jù)資產(chǎn)說明;建立和發(fā)布數(shù)據(jù)資產(chǎn)目錄及數(shù)據(jù)資源管理與服務(wù)機(jī)制等。此外,圖書館還需開展數(shù)據(jù)應(yīng)用提升服務(wù)質(zhì)量,通過對(duì)數(shù)據(jù)的挖掘分析為大數(shù)據(jù)應(yīng)用提供經(jīng)驗(yàn);積極探索數(shù)據(jù)利用的標(biāo)準(zhǔn)化,提升數(shù)據(jù)的利用效率;加強(qiáng)外部數(shù)據(jù)的獲取和應(yīng)用,拓展數(shù)據(jù)渠道,全方位、多渠道利用相關(guān)數(shù)據(jù)為用戶提供有效服務(wù)。
4.3 安全與隱私保護(hù)
圖書館構(gòu)建大數(shù)據(jù)管理平臺(tái)時(shí),需根據(jù)相關(guān)的法律法規(guī)和行業(yè)規(guī)范制定合理、有效的用戶隱私保護(hù)制度和策略,明確用戶數(shù)據(jù)采集的范圍、目的和方法,保證用戶隱私數(shù)據(jù)采集合法透明;設(shè)立專門的監(jiān)督機(jī)構(gòu),對(duì)用戶隱私數(shù)據(jù)的采集和利用進(jìn)行管理和監(jiān)督;告知用戶采集數(shù)據(jù)的內(nèi)容、目的及使用范圍等,保障用戶的知情權(quán)。此外,圖書館構(gòu)建大數(shù)據(jù)管理平臺(tái)還需從數(shù)據(jù)層和應(yīng)用層兩個(gè)方面強(qiáng)化用戶的隱私保護(hù)。在數(shù)據(jù)層方面,數(shù)據(jù)庫作為大數(shù)據(jù)服務(wù)平臺(tái)的信息主體,存儲(chǔ)著大量的用戶信息,圖書館既要防范來自外部入侵者的威脅,也要杜絕來自系統(tǒng)內(nèi)部人員的窺探,如未授權(quán)的數(shù)據(jù)查看、不正確的數(shù)據(jù)修改以及數(shù)據(jù)的不可用性等。因此,圖書館保證數(shù)據(jù)庫安全需加強(qiáng)物理安全、操作系統(tǒng)安全、DBMS安全以及數(shù)據(jù)庫加密等。云存儲(chǔ)作為大數(shù)據(jù)存儲(chǔ)的主要手段,應(yīng)在云計(jì)算的各個(gè)環(huán)節(jié)做好數(shù)據(jù)加密、身份認(rèn)證、訪問控制等隱私保護(hù)措施。在應(yīng)用層方面,用戶的隱私信息不僅包括個(gè)人信息,也包括交流信息。因此,圖書館要想實(shí)現(xiàn)信息的保護(hù),必須保證大數(shù)據(jù)平臺(tái)采集的信息是用戶知曉并同意的,同時(shí)保證只有被用戶授權(quán)的人才可以獲取相關(guān)信息。
5 結(jié)語
圖書館作為社會(huì)信息服務(wù)中心,正逐步向信息共享、服務(wù)共享的方向發(fā)展,其在大數(shù)據(jù)時(shí)代應(yīng)以數(shù)據(jù)為推動(dòng)服務(wù)的引擎,實(shí)現(xiàn)高效精確的服務(wù),以“互聯(lián)網(wǎng)+圖書館”的深度融合激發(fā)圖書館強(qiáng)大的發(fā)展動(dòng)力。
參考文獻(xiàn):
[1]涂子沛.大數(shù)據(jù)[M].桂林:廣西師范大學(xué)出版社,2012:54-58.
[2]王天泥.大數(shù)據(jù)視角下圖書館的發(fā)展對(duì)策[J].圖書館學(xué)刊,2013(3):42-44.
[3]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報(bào),2012(5):37-40.
[4]馬曉婷,李凌.基于大數(shù)據(jù)的圖書館用戶個(gè)性化隱私保護(hù)策略[J].現(xiàn)代情報(bào),2014(3):60-62.
[5]初景利,吳冬曼.論圖書館服務(wù)的泛在化:以用戶為中心重構(gòu)圖書館服務(wù)模式[J].圖書館建設(shè),2008(4):62-65.
[6]劉雅輝,張鐵贏,靳小龍,等.大數(shù)據(jù)時(shí)代的個(gè)人隱私保護(hù)[J].計(jì)算機(jī)研究與發(fā)展,2015(1):229-247.
(編校:徐黎娟)
收稿日期:2019-10-10
作者簡介:鄭光鳳(1985— ),南京圖書館助理館員。