楊利軍 高軍
〔摘 要〕隨著計算機軟硬件的快速發(fā)展和網(wǎng)絡普及,圖書館中的大數(shù)據(jù)量呈現(xiàn)爆炸式增長。本文介紹了大數(shù)據(jù)的定義,闡述了圖書館個性化服務中的大數(shù)據(jù)可視化分析的重要意義。為保證圖書館員更好地對海量、復雜大數(shù)據(jù)進行有效分析,本文設計了一種圖書館大數(shù)據(jù)可視化分析系統(tǒng)框架。該系統(tǒng)可有效提升大數(shù)據(jù)挖掘的效能,幫助用戶更好地理解數(shù)據(jù),并具有較為完善的可視化分析功能。
〔關鍵詞〕圖書館;個性化服務;大數(shù)據(jù);可視化分析
DOI:10.3969/j.issn.1008-0821.2015.07.013
〔中圖分類號〕G25076 〔文獻標識碼〕A 〔文章編號〕1008-0821(2015)07-0068-05
〔Abstract〕With the rapid development of computer hardware,software and network technology,the size of large data in library is growing exponentially.This paper introduced the definition of big data,the significance of large data visualization analysis in library personalized service.In order to analyze the massive and complex large data effectively,this paper designed a large data visualized analysis frame structure for library.The system frame structure can effectively improve the efficiency of large data mining,help users to better understand data,and contain perfect visualized analysis function.
〔Key words〕library;personalized service;big data;visualization analysis
目前,圖書館已進入大數(shù)據(jù)時代。大數(shù)據(jù)時代,數(shù)據(jù)和文獻、設備、館員一起成為圖書館服務生產(chǎn)資源和生產(chǎn)力的重要組成部分,為圖書館的服務系統(tǒng)構建、服務模式變革和服務質量保證提供安全、可靠、經(jīng)濟、便捷的大數(shù)據(jù)決策支持。圖書館大數(shù)據(jù)環(huán)境呈現(xiàn)海量(Volume)激增、多類型(Variety)、快速處理(Velocity)和高價值(Value) 的大數(shù)據(jù)4V特征[1]。隨著云計算、傳感器網(wǎng)絡、高速數(shù)據(jù)傳輸網(wǎng)絡和大數(shù)據(jù)技術在圖書館中應用的不斷深入,圖書館在提高自身服務能力和讀者閱讀滿意度的同時,其數(shù)據(jù)總量和數(shù)據(jù)類型將呈現(xiàn)快速增長態(tài)勢。如何在復雜、多變的數(shù)據(jù)環(huán)境中有效發(fā)現(xiàn)和挖掘大數(shù)據(jù)價值,為圖書館提供全面、精確、可視和可靠的大數(shù)據(jù)決策支持,成為關系圖書館服務模式科學、服務方式有效和讀者閱讀滿意的重要因素。
圖書館大數(shù)據(jù)環(huán)境具有信息分散、數(shù)據(jù)結構不統(tǒng)一的特點,傳統(tǒng)的人工分析方式因其本身存在的分析過程非結構性、不確定性和分析流程不可控等問題,難以將大數(shù)據(jù)調入應用系統(tǒng)中進行數(shù)據(jù)價值的有效發(fā)現(xiàn)、挖掘和客觀表現(xiàn),不能為圖書館的系統(tǒng)管理、運營和讀者服務提供可靠的大數(shù)據(jù)決策支持。數(shù)據(jù)可視化分析是有效適應圖書館大數(shù)據(jù)復雜環(huán)境和滿足大數(shù)據(jù)分析需求行之有效的方法。維基百科對數(shù)據(jù)可視化的定義為“數(shù)據(jù)可視化是技術上較為高級的技術方法。這些技術方法允許利用圖形、圖像處理、計算機視覺和用戶界面,通過表達、建模方式實現(xiàn)對立體、表面、屬性和變量的顯示,并對數(shù)據(jù)加以可視化解釋”[2]。因此,如何借助圖形化的手段,清晰、準確和可視地表現(xiàn)出大數(shù)據(jù)之間的關系和從知識中獲取的價值,是圖書館增強大數(shù)據(jù)價值發(fā)現(xiàn)有效性和將數(shù)據(jù)價值轉換為服務生產(chǎn)力的重要途徑。
1 圖書館大數(shù)據(jù)可視化分析的需求與挑戰(zhàn)
11 圖書館大數(shù)據(jù)可視化分析的應用現(xiàn)狀
圖書館大數(shù)據(jù)分析與可視化展示二者相輔相成。一方面大數(shù)據(jù)分析賦予可視化展示價值與意義;另一方面可視化展示幫助圖書館從數(shù)據(jù)中提取價值和知識。據(jù)調查現(xiàn)示,目前我國圖書館界大數(shù)據(jù)可視化分析應用還不普及,僅在少部分國家級和國家最高學術機構圖書館部署,絕大部分圖書館僅制定了相應的部署、應用計劃。從大數(shù)據(jù)可視化分析產(chǎn)品的選擇看,絕大多數(shù)圖書館偏向于應用免費、開源的可視化分析平臺,僅有少數(shù)高級別圖書館與第三方共同研發(fā)了相應的大數(shù)據(jù)可視化分析平臺。其中,功能強大、系統(tǒng)開源、兼容性強和易操作,是圖書館在大數(shù)據(jù)可視化分析系統(tǒng)構建中最關注的4個問題。其次,圖書館可視化分析重點關注的方向是數(shù)據(jù)空間的分布、大數(shù)據(jù)的定量計算、數(shù)據(jù)的多維分析、分析結果的可視化展示,以及如何通過大數(shù)據(jù)可視化分析來有效支持圖書館建設、管理與服務的科學決策等問題。第三,圖書館大數(shù)據(jù)資源主要以半結構化和非結構化數(shù)據(jù)方式存在。圖書館大數(shù)據(jù)可視化分析的對象主要涉及服務系統(tǒng)日志文件、圖書館運營與CRM(Customer Relationship Management,客戶關系管理)數(shù)據(jù)、讀者閱讀終端和模式數(shù)據(jù)、讀者閱讀反饋數(shù)據(jù)、讀者閱讀行為和社會關系數(shù)據(jù)、服務市場競爭環(huán)境數(shù)據(jù)等,且其可控性和可用性將隨著大數(shù)據(jù)總量、數(shù)據(jù)類型的快速遞增而呈現(xiàn)快速下降趨勢[3]。第四,隨著大數(shù)據(jù)資源采集深度和廣度的不斷增長,可視化分析過程將更多地涉及圖書館保密與讀者隱私數(shù)據(jù)。因此,如何加強大數(shù)據(jù)的安全管理和訪問權限控制,是圖書館大數(shù)據(jù)可視化分析需要重點關注的問題。
12 可視化分析應以大數(shù)據(jù)價值發(fā)現(xiàn)為目的
圖書館大數(shù)據(jù)環(huán)境具有數(shù)據(jù)海量、數(shù)據(jù)結構多樣、數(shù)據(jù)價值分布不均勻和數(shù)據(jù)價值密度低的特點,數(shù)據(jù)分析過程難以控制和不能形成統(tǒng)一的分析流程。因此,如何有效發(fā)現(xiàn)大數(shù)據(jù)價值和數(shù)據(jù)間隱匿的關系,并以可視化圖表方式展示供圖書館員決策參考,是圖書館大數(shù)據(jù)可視化分析的根本目的。其次,可視化分析系統(tǒng)服務對象應由圖書館管理層轉換為普通館員,服務模式也應由數(shù)據(jù)分析員的主動式服務轉變?yōu)槠胀^員的自助式服務。支持不同部門員工通過身份與權限認證,快速獲得直觀、可視、互動和高價值的圖形與報表,有效洞察相關數(shù)據(jù)中隱藏的價值和數(shù)據(jù)關系。支持圖書館員通過網(wǎng)絡和移動設備,實現(xiàn)與其它用戶可視化分析結果的共享。第三,大數(shù)據(jù)可視化分析系統(tǒng)應具有良好的數(shù)據(jù)環(huán)境和硬件平臺適應能力,支持用戶根據(jù)圖書館數(shù)據(jù)規(guī)模分別部署于公有云、私有云和普通IT硬件環(huán)境中,有效實現(xiàn)大數(shù)據(jù)的多類型圖表可視化展示、高效關聯(lián)分析和人機決策交互[4]。第四,大數(shù)據(jù)可視化分析系統(tǒng)應以數(shù)據(jù)價值的全面發(fā)現(xiàn)和可視化精準展示為目的。因此,數(shù)據(jù)分析員應控制好可視化分析系統(tǒng)在價值發(fā)現(xiàn)和可視化展示間的平衡點,不能過于強調數(shù)據(jù)價值發(fā)現(xiàn)而忽視可視化展示的有效性,也不能片面強調大數(shù)據(jù)的可視化展示形式而影響大數(shù)據(jù)的價值發(fā)現(xiàn)。endprint
13 圖書館數(shù)據(jù)中心系統(tǒng)運營管理的可視化分析需求 圖書館數(shù)據(jù)中心系統(tǒng)運營管理具有系統(tǒng)結構復雜、服務負載突發(fā)、故障定位困難和問題描述不準確的特點。如何通過可視化分析技術實現(xiàn)數(shù)據(jù)中心運營復雜數(shù)據(jù)的分析,并以可視化形式全面、完整、準確和清晰地展示出來,是圖書館有效發(fā)現(xiàn)數(shù)據(jù)中心運營數(shù)據(jù)中隱藏的價值、明確服務系統(tǒng)運營狀況、準確定位系統(tǒng)故障和優(yōu)化系統(tǒng)綜合服務能力的關鍵。
首先,圖書館數(shù)據(jù)中心系統(tǒng)可視化分析應加強運營數(shù)據(jù)的采集與處理、數(shù)據(jù)可視化分析和數(shù)據(jù)價值可視化表現(xiàn)3個方面的內容。須將大數(shù)據(jù)統(tǒng)計、計算機圖形學和計算機仿真學等技術結合,全面、準確和實時地以視覺圖形的方式,表現(xiàn)出數(shù)據(jù)中心系統(tǒng)運營大數(shù)據(jù)中隱含的知識,為圖書館系統(tǒng)管理員和服務系統(tǒng)平臺交互,提供可視化的數(shù)據(jù)決策、交互和反饋控制支持。其次,讀者群閱讀需求具有極強的突發(fā)性和不可控性,龐大的讀者群在同一時段突發(fā)的閱讀需求,會導致圖書館服務數(shù)據(jù)傳輸網(wǎng)絡負荷快速增長,使服務數(shù)據(jù)傳輸網(wǎng)絡擁塞和運營成本急劇攀升。因此,圖書館應通過部署可視化分析工具實現(xiàn)對服務網(wǎng)絡的監(jiān)控、分析、評估和預測,支持管理員通過提前決策、快速部署來避免未來服務高峰網(wǎng)絡擁塞。第三,數(shù)據(jù)中心系統(tǒng)自身存在的安全漏洞和運營風險是圖書館應關注的另一個重要問題。隨著數(shù)據(jù)中心系統(tǒng)功能和結構復雜度的不斷增長,其系統(tǒng)漏洞、安全威脅和運營風險可控性等問題越來越突出,如何通過可視化分析系統(tǒng)來發(fā)現(xiàn)漏洞、識別漏洞、定位漏洞和評估風險,是圖書館提高數(shù)據(jù)中心系統(tǒng)安全性和保證讀者個人隱私的關鍵[5]。
14 圖書館讀者個性化服務的大數(shù)據(jù)可視化分析需求 讀者閱讀個性化需求的發(fā)現(xiàn)和個性化服務QOS保證,是圖書館讀者個性化服務應重點關注的兩個問題。通過視頻監(jiān)控系統(tǒng)、傳感器網(wǎng)絡設備、閱讀終端運營數(shù)據(jù)和讀者閱讀滿意度反饋等數(shù)據(jù),圖書館能夠有效獲得讀者閱讀的內容、閱讀群體關系、閱讀習慣和移動閱讀路徑,以及讀者對關注內容的有效訪問次數(shù)、回訪者與新訪問者數(shù)量、不同讀者群關注度、間隔訪問天數(shù)等,最終可準確判斷個體讀者和不同讀者群的閱讀需求。其次,隨著個性化服務的深入和讀者個體數(shù)據(jù)的激增,傳統(tǒng)的依據(jù)讀者服務需求建模、提前匯總數(shù)據(jù)和提取數(shù)據(jù)分析結果的作法,因可視化圖表靜態(tài)、建模方法預先設置、報表內容不可實時調整、分析員不能動態(tài)修改和完善模型,而不能滿足讀者個性化服務高效、實時、定制和快捷的需求[6]。第三,可視化分析系統(tǒng)還應滿足圖書館管理員即時、簡單和交互式分析的需求,而不需要圖書館館員具有專業(yè)的可視化數(shù)據(jù)分析知識,系統(tǒng)能夠自動生成支持館員自主決策的可視化分析報告和圖表。第四,面對讀者個體特征數(shù)據(jù)海量、快速遞增、動態(tài)變化和低價值密度的特點,可視化分析系統(tǒng)應采取輕量建模和構建N個視圖的方法,確保系統(tǒng)能夠隨著讀者個體數(shù)據(jù)的導入而實現(xiàn)即時分析與可視化展示,支持使用者根據(jù)分析需求實時調整大數(shù)據(jù)分析的維度和度量計算方式,保證分析結果系統(tǒng)、準確、實時和直觀。
15 圖書館對大數(shù)據(jù)可視化分析系統(tǒng)的功能需求
百度百科對數(shù)據(jù)可視化思想的定義是“將數(shù)據(jù)庫中每一個數(shù)據(jù)項作為單個圖元元素,通過抽取的數(shù)據(jù)集構成數(shù)據(jù)圖像,同時將數(shù)據(jù)的各個屬性值加以組合,并以多維數(shù)據(jù)的形式通過圖表、三維等方式用以展現(xiàn)數(shù)據(jù)之間的關聯(lián)信息,使用戶能從不同的維度以及不同的組合對數(shù)據(jù)庫中的數(shù)據(jù)進行觀察,從而對數(shù)據(jù)進行更深入的分析和挖掘”。因此,圖書館大數(shù)據(jù)可視化工具應以服務圖書館員的用戶服務決策需求為核心,具有可視化分析過程數(shù)據(jù)實時更新、系統(tǒng)易于操作、數(shù)據(jù)知識多維度展示、支持多數(shù)據(jù)源和數(shù)據(jù)庫的特點。其次,大數(shù)據(jù)可視化分析結果展示應具有多視圖整合、所有數(shù)據(jù)視圖交互聯(lián)動和強大的主屏顯示功能,可根據(jù)數(shù)據(jù)價值展示需求,實現(xiàn)主從屏聯(lián)動、多屏聯(lián)動、自動翻屏,以及展現(xiàn)內容的快速查詢、縮放、切換功能。第三,可視化分析系統(tǒng)應具備高性能內存分析架構,可根據(jù)圖書館員的工作特點、決策任務和分析需求定制系統(tǒng)工作界面,有效實現(xiàn)圖書館智能管理和分析能力的完美結合[7]。此外,還應支持圖書館員通過個人移動數(shù)據(jù)終端完成移動可視化分析,實現(xiàn)圖書館內不同部門間的可視化決策共享和聯(lián)動。
2 圖書館大數(shù)據(jù)可視化分析的流程與應用策略
21 圖書館大數(shù)據(jù)可視化分析的流程
圖書館大數(shù)據(jù)可視化平臺應支持絕大多數(shù)主流操作系統(tǒng)平臺和多種開發(fā)語言,可以無縫嵌入到相關的應用系統(tǒng)之中,能夠根據(jù)可視化分析的內容、對象和結果需求,幫助圖書館員采用不同的大數(shù)據(jù)分析模式和方法開展可視化分析,并以多種展現(xiàn)方式實現(xiàn)大數(shù)據(jù)價值和大數(shù)據(jù)關系的表現(xiàn)。
圖書館大數(shù)據(jù)可視化分析流程如圖1所示。
圖書館通過視頻監(jiān)控器、傳感設備、服務器監(jiān)控設備和閱讀終端等大數(shù)據(jù)采集設備,完成對用戶服務系統(tǒng)運營、讀者閱讀需求和行為、閱讀終端運行狀況、服務市場競爭環(huán)境大數(shù)據(jù)資源的采集。其次,可通過大數(shù)據(jù)處理系統(tǒng)實現(xiàn)圖書館結構化數(shù)據(jù)及非結構化數(shù)據(jù)的準備、噪聲過濾和標準化模式轉換,在有效提高大數(shù)據(jù)價值密度、數(shù)據(jù)可用性和可控性的前提下,傳輸至大數(shù)據(jù)庫進行數(shù)據(jù)存儲。第三,大數(shù)據(jù)可視化分析系統(tǒng)可通過身身的API(Application Programming Interface,應用程序編程接口)與其他應用系統(tǒng)實現(xiàn)緊耦合或松耦合。依據(jù)分析對象的數(shù)據(jù)總量、類型和決策需求,通過關聯(lián)分析、時序分析、列表分析、路徑分析和群組分析等方法,科學、準確、快速和經(jīng)濟地挖掘圖書館大數(shù)據(jù)價值和發(fā)現(xiàn)大數(shù)據(jù)之間的關系[8]??梢暬故鞠到y(tǒng)應具有較強的可操作性、交互性和表現(xiàn)多樣性,能夠輔助圖書館員完成各種圖表的操作和靜態(tài)、動態(tài)圖形展示。此外,還應支持不同部門的圖書館員和第三方服務商在獲得相應數(shù)據(jù)庫訪問權后,通過簡單的網(wǎng)絡參數(shù)配置完成數(shù)據(jù)庫的連接、模型定義和分析結果的可視化共享展示。
22 圖書館員可視化分析的知識發(fā)現(xiàn)與獲取過程
圖書館員可視化分析知識的發(fā)現(xiàn)與獲取過程,是由計算機可視化分析系統(tǒng)與圖書館員對大數(shù)據(jù)的共同作用、交互和分析而產(chǎn)生。計算機負責大數(shù)據(jù)的處理、分析和可視化展示,而圖書館員則負責大數(shù)據(jù)知識的獲取、識別、修改和完善,具體過程如圖2所示。endprint
計算機可視化分析系統(tǒng)負責對所采集的大數(shù)據(jù)進行處理、分析系統(tǒng)建模和分析結果的可視化輸出。知識通常隱匿在圖書館大數(shù)據(jù)庫存儲的結構化、半結構化和非結構化數(shù)據(jù)中,圖書館員通過構建科學、高效和簡單的分析系統(tǒng)模式,實現(xiàn)大數(shù)據(jù)的快速處理、分析和價值挖掘,并以人機交互可視化展現(xiàn)的方式傳輸給圖書館員,通過圖書館員對大數(shù)據(jù)可視化展示信息的識別而最終形成知識。由于圖書館員的認知能力具有主面性、片面性和不確定性,因此,必須通過知識驗證過程對所發(fā)現(xiàn)的知識進行證明、分析和總結。同時,依據(jù)知識驗證的結果提出新的科學假設,經(jīng)過若干次驗證循環(huán)和后知識產(chǎn)生循環(huán),進而獲取科學、正確、可靠和易用的新知識[9]。隨后,通過數(shù)據(jù)傳輸接口將獲取的知識反饋給計算機可視化分析系統(tǒng),最終提升可視化分析系統(tǒng)的數(shù)據(jù)處理、分析建模和可視化展示的科學性與準確性。
23 圖書館大數(shù)據(jù)可視化分析的應用策略
231 大數(shù)據(jù)可視化分析系統(tǒng)平臺的功能構建
可視化分析平臺應滿足圖書館決策層、數(shù)據(jù)分析員和管理員的大數(shù)據(jù)分析、決策需求,具有平臺界面可定制、操作簡單、無縫對接任何數(shù)據(jù)源和分析結果直觀可視化展現(xiàn)的特點,能夠幫助圖書館完成服務市場環(huán)境數(shù)據(jù)、讀者閱讀需求與變化趨勢、服務風險控制與預警、QOS和讀者滿意度保證、KPI(關鍵績效指標)分析、服務系統(tǒng)運營效率、CRM、精準營銷和業(yè)務流程等多業(yè)務領域的可視化分析服務,可為圖書館提供覆蓋所有業(yè)務領域、員工層次和工作流程的可視化決策支持。其次,分析系統(tǒng)應具備先進的內存分析引擎,支持大數(shù)據(jù)的動態(tài)整合和直觀的數(shù)據(jù)分段、分層劃分,操作人員可通過簡單的拖放而建立數(shù)據(jù)關系和過濾喊聲。此外,系統(tǒng)還應根據(jù)用戶可視化分析的實時性和復雜性特點,支持大數(shù)據(jù)的動態(tài)和靜態(tài)可視化分析。分析員可根據(jù)實時大數(shù)據(jù)可視化分析結果,滿足圖書館服務對讀者QOS保障、系統(tǒng)運營安全與效率管理、讀者閱讀需求變化等應用的時限需求[10]。第三,可視化分析系統(tǒng)應具有較強的語義分析、地理空間分析、關聯(lián)分析、時序分析、列表分析、路徑分析和群組分析能力,可為用戶提供管理層決策界面、自助智能分析與查詢、電子報表、多維分析、移動商業(yè)智能應用、大數(shù)據(jù)分析報告、數(shù)據(jù)價值挖掘、ETL(Extract-Transform-Load,數(shù)據(jù)的萃取、轉置、加載至目的端的過程)和數(shù)據(jù)調度等服務。
232 可視化分析系統(tǒng)平臺應堅持技術開放的原則
可視化分析系統(tǒng)平臺應堅持技術開放、系統(tǒng)集成、統(tǒng)一平臺和統(tǒng)一管理的原則。首先,可視化分析系統(tǒng)平臺部署應支持UNIX、Linux和Windows等世界主流系統(tǒng)平臺、應用服務器和中間件??稍诓煌牟僮飨到y(tǒng)和應用平臺間移植,支持用戶通過瀏覽器、應用程序和顯示終端訪問,具有較強的系統(tǒng)獨立性和軟、硬件兼容性。其次,由于圖書館大數(shù)據(jù)庫存儲海量、多類型的特點,可視化分析系統(tǒng)應支持對國內外主流關系數(shù)據(jù)庫(Oracle、DB2、Teradata、SQL Server、Sybase等)的配置、訪問、查詢、下載和存儲等操作[11]。此外,還可根據(jù)分析對象的數(shù)據(jù)復雜度、類型和維度,支持對多維數(shù)據(jù)庫的多維OLAP(聯(lián)機分析處理),確保大數(shù)據(jù)可視化分析和數(shù)據(jù)價值表現(xiàn)的多維性。第三,分析系統(tǒng)平臺應堅持SOA(面向服務的體系結構)構建,并給圖書館服務管理系統(tǒng)、CRM系統(tǒng)、第三方大數(shù)據(jù)庫和其它應用平臺預留足夠的API(應用程序編程接口)接口,保證可視化分析系統(tǒng)平臺易于和第三方平臺、應用程序集成[12]。第四,可視化分析系統(tǒng)平臺應支持分析員的個性化定制操作,有效降低分析系統(tǒng)在特殊環(huán)境下對硬件資源的性能需求,支持圖書館員通過移動PC等設備,實現(xiàn)大數(shù)據(jù)的移動分析與可視化展示、數(shù)據(jù)共享和數(shù)據(jù)查詢等功能。
233 大數(shù)據(jù)可視化分析平臺功能構建應堅持高效、智能的原則
圖書館大數(shù)據(jù)可視化分析平臺應堅持高效、智能和自動化的構建原則,才能有效提高分析平臺對數(shù)據(jù)價值的發(fā)現(xiàn)效率的同時,大幅降低圖書館數(shù)據(jù)分析員的工作量和大數(shù)據(jù)分析成本的投入,為圖書館管理和決策活動提供精確、實時、經(jīng)濟和便捷的可視化大數(shù)據(jù)決策支持。
可視化分析平臺與大數(shù)據(jù)庫安全、高效、快速和直接的連接,是圖書館大數(shù)據(jù)分析平臺有效融合數(shù)據(jù)結構差異、精確發(fā)現(xiàn)數(shù)據(jù)關系和實時開展可視化分析的關鍵。因此,圖書館大數(shù)據(jù)可視化分析平臺應通過統(tǒng)一的數(shù)據(jù)接口,實現(xiàn)與大數(shù)據(jù)庫、多維數(shù)據(jù)集、文件和電子表格的直接連接,確保可視化分析系統(tǒng)無需編程和預先參數(shù)設置,即可實時、動態(tài)地發(fā)現(xiàn)大數(shù)據(jù)庫數(shù)據(jù)的內容、結構和關系變化,通過有效下載、整合大數(shù)據(jù)而完成動態(tài)變化的可視化分析結果。其次,當擬分析大數(shù)據(jù)資源總量有限、靜態(tài)和結構簡單時,圖書館員可通過在館員個人終端電腦上安裝可視化分析平臺的客戶端程序,實現(xiàn)大數(shù)據(jù)的可視化移動分析。而當大數(shù)據(jù)資源海量、結構復雜和動態(tài)變化時,可視化分析平臺應支持圖書館員將大數(shù)據(jù)傳輸?shù)娇梢暬治龉蚕矸掌魃?,由高性能可視化分析服務器或者多臺用戶端設備,共同完成復雜大數(shù)據(jù)的可視化分析,并將分析結果傳輸?shù)綀D書館員客戶端上顯示。第三,可視化分析平臺還應具備較強的人機交互性??梢暬治銎脚_通過對服務器運行日志、系統(tǒng)安全漏洞和風險監(jiān)測數(shù)據(jù)、數(shù)據(jù)中心硬件設備運行效率數(shù)據(jù)、服務器負載變化等大數(shù)據(jù)的分析,將結果以動態(tài)的圖形、表格等方式展示出來,管理員依據(jù)分析結果對服務與安全管理系統(tǒng)的參數(shù)進行設置和修正,最終通過智能化反饋控制有效保證服務系統(tǒng)性能最優(yōu)化[13]。
234 可視化分析應以圖書館讀者個性化服務為中心
滿足讀者閱讀和服務保障任務需求,是圖書館大數(shù)據(jù)可視化分析系統(tǒng)構建、運營的中心工作。首先,圖書館應利用視頻監(jiān)控設備、讀者閱讀行為監(jiān)控服務器、傳感器網(wǎng)絡和第三方運營商API接口,全面、準確、即時和便捷地采集與讀者閱讀活動相關的數(shù)據(jù)。通過對所采集的讀者相關數(shù)據(jù)的選擇、噪聲過濾和價值發(fā)現(xiàn),為每一名讀者構建屬于自己的小數(shù)據(jù)庫,依靠小數(shù)據(jù)全面、準確地展示讀者的個體特征和閱讀活動信息[14]。其次,對讀者個體的可視化分析應基于圖書館小數(shù)據(jù)庫資源,實現(xiàn)從經(jīng)驗分析到定量分析的轉變。分析系統(tǒng)通過對讀者行為的可視化描述和過去行為的回溯、分析與判斷,在有效過濾噪聲行為數(shù)據(jù)后,準確、清晰地表述出讀者內在的個體閱讀需求和所處閱讀群體的閱讀意愿。有助于圖書館將具有相似特征和需求的讀者劃分為一個大的讀者群,通過采用為用戶群整體定制的服務方式而有效降低成本。同時,在嚴格控制服務成本的前提下,以個性化服務保障模式來滿足個體讀者的個性化閱讀服務需求。第三,讀者個性化閱讀服務具有個性化、持續(xù)性、多樣化和需求快速增長的特點。因此,圖書館對讀者個性化服務需求的分析,應堅持實時數(shù)據(jù)和歷史數(shù)據(jù)相結合、靜態(tài)數(shù)據(jù)和動態(tài)數(shù)據(jù)相結合的原則,準確、實時地發(fā)現(xiàn)讀者新需求的產(chǎn)生和需求變化的總發(fā)展趨勢,以便更科學地做出大數(shù)據(jù)服務決策和提供服務。第四,讀者行為大數(shù)據(jù)可視化分析過程應以有效保護讀者隱私安全為前提,不能片面強調可視化分析科學性和準確度而侵犯讀者隱私,由讀者決定自身相關數(shù)據(jù)的采集、存儲、分析和應用決策。endprint
3 結束語
大數(shù)據(jù)環(huán)境下,數(shù)據(jù)已成為圖書館生產(chǎn)資料組成和服務生產(chǎn)力發(fā)展的重要因素。如何安全、高效、經(jīng)濟和快速地挖掘大數(shù)據(jù)價值,并將所獲得的知識運用到圖書館基礎設施構建、讀者個性化閱讀保障、客戶關系管理和服務模式變革中,成為關系圖書館服務能力建設和讀者QOS保障有效的關鍵。當前,大數(shù)據(jù)可視化分析系統(tǒng)是圖書館精確發(fā)現(xiàn)數(shù)據(jù)價值,將所發(fā)現(xiàn)的數(shù)據(jù)價值轉化為知識和決策依據(jù),并以可視化形式直觀展示的有效途徑。圖書館在大數(shù)據(jù)可視化分析系統(tǒng)建設、應用中,應從自身大數(shù)據(jù)應用的實際狀況、讀者服務保障的內容和標準、IT基礎設施建設水平和大數(shù)據(jù)分析需求出發(fā),和第三方共同開發(fā)出符合自身環(huán)境特點和大數(shù)據(jù)應用模式的可視化分析平臺,才能真正實現(xiàn)大數(shù)據(jù)與圖書館員、大數(shù)據(jù)與讀者、大數(shù)據(jù)與圖書館之間的“零距離”,才能為讀者服務全程提供安全、精確、經(jīng)濟和便捷的大數(shù)據(jù)可視化決策支持[4]。
參考文獻
[1]代雙鳳,董繼陽,薛健.科學計算中大數(shù)據(jù)可視化分析與應用[J].工程研究——跨學科視野中的工程,2014,6(3):275-281.
[2]王宇燦,李一飛,袁勤儉.國際大數(shù)據(jù)研究熱點及前沿演化可視化分析[J].工程研究——跨學科視野中的工程,2014,6(3):282-293.
[3]游進國,楊卓犖,胡建華,等.一種支持大規(guī)模數(shù)據(jù)的多維可視化分析框架[J].計算機工程,2011,37(19):26-31.
[4]何非,何克清.大數(shù)據(jù)及其科學問題與方法的探討[J].武漢大學學報:理學版,2014,60(1):1-12.
[5]牛春華,李慧佳.基于WOS數(shù)據(jù)的活動理論研究現(xiàn)狀可視化分析[J].圖書與情報,2014,(2):99-104.
[6]張志強,何文春,朱江,等.基于B/S架構的霧霾專題數(shù)據(jù)可視化服務系統(tǒng)設計與實現(xiàn)[J].計算機應用,2014,32(s2):140-142.
[7]孫寧偉,趙瑜,劉勇,等.TVBRT:一種基于Radial Tree的具有度量屬性的多變元時態(tài)數(shù)據(jù)可視化方法[J].計算機科學,2014,41(6):5-11,17.
[8]李久松,常曉峰,田豐林,等.海洋和大氣數(shù)據(jù)多模式動態(tài)可視化系統(tǒng)的設計和實現(xiàn)[J].海洋科學,2014,38(1):10-14.
[9]李國杰.大數(shù)據(jù)研究的科學價值[J].中國計算機學會通訊,2012,8(9):8-15.
[10]周曉分,黃國彬,白雅楠.科學計量可視化軟件的對比與數(shù)據(jù)預處理研究[J].圖書與情報,2013,57(23):64-72.
[11]鄭偉連,楊敏潔,劉睿,等.基于MBD的檢測數(shù)據(jù)和三維模型關聯(lián)與可視化技術[J].航空精密制造技術,2014,50(6):11-14,35.
[12]劉金碩,程力,王麗娜,等.利用CUDA的剪切波數(shù)據(jù)三維可視化[J].武漢大學學報:信息科學版,2013,38(11):1271-1275.
[13]Jiang D,Chen G,Ooi B C,et al.epiC:an Extensible and Scalable System for Processing Big Data[J].Proceedings of the VLDB Endowment,2014,7(7):1-12.
[14]楊良斌.關于科學計量學與可視化的若干問題探討[J].情報雜志,2012,31(4):2-3.
(本文責任編輯:郭沫含)endprint