• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    大數(shù)據(jù)挖掘背景下智慧圖書館讀者行為數(shù)據(jù)分析模式研究

    2020-05-19 10:19:04蔣一鋤曾德良
    關(guān)鍵詞:智慧圖書館分析

    蔣一鋤,曾德良

    (湖南環(huán)境生物職業(yè)技術(shù)學(xué)院 圖書館,湖南 衡陽 421001)

    在物物互聯(lián)的大數(shù)據(jù)網(wǎng)絡(luò)環(huán)境中,每一個(gè)讀者的任何行為都能夠有跡可循,智慧圖書館可以對(duì)讀者的具體行為數(shù)據(jù)充分挖掘,并對(duì)讀者的行為習(xí)慣及規(guī)律充分分析,來滿足讀者日益增長(zhǎng)的個(gè)性化服務(wù)及智慧閱讀服務(wù)需求[1]。這不僅能夠突破圖書館的現(xiàn)有服務(wù)和管理瓶頸,而且能夠加強(qiáng)圖書館資源建設(shè),創(chuàng)新服務(wù)管理,減少讀者流失問題,增加讀者粘度。因此,對(duì)讀者行為屬性分析,已成為當(dāng)前圖書館工作需要研究的重點(diǎn);如何高效分析讀者行為數(shù)據(jù),建模及生成自助服務(wù),則成為智慧圖書館目前亟待解決的關(guān)鍵問題[2]。萬物互聯(lián)的大數(shù)據(jù)背景下,讀者不僅是資源使用者,同時(shí)也是資源提供者,讀者之間資源共享將成為必然趨勢(shì),讀者行為數(shù)據(jù)分析模式的構(gòu)建將提升智慧圖書館服務(wù)的實(shí)時(shí)性、精準(zhǔn)性、高效性。

    1 讀者行為數(shù)據(jù)

    1.1 讀者行為表現(xiàn)方式及數(shù)據(jù)結(jié)構(gòu)

    圖書館的讀者行為通常表現(xiàn)為線下行為、線上行為[3]。其中線下行為主要是指讀者利用實(shí)體圖書館文獻(xiàn)、人力、空間、設(shè)備等資源及服務(wù)所產(chǎn)生的行為,比如文獻(xiàn)資源查找、借閱、信息咨詢等。線上行為是指讀者利用虛擬圖書館資源及服務(wù)所產(chǎn)生的行為,比如資源的檢索、瀏覽、下載、預(yù)約等。通過對(duì)線上線下兩類行為數(shù)據(jù)進(jìn)行分析,積極挖掘具有價(jià)值的讀者行為數(shù)據(jù),為圖書館智慧服務(wù)提供數(shù)據(jù)支撐。

    數(shù)據(jù)結(jié)構(gòu)類型通常劃分為結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化三種類型[4]。結(jié)構(gòu)化數(shù)據(jù)也叫做行數(shù)據(jù),是以二維表結(jié)構(gòu)來邏輯表達(dá)和實(shí)現(xiàn)的數(shù)據(jù),通過關(guān)系型數(shù)據(jù)庫(kù)來進(jìn)行存儲(chǔ)和管理,其特點(diǎn)是數(shù)據(jù)信息能夠用數(shù)據(jù)或統(tǒng)一的結(jié)構(gòu)加以表示,如讀者證信息、借閱信息、書目信息等。非結(jié)構(gòu)化數(shù)據(jù),是數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,沒有預(yù)定義的數(shù)據(jù)模型,在數(shù)據(jù)庫(kù)中不能使用二維邏輯表來表示的數(shù)據(jù),其特點(diǎn)是數(shù)據(jù)信息無法用數(shù)字或統(tǒng)一的結(jié)構(gòu)表示,如所有格式的辦公文檔、文本、圖片、HTML、各類報(bào)表、視頻、音頻信息等。半結(jié)構(gòu)化數(shù)據(jù)是介于完全結(jié)構(gòu)化數(shù)據(jù)(如關(guān)系型數(shù)據(jù)庫(kù)、面向?qū)ο髷?shù)據(jù)庫(kù)中的數(shù)據(jù))和完全無結(jié)構(gòu)的數(shù)據(jù)(如聲音、圖像文件等)之間的數(shù)據(jù),其特點(diǎn)是自描述的,數(shù)據(jù)的結(jié)構(gòu)和內(nèi)容混在一起,沒有明顯的區(qū)分,如HTML文檔、XML和JSON文件等。每天不斷變化的讀者行為數(shù)據(jù),無論屬于哪類數(shù)據(jù)結(jié)構(gòu),都可以理解為讀者行為數(shù)據(jù)主體,以利用圖書館服務(wù)為載體,不斷地以實(shí)時(shí)或迭代方式增加。

    1.2 讀者行為數(shù)據(jù)特性

    讀者行為數(shù)據(jù)反饋具有顯性和隱性兩種特性。顯性反饋數(shù)據(jù)數(shù)量級(jí)較少,且數(shù)據(jù)存儲(chǔ)相對(duì)比較簡(jiǎn)單,能夠?qū)崿F(xiàn)實(shí)時(shí)讀取,將反饋數(shù)據(jù)引入其中之后可以增加或減少輸入數(shù)據(jù)[5]。隱性反饋數(shù)據(jù)則有較高復(fù)雜性,在分布式文件存儲(chǔ)系統(tǒng)內(nèi)存儲(chǔ),通過運(yùn)用可拓展系統(tǒng)結(jié)構(gòu),并運(yùn)用多臺(tái)存儲(chǔ)服務(wù)器承擔(dān)負(fù)荷,用于讀者定位信息存儲(chǔ),讀取過程將產(chǎn)生一定延遲,但仍然會(huì)增加輸入數(shù)據(jù)。

    2 讀者行為數(shù)據(jù)分析

    基于大數(shù)據(jù)挖掘下的智慧圖書館讀者行為分析,就是將圖書館已獲取的讀者行為數(shù)據(jù)作為基礎(chǔ),完成對(duì)歷史數(shù)據(jù)的一系列搜集、分離、過濾、定義及分析,發(fā)現(xiàn)讀者行為之間存在的關(guān)聯(lián),明確讀者的服務(wù)需求及知識(shí)圖譜,最終分析、判定讀者的行為動(dòng)態(tài)。深度了解讀者的真實(shí)需求,是提供個(gè)性化、精準(zhǔn)化服務(wù)的關(guān)鍵。讀者行為數(shù)據(jù)分析主要分為六個(gè)步驟,即對(duì)讀者行為數(shù)據(jù)采集、預(yù)處理、分析、歸類、匹配、數(shù)據(jù)更新完善(見圖1)。

    2.1 讀者行為數(shù)據(jù)采集路徑

    第一,通過nginx等軟件監(jiān)控并采集服務(wù)器日志、智慧圖書館門戶網(wǎng)站、移動(dòng)服務(wù)平臺(tái)和借閱系統(tǒng)等數(shù)據(jù),包含資源點(diǎn)擊率、訪問內(nèi)容、頁(yè)面停留時(shí)長(zhǎng)、檢索、瀏覽、下載、收藏、分享、訪問PV、UV、IP數(shù)量、關(guān)注熱門信息以及訪問頻次等不同數(shù)據(jù)。第二,運(yùn)用監(jiān)控、射頻、感知等硬件設(shè)備收集相關(guān)數(shù)據(jù)息,包括讀者的訪問時(shí)間、訪問內(nèi)容、頻次、位置、移動(dòng)等數(shù)據(jù)。

    2.2 讀者行為數(shù)據(jù)預(yù)處理

    讀者行為數(shù)據(jù)預(yù)處理,包括對(duì)服務(wù)端所接收到數(shù)據(jù)的合理化、規(guī)范化、標(biāo)準(zhǔn)化處理,通過運(yùn)用Hadoop分布式處理框架,運(yùn)用Map-Reduce處理非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)。Hadoop作為目前的大數(shù)據(jù)處理分布式框架[6],由HDFS、Map-Reduce、Hadoop、HBase多個(gè)預(yù)處理子項(xiàng)目構(gòu)成。Habse能夠多維分布式面向數(shù)據(jù)存儲(chǔ)系統(tǒng),并對(duì)系統(tǒng)的整體容錯(cuò)率有效提升,增強(qiáng)系統(tǒng)的可拓展性,運(yùn)用NoSQL處理非關(guān)系型數(shù)據(jù),該技術(shù)具備較強(qiáng)數(shù)據(jù)處理性能及拓展水平,實(shí)現(xiàn)對(duì)數(shù)據(jù)的一系列清洗、集成、變化、規(guī)約等處理之后,再進(jìn)行數(shù)據(jù)降噪、存儲(chǔ)以及平滑聚集及概化,便可以有效轉(zhuǎn)換非關(guān)系型數(shù)據(jù),經(jīng)數(shù)據(jù)預(yù)處理提供數(shù)據(jù)集保障(見圖2)。

    圖1 讀者行為數(shù)據(jù)處理流程

    圖2 讀者行為數(shù)據(jù)預(yù)處理流程

    圖3 讀者行為數(shù)據(jù)分析流程

    2.3 讀者行為數(shù)據(jù)分析

    讀者行為數(shù)據(jù)分析主要包括對(duì)所接收數(shù)據(jù)的檢索、知識(shí)、語義、挖掘及分類,通過對(duì)數(shù)據(jù)進(jìn)行挖掘之后完成分離、過濾、遞歸以及再分析,發(fā)現(xiàn)讀者的差異化興趣愛好及行為習(xí)慣,將存在的規(guī)律與讀者的差異化行為特點(diǎn)結(jié)合,進(jìn)一步細(xì)化處理讀者行為數(shù)據(jù),并劃分讀者的行為數(shù)據(jù)為不同粒度[7]。讀者行為數(shù)據(jù)分析的結(jié)果,可直接用于讀者行為數(shù)據(jù)歸類和數(shù)據(jù)更新完善(見圖3)。

    3 建立讀者行為數(shù)據(jù)分析模型

    3.1 需求分析

    圖書館的讀者行為數(shù)據(jù)模型,一般需要對(duì)讀者行為特征數(shù)據(jù)進(jìn)行收集、分析,并概括理解為抽象化的行為數(shù)據(jù)庫(kù)特征,為滿足讀者行為需求及后續(xù)信息資源更新提供基礎(chǔ)。隨著讀者行為數(shù)據(jù)不斷變化動(dòng)態(tài)調(diào)整現(xiàn)有數(shù)據(jù)模型(見圖4)。

    構(gòu)建讀者行為數(shù)據(jù)模型,需要與大數(shù)據(jù)智慧服務(wù)相結(jié)合,實(shí)現(xiàn)實(shí)時(shí)、精確、個(gè)性化服務(wù)要求。第一,要解決海量數(shù)據(jù)下的實(shí)時(shí)計(jì)算及推薦服務(wù),運(yùn)用數(shù)據(jù)實(shí)施處理框架Spark Streaming,經(jīng)過云計(jì)算完成海量讀者行為數(shù)據(jù)的搜集,并建立與所需數(shù)據(jù)相關(guān)聯(lián)的數(shù)據(jù)[8],有效銜接不同數(shù)據(jù)知識(shí)庫(kù),從而提升讀者信息數(shù)據(jù)的精準(zhǔn)性、全面性。第二,要解決為讀者提供個(gè)性化、精準(zhǔn)化的推薦服務(wù),通過建立讀者矩陣,運(yùn)用信息協(xié)同過濾技術(shù),對(duì)存在的信息過載、超載等問題進(jìn)行有效緩解,為科學(xué)預(yù)測(cè)讀者的興趣變化提供支撐,從而構(gòu)建屬于讀者的個(gè)性化模型。第三,要對(duì)讀者的情感弱化及興趣轉(zhuǎn)移問題有效解決,深度剖析讀者的具體需求及愛好,通過日志分析軟件獲取相關(guān)數(shù)據(jù),結(jié)合讀者隱性行為,挖掘出與顯性行為相似或相關(guān)的行為數(shù)據(jù),有效改善“興趣轉(zhuǎn)移”問題[9],從而滿足讀者的興趣所需。

    3.2 建立高效安全的大數(shù)據(jù)系統(tǒng)

    在復(fù)雜多樣性、價(jià)值密度較低的大數(shù)據(jù)環(huán)境下,必須提升智慧圖書館在大數(shù)據(jù)融合、采集、挖掘、發(fā)現(xiàn)及決策等方面功能,才能確保智慧服務(wù)的高效性、科學(xué)性、精準(zhǔn)性。第一,在智慧圖書館建設(shè)中對(duì)大數(shù)據(jù)服務(wù)讀者需求內(nèi)容、范圍及格式加以界定,制定高效科學(xué)化的大數(shù)據(jù)管理方案[10],在對(duì)讀者行為數(shù)據(jù)的采集獲取過程中,運(yùn)用視頻監(jiān)控、傳感器、服務(wù)器監(jiān)控、終端監(jiān)控、第三方運(yùn)營(yíng)數(shù)據(jù)等部署方式,全面采集讀者行為數(shù)據(jù)。第二,在大數(shù)據(jù)的深層管理加工環(huán)節(jié)中,需要對(duì)數(shù)據(jù)進(jìn)行清洗、脫敏,客觀評(píng)估讀者行為數(shù)據(jù)的可用性及真實(shí)價(jià)值,實(shí)現(xiàn)數(shù)據(jù)融合及價(jià)值的二次增值,為智慧圖書館提供準(zhǔn)確、高效、安全、標(biāo)準(zhǔn)的讀者行為數(shù)據(jù)。

    3.3 讀者個(gè)性化服務(wù)體系架構(gòu)

    結(jié)合以上功能需求,智慧圖書館讀者行為數(shù)據(jù)分析服務(wù)架構(gòu)包括五個(gè)層級(jí)(見圖5)。

    (1)感知層。該層組成主要包括讀者行為數(shù)據(jù)中心系統(tǒng)、視頻、網(wǎng)絡(luò)監(jiān)控器、相機(jī)、RFID設(shè)備、傳感器等,負(fù)責(zé)完成對(duì)讀者行為數(shù)據(jù)及數(shù)據(jù)中心系統(tǒng)的運(yùn)行數(shù)據(jù)采集。

    (2)存儲(chǔ)層。該層主要是存儲(chǔ)經(jīng)感知層采集完成的數(shù)據(jù),包括結(jié)構(gòu)化、半結(jié)構(gòu)、非結(jié)構(gòu)三種類型數(shù)據(jù)[11]。

    (3)組織層。該層主要是從數(shù)據(jù)庫(kù)中數(shù)據(jù)的結(jié)構(gòu)特征來分析、處理數(shù)據(jù),并以數(shù)據(jù)組織方式對(duì)信息進(jìn)行描述。

    (4)分析層。該層主要是利用數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析、圖形分析、可視分析、語義分析化、數(shù)據(jù)挖掘、預(yù)測(cè)分析等手段,從獲到的大量讀者行為數(shù)據(jù)中迅速、精準(zhǔn)、高效地自動(dòng)發(fā)現(xiàn)數(shù)據(jù)知識(shí)間的隱藏關(guān)系,使數(shù)據(jù)分析結(jié)果更具科學(xué)性、可讀性等[12]。

    圖4 讀者行為分析模型構(gòu)建

    (5)決策層。該層主要是基于分析層處理后的讀者行為數(shù)據(jù),直接服務(wù)于管理者、讀者,實(shí)現(xiàn)智慧化圖書館決策管理、服務(wù)、環(huán)境管理、安全管理、圖書館建設(shè)、監(jiān)控預(yù)警、服務(wù)評(píng)價(jià)、服務(wù)優(yōu)化等智慧化服務(wù)。

    圖5 讀者個(gè)性化服務(wù)體系架構(gòu)

    4 讀者行為數(shù)據(jù)分析建模關(guān)鍵問題

    4.1 大數(shù)據(jù)質(zhì)量安全管理

    智慧圖書館大數(shù)據(jù)采集全面性、相關(guān)性及大數(shù)據(jù)的運(yùn)用價(jià)值、安全性,均是大數(shù)據(jù)科學(xué)決策的關(guān)鍵。所以,在智慧圖書館的大數(shù)據(jù)生命全周期管理過程中,必須始終貫穿數(shù)據(jù)質(zhì)量及安全管理理念。第一,大數(shù)據(jù)的采集范圍主要源于圖書館的中心服務(wù)系統(tǒng)、服務(wù)推送定制,以及閱讀活動(dòng)、服務(wù)環(huán)境感知、質(zhì)量評(píng)估及運(yùn)行效率、安全性管理等多個(gè)環(huán)節(jié)。因此,讀者行為數(shù)據(jù)采集所用設(shè)備,必須堅(jiān)持標(biāo)準(zhǔn)化、多樣化原則,與傳感器、網(wǎng)絡(luò)、視頻、終端監(jiān)控器以及個(gè)人智能移動(dòng)終端、第三方平臺(tái)相結(jié)合[13],保證讀者行為數(shù)據(jù)分析全面性,有效提高讀者行為數(shù)據(jù)的總價(jià)值。第二,構(gòu)建讀者行為分析統(tǒng)一大數(shù)據(jù)平臺(tái),對(duì)讀者行為數(shù)據(jù)的清洗、處理、存儲(chǔ)、脫敏、可視化管理等,實(shí)現(xiàn)讀者行為數(shù)據(jù)分析管理的科學(xué)性、實(shí)用性和可控性目的,滿足讀者服務(wù)需求。第三,在嚴(yán)格遵守國(guó)內(nèi)外有關(guān)大數(shù)據(jù)信息采集、挖掘、傳輸?shù)纫?guī)則基礎(chǔ)上,構(gòu)建端端相對(duì)的大數(shù)據(jù)安全保障體系,加強(qiáng)讀者行為分析數(shù)據(jù)開放、共享、隱私權(quán)保護(hù)、交換訪問接口、數(shù)據(jù)的存儲(chǔ)、讀取等多環(huán)節(jié)的安全管理[14]。

    4.2 讀者行為大數(shù)據(jù)平臺(tái)架構(gòu)

    讀者閱讀服務(wù)需求愈來愈多樣化,圖書館每天產(chǎn)生的各類日志(包括服務(wù)器日志、閱讀活動(dòng)、監(jiān)控視頻、推送服務(wù)、配送數(shù)據(jù)等)容量將達(dá)到T級(jí)。為滿足大數(shù)據(jù)讀者行為分析需要,必須堅(jiān)持獨(dú)立性、開放性平臺(tái)建設(shè)原則[15],構(gòu)建集成上下游的數(shù)據(jù)采集、傳輸、分析、動(dòng)態(tài)拓展等功能的智慧平臺(tái),管理人員可以結(jié)合智慧圖書館的業(yè)務(wù)優(yōu)先等級(jí)、資源總量、時(shí)效性等,實(shí)現(xiàn)對(duì)圖書館重要任務(wù)和服務(wù)效率造成較大影響的業(yè)務(wù)優(yōu)先提供資源與服務(wù)。

    4.3 讀者行為數(shù)據(jù)分析核心要素

    在構(gòu)建智慧圖書館讀者行為數(shù)據(jù)分析模式中,應(yīng)當(dāng)將效率和正確性作為核心要素,重視數(shù)據(jù)采集的相關(guān)性和有效性,深度挖掘數(shù)據(jù)的二次價(jià)值,是提高讀者服務(wù)及基礎(chǔ)管理水平的關(guān)鍵[16]。讀者需求始終在變化之中,讀者行為數(shù)據(jù)在發(fā)現(xiàn)、提取、分析過程中,需要著重考慮三個(gè)問題。第一,確保系統(tǒng)分析的無縫性、實(shí)時(shí)性,以及數(shù)據(jù)分析的智慧可用性。第二,圖書館大數(shù)據(jù)分析平臺(tái),必須具有整合各類異構(gòu)服務(wù)平臺(tái)功能,實(shí)現(xiàn)集中統(tǒng)一管控目標(biāo)。第三,注意避免智慧圖書館中發(fā)生信息孤島、數(shù)據(jù)壁壘等問題,堅(jiān)持讀者行為數(shù)據(jù)分析、處理、決策的公平、共享及開放性原則,確保讀者行為數(shù)據(jù)分析能夠達(dá)到經(jīng)濟(jì)、高效、可控目標(biāo)。

    5 結(jié)語

    文章利用大數(shù)據(jù)挖掘技術(shù),采集、整理、分析讀者行為數(shù)據(jù),并進(jìn)行建模分析,深入挖掘出讀者的真實(shí)需求,并提出了大數(shù)據(jù)質(zhì)量安全管理、讀者行為大數(shù)據(jù)平臺(tái)架構(gòu)、讀者行為數(shù)據(jù)分析核心要素等三個(gè)方面要素是構(gòu)建讀者行為數(shù)據(jù)分析模型的關(guān)鍵,基于讀者行為數(shù)據(jù)分析模型的智慧圖書館可提高服務(wù)效率和服務(wù)質(zhì)量,讓讀者在圖書館中獲得更好的體驗(yàn)感、獲得感、存在感。由于構(gòu)建實(shí)時(shí)性、精準(zhǔn)性、高效性的讀者行為數(shù)據(jù)分析模型除了受物聯(lián)網(wǎng)、人工智能、5G網(wǎng)絡(luò)等技術(shù)及設(shè)備影響外,主要還與所采用的數(shù)據(jù)挖掘算法和館員應(yīng)具備的素質(zhì)能力也有很大關(guān)系,這些都是以后需要重點(diǎn)研究的方向。

    猜你喜歡
    智慧圖書館分析
    隱蔽失效適航要求符合性驗(yàn)證分析
    電力系統(tǒng)不平衡分析
    電子制作(2018年18期)2018-11-14 01:48:24
    圖書館
    電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
    飛躍圖書館
    有智慧的羊
    去圖書館
    智慧派
    智慧決定成敗
    智慧往前沖,統(tǒng)計(jì)百分百(1)
    平陆县| 成武县| 玉林市| 旌德县| 河西区| 岳西县| 肇庆市| 江津市| 辉县市| 安新县| 萨迦县| 田林县| 乌拉特中旗| 崇礼县| 綦江县| 九龙城区| 沁水县| 永州市| 鹤庆县| 乌海市| 郴州市| 福州市| 平和县| 凌云县| 金沙县| SHOW| 曲沃县| 射洪县| 临漳县| 连云港市| 措美县| 南宫市| 左贡县| 肇东市| 平原县| 罗田县| 开江县| 重庆市| 怀化市| 水富县| 林州市|