高江麗(太原理工大學,太原 030024)
高校圖書館管理中數(shù)據(jù)挖掘技術(shù)的應用分析
高江麗
(太原理工大學,太原 030024)
高校圖書館是知識收藏與學術(shù)成果積淀的核心場所,是滿足高校師生甚至校外讀者信息需求的信息平臺。讀者的借閱行為蘊含了大量的互動信息,科學地提取這些信息對于掌握讀者興趣,加強圖書館資源整合與利用具有一定的參考價值。本文從數(shù)據(jù)挖掘技術(shù)的層面對當前高校圖書館信息化管理進行研究分析,為提高圖書資源利用率、改進圖書館服務質(zhì)量、合理配置文獻資源提供理論和實踐借鑒。
高校圖書館;信息化管理;數(shù)據(jù)挖掘
從數(shù)據(jù)處理的視角來看,數(shù)據(jù)挖掘的功能在于從數(shù)據(jù)庫中發(fā)現(xiàn)隱含的、有意義的知識,通常包括描述性挖掘與預測性挖掘兩類。對于高校圖書館的數(shù)據(jù)庫系統(tǒng)而言,數(shù)據(jù)挖掘技術(shù)能夠從海量的讀者信息中刻畫一般屬性,并在當前數(shù)據(jù)的基礎上進行推斷,從而達到預測的目的。通常數(shù)據(jù)挖掘技術(shù)可以發(fā)現(xiàn)以下知識類型:利用概念描述得到廣義知識,利用關(guān)聯(lián)分析得到關(guān)聯(lián)知識,利用分類和聚類方法得到分類知識,利用預測方法得到預測型知識,利用偏差檢測得到偏差型知識。數(shù)據(jù)挖掘的過程通常分為四個步驟,即確定領(lǐng)域?qū)ο蟆?shù)據(jù)準備、挖掘操作、結(jié)果表達和分析。
2.1高校圖書館的數(shù)據(jù)特點
高校圖書館是高校進行教學和科研活動獲取知識的重要來源,并且隨著圖書館網(wǎng)絡數(shù)字化發(fā)展步伐的不斷加快,圖書館的服務模式發(fā)生了巨大變化,信息需求的多樣性、需求方式的多元化使得圖書館面臨大量的數(shù)據(jù)需要處理。高校圖書館的數(shù)據(jù)一般來說具備以下三個方面的特點:一是數(shù)據(jù)的海量性,不僅包括文獻資料、數(shù)字資料等館藏數(shù)據(jù),還包括讀者借閱、信息需求等數(shù)據(jù)信息;二是圖書館數(shù)據(jù)的關(guān)聯(lián)性,即圖書館信息處理系統(tǒng)所積累的大量借閱數(shù)據(jù)之間存在一定的關(guān)聯(lián)性;三是信息的潛在性,即隱含在圖書館大量數(shù)據(jù)中非常有價值的信息,這些信息需要進行數(shù)據(jù)挖掘才能夠變成真正有用的數(shù)據(jù)。
2.2高校圖書館對于數(shù)據(jù)挖掘技術(shù)的需求
從高校圖書管目前所提供的主要服務模式來看,“借、閱、還”以及“信息咨詢”是主要服務類型,但隨著信息需求的個性化、信息獲取方式的多元化發(fā)展,圖書館需要借助網(wǎng)絡智能技術(shù)來拓展自身的服務范圍,提高圖書館信息利用的有效率,能夠深層次挖掘讀者的真實需求,為每位讀者提供個性化服務,而這些需要數(shù)據(jù)挖掘技術(shù)的支撐。數(shù)據(jù)挖掘技術(shù)在高校圖書館中的需求主要包括三個層面:一是讀者群與借閱行為模式分析,即敘述統(tǒng)計、孤立點分析;二是個性化服務工作,即關(guān)聯(lián)規(guī)則分析、時間序列分析;三是文獻排架管理需求。
3.1信息系統(tǒng)總體框架
數(shù)據(jù)挖掘技術(shù)在高校圖書館信息管理系統(tǒng)及數(shù)據(jù)庫中的實踐應用,可基于高校圖書館網(wǎng)站系統(tǒng),采用三層結(jié)構(gòu)體系設計,從信息收集的入口開始,到數(shù)據(jù)庫層面進行深層次的數(shù)據(jù)挖掘。用戶界面層由一系列交互的頁面組成,主要實現(xiàn)用戶通過該層對圖書館網(wǎng)站進行訪問,并獲取訪問者的實際需求信息;業(yè)務邏輯層實現(xiàn)的是應用程序的業(yè)務功能,包括多個模塊,比如用戶注冊與登陸、圖書資源搜索與預定、圖書智能推薦等;數(shù)據(jù)訪問層提供對外部數(shù)據(jù)庫的訪問,完成查詢、插入、刪除和修改數(shù)據(jù)庫中數(shù)據(jù)的功能。
3.2圖書館管理數(shù)據(jù)倉庫設計
數(shù)據(jù)庫設計在高校圖書館信息管理中至關(guān)重要,是實現(xiàn)數(shù)據(jù)挖掘功能的基礎。基于數(shù)據(jù)挖掘需求的高校圖書館數(shù)據(jù)庫由注冊認證庫與圖書館信息庫組成,其中圖書館信息庫又包括圖書信息、讀者信息、管理員采購圖書清單、用戶圖書預定需求單、圖書借閱歷史列表、新購圖書單、出版信息實體等7個實體。為提高圖書館系統(tǒng)數(shù)據(jù)庫的數(shù)據(jù)處理能力,所有SQL調(diào)用都是使用存儲過程來完成的,調(diào)用存儲過程必須使用參數(shù)進行傳遞,進而提高系統(tǒng)安全性。
3.3聚類分析應用
高校圖書館數(shù)據(jù)庫系統(tǒng)中實現(xiàn)數(shù)據(jù)挖掘功能的數(shù)據(jù)挖掘模塊根據(jù)數(shù)據(jù)處理所得數(shù)據(jù)集,應用挖掘技術(shù)實現(xiàn)對信息的挖掘,并將結(jié)構(gòu)存儲下來,這是數(shù)據(jù)挖掘技術(shù)在高校圖書館中聚類分析的具體應用。在進行聚類分析設計時,應實現(xiàn)以下幾個方面的挖掘:一是讀者聚類,即依據(jù)讀者使用情況進行讀者群劃分;二是圖數(shù)聚類,即根據(jù)圖書被借閱的次數(shù)進行聚類分析以得到有價值的信息,進而能夠?qū)D書館的文獻資料采購進行合理的分配。
3.4關(guān)聯(lián)規(guī)則應用
首先,圖書館信息系統(tǒng)提供的檢索功能可以實現(xiàn)讀者關(guān)鍵詞分析,進而分析出讀者的閱讀興趣和需求方向,為讀者提供個性化的智能推薦服務,以及提供更多有用的信息;其次,結(jié)合讀者和文獻資料之間的借閱關(guān)聯(lián)進行數(shù)據(jù)準備,分析二者之間的關(guān)聯(lián)性,并建立關(guān)聯(lián)規(guī)則;最后,在數(shù)據(jù)關(guān)聯(lián)的基礎上實現(xiàn)圖書智能推薦服務,具體步驟為:建立訓練模型→建立在線查詢服務→輸出智能推薦。
10.3969/j.issn.1673-0194.2016.17.108
G251;TP391
A
1673-0194(2016)17-0190-01
2016-07-11