摘 要:數據挖掘技術是大數據時代的產物,具有計算性能、功能性、可用性和輔助功能。圖書館使用數據挖掘技術,有助于充分發(fā)揮數字資源的價值,實現圖書館數字資源共享的目標。本文將簡單介紹數據挖掘技術和大數據的特征,分析大數據與高校圖書館的關系,并探討數據挖掘技術在圖書館系統(tǒng)中的應用策略。
關鍵詞:數據挖掘技術;大數據時代;圖書館系統(tǒng);數字資源共享
數據挖掘技術即數據處理技術,該技術方法包括神經網絡法、遺傳算法、決策樹方法、粗集方法、覆蓋正例排斥反例方法、統(tǒng)計分析法和模糊集方法等。
目前,圖書館管理系統(tǒng)開始采用數據挖掘技術以實現數字管理和數字資源共享的目標。
一、數據挖掘技術和大數據的特征
數據挖掘技術是大數據時代的產物,挖掘的任務主要是關聯分析、聚類分析、分類、預測、時序模式和偏差分析等,基本流程有五個步驟:
第一步是定義問題,確定數據挖掘的目的;
第二步是做好數據準備工作;
第三步則開始進行數據挖掘;
第四步就要分析數據挖掘的結果;
第五步是將分析所得的知識編制到信息系統(tǒng)中。
數據挖掘的技術方法包括神經網絡法、遺傳算法、決策樹方法、粗集方法、覆蓋正例排斥反例方法、統(tǒng)計分析法和模糊集方法等。
神經網絡法是通過建立網絡模型來解決數據挖掘的問題,遺傳算法是一種隨機搜索算法,決策樹方法用于預測模型,粗集方法發(fā)揮著數學工具的作用,覆蓋正例排斥反例方法用于篩選有價值的數據信息,統(tǒng)計分析法能夠處理函數關系和相關關系,模糊集方法可以對數據信息進行基本評判與分析,并建立云模型,總結云理論。
“大數據時代”被用來描述處于海量信息爆炸的今天,大數據是指巨量數據和海量數據,是一種數量巨大、結構復雜、類型繁多的數據集合,具備知識服務功能,可以集成共享數據,交叉復用形成的智力資源,主要數據結構包括結構化數據、半結構化數據和非結構化數據,數據類型繁多,有視頻、音頻、地理信息、網絡日志等。
大數據的價值密度很低,需要用云計算機對數據進行處理與應用才可以提取有價值的信息。
二、大數據與圖書館管理系統(tǒng)的關系
圖書館也和大數據有一定的相關關系,主要表現為數字圖書館具備大數據的結構類型和特征,數字資源總量增加,信息服務要求提高等方面。
大數據的結構包括結構化數據、半結構化數據和非結構化數據,圖書館管理系統(tǒng)也選用了這三種結構。
結構化數據是指在數據庫中,經常用二維表結構來表示的數據,一般情況下,圖書館在購買商業(yè)數據或者建立特色數據的時候都采用結構化數據。
半結構化數據類型包括HIML、郵件、報表和資源庫等,一般用于數據挖掘系統(tǒng)、教學資源庫、WEB群和郵件系統(tǒng)等。
非結構化數據的每一條數據記錄都由可重復或者不可重復的字段所構成,包括視頻、音頻、圖片和文檔等形式。文件服務器、視頻點播與監(jiān)控和媒體資源管理都會運用這種結構。
三、數據挖掘技術在圖書館系統(tǒng)中的應用策略
(一)采用數據挖掘技術提煉有價值的信息資源
使用數據挖掘技術可以集中所有分散的數字資源,通過數據處理與統(tǒng)計分析提煉出大量有價值的數據信息。
圖書館的數字資源主要包括所有的電子書、數據庫、視頻與音頻等,運用數據挖掘技術可以分析并利用圖書館的全部數字資源,并得出最為準確的結果。
用戶在使用圖書館數字資源的過程中,可以建立很多交互數據,從而增加了許多非結構化數據。部分圖書館已經開始使用微博信息服務,從而產生許多交互數據。
圖書館會將這些數據以不同的組織方式和形態(tài)分布在各個管理系統(tǒng)中,然后把所有的數據資源整理到同一個云平臺之中,用云技術將這些數據進行處理與分析,建立成完備的數字資源體系。
(二)統(tǒng)一管理數字資源
運用數據挖掘技術可以統(tǒng)一管理數字資源,提高信息服務質量。圖書館數據信息的分析與處理離不開云技術體系,該技術體系中的虛擬化技術可以有效實現物理設備共享,整合并調配圖書館系統(tǒng)中的硬件設備,有效延長設備的使用壽命,降低硬件建設的成本,保證實現數字資源共享的硬件安全。
(三)保證數字資源的規(guī)范管理
采用數據挖掘技術有助于實現圖書館數字資源共享的目標,輔助圖書館完善管理系統(tǒng)以保證數字資源的規(guī)范管理?;跀祿诰蚣夹g體系下的圖書館系統(tǒng)是一個分工細致的數據管理機構,可以在分析、處理與利用數字信息的過程中實現數字資源共享,保證圖書館管理工作的程序化、清晰化與科學化。
四、結語
綜上所述,數據挖掘技術是大數據時代的產物,圖書館和大數據有一定的相關關系,主要表現在數字圖書館具備大數據的結構類型和特征,數字資源總量增加以及用戶的信息服務要求提高三個方面。將數據挖掘技術應用于圖書館管理系統(tǒng)可以提煉有價值的信息資源,統(tǒng)一管理數字資源,保證數字資源的規(guī)范管理。
參考文獻:
[1] 陳麗麗,夏捷,陶賢繼.實現大數據時代圖書館的數字資源共享的有效措施[J].上海師范大學,2010(4).
[2] 何建新.淺談如何實現大數據時代圖書館的數字資源共享的策略[J].廣東大學,2011(12).
[3] 陳麗麗.數據挖掘在圖書館個性化服務的應用研究[J].上海師范大學,2010(5).
[4] 金玉嬋.數據挖掘技術中基于關聯規(guī)則算法的研究[J].科技傳播,2011(12).
作者簡介:武艷榮,包頭市委黨校,研究方向:圖書信息。