趙吉文
摘要:隨著經(jīng)濟的發(fā)展,帶動了信息技術(shù)的快速發(fā)展,提高了信息處理技術(shù)的水平,數(shù)據(jù)挖掘技術(shù)也得到了較快發(fā)展。本文對圖書館中數(shù)據(jù)挖掘技術(shù)的應(yīng)用進(jìn)行了研究,結(jié)合目前高校圖書館數(shù)據(jù)挖掘技術(shù)的運用現(xiàn)狀,為讀者提供更具個性化的服務(wù)。
關(guān)鍵詞:數(shù)據(jù)挖掘;高校圖書館;智能分析
中圖分類號:TP311.13 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2019)06-0052-02
0 引言
目前我國高校圖書館的藏書量越來越多,不僅增加了管理員工作量和信息處理,對于讀者來說也很難進(jìn)行書籍查找,在這樣的背景下,進(jìn)行高校圖書館的數(shù)據(jù)挖掘等智能化運用和分析就越來越有必要。在高校的智能圖書館中,讀者的歷史訪問數(shù)據(jù)都會有所記錄,因為這些數(shù)據(jù)資料中隱藏著很多信息,所以圖書館都會就此進(jìn)行數(shù)據(jù)挖掘和分析,并運用分析的結(jié)果為讀者提供更好的服務(wù)。
1 數(shù)據(jù)挖掘技術(shù)
1.1 數(shù)據(jù)挖掘技術(shù)的內(nèi)涵
數(shù)據(jù)挖掘是對數(shù)據(jù)庫中存儲的數(shù)據(jù)信息的一種整理和提取,并從中挖掘出對人們有用的一種數(shù)據(jù)處理技術(shù)[1]。數(shù)據(jù)挖掘的信息處理過程有四個方面的內(nèi)容:(1)確定分析對象。數(shù)據(jù)的挖掘必須要有確定的對象,這樣才能達(dá)到實際的挖掘目標(biāo);(2)了解挖掘的數(shù)據(jù)對象。在熟悉需要挖掘的對象后才能進(jìn)行準(zhǔn)備,了解數(shù)據(jù)的來源、特點等,并采取更適合的數(shù)據(jù)挖掘方式。因為數(shù)據(jù)的挖掘需要進(jìn)行前期的準(zhǔn)備,所以必須要了解數(shù)據(jù)對象的內(nèi)容;(3)數(shù)據(jù)探索過程。數(shù)據(jù)的挖掘過程就是一種探索過程,只有進(jìn)行有用數(shù)據(jù)的深度探索,了解其特點和規(guī)律,并進(jìn)行分析預(yù)測,才能更好的開展實際的指導(dǎo)工作;(4)建模和應(yīng)用過程。數(shù)據(jù)的建模過程要根據(jù)數(shù)據(jù)本身的特點進(jìn)行,運用合適的挖掘技術(shù)建立數(shù)據(jù)基礎(chǔ),并進(jìn)行數(shù)據(jù)挖掘的計算驗證,然后才可以確定使用,據(jù)此進(jìn)行數(shù)據(jù)決策和后期的投入使用。
1.2 數(shù)據(jù)挖掘的在高校圖書館智能分析中的作用
現(xiàn)在科學(xué)信息技術(shù)在高速發(fā)展,高校在發(fā)展建設(shè)過程中也不斷擴大其圖書館的規(guī)模,其藏書量在擴大,管理系統(tǒng)的數(shù)據(jù)量也越來越多,要提高圖書館的服務(wù)質(zhì)量,打造個性化服務(wù),高校圖書館就要運用數(shù)據(jù)挖掘技術(shù),提高圖書館系統(tǒng)的智能化。
(1)提高圖書館的決策力?,F(xiàn)在高校的圖書館管理系統(tǒng)中都運用了數(shù)據(jù)挖掘技術(shù),它可以實現(xiàn)有用數(shù)據(jù)信息的分析研究,為管理員和領(lǐng)導(dǎo)提供更科學(xué)準(zhǔn)確的決策,提高其可操作性。比如,在查閱圖書借閱情況時,運用數(shù)據(jù)挖掘技術(shù)分析,對于讀者的讀書類別和次數(shù)進(jìn)行提取分析,就可以從中發(fā)現(xiàn)其借閱規(guī)律,為圖書館的管理和圖書添置提供方向,也提供了一種可行性的依據(jù)。因為數(shù)據(jù)挖掘技術(shù)的智能化,它實現(xiàn)了圖書館管理系統(tǒng)內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)的統(tǒng)一,并以此為基礎(chǔ)進(jìn)行智能分析,領(lǐng)導(dǎo)才可以得到更加靈活準(zhǔn)確的數(shù)據(jù)信息,然后進(jìn)行圖書館的管理決策[2]。這一信息技術(shù)主要是根據(jù)歷史數(shù)據(jù)查找其中隱藏的規(guī)律,然后進(jìn)行預(yù)測,為實際決策提供依據(jù)。(2)指導(dǎo)采購工作。數(shù)據(jù)挖掘技術(shù)進(jìn)行的是智能化的數(shù)據(jù)分析,其得到的分析結(jié)果對圖書館的圖書采購計劃有很大的指導(dǎo)作用。通過分析預(yù)測,圖書館圖書的采購行為就可以根據(jù)讀者的實際閱讀量進(jìn)行,而不是由圖書采購員的主觀因素和分析進(jìn)行的,使得圖書的利用率提高,降低了不合理圖書采購帶來的影響。(3)打造個性化服務(wù)。高校圖書館設(shè)置的目的就是為了讓教師和學(xué)生可以查閱圖書,如果選購的圖書不能滿足他們的需求,和他們的愛好有很大出入,不僅圖書利用率下降,還是一種很大的資源浪費。而將數(shù)據(jù)挖掘技術(shù)運用在高校圖書館中,就可以根據(jù)讀者的不同閱讀需求進(jìn)行數(shù)據(jù)分析,并從中把握讀者的圖書需求,為他們提供個性化的服務(wù)。這樣高校圖書館的服務(wù)質(zhì)量就得到了提高,也可以滿足讀者的閱讀需求,發(fā)揮圖書館的真正作用。
2 數(shù)據(jù)挖掘在高校圖書館智能分析中面臨的挑戰(zhàn)
在高校圖書館中運用數(shù)據(jù)挖掘技術(shù)雖然可以解決很多問題,但是數(shù)據(jù)挖掘技術(shù)本身也有一些缺陷,主客觀因素都會對其產(chǎn)生影響。因此,在高校圖書館智能分析中,在享受數(shù)據(jù)挖掘技術(shù)帶來好處的同時,也要發(fā)現(xiàn)其對圖書館智能分析帶來的新的挑戰(zhàn),為讀者提供更高質(zhì)量的服務(wù)。
2.1 異構(gòu)數(shù)據(jù)源的信息挖掘
異構(gòu)數(shù)據(jù)源來自很多不同的數(shù)據(jù)源,需要從中獲取有用的信息再進(jìn)行綜合分析,得到的信息才是有用的。但在高校圖書館管理中,資源信息更新?lián)Q代快,而且需要很大的資金投入,圖書館的技術(shù)管理人員也要不斷學(xué)習(xí),這就增加了其運用的難度。
2.2 數(shù)據(jù)挖掘結(jié)果的合理表示
將數(shù)據(jù)挖掘技術(shù)運用在高校圖書館的數(shù)據(jù)信息挖掘中有很大的作用,但信息的處理、挖掘結(jié)果的運用等方面都具有不確定性,其受到挖掘信息的種類、表現(xiàn)形式等因素的影響,挖掘結(jié)果的表達(dá)也需要繼續(xù)分析。對于數(shù)據(jù)信息的挖掘結(jié)果高校圖書館的從業(yè)人員的研究角度和方式也存在差別,必須要根據(jù)其不同的表現(xiàn)形式才能進(jìn)行挖掘結(jié)果的分析。
2.3 不同層面數(shù)據(jù)信息的交互式挖掘
在數(shù)據(jù)信息挖掘中要先確定挖掘目標(biāo),高校圖書館的數(shù)據(jù)信息資源很多,數(shù)據(jù)信息的挖掘是一種復(fù)雜信息的查詢過程,在不同的層面都有不同的信息處理方式,而且查詢過程要保留一些有用的環(huán)節(jié),這樣數(shù)據(jù)挖掘的結(jié)果才更具有可靠性。在這一過程中,要根據(jù)實際的搜索條件進(jìn)行及時的動態(tài)調(diào)整和查詢,其中的查詢過程必須要從不同角度審視,并結(jié)合挖掘過程進(jìn)行數(shù)據(jù)的靈活性變動調(diào)整[3]。這些都要求圖書管理人員的專業(yè)技術(shù)能力,增加了這一工作的復(fù)雜性。
3 數(shù)據(jù)挖掘在高校圖書館智能分析中的應(yīng)用
3.1 推薦圖書文獻(xiàn)
在高校圖書館智能分析中,數(shù)據(jù)挖掘技術(shù)可以依據(jù)讀者的歷史閱讀數(shù)據(jù)資料進(jìn)行聚類和關(guān)聯(lián)分析,并就讀者閱讀的圖書文獻(xiàn)把握其中的關(guān)聯(lián)規(guī)則,比如讀者可能更偏好文學(xué)類的書籍,但是同時他也會借閱法律類的圖書。數(shù)據(jù)分析就是運用計算把握其中的關(guān)聯(lián)規(guī)則,并了解這類讀者的基本借閱模式,根據(jù)這些信息圖書館可以推薦更感興趣的圖書數(shù)據(jù)庫,在讀者進(jìn)行圖書閱讀借閱時為讀者推薦數(shù)據(jù)分析的相關(guān)圖書文獻(xiàn)資料[4]。這樣不僅節(jié)約了讀者的時間,也可以提供更優(yōu)質(zhì)的服務(wù),發(fā)現(xiàn)不同類別圖書的關(guān)聯(lián)性強度,為其他讀者借閱某類圖書時推薦關(guān)聯(lián)性最強的圖書資料。
3.2 檢索圖書文獻(xiàn)
圖書館文獻(xiàn)檢索是其信息推薦個性化服務(wù)的重要內(nèi)容,以往圖書館文獻(xiàn)的檢索只提供文獻(xiàn)的簡單信息,對于讀者的閱讀興趣不能進(jìn)行智能化的分析,其服務(wù)也就不夠個性化。數(shù)據(jù)挖掘技術(shù)就可以輕松實現(xiàn)個性化推薦服務(wù),它對讀者借閱行為產(chǎn)生的數(shù)據(jù)信息進(jìn)行收集,主要是圖書館數(shù)據(jù)庫中讀者的借閱記錄、預(yù)約記錄、續(xù)借記錄等等,并對此展開篩選處理,消除噪聲數(shù)據(jù)和重復(fù)數(shù)據(jù),再預(yù)處理和轉(zhuǎn)換得到的信息,然后就可以建立數(shù)據(jù)庫進(jìn)行數(shù)據(jù)的挖掘計算。根據(jù)之前建立的數(shù)據(jù)庫,進(jìn)行聚類和關(guān)聯(lián)性分析,對于讀者借閱書目的類型、閱讀興趣愛好等信息進(jìn)行集合、分析,并運用結(jié)合可視化技術(shù)提供更具個性化的文獻(xiàn)檢索服務(wù)。讀者進(jìn)行文獻(xiàn)檢索時,圖書館系統(tǒng)就會通過數(shù)據(jù)挖掘產(chǎn)生的推薦集自動為讀者推薦相關(guān)的文獻(xiàn),提取有價值的文獻(xiàn)數(shù)據(jù)信息,運用可視化和動態(tài)改變的方式呈現(xiàn)出來。
3.3 管理館藏書架
圖書館的館藏有很多類別,對館藏書架管理優(yōu)化是影響高校圖書館科學(xué)管理的重要因素,可以進(jìn)行圖書文獻(xiàn)變化趨勢的預(yù)測,并預(yù)留最新文獻(xiàn)的位置,減少館藏圖書的倒架工作,及時剔除舊文獻(xiàn)。在高校圖書館智能分析中運用數(shù)據(jù)挖掘技術(shù),可以預(yù)測分析歷年圖書文獻(xiàn)的借閱日志,把握其周期性變化,完成圖書借閱的分類管理,并了解借閱頻繁、增加幅度大的圖書類別。通過這兩部分圖書信息的分析和設(shè)置的排架規(guī)則,對于借閱量大的圖書時要為其預(yù)留位置,減少圖書的倒架工作。同時要分類分析館藏中的文獻(xiàn)數(shù)據(jù),對于規(guī)定時間內(nèi)流通少和基本沒有流通的圖書要進(jìn)行處理,而復(fù)本過多的圖書也要進(jìn)行分類,對文獻(xiàn)的數(shù)量和藏書位置進(jìn)行統(tǒng)計,及時剔除舊文獻(xiàn),將其下架。
3.4 情報咨詢工作
互聯(lián)網(wǎng)中的信息繁雜而多,在進(jìn)行信息獲取時就存在很大的問題,這是情報咨詢工作的一個衡量標(biāo)準(zhǔn),而數(shù)據(jù)挖掘技術(shù)就可以很好的解決這一問題。因此,高校圖書館的信息挖掘系統(tǒng)要和互聯(lián)網(wǎng)連接,并和高校的教學(xué)安排、研究內(nèi)容、發(fā)展方向等多個方面相結(jié)合,挖掘服務(wù)器上互聯(lián)網(wǎng)的網(wǎng)頁。數(shù)據(jù)挖掘技術(shù)結(jié)合用戶的搜索條件就可以自動在互聯(lián)網(wǎng)上進(jìn)行相關(guān)網(wǎng)頁內(nèi)容的搜索,并進(jìn)行海量數(shù)據(jù)信息的深層次分析,提供更完整安全的數(shù)據(jù)信息。而且檢索結(jié)果都要進(jìn)行聚類和關(guān)聯(lián)性分析,對于互聯(lián)網(wǎng)上所有的相關(guān)數(shù)據(jù)信息都可以根據(jù)學(xué)科發(fā)展、科研方向等內(nèi)容進(jìn)行分類分析,并提供索引和有效的鏈接方式。通過檢索界面的建立,為讀者提供可視化的方式,他們可以根據(jù)服務(wù)器提供的關(guān)鍵詞、主題和其他一些有效的檢索條件完成信息挖掘。通過數(shù)據(jù)挖掘技術(shù)的運用,大大提高檢索速度,節(jié)省信息挖掘時間,而且圖書館的信息資源也可以得到優(yōu)化[5]。
4 結(jié)語
在高校圖書館智能分析中運用數(shù)據(jù)挖掘技術(shù),要先把握數(shù)據(jù)挖掘技術(shù)的主要概念,了解數(shù)據(jù)挖掘的主要步驟,并認(rèn)識到其在高校圖書館工作管理中發(fā)揮的作用,提供檢索數(shù)據(jù)的理論依據(jù)。通過分析高校圖書館智能分析中數(shù)據(jù)挖掘技術(shù)面臨的挑戰(zhàn),更好的運用數(shù)據(jù)挖掘技術(shù),并不斷研究推進(jìn)圖書館的信息管理,收集館內(nèi)原始數(shù)據(jù),普及數(shù)據(jù)挖掘技術(shù),根據(jù)產(chǎn)生的數(shù)據(jù)信息資源,為讀者提供更好的服務(wù)。
參考文獻(xiàn)
[1] 張靖.數(shù)據(jù)挖掘在高校圖書館的應(yīng)用研究[J].卷宗,2014(7):41.
[2] 嚴(yán)春來.大數(shù)據(jù)環(huán)境下數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2017(3):113+115.
[3] 陶正梁.數(shù)據(jù)挖掘在高校圖書館期刊管理中的應(yīng)用研究[J].蘭臺世界,2015(17):148-149.
[4] 張鈺莎,梁欣祺.數(shù)據(jù)挖掘在高校圖書館服務(wù)中的應(yīng)用研究[J].廊坊師范學(xué)院學(xué)報(自然科學(xué)版),2015,15(3):32-35.
[5] 趙彤霞.數(shù)據(jù)挖掘技術(shù)在高校圖書館讀者數(shù)據(jù)分析中的應(yīng)用研究[J].中國科技信息,2010(18):138-139.
Application of Data Mining in Intelligent Analysis of University Library
ZHAO Ji-wen
(Henan Mechanical and Electrical Vocational College, Zhengzhou Henan? 451191)
Abstract:With the development of economy, the rapid development of information technology has been promoted, the level of information processing technology has been improved, and data mining technology has also been developed rapidly. This paper studies the application of data mining technology in libraries, and combines the current application status of data mining technology in university libraries to provide more personalized services for readers.
Key words:data mining; university library; intelligent analysis