余夢媛
摘 要:?當(dāng)前圖書館借閱量預(yù)測方法無法描述混沌性等非平穩(wěn)變化特征,導(dǎo)致圖書館借閱量預(yù)測錯誤差大,為了改善圖書館借閱量的預(yù)測效果,設(shè)計了基于小波支持向量機(jī)的圖書館借閱量預(yù)測方法。首先對當(dāng)前國內(nèi)外圖書館借閱量的預(yù)測研究現(xiàn)狀進(jìn)行分析,找到引起圖書館借閱預(yù)測誤差大的原因,然后收集圖書館借閱量預(yù)測的歷史數(shù)據(jù),并通過混沌分析算法對歷史數(shù)據(jù)進(jìn)行重新構(gòu)造,并引入小波支持向量機(jī)實現(xiàn)圖書館借閱量預(yù)測模型的建立,最后與其它圖書館借閱量的預(yù)測方法在相同環(huán)境進(jìn)行對比測試。提出的方法可以對圖書館借閱量的變化特征進(jìn)行深度挖掘,圖書館借閱量預(yù)測精度超過95%,高于對比方法圖書館借閱量預(yù)測精度,獲得更加可靠的圖書館借閱量的建模和預(yù)測結(jié)果。
關(guān)鍵詞:?圖書借閱量; 混沌性特征; 數(shù)據(jù)挖掘; 混沌分析算法
中圖分類號: TP 393? ? ? 文獻(xiàn)標(biāo)志碼: A
Prediction of Library Loan Volume Based on Wavelet Support Vector Machine
YU Mengyuan
(Department of Library, Henan Polytechnic Institute, Nanyang, Henan 473000, China)
Abstract:
Current library borrowing forecasting methods cannot describe the non-stationary change characteristics such as chaos, which leads to great error in library borrowing forecasting. In order to improve the forecasting effect of library borrowing, a library borrowing forecasting method based on wavelet support vector machine (WSVM) is designed. Firstly, this paper analyzes the current situation of the prediction of library borrowing volume at home and abroad, finds out the reasons for the large error in the prediction of library borrowing volume, then collects the historical data of library borrowing volume prediction, reconstructs the historical data through chaotic analysis algorithm, and introduces the wavelet support vector machine to establish the prediction model of library borrowing volume. Finally, it establishes the prediction model of library borrowing volume. The forecasting methods of library borrowing volume are tested in the same environment. The presented method can deeply mine the changing characteristics of library borrowing volume. The prediction accuracy of library borrowing volume exceeds 95%, which is higher than that of the comparative methods. It can obtain more reliable model and prediction results of library borrowing volume.
Key words:
book borrowing; chaotic characteristics; data mining; chaotic analysis algorithm
0 引言
隨著高校招生規(guī)模的不斷擴(kuò)大,高校學(xué)生人數(shù)猛增,高校圖書館使用頻率越來越高,而圖書館借閱量預(yù)測結(jié)果是衡量一個學(xué)校圖書館信息系統(tǒng)一個重要評價指標(biāo)[1-3]。圖書館借閱量的預(yù)測可以幫助圖書館管理人員了解學(xué)生喜歡那類圖書,可以對圖書進(jìn)行有效管理,提高圖書館中圖書的利用率,同時可以幫助學(xué)生快速借到自己真正需要的圖書,因此圖書館借閱量的建模和預(yù)測結(jié)果對圖書館智能化管理具有重要研究意義[4-6]。
針對圖書館借閱量的建模和預(yù)測問題,國外的研究起步比較早,而且技術(shù)也比較成熟,而國內(nèi)的研究雖然起步比較晚,但是我國投入了大量的人力、財力對圖書館借閱量的建模和預(yù)測問題,發(fā)展勢頭十分好[7-8]。圖書館借閱量的建模和預(yù)測研究可以劃為兩類2方法,一種是基于線性理論圖書館借閱量的預(yù)測方法,主要為回歸分析算法、灰色模型等,它們通過對圖書館借閱量相關(guān)數(shù)據(jù)進(jìn)行分析,估計圖書館借閱量預(yù)測模型的參數(shù),對于小規(guī)模圖書館,其它預(yù)測效果比較好[9],但是對于大型圖書館,它們借閱量預(yù)測精度比較低,這是因為現(xiàn)代圖書館借閱量不只具有線性變化特征,由于受到學(xué)生、圖書館環(huán)境、圖書種類等影響,具有一定的混沌性,這樣無法建立精確的圖書館借閱量預(yù)測模型。另一種是基于非線性理論圖書館借閱量的預(yù)測方法,引入了混沌分析算法、神經(jīng)網(wǎng)絡(luò)、對圖書館借閱量的變化特征進(jìn)行分析和描述,相于線線預(yù)測方法,該類方法的圖書館借閱量的建模和預(yù)測效果更優(yōu)[10-12]。但是神經(jīng)網(wǎng)絡(luò)是一種基于經(jīng)驗風(fēng)險小化的非線性預(yù)測方法,對圖書館借閱量的歷史數(shù)據(jù)規(guī)模有要求,因此圖書館借閱量預(yù)測結(jié)果不太穩(wěn)定,而對于復(fù)雜多變的圖書館借閱量,混沌分析算法只能從一個方向?qū)ζ涮卣鬟M(jìn)行描述,圖書館借閱量預(yù)測效果有待改善,因此圖書館借閱量的預(yù)測仍然是當(dāng)前高校和各種科研院所關(guān)注的焦點[12-14]。
針對混沌分析算法、神經(jīng)網(wǎng)絡(luò)等圖書館借閱量的預(yù)測方法預(yù)測錯誤差大的難題,以高圖書館借閱量預(yù)測精度為目標(biāo),提出了基于小波支持向量機(jī)的圖書館借閱量預(yù)測方法,引入數(shù)據(jù)挖掘技術(shù)中的小波支持向量和混沌分析算法聯(lián)合對圖書館借閱量進(jìn)行預(yù)測,通過采用具體圖書館借閱量歷史數(shù)據(jù)對該方法性能進(jìn)行測試。本文方法能夠有效描述圖書館借閱量的變化特征,圖書館借閱量預(yù)測精度超過95%,遠(yuǎn)遠(yuǎn)高于圖書館管理系統(tǒng)中對借閱量預(yù)測精度要求,而且預(yù)測效果要明顯優(yōu)于其它方法,驗證了本文方法的可行性和優(yōu)越性。
2 基于小波支持向量機(jī)的圖書館借閱量預(yù)測模方法
2.1 混沌分析算法
現(xiàn)代圖書館借閱量不只具有線性變化特征,由于受到學(xué)生、圖書館環(huán)境、圖書種類等影響,具有一定的混沌性,如果直接將圖書館借閱量的歷史數(shù)據(jù)xi,i=1,2,…,N進(jìn)行建模,那么無法準(zhǔn)確找到圖書館借閱量的歷史數(shù)據(jù)隱藏的變化特征,因此采用混沌分析算法對圖書館借閱量的歷史數(shù)據(jù)xi,i=1,2,…,N進(jìn)行分析和處理,實現(xiàn)重新構(gòu)造,得到一個新的對圖書館借閱量的歷史數(shù)據(jù),即建模的學(xué)習(xí)樣本,具體如式(1)所示。
式中,m表示圖書館借閱量的嵌入維數(shù),τ表示歷史數(shù)據(jù)的時間延遲數(shù)量。
2.2 數(shù)據(jù)挖掘技術(shù)
當(dāng)前數(shù)據(jù)挖掘技術(shù)的類型很多,狀態(tài)回聲網(wǎng)絡(luò)、極限學(xué)習(xí),支持向量機(jī)等,其中支持向量機(jī)的建模效果以用通用性更好,因此本文選擇其進(jìn)行圖書館借閱量的建模和預(yù)測。圖書館借閱量歷史數(shù)據(jù)樣本數(shù)量為:n,它們組成一個集合:{(xi,yi),i=1,2,…,n},采用函數(shù)φ(x)對圖書館借閱量歷史樣本進(jìn)行映射,并建立如下形式圖書館借閱量預(yù)測的回歸方法如式(2)所示。
式中,ω為權(quán)值向量,b為偏置向量。
要得到圖書館借閱量預(yù)測結(jié)果,首先要對ω和b進(jìn)行準(zhǔn)確估計,通過引入懲罰參數(shù)(C)得到如下的最小化形式如式(3)所示。
2.3 小波函數(shù)
從式(6)可知,要建立最優(yōu)的圖書館借閱量預(yù)測模型,就需確定最合理核函數(shù)k(x,xi),當(dāng)前核函數(shù)很多,但是都有它們各自的局限性,而小波函數(shù)具有較好的性能,本文選擇其構(gòu)建最合理的核函數(shù)k(x,xi)。小波函數(shù)ψ(x)通過平移因子a和伸縮因子b是到許多小波函數(shù)組合,具體如式(8)所示。
2.4 圖書館借閱量預(yù)測步驟
(1) 針對一個具體的大學(xué)圖書館,與圖書館管理系統(tǒng)的管理員進(jìn)行聯(lián)系,從圖書館管理系統(tǒng)中導(dǎo)出圖書館借閱量的歷史數(shù)據(jù)。
(2) 采用混沌分析算法對書館借閱量的歷史數(shù)據(jù)進(jìn)行分析和處理,確定圖書館借閱量的嵌入維數(shù)和歷史數(shù)據(jù)的時間延遲數(shù)量。
(3) 根據(jù)圖書館借閱量的嵌入維數(shù)和歷史數(shù)據(jù)的時間延遲數(shù)量,建立圖書館借閱量建模學(xué)習(xí)樣本。
(4) 初始化小波支持向量機(jī)的參數(shù),如懲罰參數(shù)(C)的值,小波函數(shù)的a和b的值。
(5) 采用小波支持向量機(jī)對圖書館借閱量建模學(xué)習(xí)樣本進(jìn)行訓(xùn)練,建立圖書館借閱量預(yù)測模型。具體如圖1所示
3 圖書館借閱量建模和預(yù)測的實例研究
3.1 圖書館借閱量數(shù)據(jù)來源
為了分析基于小波支持向量機(jī)的圖書館借閱量預(yù)測方法的性能,采用某大學(xué)圖書館的日借閱量歷史數(shù)據(jù)進(jìn)行實例分析,具體如圖2所示。實驗平臺為:Intel 酷睿i9 9900K CPU,影馳ONE 240G SDD 硬盤,芝奇Ripjaws4 DDR4 8G RAM, Win10 OS。
3.2 圖書館數(shù)據(jù)的混沌分析算法處理
采用混沌分析算法分析對圖2中的圖書館借閱量歷史樣本數(shù)據(jù)進(jìn)行分析,得到圖書館借閱量的嵌入維數(shù)和歷史數(shù)據(jù)的時間延遲值分別為:10和7,根據(jù)它們的值建立圖書館借閱量學(xué)習(xí)樣本數(shù)據(jù),選擇最后100個數(shù)據(jù)作為驗證樣本,其它為擬合樣本。
3.3 本方法的圖書館借閱量預(yù)測性能分析
采用數(shù)據(jù)挖掘技術(shù)對圖書館借閱量的歷史數(shù)據(jù)進(jìn)行擬合和預(yù)測,結(jié)果如圖3所示。
對從圖3可知,本文方法的圖書館借閱量擬合效果要優(yōu)于驗證效果,但是它們的圖書館借閱量預(yù)測精度均相當(dāng)高,可以滿足圖書館管理的實際應(yīng)用要求。
3.4 與其它圖書館借閱量預(yù)測性能對比
為了體現(xiàn)基于小波支持向量機(jī)的圖書館借閱量預(yù)測方法的優(yōu)越性,選擇回歸分析方法、RBF神經(jīng)網(wǎng)絡(luò)的圖書館借閱量預(yù)測方法進(jìn)行對比測試。統(tǒng)計它們的圖書館借閱量預(yù)測精度以及建模時間,結(jié)果表1所示。
對表圖書館借閱量預(yù)測精度和建模時間進(jìn)行分析可以知道
(1) 本文模型的圖書館借閱量擬合和預(yù)測精度要優(yōu)于回歸分析方法、RBF神經(jīng)網(wǎng)絡(luò)的圖書館借閱量預(yù)測精度,降低了圖書館借閱量預(yù)測誤差,圖書館借閱量預(yù)測結(jié)果更加可信。
(2) 本文模型的圖書館借閱量建模時間要小于回歸分析方法、RBF神經(jīng)網(wǎng)絡(luò)的圖書館借閱量建模,提高了圖書館借閱量建模速度,圖書館借閱量建模效率得到明顯改善。
4 總結(jié)
為了解決當(dāng)前圖書館借閱量的預(yù)測方法存在的缺陷,設(shè)計了小波支持向量機(jī)的圖書館借閱量預(yù)測方法,在相同環(huán)境下,與其它圖書館借閱量的預(yù)測方法進(jìn)行了對比測試,本文方法提高了圖書館借閱量預(yù)測精度,而且高于對比方法的圖書館借閱量預(yù)測精度,圖書館借閱量的建模速度更快,具有廣泛的應(yīng)用前景。
參考文獻(xiàn)
[1] 馬蕾. 基于流通數(shù)據(jù)分析的高校圖書館館藏資源建設(shè)研究——以長江大學(xué)武漢校區(qū)圖書館中文圖書為例[J]. 農(nóng)業(yè)圖書情報學(xué)刊, 2016, 28(11): 37-41.
[2] 胡烏仁. 大數(shù)據(jù)環(huán)境下高校圖書館讀者閱讀趨勢及特點分析——以內(nèi)蒙古師范大學(xué)圖書館為例[J].內(nèi)蒙古財經(jīng)大學(xué)學(xué)報, 2016, 14(4): 144-148.
[3] 茹文,忻展紅. 圖書館借閱數(shù)據(jù)分類信息的關(guān)聯(lián)性研究[J]. 北京郵電大學(xué)學(xué)報(社會科學(xué)版), 2016,18(1):14-19.
[4] 喬慧君,周筠珺. 高校圖書館借閱率與學(xué)生學(xué)習(xí)狀態(tài)關(guān)系研究[J].大學(xué)圖書館學(xué)報, 2015, 33(1): 55-60.
[5] 張麗萍,楊琳,王雨荷.基于用戶借閱行為的館藏資源使用挖掘研究[J].圖書館理論與實踐, 2014,21(9):9-12.
[6] 趙楠. 高校圖書館讀者借閱行為分析及導(dǎo)讀策略研究[J]. 赤峰學(xué)院學(xué)報(自然科學(xué)版), 2014, 30(10): 96-97.
[7] 鄒梅. 圖書借閱量下降原因及對策[J].吉林工程技術(shù)師范學(xué)院學(xué)報,2013,29(7):54-55.
[8] 姬曼姝. 高校圖書館流通借閱現(xiàn)狀的統(tǒng)計分析——以內(nèi)蒙古師范大學(xué)圖書館為例[J].圖書情報工作,2013,57(S1):178-181.
[9] 吳佳慧. 高校圖書館館際借閱服務(wù)影響效應(yīng)的實證測度——基于南京部分高校圖書館的調(diào)查數(shù)據(jù)[J]. 圖書館,2018(11):99-105.
[10] 許志榮,陳倩,過榴曉. 基于時間序列分析的高校圖書館借閱量研究——以江南大學(xué)圖書館為例[J].農(nóng)業(yè)圖書情報學(xué)刊, 2018, 30(10): 107-110.
[11] 宋妍,肖希明. 基于GM(1,1)模型的大學(xué)圖書館文獻(xiàn)借閱量預(yù)測與分析[J]. 云南師范大學(xué)學(xué)報(自然科學(xué)版),2018,38(6):35-39.
[12] 王蓉.基于云計算平臺的高校圖書館借閱信息管理系統(tǒng)[J].現(xiàn)代電子技術(shù), 2018, 41(13): 182-186.
[13] 李樹青,莊光光,秦嘉杭,等.借閱場景下圖書專業(yè)性質(zhì)量測度方法和圖書個性化推薦服務(wù)方法[J].圖書情報工作,2018,62(11):53-63.
[14] 劉春霞.支持向量機(jī)的用戶借閱行為分析——以河南理工大學(xué)圖書館為例[J].圖書情報導(dǎo)刊,2017,2(8):1-8.
(收稿日期: 2019.05.10)