胡少霞
(泰山護理職業(yè)學院,山東 泰安 271000)
為了最大限度地提高圖書的有效利用率,高校圖書館實施科學的管理措施是十分必要的。從圖書利用率的角度分析,借閱逾期是主要的影響因素之一[1]。出現(xiàn)借閱逾期的原因如下:一方面是學生借閱時間的設(shè)置低于實際閱讀需求時間,導致難以按時還書;另一方面是時間較長,學生或教師忘記了圖書的具體借閱日期以及規(guī)定的還書日期[2]。針對上述2 種情況,結(jié)合實際的圖書館管理需求,在圖書借閱逾期前實施及時有效的針對性預警是十分必要的。針對該問題,文獻[3]提出了一種以GSM 為基礎(chǔ)的圖書館借閱逾期自動系統(tǒng),該系統(tǒng)具有良好的實際應用效果,但是其應用的前提是借閱時間統(tǒng)一,這在一定程度上降低了圖書館的借閱服務質(zhì)量;文獻[4]提出以人數(shù)為基礎(chǔ)的預警平臺設(shè)計研究,具有良好的預警效果,但是其預警的全面性仍存在進一步提升的空間。對上述圖書館借閱逾期預警系統(tǒng)進行分析后可以發(fā)現(xiàn),進一步加深相關(guān)研究仍然具有十分重要的現(xiàn)實價值。
以此為基礎(chǔ),該文充分利用決策樹算法的優(yōu)勢,提出了一種基于決策樹算法的高校圖書館借閱逾期預警系統(tǒng)設(shè)計研究,并通過對比測試分析了該設(shè)計系統(tǒng)的預警效果。
決策樹又稱判樹。它是一種與流程圖相似的樹結(jié)構(gòu)。在這一樹結(jié)構(gòu)中,每一個內(nèi)部結(jié)點代表一個屬性上的測試,每一個分支代表一個測試輸出,而每一個葉子結(jié)點代表一個類或類分布。對未知的樣本數(shù)據(jù)進行分類,應先從樹根入手,對這個對象的特征進行逐個檢測,然后沿著這個分支一直往下進行,直到抵達某個葉子結(jié)點,這個結(jié)點所表示的類就是這個對象所屬的類。
在數(shù)據(jù)倉庫建立后,首先應依據(jù)決策樹構(gòu)建的目標提取修正如表1 所示的多維數(shù)據(jù)集。從表1 中選擇年份、姓名、圖書借閱率以及文理科屬性作為類別標識屬性,從候選屬性中選擇“圖書借閱率、文理科”作為決策樹的決策屬性集。由表1 可知,初始時刻屬于u1圖書借閱率類和u2文理科類的實例個數(shù)分別為57 個和43 個,因此可得到公式(1)。
表1 訓練樣本
式中:u1為圖書借閱率;u2為文理科類的實例個數(shù);P為類別屬性出現(xiàn)預警的概率。
給定樣本的信息嫡如公式(2)所示。
圖書借閱率=“0”,正例為18,反例為6,其信息嫡如公式(3)所示。
圖書借閱率=“1”,正例為29,反例為9,其信息嫡如公式(4)所示。
圖書借閱率=“2”,正例為9,反例為18,其信息嫡如公式(5)所示。
同上述其他公式一樣列出過程
圖書借閱率=“3”,正例為1,反例為10,其信息嫡如公式(6)所示。
如果選取圖書借閱率作為分類屬性,那么條件嫡如公式(7)所示。
基于高校圖書館借閱數(shù)據(jù)規(guī)模和數(shù)據(jù)流量較大的特點,高校須對相關(guān)借閱數(shù)據(jù)進行完整、有效地儲存,才能夠切實保證借閱逾期預警系統(tǒng)實現(xiàn)對全體成員的全覆蓋[5]。針對此問題,該文將具有標準6U 5HP VPX 架構(gòu)的FKG-VPXV7-M8 作為系統(tǒng)的存儲裝置。表2 為FKG-VPXV7-M8 的基本運行參數(shù)設(shè)置情況。
表2 FKG-VPXV7-M8 的基本運行參數(shù)設(shè)置情況
結(jié)合表2 中的參數(shù)信息可以看出,F(xiàn)KG-VPXV7-M8 具有帶寬高、容量大的特點,其提供的標準exFAT 文件系統(tǒng)可以對高校圖書館借閱數(shù)據(jù)進行采集、記錄、存儲以及管理。借助上述配置,F(xiàn)KG-VPXV7-M8 還具有實時記錄功能、數(shù)據(jù)回放功能、數(shù)據(jù)訪問功能、文件在線管理功能、自檢及故障檢測功能和異常容錯保護機制等功能。
為了實現(xiàn)對高校圖書館借閱逾期情況的及時預警,須結(jié)合借閱信息對相關(guān)數(shù)據(jù)進行適應性分析,因此需要功能強大的開發(fā)板作出系統(tǒng)的核心。該文選擇Xilinx Zynq-7010 的MYC-Y7Z010-V2 作為系統(tǒng)的開發(fā)板,其搭載了ARM+FPGA全可編程處理器,且完美支持4.14.0 內(nèi)核的Linux OS 系統(tǒng),采用94PIN(FPGA)郵票孔連接,具有較高的抗沖擊性能。除此之外,MYC-Y7Z010-V2 的ARM 與FPGA 通信方式采用了AXI 高速片上總線通信機制,在吉比特級帶寬的支持下,避免了傳統(tǒng)ARM+FPGA 架構(gòu)的通信限制。圖1 為MYC-Y7Z010-V2的FPGA 接口設(shè)置情況。
圖1 MYC-Y7Z010-V2 的FPGA 接口設(shè)置
MYC-Y7Z010-V2 的FPGA 外設(shè)接口包括串口、以太網(wǎng)口以及視頻接口,可有效滿足應用階段預警系統(tǒng)的拓展性需求。
為了實現(xiàn)對高校圖書館借閱逾期情況的全面預警,首先需要準確提取相關(guān)借閱數(shù)據(jù)[6]。該文分別從圖書的角度和用戶的角度開展該項工作,對不同角度提取的結(jié)果進行匹配,以確保提取結(jié)果的完整性。首先以圖書為核心進行借閱數(shù)據(jù)提取,具體的提取方式如公式(8)所示。
式中:f(x)為以圖書為核心的借閱數(shù)據(jù)提取結(jié)果;xi為i類圖書的現(xiàn)有館藏數(shù)量;x0為i類圖書的實際館藏數(shù)量;k為損耗系數(shù);e為允許誤差參數(shù)[7-8]。
其次,以用戶為核心進行借閱數(shù)據(jù)提取,具體的提取方式如公式(9)所示。
式中:g(x)為以用戶為核心的借閱數(shù)據(jù)提取結(jié)果;n為參與圖書借閱的用戶總量;∑xi為單一用戶的圖書借閱總量[9]。
以上述不同角度高校圖書館借閱數(shù)據(jù)提取結(jié)果為基礎(chǔ),對提取結(jié)果的完整性進行分析,當f(x)=g(x)時,表示提取的數(shù)據(jù)結(jié)果可靠,可以執(zhí)行后續(xù)的預警分析;當f(x)和g(x)存在差異時,要對具體的差異數(shù)據(jù)進行核對,具體的核對方法是在圖書館借閱系統(tǒng)中查閱相應的信息,從而有效提取高校圖書館借閱數(shù)據(jù),為后續(xù)的預警效果提供保障。
結(jié)合第2.1 節(jié)提取的數(shù)據(jù)信息,該文在開展借閱逾期預警的過程中引入了決策樹算法對具體借閱狀態(tài)進行分析。圖2 為該文構(gòu)建的決策樹算法執(zhí)行流程。
圖2 基于決策樹的借閱逾期預警流程
基于決策樹的借閱逾期預警流程,先對數(shù)據(jù)進行清洗,按照目標借閱時間對提取的借閱數(shù)據(jù)進行預處理,具體的處理方式可以表示為公式(10)。
式中:p(x)為處理后的借閱數(shù)據(jù)信息;sim()為一致性函數(shù);t為目標借閱時間設(shè)置情況;x為目標節(jié)約類別。
當借閱時間一致時,結(jié)合圖書館的管理需求,設(shè)置具體的預警標準,決策階段主要是根據(jù)借閱時間與當前時間差進行的,如公式(11)所示。
式中:Δt為借閱時間與當前時間差;t'為當前時間;t0為借閱時間。
以此可以對借閱逾期數(shù)據(jù)進行分析。
計算結(jié)果與預警標準之間的關(guān)系,確定預警動作,如公式(12)所示。
κ=Δt-T(12)式中:κ為預警動作執(zhí)行判斷參數(shù);T為設(shè)置的預警標準。
預警動作的具體執(zhí)行標準見表3。
表3 預警動作執(zhí)行標準
根據(jù)表3 可以對高校圖書館借閱逾期情況進行有效預警。
該文以某高校的實際圖書館管理系統(tǒng)數(shù)據(jù)為基礎(chǔ)測試數(shù)據(jù),對應的數(shù)據(jù)信息中涵蓋用戶整體借閱數(shù)據(jù)、用戶信息數(shù)據(jù)以及具體的圖書信息數(shù)據(jù)。在測試過程中,考慮到原始數(shù)據(jù)的規(guī)模較大,直接利用其進行測試對應的時間開銷較大,因此,該文隨機選取了其中9 個月的借閱數(shù)據(jù)作為最終測試數(shù)據(jù)。對于測試數(shù)據(jù)中存在的殘缺記錄及不完整信息,應結(jié)合相關(guān)資源進行修補,并通過校園卡號對其進行標志處理。最后進行測試的18 425 條有效記錄,將其按照目標借閱時間進行劃分,主要可分為5 類,對應的時間分別為15 天、1 個月、40 天、50 天以及2 個月。將上述數(shù)據(jù)分組導入SQL Server,可以作為測試階段差異化測試環(huán)境構(gòu)建的基礎(chǔ)。在上述數(shù)據(jù)的基礎(chǔ)上,該文以受測試圖書館的管理要求為基礎(chǔ),對距離借閱時間小于7 天的情況進行預警處理,同時考慮到實際借閱情況的差異性,設(shè)置了不同的測試數(shù)據(jù)構(gòu)成,具體見表4。
表4 測試數(shù)據(jù)構(gòu)成設(shè)置
除此之外,在測試過程中,該文還設(shè)置了對照組,對應的預警方法分別為文獻[3]系統(tǒng)和文獻[4]系統(tǒng)。在此基礎(chǔ)上,對比3 個系統(tǒng)的預警效果,可以對該文設(shè)計系統(tǒng)的性能作出客觀評價。
該文分別統(tǒng)計了不同系統(tǒng)的預警效果。具體的測試結(jié)果見表5。
表5 不同系統(tǒng)預警結(jié)果統(tǒng)計表
由表5 可知,在3 個不同預警系統(tǒng)的測試結(jié)果中,借閱逾期情況的預警效果隨著數(shù)據(jù)構(gòu)成復雜程度的不斷提高,均出現(xiàn)了不同程度的下降。其中,當測試數(shù)據(jù)的目標借閱時間構(gòu)成為一種(測試組1)時,3 個系統(tǒng)均實現(xiàn)了對借閱逾期情況的100.00%預警,且并未出現(xiàn)錯誤預警的情況。但是隨著測試數(shù)據(jù)目標借閱時間構(gòu)成的逐漸多元化,文獻[3]系統(tǒng)對于借閱逾期情況的預警效果逐漸下降,其中,正確預警率最小值達到了94.74%(測試組5),錯誤預警率最大值達到了34.74%(測試組5);文獻[4]系統(tǒng)對借閱逾期情況的預警效果雖然比文獻[3]系統(tǒng)高,但是也呈逐漸下降的發(fā)展趨勢,正確預警率最小值達到了95.24%(測試組4),錯誤預警率最大值達到了21.05%(測試組5)。相比之下,該文設(shè)計系統(tǒng)的預警效果表現(xiàn)出了較高的穩(wěn)定性和可靠性,其中,正確預警率始終為100.00%,錯誤預警率最大值也僅為3.16%(測試組5),與文獻[3]系統(tǒng)和文獻[4]系統(tǒng)相比,具有明顯優(yōu)勢。綜合上述的測試結(jié)果可知,該文設(shè)計的基于決策樹算法的高校圖書館借閱逾期預警系統(tǒng)可以實現(xiàn)對不同環(huán)境借閱逾期情況的全面預警,具有良好的實際應用效果。
該文提出的基于決策樹算法的高校圖書館借閱逾期預警系統(tǒng)設(shè)計研究,在設(shè)計階段充分考慮了圖書館借閱信息規(guī)模以及流量上的屬性特點,并以此為基礎(chǔ)對硬件進行了針對性設(shè)計。該文還結(jié)合借閱逾期的判定標準,在軟件設(shè)計階段引入決策樹算法,根據(jù)用戶的實際借閱時間實現(xiàn)對不同逾期情況的全面預警。借助該文對高校圖書館借閱逾期預警系統(tǒng)的設(shè)計,希望能為高校圖書館借閱服務工作的開展提供有價值的幫助,最大程度地提高圖書館資源的有效利用率。