王宇一
(江蘇信息職業(yè)技術(shù)學(xué)院,江蘇無錫 214153)
RFID技術(shù)在圖書領(lǐng)域的擴(kuò)展應(yīng)用與研究
王宇一
(江蘇信息職業(yè)技術(shù)學(xué)院,江蘇無錫 214153)
隨著RFID技術(shù)在圖書館中的普遍應(yīng)用,目前很多物聯(lián)網(wǎng)圖書館已經(jīng)建成,它將圖書館工作人員從繁重的圖書盤點等日常工作中解放出來,加快了圖書館的工作效率,同時還實現(xiàn)了對讀者的自助式服務(wù),大大提高了讀者對圖書館的滿意度.文章在RFID被圖書館普遍應(yīng)用的基礎(chǔ)上,提出了其還能在圖書館中的擴(kuò)展應(yīng)用,RFID技術(shù)的擴(kuò)展能為圖書館在圖書采編,館藏安排等方面提供決策性依據(jù).
RFID;頻繁路徑;圖書館
目前大部分圖書館應(yīng)用RFID(Radio Frequency Identification)技術(shù)仍只是為了實現(xiàn)圖書的自助借還和高速盤點,并以此提高圖書館的工作效率.但作為一個現(xiàn)代化圖書館除了擁有較高的工作效率之外,還應(yīng)及時了解讀者的需求,合理配置圖書館的文獻(xiàn)資源,提高資源的利用率,促進(jìn)圖書館的現(xiàn)代化管理,真正滿足廣大讀者.
在RFID系統(tǒng)的應(yīng)用中,部署多個閱讀器和多個電子標(biāo)簽的情形是不可避免的,而且每個RFID閱讀器都對應(yīng)一個RFID數(shù)據(jù)流[1].RFID數(shù)據(jù)流是物品在移動過程中所形成的路徑數(shù)據(jù)的集合,這些路徑數(shù)據(jù)代表了物品到過的地點,在這些地點所停留的時間,物品的一些特征、屬性值、變化趨勢等.
RFID路徑數(shù)據(jù)的發(fā)現(xiàn)給RFID技術(shù)的應(yīng)用開辟了新的領(lǐng)域.沃頓商學(xué)院的學(xué)者就已經(jīng)通過在超市中部署RFID閱讀器,同時在購物車上安裝RFID標(biāo)簽,獲取了顧客在購物時行走的路徑數(shù)據(jù),以此得到了許多有用的信息[2],作為調(diào)整超市物品擺放和刺激顧客消費(fèi)欲的有力依據(jù).
本文利用RFID路徑數(shù)據(jù)的特點,幫助圖書館了解讀者對不同圖書所偏愛的不同閱讀方式,并精確統(tǒng)計出館藏文獻(xiàn)的利用率(如讀者實際利用圖書的圖書借閱次數(shù),因無法統(tǒng)計圖書在館閱讀的次數(shù)而變得并不完整),從而作為滿足讀者需求、配置館藏資源的重要依據(jù).另外,針對RFID路徑數(shù)據(jù)量大的特點[3],采用數(shù)據(jù)挖掘技術(shù)對海量路徑數(shù)據(jù)進(jìn)行管理,從而縮短訪問查詢數(shù)據(jù)庫的時間,并從中獲取讀者真正想要的信息.文中主要完成對圖書頻繁路徑(如書架→閱覽室→書架)的挖掘工作,通過產(chǎn)生的關(guān)聯(lián)規(guī)則來得到圖書在館的借閱次數(shù)(閱覽室內(nèi)都部署有RFID閱讀器),并分析出哪一類圖書讓讀者更喜歡在館內(nèi)閱讀.這樣有助于圖書管理員對讀者進(jìn)行個性化服務(wù),進(jìn)一步提高圖書的借閱率和讀者的滿意度.
1.1 RFID數(shù)據(jù)特點
RFID數(shù)據(jù)庫是由形如<EPC,(a1,….an),(m1….mk),path>的RFID數(shù)據(jù)元組組成的集合[4].其中,EPC表示電子產(chǎn)品的編碼(Electronic Product Code,EPC),具有全球的唯一性;(a1,…. an),(m1….mk)的含義與傳統(tǒng)數(shù)據(jù)庫相同,名稱分別為非路徑維屬性值和非路徑度量值;path表示路徑信息.RFID數(shù)據(jù)庫與傳統(tǒng)多維數(shù)據(jù)庫相比,多出了路徑數(shù)據(jù),并具有全球唯一的標(biāo)識符EPC[4].
RFID系統(tǒng)中的閱讀器會定期掃描可識別范圍內(nèi)所有物品的標(biāo)簽信息.標(biāo)簽中的EPC能及時回應(yīng)閱讀器的探測,并在被掃描時形成如EPC,lo-cation,time的多條記錄,其中,location表示物品所在的地點,time表示掃描發(fā)生的時間[2].當(dāng)物品離開時,系統(tǒng)會把這些記錄重新壓縮成如(EPC,location,times)的記錄,其中,times表示物品停留的時間.將EPC相同的這些(EPC,location,times)記錄按照產(chǎn)生的先后順序組合起來,就是該物品的移動路徑(path),路徑的形式為(l1,t1)(l2,t2)…(ln,tn),其中(li,ti),i=1,2,…n表示路徑段,l表示物品停留的地點,必須為具體值,t則表示物品停留的時間,可以是具體值也可用“*”來表示任意值[4].
表1是一個RFID數(shù)據(jù)庫的示例.移動路徑中各地點的含義:c,倉庫;z,整架車;j,書架;r,閱覽室.停留時間以“h”為單位.另外它還包括2個非路徑屬性值:圖書分類,出版社;一個非路徑度量值:圖書價格.
表1 RFID示例數(shù)據(jù)庫Table 1 RFID sample database
1.2 RFID數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的比較
1.2.1 具有運(yùn)動性
在對RFID數(shù)據(jù)動態(tài)采集的過程中,筆者發(fā)現(xiàn)因受物品停留時間、停留地點不斷變化的因素影響,RFID數(shù)據(jù)時刻處于運(yùn)動中.另外工作人員在進(jìn)行數(shù)據(jù)采集時,為了工作方便會選用移動式閱讀器,因此,采集數(shù)據(jù)的閱讀器也處于運(yùn)動狀態(tài)中.
1.2.2 數(shù)據(jù)量巨大
當(dāng)貼有RFID標(biāo)簽的物品在某一地點停留時,該地點中的閱讀器便會每隔一段時間自動記錄一次該物品的狀態(tài)信息[5],同時錄入RFID數(shù)據(jù)庫.因此,RFID數(shù)據(jù)每天會產(chǎn)生上億的數(shù)據(jù)量并不斷增長[6].
1.2.3 非路徑屬性值
RFID數(shù)據(jù)集里除了包含物品的移動路徑值,還包含對該物品描述的非路徑屬性值,但其內(nèi)容需要使用RFID技術(shù)的具體業(yè)務(wù)來定[2].例如,本文做的是RFID圖書管理系統(tǒng),那么在圖書館業(yè)務(wù)中物品指的就是圖書,其具體描述就是圖書的種類、出版社等信息.
由上可知,RFID數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的最大區(qū)別在于RFID數(shù)據(jù)有數(shù)據(jù)量大、分布范圍廣等特點[7],因此,如果用傳統(tǒng)數(shù)據(jù)庫的方法來解決它不僅耗時耗力,還得不到有效的數(shù)據(jù).這就要求人們建立專門的方法,對RFID數(shù)據(jù)進(jìn)行處理,在海量數(shù)據(jù)中挖掘有用的知識,充分發(fā)揮RFID技術(shù)在圖書館中的優(yōu)勢.
2.1 路徑數(shù)據(jù)問題
圖書館想通過文獻(xiàn)流通的趨勢來獲得準(zhǔn)確的圖書借閱次數(shù),以此提高館藏文獻(xiàn)的利用率.雖然傳統(tǒng)數(shù)據(jù)庫里也記錄了每本圖書的狀態(tài)(在館、借出),但這樣的記錄并不包括圖書在館閱讀的情況,因此并不準(zhǔn)確.不過RFID的路徑數(shù)據(jù)提供了豐富的信息資源,讓人們可以輕松解決上述問題.通過路徑數(shù)據(jù)可以清楚知道圖書在書架和閱覽室之間的移動情況,由此就可準(zhǔn)確得到圖書在館的借閱次數(shù),從而合理配置館藏資源,并作為圖書采購的決策性依據(jù).但是,RFID數(shù)據(jù)量非常之大,在查詢數(shù)據(jù)庫的過程中常常既耗費(fèi)時間又耗費(fèi)資源,因此,為了提高查詢效率,還需采用數(shù)據(jù)挖掘技術(shù)對其海量路徑數(shù)據(jù)進(jìn)行管理,以此獲取人們真正想要的信息.
2.2 數(shù)據(jù)分布式問題
RFID系統(tǒng)的結(jié)構(gòu)具有天然的分布性[8],其閱讀器也是分布的.閱讀器會將采集到的數(shù)據(jù)傳送到臨近的服務(wù)器上,以此減輕網(wǎng)絡(luò)傳輸?shù)膲毫?因此,只有采用數(shù)據(jù)挖掘才能讓這些分布的數(shù)據(jù)得到及時而有效的處理.
2.3 數(shù)據(jù)量大的問題
在實際應(yīng)用中,隨著物品狀態(tài)的不斷變化,系統(tǒng)中每天都會有大量的路徑數(shù)據(jù)產(chǎn)生[9],這些數(shù)據(jù)所需的存儲空間也很大,因此,要想從中得到有用的信息就必須進(jìn)行數(shù)據(jù)挖掘.
2.4 數(shù)據(jù)的不準(zhǔn)確性
RFID閱讀器在讀取物品標(biāo)簽時常發(fā)生錯讀或者漏讀的現(xiàn)象[10],因此,只有利用數(shù)據(jù)挖掘?qū)﹀e誤數(shù)據(jù)進(jìn)行清理后才能把所有的數(shù)據(jù)傳遞給下一個業(yè)務(wù)流程.
3.1 路徑數(shù)據(jù)的關(guān)聯(lián)模型
建立該模型的目的是通過挖掘圖書的頻繁路徑來產(chǎn)生[圖書(類別)—圖書(路徑)]的關(guān)聯(lián)規(guī)則,以此統(tǒng)計圖書在館的借閱次數(shù)和了解讀者對不同類型圖書所偏愛的閱讀模式,這為圖書館在配置館藏資源和提高館藏利用率方面都提供了決策性依據(jù).
3.1.1 數(shù)據(jù)源
在RFID數(shù)據(jù)庫中抽取圖書的路徑數(shù)據(jù)和非路徑屬性值(包括圖書大類、圖書分類、圖書名稱等),建立RFID事務(wù)數(shù)據(jù)庫.事務(wù)數(shù)據(jù)庫中的每一條事務(wù)為圖書的一條路徑記錄.因為實際情況中每本圖書在館內(nèi)的路徑都是不斷循環(huán)往復(fù)的,所以為了提高挖掘的效率并得到筆者真正想要的信息,本文把圖書在館的循環(huán)路徑經(jīng)分析后,分成4段路徑記錄,第1段是架上的圖書被拿至閱覽室閱讀;第2段是放回架上的圖書(閱覽室閱讀完后)被拿至借閱處借出,或者再次被拿至閱覽室閱讀(這與第一段路徑相同);第3段是借出歸還的圖書經(jīng)過上架后再次被借出;第4段是借出歸還的圖書經(jīng)過上架后被借至閱覽室閱讀.基于Apriori改進(jìn)算法的路徑挖掘系統(tǒng)模型,見圖1.
圖1 基于Apriori改進(jìn)算法的路徑挖掘系統(tǒng)模型Fig.1 Mining system model based on the improved algorithm of Apriori path
3.1.2 路徑挖掘的方法設(shè)計
因為RFID路徑數(shù)據(jù)量很大,所以頻繁路徑會有很多.但本文只對有過借閱記錄的圖書路徑做挖掘,那些路徑值一直在書架上從未被借閱過的圖書,暫不對其進(jìn)行挖掘分析.另外,本文主要針對路徑數(shù)據(jù)中的地點值進(jìn)行分析,因此,在路徑(l1,t1)(l2,t2)…(ln,tn)中,t的數(shù)值筆者用“*”來表示,為任意時間值都可比對.文中頻繁路徑挖掘的基本數(shù)據(jù)單位為單個路徑段和圖書的屬性值,具體挖掘步驟如下.
(1)先將圖書的屬性值(圖書大類、分類、名稱等)嵌入圖書路徑數(shù)據(jù)中,形如(文學(xué))(小說)(飄)(j,*)(r,*)(j,*)的路徑數(shù)據(jù),然后組成如表1所示的事務(wù)數(shù)據(jù)庫.其中,z,整架車;j,書架;r,閱覽室;b,借閱處.
(2)利用第二章設(shè)計的Apriori改進(jìn)算法,挖掘頻繁路徑.
(3)輸出挖掘結(jié)果,產(chǎn)生關(guān)聯(lián)規(guī)則.
表2 RFID事務(wù)數(shù)據(jù)庫Table 2 RFID transaction database
3.2 挖掘結(jié)果展示
在設(shè)置信任度為6%,置信度為10%的挖掘條件下,對文學(xué)類圖書在館內(nèi)的移動路徑進(jìn)行數(shù)據(jù)挖掘,其結(jié)果展示見圖2.
在設(shè)置地點為“閱覽室”,置信度為30%的挖掘條件下,對小說在閱覽室的移動路徑進(jìn)行數(shù)據(jù)挖掘,其結(jié)果展示見圖3.
圖2 文學(xué)類圖書讀者偏愛閱讀方式關(guān)聯(lián)規(guī)則挖掘Fig.2 Mining association rules in reading literature books that readers prefer
圖3 圖書在閱覽室的借閱次數(shù)Fig.3 Frequency of borrowing books in the reading room
通過對挖掘結(jié)果的展示,可以分析出在文學(xué)類圖書中讀者較為喜歡在閱覽室內(nèi)閱讀,特別是英國文學(xué),由此可以知道文學(xué)類的圖書在需求上并不低,只是讀者偏愛的閱讀模式是在館內(nèi).在第二張挖掘展示圖中可以很簡單的計算出小說這類圖書在閱覽室的借閱次數(shù),1年中有2 816次,由此讓筆者可以調(diào)整下小說的布局,合理配置館藏資源,把小說放在閱覽室中,既增加其閱讀率,又方便讀者閱讀.
3.3 分析挖掘結(jié)果的建議
3.3.1 了解讀者群體特點
在對圖書路徑數(shù)據(jù)進(jìn)行挖掘后,可以發(fā)現(xiàn)文學(xué)類的圖書,讀者整體傾向于在閱覽室內(nèi)閱讀,特別是英國文學(xué),在閱覽室內(nèi)閱讀的比例大大高于圖書借出館外閱讀的比例.如果沒有對路徑數(shù)據(jù)的挖掘,可能認(rèn)為英國文學(xué)的需求性很低,其實不然,只是讀者對這類圖書更喜歡在閱覽室內(nèi)閱讀而已.這樣使得圖書管理員明確了解了不同讀者的閱讀興趣、閱讀習(xí)慣和傾向性的不同.通過挖掘結(jié)果的分析,管理員可以考慮進(jìn)行有針對性的推薦活動,使得文學(xué)類圖書在館內(nèi)閱讀與館外閱讀的比例達(dá)到一個較為合理的平衡點,這就能在提高館藏利用率的同時又增加了讀者的滿意度.
3.3.2 合理配置館藏資源
如何配置好館藏資源的問題已經(jīng)困擾圖書館很久,一直未能得到有效的解決,其中關(guān)鍵性一點就是因為無法準(zhǔn)確統(tǒng)計出圖書借閱的次數(shù).通過對RFID系統(tǒng)中路徑數(shù)據(jù)的挖掘,可以輕松得到圖書在館的借閱次數(shù),從而為合理配置館藏資源提供了關(guān)鍵性的數(shù)據(jù)依據(jù).
3.3.3 改善館藏的布局
關(guān)于改善館藏布局的問題,在文中并未能做出實現(xiàn),但只要在做RFID事務(wù)數(shù)據(jù)庫時選取讀者的信息為非路徑屬性值,就可通過掃描借書證的標(biāo)簽來獲取讀者在圖書館內(nèi)的行走路線.如發(fā)現(xiàn)大部分讀者在瀏覽過文學(xué)類圖書后會走到法律類圖書前繼續(xù)翻閱,就可獲知原來對文學(xué)類有興趣的讀者也喜歡法律類的圖書.這就給圖書管理員在圖書擺放和館藏布局的調(diào)整提供了很好依據(jù).
[1] 黃毅,鄭力,向晴.基于復(fù)雜事件處理的RFID輔助實時生產(chǎn)監(jiān)控[J].清華大學(xué)學(xué)報:自然科學(xué)版,2013,53(5):721-728.
HUANG Y,ZHENG L,XIANG Q.Complex event processing based on RFID assisted real-time production monitoring[J].J Tsinghua Univ:Nat Sci Edi,2013,53(5):721-728.
[2] 楊惠霄,張李浩.基于RFID技術(shù)的供應(yīng)鏈投資決策及協(xié)調(diào)[J].計算機(jī)集成制造系統(tǒng),2014,20(1):55-61.
YANG H X,ZHANG L H.RFID technology investment decision and coordination based on supply chain[J].Comput Integr Manuf Syst,2014,20(1):55-61.
[3] JIA X Y,F(xiàn)ENG P,ZHANG S G,et al.An ultra-low-power area-efficient non-volatile memory in a 0.18 μm single-poly CMOS process for passive RFID tags[J].J Semic,2013,34(8):085004.
[4] 陳竹西.面向RFID海量數(shù)據(jù)的若干數(shù)據(jù)挖掘技術(shù)研究[D].揚(yáng)州:揚(yáng)州大學(xué),2009.
CHEN Z X.Research on several data mining algorithms for massive RFID data[D].Yangzhou:Yangzhou University,2009.
[5] LIM J,KIM S,OH H,et al.A designated query protocol for serverless mobile RFID systems with reader and tag privacy [J].Tsinghua Sci Tech,2012,14(5):521-536.
[6] WU J,WANG D,SHENG H Y.Object tracking and tracing:Hidden semi-markov model based probabilistic location determination[J].J Shanghai Jiaotong Univ:Nat Sci Edi,2011,16(2):466-473.
[7] SHUNG H C,KYUNG H K,SANGJIN H,et al.Effective object identification and association by varying coverage through RFID power control[J].J Comput Sci Tech,2014,29(1):4-20.
[8] WU L,HUANG L Y.Improvement of location methods based on RFID[J].J China Univ Posts Telecom,2013,20(1):36-41.
[9] LIU X,ZHANG W Y,LIU X Z,et al.Eight-sided fortress:A lightweight block cipher[J].J China Univ Posts Telecom,2014,21(1):104-108.
[10]GU0C,ZHANG Z J,ZHU L H,et al.A novel secure group RFID authentication protocol[J].J China Univ Posts Telecom,2014,21(1):94-103.
The expansion of the study and application of RFID technology in library field
WANG Yu-yi
(Jiangsu Vocational College of Information Technology,Wuxi 214153,China)
With the widespread application of RFID technology in the library,at present a lot of IOT library has been built,it will not only liberate library staff from the heavy book inventory and other daily work,to speed up the library work efficiency,but also realize the self-help service to readers,greatly improving the reader satisfaction of the library.Based on the universal application of the library in RFID,the paper proposes an extended application in the library,the extension of RFID technology for library in book editing,providing evidences collection arrangement etc.
RFID;frequent path;library
TP 258
A
【責(zé)任編輯:陳 鋼】
1671-4229(2015)05-0071-05
2015-03-24;
2015-04-07
王宇一(1983-),女,工程師.E-mail:550431810@qq.com