宋春勝 張志杰 梁世民
關(guān)鍵詞:數(shù)字資源;統(tǒng)計(jì)系統(tǒng);統(tǒng)計(jì)數(shù)據(jù);公共圖書館;代理訪問
摘要:圖書館數(shù)字化已經(jīng)成為當(dāng)前圖書館的主要發(fā)展方向,數(shù)字資源是數(shù)字化圖書館的重要館藏,數(shù)字資源的使用率直接影響數(shù)字資源服務(wù)水平的高低,而圖書館傳統(tǒng)的使用率統(tǒng)計(jì)方法無法較好地掌握數(shù)字資源的利用情況。文章主要對(duì)數(shù)字資源統(tǒng)計(jì)系統(tǒng)進(jìn)行了設(shè)計(jì)分析。
中圖分類號(hào):G250文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2018)10-0116-03
1背景
數(shù)字資源是文獻(xiàn)信息的表現(xiàn)形式之一,是圖書館資源建設(shè)不可或缺的部分。隨著信息技術(shù)的發(fā)展與互聯(lián)網(wǎng)的普及應(yīng)用,基于Web的數(shù)字資源發(fā)展迅猛,在不斷擴(kuò)大知識(shí)儲(chǔ)備、豐富館藏資源的同時(shí),科學(xué)、全面、精細(xì)、簡便地駕馭和掌握數(shù)字資源,合理地對(duì)數(shù)字資源的訪問情況和實(shí)用價(jià)值進(jìn)行統(tǒng)計(jì)、分析和科學(xué)評(píng)價(jià),是信息時(shí)代為圖書館帶來海量數(shù)字化資源的同時(shí)又對(duì)圖書館的科學(xué)決策支持體系提出的一個(gè)現(xiàn)實(shí)問題。筆者以廣西壯族自治區(qū)圖書館為例,主要針對(duì)數(shù)據(jù)庫的訪問次數(shù)、檢索次數(shù)、鏈接次數(shù)、全文下載次數(shù)等基本指標(biāo)統(tǒng)計(jì)進(jìn)行設(shè)計(jì)。
2數(shù)字資源統(tǒng)計(jì)的意義
2.1有利于提高圖書館的數(shù)字資源服務(wù)水平
廣西壯族自治區(qū)圖書館是廣西綜合性省級(jí)公共圖書館,近年來緊跟信息技術(shù)發(fā)展的步伐,大力建設(shè)數(shù)字化文獻(xiàn)資源,目前該館正式采購的商業(yè)電子資源約30個(gè),試用商業(yè)資源約15個(gè),自建特色資源19個(gè)。因受地區(qū)發(fā)展水平、學(xué)歷、經(jīng)濟(jì)狀況、年齡、性別等諸多因素的影響,讀者對(duì)數(shù)字資源的需求都不一致。圖書館要統(tǒng)計(jì)讀者的使用情況,分析讀者的需求,有針對(duì)性地采購商業(yè)數(shù)字資源或自建特色資源,同時(shí)將統(tǒng)計(jì)數(shù)據(jù)通過圖書館的可視化平臺(tái)進(jìn)行數(shù)據(jù)展示,以便引導(dǎo)讀者正確使用數(shù)字資源。因此,圖書館建立高效、準(zhǔn)確的使用統(tǒng)計(jì)模式,對(duì)提高數(shù)字資源服務(wù)水平有著重要作用。
2.2有效幫助圖書館采購商業(yè)數(shù)字資源
目前,商業(yè)數(shù)字資源生產(chǎn)商、資源種類越來越多,讀者的個(gè)性化需求也越來越大,但各個(gè)圖書館購買資源的經(jīng)費(fèi)卻相對(duì)有限。在這種矛盾日益加劇的情況下,圖書館在商業(yè)數(shù)字資源的購買和使用過程中需要建設(shè)一套比較合理的評(píng)價(jià)和分析體系,通過一系列評(píng)估指標(biāo)的評(píng)定,為圖書館商業(yè)數(shù)字資源的購買、成本計(jì)算、資源利用及相關(guān)服務(wù)提供科學(xué)合理的依據(jù)。圖書館每年都會(huì)對(duì)已采購的數(shù)字資源進(jìn)行續(xù)費(fèi),或?qū)υ囉脭?shù)字資源進(jìn)行新增采購,對(duì)于已采購的數(shù)字資源是否進(jìn)行續(xù)費(fèi)的主要依據(jù)之一是該廠商提供的該數(shù)字資源庫的使用量,而這些數(shù)據(jù)的真實(shí)性和準(zhǔn)確性有待商榷。對(duì)于新采購的數(shù)字資源,圖書館無任何使用統(tǒng)計(jì)數(shù)據(jù),無法真正了解讀者的需求。因此,建設(shè)數(shù)字資源統(tǒng)計(jì)系統(tǒng)能有效幫助圖書館在商業(yè)數(shù)字資源建設(shè)和使用方面制定正確的決策。
2.3有效幫助圖書館建設(shè)特色數(shù)字資源
在文化共享工程實(shí)施過程中,除接收國家管理中心提供的文化信息資源外,廣西壯族自治區(qū)圖書館還制作了舞臺(tái)藝術(shù)、旅游文化、科普知識(shí)、農(nóng)業(yè)科技、文物珍品和人物等具有廣西民族特色和地方特色的文化信息資源。廣西壯族自治區(qū)圖書館依托豐富的館藏以及地方特有的珍貴文獻(xiàn)資料,自建廣西戲劇、廣西文壇、廣西新農(nóng)村建設(shè)、廣西民國人物、八桂詩詞等專題數(shù)字資源,逐步形成了以地方文獻(xiàn)、少數(shù)民族文獻(xiàn)和東盟文獻(xiàn)為館藏特色,紙質(zhì)文獻(xiàn)和數(shù)字文獻(xiàn)并重的復(fù)合型圖書館資源結(jié)構(gòu)體系。建設(shè)數(shù)字資源統(tǒng)計(jì)系統(tǒng)能夠統(tǒng)計(jì)讀者對(duì)自建資源的使用情況,促使圖書館有針對(duì)性地對(duì)本館自建資源進(jìn)行充實(shí)和完善。
2.4有效幫助圖書館規(guī)范數(shù)字資源的統(tǒng)計(jì)
廣西壯族自治區(qū)圖書館購置了中國知網(wǎng)、維普期刊、萬方數(shù)據(jù)、讀秀知識(shí)庫、人大復(fù)印報(bào)刊資料等眾多數(shù)字資源,覆蓋數(shù)字型學(xué)術(shù)期刊、報(bào)紙、博碩士論文、會(huì)議論文、年鑒和圖書等文獻(xiàn)類型。目前,數(shù)字資源庫一般采用傳統(tǒng)的數(shù)據(jù)庫統(tǒng)計(jì)模式,即數(shù)字資源使用統(tǒng)計(jì)數(shù)據(jù)均由數(shù)字資源廠商提供,真實(shí)性和準(zhǔn)確性有待商榷,同時(shí),商業(yè)數(shù)字資源的類型繁多,各個(gè)廠商均采用各自的方式進(jìn)行統(tǒng)計(jì),缺乏統(tǒng)一的標(biāo)準(zhǔn)。針對(duì)以上問題,尋找有效的數(shù)字資源統(tǒng)計(jì)模式,建設(shè)符合廣西壯族自治區(qū)圖書館需求的數(shù)字資源統(tǒng)計(jì)分析平臺(tái),開展數(shù)字資源的使用統(tǒng)計(jì)分析,對(duì)該館數(shù)字資源建設(shè)具有重大意義。
3主要功能模塊設(shè)計(jì)
3.1HTTP代理訪問模塊設(shè)計(jì)
廣西壯族自治區(qū)圖書館為了提高圖書館數(shù)字服務(wù)水平,將數(shù)字資源庫掛載到圖書館數(shù)字資源平臺(tái)上供讀者使用,讀者通過HTTP代理方式訪問數(shù)字資源后,所有的訪問數(shù)據(jù)均會(huì)儲(chǔ)存在圖書館內(nèi)部的代理服務(wù)器中,為數(shù)據(jù)分析統(tǒng)計(jì)業(yè)務(wù)提供基礎(chǔ)。
由圖1可知,數(shù)字資源平臺(tái)安裝在圖書館代理服務(wù)器中,讀者向圖書館代理服務(wù)器發(fā)送請(qǐng)求報(bào)文,代理服務(wù)器需要正確地處理請(qǐng)求和連接,同時(shí)向目標(biāo)服務(wù)器發(fā)送請(qǐng)求,并將收到的來自目標(biāo)服務(wù)器的響應(yīng)轉(zhuǎn)發(fā)給客戶端。代理服務(wù)器扮演的是“中間人”角色,對(duì)于連接到代理服務(wù)器的客戶端來說,它是服務(wù)端;對(duì)于要連接的服務(wù)端來說,代理服務(wù)器是客戶端。代理服務(wù)器負(fù)責(zé)在兩端之間來回傳送HTTP報(bào)文。
3.2讀者登錄認(rèn)證模塊設(shè)計(jì)
宋春勝,張志杰,梁世民:圖書館數(shù)字資源統(tǒng)計(jì)系統(tǒng)研究考慮到所需統(tǒng)計(jì)數(shù)據(jù)的完整性,無論讀者是否在圖書館局域網(wǎng)內(nèi),系統(tǒng)均使用代理訪問的方式進(jìn)行。讀者在圖書館局域網(wǎng)范圍內(nèi)免賬號(hào)登錄(IP授權(quán)登錄)就能直接連接到數(shù)字資源;而讀者在局域網(wǎng)外任意地方使用有效讀者證號(hào)進(jìn)行登錄,登錄之后使用代理方式訪問數(shù)字資源平臺(tái)。
讀者登錄認(rèn)證模塊部分代碼如下:
public class IPFilter implements Filter{
public void Filter () {
IPbean ipbean = UserManager.getInstance().checkIP(httpRequest);
if(ipbean != null)
{
int departmentId = ipbean.getDepartmentId();
String sid = UserManager.getInstance().createSessionID();//如果為空就用本地的sessionId
if(sid == null)
sid = httpRequest.getSession().getId();
User user = new User(sid);
user.setIp(httpRequest.getRemoteAddr());
user.setUserName(user.getIp());
user.setDepartmentId(departmentId);
if(ipbean == null || ipbean.getNeedAgent() == 0)
{
user.setInIp(true);
UserManager.getInstance().addInUser(user);httpRequest.getSession().setAttribute(Constant.USER_SESSION,sid);
httpRequest.getSession().setAttribute(Constant.INIP,"in");
LogRecord loginMsg = new LogRecord(LogType.userlog,LogLevel.veryImportant,"IPLoginFilter doFilter","內(nèi)網(wǎng)用戶訪問");
loginMsg.addInfos("logtype","iplogin");
loginMsg.addInfos("cwsid",user.getSid());
loginMsg.addInfos("user",user.doJson());
loginMsg.addInfos("user-agent",httpRequest.getHeader("User-Agent"));
Log.getInstance().logInfo(loginMsg);
}else{
Cookie cookie=CookieUtil.createCookie("cwsid",sid,24*60*60);
httpResponse.addCookie(cookie);//加入
user.setInIp(false);
user.setIslogin(true);
UserManager.getInstance().addOutUser(user);//sid加入session中
httpRequest.getSession().setAttribute(Constant.USER_SESSION,user.getSid());
LogRecord loginMsg=new LogRecord(LogType.userlog,LogLevel.veryImportant,"RewriteServlet visitUrl","ip范圍內(nèi)用戶,ip代理登錄");
loginMsg.addInfos("type","login");
loginMsg.addInfos("user",user.doJson());
Log.getInstance().logInfo(loginMsg);
}
}else{//外網(wǎng)用戶
if(checkPath(request_uri)){//遠(yuǎn)程用戶在還沒有登錄之前,允許訪問部分網(wǎng)站頁面,這時(shí)先設(shè)置一個(gè)臨時(shí)賬戶
if(sidObj==null||!UserManager.getInstance().hasTempUser((String)sidObj))
{
user.setUserName(user.getIp());
user.setIslogin(false);
UserManager.getInstance().addTempUser(user);
httpRequest.getSession().setAttribute(Constant.USER_SESSION,sid);
}
filterChain.doFilter(req,res);
return;
}else {
httpRequest.getSession().setAttribute(Constant.INIP,"out");
String loginUrl=UserManager.getInstance().viewLoginPage(httpRequest,msgCode);
}
}
3.3訪問量統(tǒng)計(jì)模塊設(shè)計(jì)
讀者登錄代理訪問服務(wù)器后,代理服務(wù)器將記錄讀者所發(fā)送的全部請(qǐng)求報(bào)文及數(shù)據(jù)庫服務(wù)器返回的全部響應(yīng)報(bào)文,統(tǒng)計(jì)計(jì)數(shù)器按照相應(yīng)的統(tǒng)計(jì)規(guī)則對(duì)所有的報(bào)文進(jìn)行分析處理,從而得到相應(yīng)的統(tǒng)計(jì)結(jié)果。而不同廠商的數(shù)字資源系統(tǒng)設(shè)計(jì)千差萬別,在數(shù)據(jù)結(jié)構(gòu)、存儲(chǔ)方式、信息數(shù)據(jù)格式、檢索語言、檢索方法以及操作要求、應(yīng)用系統(tǒng)等方面都存在差異。因此,不同的數(shù)字資源庫系統(tǒng)調(diào)用不同的程序模塊進(jìn)行統(tǒng)計(jì)。筆者主要對(duì)首頁訪問次數(shù)、檢索次數(shù)、明細(xì)鏈接次數(shù)、全文下載次數(shù)進(jìn)行統(tǒng)計(jì),在設(shè)計(jì)統(tǒng)計(jì)模塊計(jì)數(shù)器時(shí)均使用模塊化設(shè)計(jì)(見表1)。
4結(jié)語
讀者在使用圖書館海量的數(shù)字資源時(shí),數(shù)字資源統(tǒng)計(jì)系統(tǒng)能夠精細(xì)完整地記錄用戶的訪問瀏覽行為信息,靈活易讀地展現(xiàn)數(shù)字資源的使用統(tǒng)計(jì)結(jié)果,科學(xué)而全面地評(píng)價(jià)數(shù)字資源的價(jià)值與質(zhì)量,有利于圖書館進(jìn)行數(shù)字資源續(xù)訂與選用的科學(xué)決策,提高圖書館的數(shù)字服務(wù)水平。
參考文獻(xiàn):
[1]胡大琴.圖書館數(shù)字資源利用統(tǒng)計(jì)調(diào)查研究[J].圖書館建設(shè),2017(12):69-74.
[2]倪劼.基于SharpPcap的圖書館數(shù)字資源訪問統(tǒng)計(jì)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].圖書館工作與研究,2017(12):48-53,79.
[3]梁超.淺析國內(nèi)圖書館數(shù)字資源統(tǒng)計(jì)的具體做法[J].四川圖書館學(xué)報(bào),2016(2):41-45.
[4]周欣,陸康,張迎春.數(shù)字資源校外訪問及統(tǒng)計(jì)分析系統(tǒng)探討[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2016(6):39-44.
[5]陸康.高校圖書館數(shù)字資源統(tǒng)計(jì)系統(tǒng)建設(shè)研究[J].現(xiàn)代情報(bào),2015(9):140-145.
[6]馬建霞.圖書館數(shù)字資源訪問統(tǒng)計(jì)研究[J].圖書館雜志,2005(8):25-29.
[7]徐恪,劉亞霄,劉衛(wèi)東.數(shù)據(jù)庫應(yīng)用系統(tǒng)中的安全訪問代理的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2000(1):105-107.
(編校:崔萌)第38卷第10期河南圖書館學(xué)刊2018年10月
收稿日期:2018-09-05
作者簡介:李麗博(1982—),洛陽職業(yè)技術(shù)學(xué)院助理館員。