□錢(qián)玲飛 汪榮
文獻(xiàn)借閱是高校圖書(shū)館傳統(tǒng)讀者服務(wù)工作中最基本、最主要的內(nèi)容之一,隨著自動(dòng)化技術(shù)在圖書(shū)館的廣泛應(yīng)用,聯(lián)機(jī)公共檢索目錄(OPAC)系統(tǒng)每天產(chǎn)生大量的圖書(shū)借閱記錄數(shù)據(jù),通過(guò)對(duì)這些數(shù)據(jù)的統(tǒng)計(jì)與分析,可以獲取有利于組織管理和文獻(xiàn)服務(wù)的信息,掌握讀者的閱讀傾向以及圖書(shū)的借閱狀況,提升服務(wù)質(zhì)量,開(kāi)展深層次服務(wù)工作。
h指數(shù)由美國(guó)學(xué)者赫希(Hirsch J.E.)于2005年提出,最初用于評(píng)價(jià)科學(xué)家成就。h是指科學(xué)家發(fā)表的h篇論文每篇論文的被引次數(shù)至少為h[1-2]。h指數(shù)是一個(gè)相對(duì)較簡(jiǎn)單并且易于理解的復(fù)合指標(biāo)。自提出h指數(shù)的概念后,國(guó)外對(duì)于h指數(shù)及其衍生指數(shù)的理論研究和應(yīng)用研究很多,其中應(yīng)用在圖書(shū)情報(bào)領(lǐng)域的主要有對(duì)于圖書(shū)館員的評(píng)價(jià)[3],對(duì)于圖書(shū)情報(bào)領(lǐng)域的學(xué)術(shù)研究水平的評(píng)價(jià)[4],對(duì)于圖書(shū)情報(bào)領(lǐng)域的期刊評(píng)價(jià)[5],但是未見(jiàn)對(duì)于借閱數(shù)據(jù)分析的評(píng)價(jià)。國(guó)內(nèi)第一篇關(guān)于h指數(shù)的文章是2006年1月發(fā)表于《科學(xué)觀察》的《也談h指數(shù)的機(jī)會(huì)和局限性》[6],這是一篇翻譯的文章,此后有越來(lái)越多的國(guó)內(nèi)學(xué)者開(kāi)始研究h指數(shù)。國(guó)內(nèi)學(xué)者對(duì)于h指數(shù)的研究主要是應(yīng)用研究,其應(yīng)用領(lǐng)域有大學(xué)h指數(shù)研究[7]、期刊h指數(shù)研究[8-10]、科研人員h指數(shù)研究[11-12],僅有一篇文章是關(guān)于圖書(shū)館流通數(shù)據(jù)的h指數(shù)研究[13],但是只是應(yīng)用示例,沒(méi)有對(duì)結(jié)果進(jìn)行深入分析。
雖然h指數(shù)是針對(duì)學(xué)術(shù)評(píng)價(jià)提出的,但它的思想和方法可以被用于其他類似的領(lǐng)域中。圖書(shū)館中處于流通狀態(tài)的圖書(shū)和學(xué)者的論文相似,圖書(shū)被借閱頻次對(duì)應(yīng)論文被引頻次,可以像分析論文被引一樣分析借閱數(shù)據(jù),從而可以將h指數(shù)應(yīng)用于圖書(shū)館借閱數(shù)據(jù)分析。
在傳統(tǒng)上,對(duì)流通數(shù)據(jù)分析、評(píng)價(jià)的指標(biāo)一般是借閱頻次(如圖書(shū)集合的借閱量、讀者群的借閱量等)和平均借閱量(如圖書(shū)的平均借閱量、讀者的平均借閱量等),這兩種指標(biāo)一般是基于簡(jiǎn)單統(tǒng)計(jì)的方法[14-16]。用傳統(tǒng)指標(biāo)和方法雖然能夠在一定程度上揭示圖書(shū)館運(yùn)營(yíng)和讀者利用圖書(shū)的狀況,但存在明顯的不足。比如,利用簡(jiǎn)單統(tǒng)計(jì)得出的借閱頻次只是客觀數(shù)字的集合,無(wú)法在圖書(shū)集合(讀者群)之間進(jìn)行客觀的比較,也無(wú)法確定相對(duì)公正的界線來(lái)衡量和確定核心圖書(shū)和讀者;平均借閱量抹殺和掩蓋了圖書(shū)集合(讀者群)內(nèi)部的差別,以致無(wú)法進(jìn)行客觀的比較。近年也出現(xiàn)利用數(shù)據(jù)挖掘、關(guān)聯(lián)規(guī)則分析方法對(duì)流通數(shù)據(jù)進(jìn)行分析,從而挖掘出一些深層信息[17-19]。利用這些方法雖然可以得出一些深層信息,但是比較復(fù)雜,不夠直觀,可操作性不強(qiáng),結(jié)果受人為參數(shù)設(shè)定的影響較大。
圖書(shū)借閱h指數(shù)相對(duì)于傳統(tǒng)評(píng)價(jià)指標(biāo)和方法的優(yōu)勢(shì)在于增強(qiáng)了圖書(shū)集合(讀者群)之間的可比性,能夠更加客觀地反映圖書(shū)利用狀況和讀者的借閱情況;另一方面,通過(guò)圖書(shū)借閱h指數(shù)也可確定核心圖書(shū)和讀者,改變傳統(tǒng)的圖書(shū)借閱排行榜整齊劃一地列出前n名的局面,體現(xiàn)圖書(shū)集合(讀者群)的個(gè)性化特點(diǎn)。h指數(shù)作為一種直觀有效的指標(biāo),相對(duì)于數(shù)據(jù)挖掘、關(guān)聯(lián)規(guī)則分析方法,其計(jì)算方法相對(duì)簡(jiǎn)單,可操作性強(qiáng),便于在圖書(shū)館實(shí)際應(yīng)用中推廣。
圖書(shū)館借閱數(shù)據(jù)在邏輯上由緊密相關(guān)、不可分割的兩個(gè)部分組成:一是讀者借閱圖書(shū)的數(shù)據(jù);二是圖書(shū)被借閱的數(shù)據(jù)。如果將這兩個(gè)數(shù)據(jù)按照借閱頻次進(jìn)行排序,就會(huì)形成一個(gè)類似于h指數(shù)原始定義中論文數(shù)與引文數(shù)的數(shù)據(jù)序列,從而可以計(jì)算相應(yīng)的h指數(shù)。本文從匯文系統(tǒng)數(shù)據(jù)庫(kù)中提取2009年的借閱數(shù)據(jù),分兩部分統(tǒng)計(jì),第一部分按照《中圖書(shū)館分類法》,將各大類圖書(shū)的借閱情況進(jìn)行統(tǒng)計(jì)分析;第二部分為對(duì)讀者進(jìn)行分類,分為本科生、碩士生、博士生、教師、博導(dǎo)等,然后對(duì)各類讀者借閱情況進(jìn)行統(tǒng)計(jì)分析。
按照h指數(shù)計(jì)算方法,表1中,A類圖書(shū)中共有13種書(shū)的借閱次數(shù)不小于13,得A類圖書(shū)2009年的借閱h指數(shù)為13。其他類別的圖書(shū)以相同的方法統(tǒng)計(jì),結(jié)果見(jiàn)表2。
表1 A類圖書(shū)借閱情況表
表2 各類圖書(shū)借閱的h指數(shù)
將各類圖書(shū)借閱的h指數(shù)排序,結(jié)果如圖1所示:
圖1 2009年各類圖書(shū)借閱的h指數(shù)
從圖1可以看出,I類(文學(xué)類)、O類(數(shù)理科學(xué)和化學(xué)類)和T類(工業(yè)技術(shù)類)圖書(shū)借閱的h指數(shù)大于50,明顯高于其他類,X類(環(huán)境科學(xué)安全科學(xué)類)、S類(農(nóng)業(yè)科學(xué)類)圖書(shū)借閱的h指數(shù)小于10,明顯低于其他類。I類圖書(shū)屬于文學(xué)類,讀者群廣泛,故其h指數(shù)高,O類圖書(shū)是數(shù)理化基礎(chǔ)學(xué)科,由于我校是理工類院校,大部分專業(yè)學(xué)生在學(xué)習(xí)時(shí)都要用到這類圖書(shū),所以其h指數(shù)高。同樣的,我校沒(méi)有農(nóng)業(yè)類專業(yè),一般學(xué)生對(duì)這類書(shū)沒(méi)有需求,所以,農(nóng)業(yè)科學(xué)類圖書(shū)借閱的h指數(shù)最低。其次是環(huán)境科學(xué)類圖書(shū)借閱的h指數(shù)較低,與讀者對(duì)這類問(wèn)題關(guān)注較少也有關(guān)系。
由于I類、O類、T類圖書(shū)借閱的h指數(shù)很高,有必要對(duì)這幾類圖書(shū)進(jìn)行深入分析,為此,我們提出核心圖書(shū)的概念,即,滿足借閱次數(shù)不小于h的圖書(shū)稱之為核心圖書(shū)。I大類的核心圖書(shū)共68種,對(duì)這68種圖書(shū)進(jìn)行分析,這些圖書(shū)的分類號(hào)與入選數(shù)如圖2所示(為簡(jiǎn)潔起見(jiàn),入選數(shù)為1的未作分布圖統(tǒng)計(jì)):
圖2 文學(xué)類核心圖書(shū)分布
圖3 O類核心圖書(shū)分布
圖4 T類核心圖書(shū)分布
從圖2可以看到,I247(當(dāng)代小說(shuō))類入選核心圖書(shū)數(shù)最多,占77%。從圖3和圖4可以看到,數(shù)學(xué)類和計(jì)算機(jī)類的習(xí)題集入選核心圖書(shū)較多。這說(shuō)明,圖書(shū)館的核心圖書(shū)對(duì)學(xué)生的自學(xué)有很大幫助。TP312(程序語(yǔ)言、算法語(yǔ)言類)的圖書(shū)居T類核心圖書(shū)之首,說(shuō)明這類圖書(shū)的需求量很大。另外,TP312MA類圖書(shū)(Matlab類)的圖書(shū)入選數(shù)為各類語(yǔ)言之首,說(shuō)明作為工科院校,我校師生用Matlab作為實(shí)驗(yàn)和仿真工具較多。
為了分析不同讀者類型的借閱狀況,本文提出讀者借閱h指數(shù)的概念,即對(duì)讀者進(jìn)行分類,分為本科生、碩士生、博士生、教師及其他(主要包括成人教育、后勤機(jī)關(guān)、通用借書(shū)證用戶等),然后對(duì)各類讀者借閱情況進(jìn)行h指數(shù)統(tǒng)計(jì)分析,結(jié)果見(jiàn)表3。
表3 各類讀者借閱h指數(shù)
從表3可見(jiàn),本科生借閱h指數(shù)最高,其次是碩士生和博士生,這與本科生的課程最多、課程種類最廣有很大聯(lián)系。按照核心圖書(shū)的定義,借閱次數(shù)不少于h的讀者稱為核心讀者,對(duì)本科生、碩士生和博士生核心讀者的專業(yè)進(jìn)行分析,各院系核心讀者總數(shù)前5的數(shù)量如表4所示:
表4 各院系核心讀者排名前5的數(shù)量
從表4可見(jiàn),機(jī)電學(xué)院、自動(dòng)化學(xué)院、航空宇航學(xué)院的核心讀者最多,其次是信息科學(xué)與技術(shù)學(xué)院、能源與動(dòng)力學(xué)院,這幾個(gè)學(xué)院正是我校實(shí)力最強(qiáng)的學(xué)院,這說(shuō)明,這些學(xué)院的學(xué)生有較好的學(xué)習(xí)習(xí)慣,能夠積極利用圖書(shū)館的資源。另一方面,從這些分析可見(jiàn),圖書(shū)館應(yīng)該優(yōu)先保障這些重點(diǎn)學(xué)院的資源,以獲得較高的資源利用率。
圖書(shū)館在為讀者提供功能強(qiáng)大、形式多樣的數(shù)字化資源服務(wù)的同時(shí),如何提升傳統(tǒng)文獻(xiàn)資源的信息服務(wù)質(zhì)量,是圖書(shū)館全面做好讀者服務(wù)工作要研究的重要課題。h指數(shù)自被提出后,現(xiàn)已在學(xué)術(shù)評(píng)價(jià)、期刊評(píng)價(jià)、學(xué)術(shù)機(jī)構(gòu)評(píng)價(jià)等方面得到充分的研究,并在實(shí)踐中得到了應(yīng)用。隨著計(jì)算機(jī)網(wǎng)絡(luò)在圖書(shū)館中的廣泛應(yīng)用,圖書(shū)館積累了大量的圖書(shū)借閱數(shù)據(jù),通過(guò)對(duì)OPAC信息庫(kù)中記錄的圖書(shū)借閱數(shù)據(jù)進(jìn)行h指數(shù)分析,可以指導(dǎo)圖書(shū)館優(yōu)化館藏資源,了解讀者對(duì)不同類別文獻(xiàn)的閱讀需求,從而全面提升高校圖書(shū)館的服務(wù)質(zhì)量。
本文以2009年數(shù)據(jù)為例進(jìn)行借閱h指數(shù)分析,得出了一些有益的結(jié)論。今后還需要進(jìn)一步細(xì)化分析,如進(jìn)行各類圖書(shū)不同年度的借閱h指數(shù)分析,核心圖書(shū)的借閱讀者分析,核心讀者的借閱圖書(shū)的分析等。同時(shí),在計(jì)算h指數(shù)的時(shí)候,也可以改進(jìn)統(tǒng)計(jì)方法,比如,統(tǒng)計(jì)圖書(shū)排名時(shí)考慮此類圖書(shū)的館藏?cái)?shù),統(tǒng)計(jì)學(xué)院排名時(shí)考慮學(xué)院的總?cè)藬?shù)等,盡量做到客觀公正。
1 Hirsch J E.An Index to Quantify an Individual's Scientific ResearchOutput.Proceedings of the National Academy of Sciences of the USA,2005(46):16569-16572
2 Rousseau R.New Developments Related to the Hirsch Index.科學(xué)觀察,2006(4):23-25
3 Oppenheim,Charles.Using the h-index to rank influential British researchers in information science and librarianship.Journal of the American Society for Information Science and Technology,F(xiàn)ebruary 2007,58(2):297-301
4 Sanderson,M.Revisiting h measured on UK LIS and IR academics[J].Journal of the American Society for Information Science and Technology,May 2008,59(7):1184-1190
5 Onyancha,O.B.A Citation Analysis of Sub-Saharan African Library and Information Science Journals using Google Scholar.African Journal of Library,Archives &Information Science,Oct.2009:19(2):101-116
6 劉俊婉譯.也談h指數(shù)的機(jī)會(huì)和局限性.科學(xué)觀察,2006(1):10-11
7 萬(wàn)錦堃,花平寰,趙呈剛.中國(guó)部分重點(diǎn)大學(xué)h指數(shù)的探討.科學(xué)觀察,2007(3):9-16
8 趙基明.h指數(shù)及其在中國(guó)學(xué)術(shù)期刊評(píng)價(jià)中的應(yīng)用.評(píng)價(jià)與管理,2007(4):14-20
9 劉銀華.h指數(shù)評(píng)價(jià)期刊的有效性分析.情報(bào)理論與實(shí)踐,2007(6):809-811,815
10 姜春林等.H指數(shù)和G指數(shù)—期刊學(xué)術(shù)影響力評(píng)價(jià)的新指標(biāo).圖書(shū)情報(bào)工作,2006(12):63–65
11 邱均平等.h指數(shù)在人才評(píng)價(jià)中的應(yīng)用—以圖書(shū)情報(bào)學(xué)領(lǐng)域中國(guó)學(xué)者為例.科學(xué)觀察,2007(3):17-22
12 陳亞芬.H指數(shù)在科研人員業(yè)績(jī)?cè)u(píng)價(jià)中的應(yīng)用.科學(xué)管理研究,2008(5):52-54,85
13 周志峰.h指數(shù)應(yīng)用于圖書(shū)館借閱數(shù)據(jù)分析的探索.圖書(shū)館建設(shè),2009(11):82-84,89
14 周清華.從借閱數(shù)據(jù)分析讀者的閱讀特點(diǎn).科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2005,(2):65-67
15 許智林,王小華.分析數(shù)據(jù)尋找規(guī)律 科學(xué)管理優(yōu)化服務(wù)—陜西理工學(xué)院(北區(qū))2004~2005學(xué)年圖書(shū)借閱情況統(tǒng)計(jì)分析.現(xiàn)代情報(bào),2006,(4):126-128
16 周佳麗.借閱數(shù)據(jù)分析背景下的館藏結(jié)構(gòu)調(diào)整建議—以江蘇技術(shù)師范學(xué)院為例.圖書(shū)館學(xué)刊,2009,(7):87-90
17 張魯.數(shù)據(jù)挖掘技術(shù)在讀者借閱行為分析中的應(yīng)用.情報(bào)雜志2005,(6):36-37,40
18 彭儀普,熊擁軍.關(guān)聯(lián)挖掘在文獻(xiàn)借閱歷史數(shù)據(jù)分析中的應(yīng)用.情報(bào)雜志,2005(8):40-41,44
19 溫嶸生.基于OPAC信息庫(kù)圖書(shū)借閱數(shù)據(jù)關(guān)聯(lián)挖掘分析與應(yīng)用.情報(bào)雜志,2007(7):61-63
大學(xué)圖書(shū)館學(xué)報(bào)2012年2期