魏輔軼,趙霞琦,陳俏穎,于清淼
(1.天津工業(yè)大學,天津 300387;2.天津商業(yè)大學,天津 300134)
數(shù)字資源是文獻信息的表現(xiàn)形式之一,是將計算機技術(shù)、通信技術(shù)及多媒體技術(shù)相互融合而成的以數(shù)字形式發(fā)布、獲取、利用的信息資源的總和[1]。它包括以數(shù)字方式生成的或從現(xiàn)有的模擬資源轉(zhuǎn)換成數(shù)字形式的有關(guān)文化、教育、科學和行政管理的資源及有關(guān)技術(shù)、法律、醫(yī)學及其他領(lǐng)域的信息[2]。高校在數(shù)字資源使用的深度和廣度上一直處于領(lǐng)先地位?!?014年購買數(shù)字資源的經(jīng)費占資源建設(shè)經(jīng)費的38%,2016年已上升至65%,比重大幅上升。澳大利亞的維多利亞大學圖書館在其2016-2020年的戰(zhàn)略規(guī)劃中提到,到2020年該館新購的信息資源將是100%電子化的?!保?]如何衡量和評價使用數(shù)字資源所帶來的效益,助力各相關(guān)機構(gòu)調(diào)整資源結(jié)構(gòu)、提高服務質(zhì)量、滿足用戶需求,發(fā)揮數(shù)字資源的最大價值,值得學術(shù)界研究。
早 在1997 年,Mark Smith 和Gerry Rowland 就提出應該開展電子資源績效評價問題研究,衡量電子資源的使用效益[4]。國內(nèi)學者對數(shù)字資源使用效益評價研究也給予了高度關(guān)注,并取得了一些成果。
1.1.1 數(shù)字資源使用效益評價指標體系研究
賀文愛等將登錄次數(shù)、檢索次數(shù)、下載數(shù)量、文獻被利用情況、學科分布情況等作為電子資源使用績效評價指標[5]。袁芳等學者認為當前電子資源的使用績效分析大多通過對檢索、登錄、全文訪問、拒絕訪問、IP地址等電子資源本身進行的評估,在使用成本上并沒有完整和深度的分析[6]。因此,在此基礎(chǔ)上引進單篇下載費、單次檢索費,來對數(shù)據(jù)庫的使用成本進行深度分析[6-7]。上述學者構(gòu)建的評價指標忽視了用戶主觀使用感受。蒲筱哥等認為數(shù)字資源使用績效的分析就是要分析數(shù)字資源建設(shè)的投入與產(chǎn)出的客觀效益情況和用戶使用滿意度的主觀績效情況,因此數(shù)字資源使用績效多指標綜合評價指標體系的構(gòu)成要素可分為數(shù)字資源內(nèi)容、數(shù)字資源檢索系統(tǒng)的資源提供能力、數(shù)字資源用戶利用情況、數(shù)字資源成本分析以及數(shù)字資源服務[8]。
1.1.2 數(shù)字資源使用效益評價方法研究
在數(shù)字資源使用效益評價指標組合權(quán)重測算方法的研究中主要采用以下幾種方法:(1)主觀賦權(quán)法。如層次分析法[9]113(AHP)。(2)客觀賦權(quán)法。如熵權(quán)法、三角模糊語義法[10]114。(3)不少學者采用主觀賦權(quán)法和客觀賦權(quán)法結(jié)合測算評價指標組合權(quán)重,既能避免受到評價者經(jīng)驗、知識結(jié)構(gòu)等主觀因素的影響,又能克服樣本自身客觀因素的干擾。如蒲筱哥等利用客觀賦權(quán)方法中的改進熵權(quán)法和主觀賦權(quán)方法中的網(wǎng)絡分析法相組合的賦權(quán)模型計算被評價數(shù)字資源使用績效指標的組合權(quán)重[11]。陳英利用主觀賦權(quán)方法中的層次分析法(AHP)和客觀賦權(quán)方法中的CRITIC 法相組合的賦權(quán)模型,確定高校圖書館數(shù)字資源績效評價指標權(quán)重[12]60,62。
在數(shù)字資源使用效益評價實證研究中,主要采用灰色關(guān)聯(lián)分析法[9]114(GRA)、線性加權(quán)法價[12]115、TOPSIS 法[11-14]、DEA 法[15](數(shù)據(jù)包絡分析方法)等。還有學者通過問卷調(diào)查和訪談探究研究生群體對高校圖書館數(shù)字資源使用頻率與學業(yè)成就、學術(shù)成就、信息素養(yǎng)能力與職業(yè)能力的關(guān)聯(lián)[16]。
早期研究主要從宏觀角度出發(fā),多集中于數(shù)字資源使用效益的總體情況評價,將不同的評價要素如內(nèi)容、數(shù)量、核心期刊比例或者學科占比、下載量,甚至包括主管評價等統(tǒng)一在一個框架之內(nèi),再賦予不同的權(quán)重算法。這樣的優(yōu)勢在于考慮的指標數(shù)量比較豐富,評價的維度較多,可以滿足更多不同的需要,但劣勢也相對明顯。首先,評價體系較為復雜,指標的測量和對比需要更多的時間,更多指標測量可能會影響最后的精度。其次,權(quán)重的設(shè)置并不唯一,不同的算法可能導致不同的權(quán)重。再次,早前的研究是一種性質(zhì)評價的方法,也就是通過對象的屬性來評價對象。這樣的研究角度存在較為濃重的主觀價值取向,無法深入反映文獻資源使用者使用的真實情況。本文研究將采用一種完全不同的評價視角,脫離原有的復雜評價體系的方式,利用H 指數(shù)和影響因子的邏輯內(nèi)涵與核心思想,從文獻資源效益產(chǎn)出的角度,從使用者最終利用文獻產(chǎn)出成果的層面,評價文獻資源與使用者結(jié)合之后,產(chǎn)生新的學術(shù)成果的效率高低,將為評價文獻資源的真實效益產(chǎn)出提供新的科學參考指標。
H指數(shù)是一種被廣泛接受的用以應對研究者進行引文量化的評價方法。2005 年在Jorge E.Hirsch教授提出這種引文評價思想之后,學者們將H 指數(shù)從評價研究者學術(shù)成就拓展到其他領(lǐng)域,Braun等首先將H指數(shù)應用于學術(shù)期刊評價,認為H指數(shù)是期刊影響因子的有效補充[17],Rousseau的研究也肯定了H 指數(shù)在期刊評價中的作用[18],Schubert和Gl?nzel將H指數(shù)與期刊評價結(jié)合,建立了期刊H指數(shù)與出版數(shù)量、篇均被引量的理論數(shù)學模型[19]。除此之外,還延伸到研究機構(gòu)評價[20]、學術(shù)會議評價[21-22]、專利評價[23]、微博影響力研究[24]等方面。實際上,在H指數(shù)面世不久后,德國的博士研究生M.G.Banks 便擴展了其用途,借用H 指數(shù)法確定物理學熱門課題[25]。Bornmann和Daniel運用H指數(shù)檢驗BIF(促進生物醫(yī)學基礎(chǔ)研究基金)委員會的同行評議結(jié)果的有效性,發(fā)現(xiàn)獲得研究基金申請者的H 指數(shù)高于落選者[26]。Egghe L.和Rousseau 將H 指數(shù)定義擴展到信息生產(chǎn)過程中,通過基于Lotka 定律提出計算H 指數(shù)的靜態(tài)數(shù)學模型[27]。FRED Y.的研究發(fā)現(xiàn)Gl?nzel-Schubert模型不僅適用于期刊評價,還可以用于學術(shù)機構(gòu)評價領(lǐng)域[28]。
隨著研究的深入,研究者們發(fā)現(xiàn)H 指數(shù)存在著許多問題。如:H 指數(shù)對于那些剛開始從事科學研究的人員而言是不利的,因為他們的論文產(chǎn)出和引文率相對較低[29];H 指數(shù)完全忽視H 指數(shù)以下的論文數(shù)量及被引頻次,這樣即使H 指數(shù)相同的作者,其發(fā)表的論文數(shù)量也不一定相同,也有可能存在某一作者H指數(shù)以下的論文數(shù)量及被引頻次都高于相同H指數(shù)的作者[30]。為了突破H指數(shù)存在的局限,國內(nèi)外學者對H 指數(shù)進行改進。本文列舉一些具有代表性的研究:Egghe L.引入了G指數(shù)[31],并且修正了靜態(tài)時間下計算H 指數(shù)的公式,考慮時間變化因素,提出了動態(tài)時間下的H 指數(shù)數(shù)學模型[32]。Alonso 等基于h指數(shù)和g 指數(shù),創(chuàng)造性地提出了hg 指數(shù)來衡量科學家的學術(shù)產(chǎn)出,試圖融合以往兩項指數(shù)的優(yōu)點[33]。金碧輝和Rousseau 提出了R 指數(shù)和AR 指數(shù)[34]。Prathap G.提出了P指數(shù)[35]。Bornmann和Mutz等學者曾對H指數(shù)與G指數(shù)、R指數(shù)、AR指數(shù)等八類重要H指數(shù)變體進行比較,試圖發(fā)現(xiàn)是否存在比H 指數(shù)更好的評估指標,結(jié)果表明存在兩種類型的指數(shù):反映核心論文的數(shù)量指數(shù)和反映核心論文的影響力指數(shù),并且這些指數(shù)可以很好地相互結(jié)合來反映學者研究成果的不同維度[36]。關(guān)于H指數(shù)的研究還在繼續(xù),不可否認的是,雖然H指數(shù)公式存在一些不足,但由于H 指數(shù)計算簡單,操作方便,是一種高效的評價方法,這也是H 指數(shù)受到高度關(guān)注和廣泛應用的原因。
H 指數(shù)的數(shù)學邏輯本質(zhì)是:存在兩個集合元素A和B,當A中的元素增加引起集合B內(nèi)的元素會相應地隨著A 集合新增元素的增加而增加。H指數(shù)衡量的是集合A中元素個數(shù)與其引起的集合B 新增元素數(shù)量降序排列后的序號與元素數(shù)量相等時的序號值。一般定義為:一個作者發(fā)表的文章至多有H篇,每篇至少被引H次。
從幾何學上理解H 指數(shù)會更加直觀。H 指數(shù)可以表示為:將被引文獻按引用數(shù)量降序之后,可以找到一個最大的排序序號為H 的文獻,H 等于或者小于該文獻被引次數(shù)。那么,用幾何圖形方式表達H 指數(shù),假如某A 學者發(fā)文集合Pi 中有14篇文獻編號為P1-P14,其引用情況如表1所示。
表1 學者A 發(fā)文被引用情況分布
將學者發(fā)表論文所有論文集Pi的引用數(shù)量單位用一個邊長為1 的正方形來表示。經(jīng)過排序并圖形化之后得到圖1所示。
圖1中每一個小正方形代表了一次引用。整體藍色區(qū)域就是該作者發(fā)文引用數(shù)量形成的一個特定的引用圖形。在這個特定的圖形中,H 指數(shù)就可以表示為,在藍色區(qū)域中做一個面積最大的內(nèi)接正方形,其邊長的長度就是該作者的H 指數(shù)。在這個例子中該作者的H指數(shù)就可以用幾何圖形表示(如圖2 所示)。圖2 邊長為6 的正方形S1就是藍色區(qū)域最大內(nèi)接正方形,其邊長6就是A作者的H指數(shù)。
圖1 A學者論文集合引用分布
圖2 A學者H指數(shù)的幾何表達
對于任何一個作者的論文引用數(shù)據(jù)都可以用這樣一種幾何圖形方法表示出來,其圖形最大內(nèi)接正方形的邊長就是這個作者的H指數(shù)。這就是H指數(shù)在幾何圖形上的定義表示。很顯然,H指數(shù)實際上是將發(fā)文數(shù)量和文章的引用數(shù)量之間的關(guān)系表示為一個幾何區(qū)域內(nèi)最大內(nèi)接正方形。
H指數(shù)目的是消減單篇論文引用過高或者發(fā)文量過高所帶來的圖形橫向和縱向面積的延展,將作者的發(fā)文與引用的評價鎖定在圖形的核心內(nèi)部。H 指數(shù)的增加要求發(fā)文量和引用同時增加,而不能單一的增加某一篇文獻,尤其是引用次數(shù)排在前列的文獻的引用次數(shù),也不能增加低引用的文獻數(shù)量。在圖形中可以看出增加藍色區(qū)域橫縱兩個邊長并不能改變內(nèi)接正方形S1的邊長。因此,單純增加個別高被引文獻的引用次數(shù)或者增加低被引文獻的發(fā)文量不能提升H指數(shù)的值。
H指數(shù)實際上假定了同一作者發(fā)表文獻應該有近似的學術(shù)水平,其引用次數(shù)應該也相近。在此基礎(chǔ)上,引用數(shù)量最相近那些論文的數(shù)量和引用數(shù)量構(gòu)成的正方形邊長就是H指數(shù)的表達。因此,H 指數(shù)從幾何上表達的是作者發(fā)文的最核心的產(chǎn)出效率,也就是正方形S1 的面積大小。更進一步說,只要符合這種邏輯關(guān)系的行為或者數(shù)據(jù)都可以用H指數(shù)的思想表達出來。這就為用H指數(shù)衡量數(shù)字資源文獻利用效益提供了邏輯基礎(chǔ)。
文獻資源是一種可以被需求者使用并產(chǎn)生新價值的人工資源。文獻資源尤其是數(shù)字文獻資源相對于自然資源有這樣幾個經(jīng)濟特征:第一,數(shù)字文獻資源使用沒有邊際成本。數(shù)字文獻資源一經(jīng)購買可以反復下載、復制、閱讀,這些行為并不磨損或者消耗資源本身。也就是每次使用資源的邊際成本趨近于零。而自然資源相對成本較為固定。第二,文獻資源投入與產(chǎn)出分離。有形資源投入后在相同的技術(shù)條件下基本一般能達到一個固定的新產(chǎn)品產(chǎn)出比率。但文獻資源的使用具有很強的隨機性,與使用者的能力和文獻本身的質(zhì)量都有著密不可分的關(guān)系。不同的文獻對同樣的人,不同的人接觸同樣的文獻,產(chǎn)生的效果天差地別。自然資源在生產(chǎn)和技術(shù)條件不變的情況下,產(chǎn)出率一般較為固定。第三,使用與效益分離。文獻資源的獲得或者閱讀并不一定直接產(chǎn)生效益,文獻資源產(chǎn)生的效益也與文獻資源被下載或者閱讀的數(shù)量沒有必然聯(lián)系。自然資源的大量投入雖然也存在邊際收益遞減的情況,但效益產(chǎn)出的總量在投入的前期是上升的。這些特征都表明文獻資源的經(jīng)濟屬性與自然資源不同,對文獻資源利用效益的評價也是一個較為困難的問題。
文獻資源使用后產(chǎn)出的效益如何量化,一直是困擾圖書館多年的難題。在電子文獻資源成為主角之后,數(shù)據(jù)庫商憑借資源管理的優(yōu)勢掌握了讀者對數(shù)字資源使用的數(shù)據(jù)。數(shù)據(jù)庫商在與圖書館的談判中經(jīng)??梢钥吹綌?shù)據(jù)庫商提出他們的數(shù)據(jù)庫下載量連年的增長,以此作為漲價的一個重要理由。這樣的做法看似很具備說服力,實際上是曲解了文獻資源使用與產(chǎn)出之間的關(guān)系,將文獻資源的使用與文獻資源最終的產(chǎn)出效益混為一談,選擇了有利于自己的數(shù)據(jù)作為談判的籌碼。圖書館要想在談判中獲得優(yōu)勢就必須提出一個更加科學的評價指標,摒棄單一的由下載量衡量資源利用效益的方式,這就需要首先定義文獻的“效益”究竟如何衡量。
究竟如何衡量文獻資源利用的效益,其實H指數(shù)的思想已經(jīng)給出了一種解答。答案是:引用就是效益。換句話說,文獻所產(chǎn)生的文獻就是文獻產(chǎn)生的效益。H指數(shù)正是將引用的數(shù)量作為了文獻產(chǎn)出的效益,并將作者所有文獻的引用分布用一個內(nèi)接正方形來勾畫出其核心的部分。引文統(tǒng)計雖然現(xiàn)在依然存在很多缺點,如不能全面反應冷門研究、容易受期刊地位高低所帶來的馬太效應的影響、缺少同行評議的深度等問題,但引文評價依然是現(xiàn)在衡量作者和期刊水平最直觀、成本最低的方式。因此,站在現(xiàn)有的理論上看,引文評價不一定是最為準確的,但卻是最可行的效益評價方式。
以H 指數(shù)的理論為基礎(chǔ)就可以定義:文獻資源的效益表現(xiàn)在被引用的次數(shù)上,文獻被引用的次數(shù)越多,其產(chǎn)出的效益就越大,被引用的文獻資源本身就具有更高的價值和效益產(chǎn)出。假如一個學校,使用某個數(shù)據(jù)庫資源后,該學校的作者發(fā)文中引用該數(shù)據(jù)庫中的文獻數(shù)量越多,就說明這個數(shù)據(jù)庫對該學校產(chǎn)出的效益越大。遵循這個邏輯關(guān)系,就可以利用H 指數(shù)的思想構(gòu)建數(shù)字資源利用效益評價的新指標。
如圖3所示,H指數(shù)的兩個相關(guān)要素是發(fā)文數(shù)和引用量。如果能在文獻資源使用中也找到這樣兩個要素,就可以利用H 指數(shù)的思想構(gòu)建出新的評價指標。在數(shù)字文獻資源使用中,文獻資源的期刊的數(shù)量是一個類似發(fā)文量的要素;期刊的下載量和期刊被本校作者所引用的數(shù)量類似于引文的要素。這樣就可以構(gòu)建出兩個新的評價指標,其定義如下:
圖3 數(shù)字資源利用與H指數(shù)的關(guān)系
期刊的種數(shù)與期刊的下載結(jié)合構(gòu)造出資源下載H 指數(shù)HOD(H-index of Download),其定義為:某一數(shù)據(jù)庫資源(每年)至多有H 種期刊,每種期刊至少被下載H次;
期刊的種數(shù)與期刊的引用結(jié)合構(gòu)造出資源引用H 指數(shù)HOC(H-index of citation),其定義為:每年某一數(shù)據(jù)庫資源至多有H 種期刊,每種期刊至少被引用H次。
可以看出,HOD 和HOC的定義與H指數(shù)本身的邏輯定義基本相同。這就保證了HOD 和HOC可以用來衡量資源被下載和被引用真正有效的核心數(shù)量。
本文基于Web of Science 平臺,統(tǒng)計天津大學、北京大學、清華大學、上海交通大學、中國人民大學5 所高校在Wiley 電子期刊(簡稱Wiley)、Elsevier 的ScienceDirect 電子期刊數(shù)據(jù)庫(簡稱SD)和SpringerNature 的電子期刊數(shù)據(jù)庫(簡稱Springer)上2017-2019年下載數(shù)據(jù)和引用數(shù)據(jù),并計算了每所高校的HOD 與HOC 的值,結(jié)果如表2所示。
表2 高校HOD與HOC值分布
計算結(jié)果表明,統(tǒng)計中各大學的HOD 指數(shù)隨年份變化較HOC 指數(shù)表現(xiàn)出了更多的波動;HOC指數(shù)較為穩(wěn)定,每年變化幅度較??;SD 的HOD 與HOC 指數(shù)明顯高于Wiley 與Springer;中國人民大學(文科較強的院校)3個數(shù)據(jù)庫的HOD與HOC指數(shù)顯著低于清華大學、北京大學、天津大學和上海交通大學(理工科較強的院校)。
HOD指數(shù)波動說明即便是文獻資源的核心下載量也存在不穩(wěn)定性,這就證明了用下載總數(shù)作為評判數(shù)字文獻資源使用產(chǎn)出效益的標準在極大程度上會造成誤判。一所大學在規(guī)模和人員變化不大的情況下,其對文獻資源的效益產(chǎn)出從邏輯上推論也應該是相對穩(wěn)定的。研究中HOC的值反而非常穩(wěn)定,即便是在HOD增加的情況下HOC的值也表現(xiàn)出了顯著的穩(wěn)定性。有時即便是在HOD下降的情況下,HOC依然表現(xiàn)穩(wěn)定。如2018年北京大學和清華大學Springer 數(shù)據(jù)庫的HOD 指數(shù)都有所下降,但兩者的HOD 指數(shù)一個持平,另一個反而增加呈現(xiàn)出截然相反的走勢。無獨有偶的是,同年的上海交通大學Wiley 數(shù)據(jù)庫在HOD 指數(shù)持平的情況下,HOC 指數(shù)明顯增加。這些數(shù)據(jù)都可以證明,HOC 作為衡量文獻效益產(chǎn)出的是指標表現(xiàn)出了較好的穩(wěn)定性,是一個較為穩(wěn)定評價大學研究者對文獻資源使用效益產(chǎn)出的指標。
但需要提出一個問題,SD數(shù)據(jù)庫雖然HOD和HOC 的絕對值高于其他兩者,但是不是就可以斷定SD 數(shù)據(jù)庫資源的產(chǎn)出效益的效率絕對高于Wiley和Springer呢?
需要明確的是資源效益產(chǎn)出的絕對值的高低并不能完全代表產(chǎn)出效率或者說效益比例的高低。SD 數(shù)據(jù)庫的HOC 較高的原因很大程度上與其高HOD 指數(shù)相關(guān)。也就是說,大量的下載使用可能帶來了更多的引用的絕對數(shù)量。為了消除大量下載帶來的HOC 絕對值的提升,可以借用影響因子的算法來平衡引用和下載之間的關(guān)系。
消除大量下載可能導致的高引次數(shù),利用影響因子的概念對引用和下載之間的關(guān)系進行算數(shù)平均。如公式(1),即用HOC除以HOD,構(gòu)造一個新的評價指標“資源使用效益H指數(shù)”(H-index of Benefits,HOB)
HOB的幾何意義為核心引用區(qū)域最大內(nèi)接正方形邊長除以核心下載區(qū)域最大內(nèi)接正方形邊長,在數(shù)學上可以認為是:兩者最大內(nèi)接正方形區(qū)域的邊長之比,或者說平均1 次HOD 下載所能帶來HOC的數(shù)值。理論上可以看出HOB指數(shù)越高,文獻資源效益產(chǎn)出的效率就越高。為了驗證HOB指數(shù)在衡量文獻資源產(chǎn)出效益效率方面的作用,本文又進一步對HOB開展實證研究。
依據(jù)前文數(shù)據(jù)統(tǒng)計了5 所高校2017-2019 年Wiley、Elsevier 的SD 和Springer 三個文獻資源的HOB指數(shù)與資源的下載量分布,結(jié)果如圖4-圖13所示。
圖4 天津大學HOB指數(shù)
圖5 天津大學下載量
圖6 北京大學HOB指數(shù)
圖7 北京大學下載量
圖8 清華大學HOB指數(shù)
圖9 清華大學下載量
圖10 上海交通大學HOB指數(shù)
圖11 上海交通大學下載量
圖12 中國人民大學HOB指數(shù)
圖13 中國人民大學下載量
從統(tǒng)計的HOB 指數(shù)的分布情況分析看,HOB指數(shù)反映出以下幾個特征。
第一,各學校自身的HOB 指數(shù)呈現(xiàn)出比較穩(wěn)定的特征。北京大學、清華大學和上海交通大學3個數(shù)據(jù)庫HOB 的波動幅度不大,這與表1 中HOC指數(shù)呈現(xiàn)出一致的表現(xiàn),也進一步證明同一學校文獻資源產(chǎn)出效益的效率在其他研究條件不發(fā)生變化時,也基本保持在一個穩(wěn)定的區(qū)間內(nèi)。
第二,同一大學不同數(shù)據(jù)庫HOB 指數(shù)變化的特征相似。天津大學和中國人民大學HOB指數(shù)出現(xiàn)了一定的波動,但天津大學和中國人民大學3個數(shù)據(jù)庫HOB 指數(shù)變化的方向呈現(xiàn)了相同的趨勢。這種趨勢應該是統(tǒng)計周期內(nèi)這兩所大學的學科建設(shè)發(fā)展的投入在HOB 指數(shù)上的反映,從這一點反映出HOB指數(shù)較好地表達了大學科研發(fā)展的整體趨勢,具備指標的敏感性。從這一點可以推論出當大學科研建設(shè)中人員、資金或者政策發(fā)生較大變化時,文獻資源的HOB指數(shù)也可能會跟隨發(fā)生變化。
第三,不同大學之間HOB 指數(shù)相差較大。各數(shù)據(jù)庫在不同大學的HOB 指數(shù)大多集中在0.3 到0.1 之間。HOB 最高值出現(xiàn)在2017 年天津大學Wiley 數(shù)據(jù)庫,HOB 指數(shù)為0.335;最小值出現(xiàn)在2017 年中國人民大學Wiley 數(shù)據(jù)庫,HOB 指數(shù)為0.055。不同大學之間相比,同一資源的HOB指數(shù)相差較大,學科類型的設(shè)置和發(fā)展情況是制約HOB指數(shù)的一個重要因素。中國人民大學的3個數(shù)據(jù)庫的HOB 指數(shù)均低于其他院校,但在發(fā)展趨勢上中國人民大學的HOB指數(shù)表現(xiàn)出了較高的上升趨勢,這說明中國人民大學在2017-2019 年可能加強了相關(guān)理工學科的建設(shè)工作。
第四,HOB用于文獻資源效益評價,可以更加直觀地反映出不同文獻資源真實產(chǎn)出效益的效率。在文獻資源談判中數(shù)據(jù)庫商更多地采用下載量增加作為漲價的依據(jù),而從本次研究的數(shù)據(jù)中可以明顯地看出,下載量的增加不能作為文獻資源實際產(chǎn)出效益的指標。圖3-12 中的對比可以明顯地展示,下載量的增加與HOB 指數(shù)并沒呈現(xiàn)出正相關(guān)的特征。其中4 所大學在下載量增加的情況下,HOB指數(shù)未顯著增加,有的年份還出現(xiàn)了下降。中國人民大學3個文獻資源的HOB指數(shù)隨著下載量的下降反而出現(xiàn)了增加。因此,HOB 比較好地反擊了下載量增加為數(shù)據(jù)庫商帶來的談判優(yōu)勢,真實地反映了數(shù)據(jù)庫資源核心的產(chǎn)出效益。
HOB指數(shù)可以展現(xiàn)不同文獻數(shù)據(jù)資源之間的效益高低(見圖14-圖16)。HOB指數(shù)出現(xiàn)之前如何對不同資源之間的效益進行比較是一個較為困難的問題。不同資源的內(nèi)容異質(zhì)性,文獻的數(shù)量和學科分布不一致,大學學科建設(shè)的側(cè)重點都會導致資源評價缺乏一個統(tǒng)一的評價指標。HOB可以對比不同數(shù)據(jù)庫資源在同一大學的核心產(chǎn)出效益的高低。研究中Wiley的HOB指數(shù)在5所大學3個不同年份的15 個時間統(tǒng)計節(jié)點上獲得了11 個第一。換句話說,Wiley的期刊資源在有限的下載量中得到了更高的引用,相較于SD 和Springer 帶來了更高的效率和效益。
圖14 Wiley期刊HOB值分布
圖15 SD期刊HOB值分布
圖16 Springer期刊HOB值分布
同時,HOB 指數(shù)還可以展示數(shù)據(jù)資源在統(tǒng)計整體中的表現(xiàn)情況。Wiley、SD 和Springer 三個數(shù)據(jù) 資 源 總 體HOB 均 值 為:Wiley(0.211);SD(0.189);Springer(0.171)。Wiley 的HOB 指數(shù)較SD高出了11.6%,較Springer高出了23.4%。Wiley在整體HOB 指數(shù)的表現(xiàn)依然好于SD 和Springer,因此Wiley 的產(chǎn)出效益最好,平均1次下載可以帶來0.211 次的HOB 指數(shù),而價格和下載量都高于Wiley的SD,其效益卻沒有排在首位。也許從個別期刊名氣來看,SD顯得非常優(yōu)秀,但Wiley期刊資源的整體平均效益卻更為搶眼。HOB指數(shù)可以繞開數(shù)據(jù)庫資源中的一些先天的內(nèi)容區(qū)別特征,直接從用戶使用的角度評價資源最終的效益產(chǎn)出的情況,為評價數(shù)字文獻資源提供了一個新的角度。
本文設(shè)計的三個指標:HOB、HOD 和HOC,其理論基礎(chǔ)是H指數(shù)的構(gòu)造思想和影響因子(IF)思想在數(shù)字資源評價領(lǐng)域的應用,在理論基礎(chǔ)上較為成熟與完備。其優(yōu)點是跳出數(shù)字資源評價中對資源內(nèi)容評價的傳統(tǒng)方法,直接采用資源效益產(chǎn)出的概念,從資源帶來的產(chǎn)出(引用)作為評價的主體,力求從結(jié)果的角度看待資源對使用而言帶來效益的程度和效率。HOB指數(shù)計算方法簡單可行,簡明扼要地表達了資源核心效益產(chǎn)出的效率,可以清晰地比較同一學校不同數(shù)據(jù)庫資源或者不同學校同一數(shù)據(jù)庫資源之間效益產(chǎn)出量化值,較為完美地避免了數(shù)據(jù)庫資源中個別“明星期刊”帶來的超高引用和下載,強調(diào)了資源整體的核心效益產(chǎn)出效率。
但HOB指數(shù)用于評價面對以下幾個問題。
第一,由于HOB指數(shù)與統(tǒng)計的主體大學相關(guān),因由于不同大學研究人員和基礎(chǔ)本身存在較大差異,因此不同學校HOB指數(shù)對比性不強,不能通過對比不同學校同一資源HOB指數(shù)的高低來驗證彼此學科發(fā)展的優(yōu)劣。HOB指數(shù)適用于在同一學校內(nèi),比較不同文獻資源產(chǎn)出發(fā)展趨勢時具有可比性,或者比較同一資源在不同年份的產(chǎn)出效益和趨勢的變化。
第二,HOB評價缺陷也和它的優(yōu)勢一樣,排除了文獻資源中的一些其他因素。如果圖書館以文獻保障率特別是核心期刊或者重要期刊保障率為目的評價文獻資源的價值,HOB 指數(shù)可能會導致一些優(yōu)秀的資源得分不高情況。
第三,不同類型大學之間HOB 指數(shù)相差較大。本次研究發(fā)現(xiàn),中國人民大學在3個數(shù)據(jù)資源HOB指數(shù)的評分上明顯低于其他院校。這就表明HOB的絕對值和該??蒲幸?guī)模和實力相關(guān)。
第四,本次研究沒有涉及資源類型對HOB 指數(shù)的影響。但本次研究所選的是三個理工科為主的文獻資源,文科類資源的產(chǎn)出效益HOB 指數(shù)相對于理工類資源的HOB 指數(shù)會呈現(xiàn)出何種變化,本次研究還未能涉及。
第五,科研條件和實力的波動對HOB 指數(shù)會產(chǎn)生影響,進而將這種影響傳遞到文獻資源上。由于HOB 指數(shù)與引用量息息相關(guān),那么當科研文章數(shù)量下降時,HOB 指數(shù)就會受到明顯的影響。尤其是在某些核心研究團隊離開時,HOB 指數(shù)將會產(chǎn)生波動。但這一點反過來也可以用于衡量一所大學科研是否具有穩(wěn)定性。
本文設(shè)計的三個指標:資源使用效益H 指數(shù)HOB(H-index of Benefits,)、資源下載H指數(shù)HOD(H-index of Download)和資源引用H 指數(shù)HOC(H-index of citation),其理論基礎(chǔ)是H指數(shù)的構(gòu)造思想和影響因子(IF)思想在數(shù)字資源評價領(lǐng)域的應用,在理論基礎(chǔ)上較為成熟與完備。同時,本次研究是一項通過情報學的理論工具解決圖書館工作中具體問題的研究,是情報學和圖書館學在實踐中的一種結(jié)合嘗試與應用。實證研究可以得出以下結(jié)論:HOB 指數(shù)可以較好替代下載量作為文獻資源評價的指標;HOB 指數(shù)的運用也解決了HOC 數(shù)值絕對性的問題;HOB 具有很好的穩(wěn)定性和學科成果發(fā)展敏感性;HOB 不僅可以評價文獻資源產(chǎn)生的實際效果,在一定程度上也反映出了科研成果產(chǎn)出的發(fā)展現(xiàn)狀。
HOB指數(shù)未來面對的最大問題是如何克服自身缺點,需要圖書館在具體工作中的信任并使用HOB 為資源評價工作提供參考依據(jù),更為重要的是在與數(shù)據(jù)庫商的談判中發(fā)揮重要的數(shù)據(jù)力量。