唐吉深(河池學院圖書館 廣西 宜州 546399)
在社會文化大發(fā)展背景下,一方面,新聞出版市場蓬勃發(fā)展,出版圖書的品種不斷增多,《2011年新聞出版產(chǎn)業(yè)分析報告》顯示,2011年全國出版的新書達20余萬種[1];另一方面,高校圖書館在數(shù)字化進程中,不同程度地面臨著資源購置經(jīng)費緊張的困境。如何高效合理地利用有限的購置經(jīng)費,從魚龍混雜的書海中遴選出符合學科發(fā)展需要的精品圖書,成為高校圖書館學科資源建設的重點和難點?!昂诵某霭嫔纭钡拇_定有助于采訪決策者實施重點突出、目標明確的采集策略,進而提高學科圖書采集的質(zhì)量和效率。
有關 “核心出版社”的測定研究來源于“布拉德福定律”(Bradford 's Law of Scatering)[2]。布拉德福認為,文獻出版規(guī)模存在一種極不均勻、呈現(xiàn)高度集中與分散的數(shù)量分布。美國的沃森(D B Worthen)首次運用該定律測定出醫(yī)學專業(yè)專著的出版分布情況,確定了該學科的“核心出版社”,并用于指導學科建設。國內(nèi)有關“核心出版社”的研究成果首見于1991年《大學圖書館學報》刊發(fā)的吳力群《關于“核心出版社”的探討》[3]一文,在2008年首屆“館藏與出版”論壇舉辦后迅速升溫,并出現(xiàn)了一支以上海師范大學圖書館蔡迎春、穆衛(wèi)國、陸怡洲等為代表的學術科學研究團隊,致力于“核心出版社”計量分析的有關理論與實證研究。
筆者對有關研究成果進行梳理分析發(fā)現(xiàn),該領域的研究體系化趨勢明朗,運用現(xiàn)代信息計量理論和方法進行應用研究成為目前的研究熱點?!昂诵某霭嫔纭钡臏y定方法可分為3類:第1類是基于“布拉德福定律”的系列定量分析方法,包括布拉德福區(qū)域分析法、館藏調(diào)查法、征訂目錄法、百分比法、引文分析法及各種方法組合使用的綜合分析法[4];第2類是以專家評審法[5]為代表的主觀定性分析法;第3類是以定量手段解決定性問題的準定量分析方法,以層次分析法[6]最具典型。以上方法各有千秋,但就方法自身的理論可靠性來看,圖書情報界對“布拉德福定律”的系列定量分析方法認可度較高,其相關研究得到了實踐的有效驗證。
采用布拉德福區(qū)域分析法測算“核心出版社”的核心在于“出版社等級排名序列”(以下簡稱布拉德福序列)的建立。從已有研究成果來看,目前“核心出版社”的測算主要以單一性獨立指標(如“出版數(shù)量”、“出版圖書被引用量”、“館藏數(shù)量”等指標)作為布拉德福序列的評價指標,缺乏全面揭示“核心出版社”深層次內(nèi)涵價值的綜合評測指標體系。
鑒于此,本文以館藏資源分析評價的需求為基礎,按照篩選原則探尋影響評價結(jié)果的多種復合指標因子,形成完備的評價指標體系,并引入數(shù)學模型為指標體系中各項指標分配相應的客觀權值,以映射不同指標對結(jié)果影響的重要程度;在此基礎上采用復合指標加權算法測算各出版社綜合評測分,構(gòu)建布拉德福序列,運用布拉德福區(qū)域分析法確定“核心出版社”,以期測算的結(jié)果準確、客觀、適用性強,進而為高校圖書館學科資源建設工作提供值得信賴的決策依據(jù)。
綜合各方關于館藏學科“核心出版社”的定義[7-9]可知,核心出版社出版的圖書應具備學科信息含量高、學術價值高、學科地位高、學科特色突出、受讀者歡迎等特征。運用科學性原則、發(fā)展性原則、指導性原則、可操作性原則等指標篩選原則[10],可以提煉出專著規(guī)模指標(Quantity Index,簡稱QI)、學術影響力指標(Academic Index,簡稱AI)、館藏貢獻指標(Contribution Index,簡稱CI)、利用率指標(Utilization Index,簡稱UI)4個指標組成的評測指標體系。
2.1.1 專著規(guī)模指標
專著規(guī)模指標反映出版社學科圖書的出版能力。通常采用學科專著出版所占比例衡量出版社的出版能力,專著出版比例高,表明出版社出版能力強、對該學科資源占有率高、出版物選題廣、出版專著數(shù)量多、學科聲譽好、受讀者及受眾青睞。某出版社在某一時段出版專著的信息可以從《全國總書目》、中盤商館配書目及網(wǎng)絡書店書目等組成的完備書目源中獲取。某一出版社的專著規(guī)模指標的計算公式為:
其中,ni為某一出版社某時段內(nèi)出版的專著品種數(shù)量;N為該學科領域某時段內(nèi)所有出版社出版的專著品種數(shù)的總和。
2.1.2 學術影響力指標
學術影響力指標反映出版社出版的學科圖書學術質(zhì)量的優(yōu)劣程度。通常采用學科專著被引用次數(shù)比例衡量學科圖書學術質(zhì)量的優(yōu)劣程度,專著被引用次數(shù)比例高,表明學術界對該出版社出版的學科圖書的認可度高、研究價值高。某出版社在某時段內(nèi)出版的專著被引用頻次數(shù)據(jù)可以從谷歌學術搜索(Google Scholar)、《中國社會科學引文索引》(Chinese Social Sciences Citation Index,簡稱CSSCI)、《中國引文數(shù)據(jù)庫》 (Chinese Citation Database,簡稱CCD)、《中國科學引文數(shù)據(jù)庫》 (Chinese Science Citation Database,簡稱CSCD)及《讀秀中文學術搜索》(DuXiu Scholar)中獲取。某一出版社的學術影響力指標的計算公式為:
其中,Ai為學術影響力指標計算值;ci為某一出版社某時段內(nèi)出版的專著被引用頻次;C為該學科領域某時段內(nèi)所有出版社出版的專著被引用頻次的總和。
2.1.3 館藏貢獻指標
館藏貢獻指標反映出版社出版的學科圖書對高校學科館藏建設的適用程度。通常采用學科專著被收藏比例衡量學科圖書對高校學科館藏建設的適用程度,專著被收藏比例高,表明出版社出版的學科專著對高校學科專業(yè)設置和發(fā)展需要的適用度高、館藏收藏價值高。某出版社在某時段內(nèi)出版的專著被收藏的數(shù)據(jù)一方面可以取自涵蓋國內(nèi)“211工程”重點高校圖書館學科館藏信息的中國高等教育文獻保障系統(tǒng)(China Academic Library & Information System,簡稱CALIS)聯(lián)合目錄(CALIS Online Catalog),另一方面可以取自代表學科特色的本館館藏,兩者的重復數(shù)據(jù)應予以去除。某一出版社的館藏貢獻指標的計算公式為:
其中,Ci為館藏貢獻指標計算值;ai為某出版社某時段內(nèi)出版的專著被CALIS收藏的品種數(shù)量;si為某出版社某時段內(nèi)出版的專著被本館收藏的品種數(shù)量;A為該學科領域某時段內(nèi)所有出版社出版的專著被CALIS收藏種數(shù)的總和;S為該學科領域某時段內(nèi)所有出版社出版的專著被本館收藏種數(shù)的總和。
2.1.4 利用率指標
利用率指標反映讀者對出版社出版的學科圖書的利用效率。通常采用學科專著的借閱人次衡量讀者對出版社出版的學科圖書的利用效率,專著的借閱人次多,表明出版社出版的學科專著對讀者學習需求的滿足度高、使用價值高。某出版社在某一時段內(nèi)出版的學科專著的借閱人次統(tǒng)計數(shù)據(jù)可以從本館圖書流通管理系統(tǒng)中獲取。某一出版社的利用率指標的計算公式為:
其中,Ui為利用率指標計算值;bi為某出版社某時段內(nèi)出版的專著的歷年借閱人次數(shù)量;B為本館收藏的該學科領域某時段內(nèi)所有出版社出版的專著的歷年借閱人次的總和。
2.2.1 指標權重賦值方法及工具選擇
指標權重是指被考察指標在整體指標體系中價值的高低和相對重要的程度以及所占比例大小的量化值,也稱指標權重系數(shù)[11]。合理的指標權重分配方法是實現(xiàn)指標體系科學完整評判的首要因素,因此選擇指標權重測定方法及相應的測算工具至關重要。
(1)指標權重賦值方法選擇 指標權重賦值方法通常分為兩類:一類是主觀賦權法,指標權重由專家根據(jù)經(jīng)驗主觀判斷而得出,決策結(jié)果具有較強的主觀隨意性,通常適用于樣本信息量少、信息之間內(nèi)在規(guī)律尚未形成的分析初始階段,如層次分析法(Analytic Hierarchy Process,簡稱AHP)、德爾菲法(Delphi Method)等。另一類是客觀賦權法,指標權重依據(jù)樣本數(shù)據(jù)之間形成的內(nèi)在規(guī)律確定,有數(shù)學理論支撐,科學可靠,如熵值法(Entropy Method)、主成分分析法(Principal Component Analysis,簡稱PCA)等[12]。由于有關“核心出版社”測定研究的來源數(shù)據(jù)覆蓋面廣、信息量充足,因此在指標權重值計算方法上應選擇較為理想的熵值法。
(2)指標權重測算工具選擇 根據(jù)權重賦值方法的特點,要有針對性地選擇適合的測算工具。考慮熵值法計算過程的特性及數(shù)據(jù)復雜性,筆者選擇界面友好、操作方便,具有數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)分析等功能的SPSS軟件(Statistical Product and Service Solutions)作為測算指標權重值的實驗平臺,以保證測算過程的準確和高效。
2.2.2 指標權重值測算原理及流程
根據(jù)熵值法原理[13-14]對館藏學科“核心出版社”評測指標測算如下:
(1)構(gòu)造指標評測矩陣 在SPSS測算實驗平臺中,筆者采集了館藏學科“核心出版社”各評測指標原始數(shù)據(jù),并構(gòu)造了原始指標評測矩陣X=(xij)m×n,其中m為待評測出版社個數(shù),n為指標個數(shù)。為了消除原始數(shù)據(jù)數(shù)量級上的差異性,統(tǒng)一衡量標準,筆者在SPSS軟件中采用線性比例方法對原始矩陣進行歸一化處理,得到標準化矩陣Y=(yij)m×n,其中0≤yij≤1。
(2)計算標準化矩陣中各元素概率,其公式為:
(3)計算指標體系中第j個指標的熵值,其公式為:
其中,k=(lnm)-1,Sj>0 。
(4)計算指標體系中第j個指標的權重值,其公式為:
其中,Hj=1-Sj,Hj為第j個指標的差異系數(shù)。
2.2.3 布拉德福序列建立
(1)按<7>式可測得的各指標權重值,對其構(gòu)造權重向量W=(w1,w2,…wj,…wn)。
(2)采用加權算法計算第i 個出版社綜合評測值,其公式為:
(3)在<8>式計算各出版社綜合評分的基礎上,按綜合評分值對出版社降序排列,得到出版社的布拉德福序列V=(v1,v2,…vi,…vm)。
目前,已有大量理論與實證研究闡述了有關布拉德福區(qū)域分析法在“核心出版社”測定中應用的可行性,本文不再贅述。將出版社綜合評測分替代傳統(tǒng)的單一出版物數(shù)量作為出版社排序的基準參照,同樣符合布拉德福定律適用要素。
本文采用布拉德福區(qū)域分析法測定學科“核心出版社”:在學科出版社布拉德福序列V=(v1,v2,…vi,…vm)的基礎上,將其劃分為若干區(qū)域,使得各區(qū)域內(nèi)出版社的綜合評測分總和相等或相當。此時,若進入各區(qū)域內(nèi)出版社的數(shù)量滿足布氏定律要求,即存在1:a:a2…的關系(a>1,a為布拉德福系數(shù)),則綜合評測分排名靠前且出版社數(shù)量不多的第一區(qū)即為核心區(qū),核心區(qū)內(nèi)的出版社即為學科館藏“核心出版社”。另外,可按重要程度依次將除核心區(qū)以外的其他區(qū)域列為館藏資源建設關注的主要區(qū)、一般區(qū)、相關區(qū)、無關區(qū)等,以便決策者有針對性地做出重點突出、符合館藏發(fā)展特色的采訪策略。
本文以河池學院圖書館經(jīng)濟學科圖書“核心出版社”為實例進行實驗。樣本數(shù)據(jù)采集:將《全國總書目》、人天書目、卓越網(wǎng)書目及當當網(wǎng)書目中有關經(jīng)濟學科圖書書目導入SPSS軟件,按照高校學科資源建設的要求剔除休閑類、娛樂類、通俗類、少兒類、勵志類等不符合學科圖書學術標準的書目,經(jīng)整理、去重、篩選、清理等預處理操作,得到2003—2006年422家出版社的16 608條專著書目信息;從《谷歌學術搜索》等引文數(shù)據(jù)庫中統(tǒng)計各出版社學科專著被引頻次數(shù)據(jù);從CALIS聯(lián)合目錄獲取經(jīng)濟學科館藏數(shù)據(jù)14 309條;從河池學院圖書館圖騰管理系統(tǒng)獲取經(jīng)濟學科館藏數(shù)據(jù)4 652條及流通借還記錄14 003條。筆者在SPSS軟件中整合匯總數(shù)據(jù),并建立以專著規(guī)模指標,學術影響力指標、館藏貢獻指標、利用率指標為評測指標、以422家出版社為評測對象的原始指標評測矩陣X=(xij)422×4,其中1≤i≤422,1≤j≤4。按照上述權重值計算流程,分別計算4個指標的熵值Sj、差異系數(shù)Hj和權重值Wj,計算結(jié)果如表1所示。
表1 出版社各指標熵值和差異系數(shù)及指標權重值
首先,根據(jù)上述測算的指標權重值計算各出版社綜合測評分,并生成布拉德福序列V=(v1,v2,…vi,…v422)。然后,設定擬劃分布拉德福區(qū)域數(shù)量為3個(核心區(qū)、主要區(qū)、次要區(qū)),并按照布拉德福區(qū)域分析法原理對生成的布拉德福序列V進行歸類劃分。最后,得出劃分結(jié)果如表2所示。
表2 經(jīng)濟學科圖書出版社區(qū)域劃分
由表2可知,落入核心區(qū)的出版社13家(排名靠前),主要區(qū)的出版社68家(排名居中),次要區(qū)的出版社341家(排名靠后),各區(qū)評測分所占比例分別為39.40%、31.23%、29.37%,基本相當,各區(qū)域出版社數(shù)量比為:13:68:341≈1:5:52,符合布拉德福文獻出版分布定律。
因此,本實驗測定的經(jīng)濟學科“核心出版社”具體見表2“核心區(qū)”。
由樣本實驗可知,4個指標的重要程度依次為:利用率指標>專著規(guī)模指標>館藏貢獻指標>學術影響力指標。利用率指標排首位表明:實驗數(shù)據(jù)中圖書被利用情況差異大,熵值小,對評測總分的影響大;學術影響力指標排末位表明:實驗數(shù)據(jù)中圖書被學者引用的次數(shù)分布相對均勻緩和,熵值大,對評測總分的影響相對較小。
將實驗測定的“核心出版社”結(jié)果與蔡迎春在《基于綜合分析法的核心書目及核心出版社的測定》[15]中測定的經(jīng)濟學科“核心出版社”對比發(fā)現(xiàn),除了出版社的排名先后不一樣外,本實驗測定的13家“核心出版社”有12家與其完全一致。而本實驗中測評分最高的“機械工業(yè)出版社”在蔡迎春一文中未入圍“核心出版社”,主要原因在于“核心出版社”的測評方法是基于多指標評價體系,各指標之間權重大小對評測結(jié)果影響較大。本實驗中“利用率指標”權重最高,因樣本數(shù)據(jù)中機械工業(yè)出版社的學科圖書被借閱頻次最高,故在一定程度上對其綜合評分增加了加分因子。由此可見,館藏學科“核心出版社”的選擇在考慮普遍性因素的同時,更應突出本校學科資源建設的獨特性和適用性。
實例研究證實,基于多指標體系的館藏學科“核心出版社”評測方法科學、易用,測定結(jié)果準確且能突顯各高校圖書館學科館藏建設的特性??梢姡诙嘀笜梭w系的館藏學科“核心出版社”評測模型架構(gòu)設想合理,具有可行性和可操作性,可為高校圖書館的學科館藏建設提供科學可靠的支持。筆者下一步研究將考慮引入專家系統(tǒng)對模型的評估,以指導高校圖書館制定優(yōu)化學科資源建設的應對措施和策略,進一步發(fā)揮館藏學科“核心出版社”評測模型的應用價值。
[1]新聞出版總署信息中心.解讀《2011年新聞出版產(chǎn)業(yè)分析報告》[EB/OL]. [2012-07-17]. http://www.gapp.gov.cn/cms/html/21/367/201207/760532.html.
[2]邱均平. 信息計量學[M].武漢:武漢大學出版社,2006:97-131.
[3]吳力群.關于“核心出版社”的探討[J]. 大學圖書館學報,1991 (5):36-37.
[4]徐文賢,蔣志強.核心出版社的測定及其評價[J]. 高校圖書館工作,2001(6):9-11.
[5]朱慶華.信息分析基礎、方法及應用[M]. 北京:科學出版社,2004:74-95.
[6]蔡迎春.基于層次分析法的學科圖書采購模型構(gòu)建及實證分析[J].圖書情報工作,2010(21):36-39.
[7]范超英,田麗娜.館藏圖書核心出版社測定模型研究[J].圖書情報工作,2009(13):58-60.
[8]林曉華.基于核心出版社理論的學術圖書采購策略[J].圖書館建設,2010(3):49-51.
[9]鐘建法“.核心出版社”采購的理論和方法[J]. 圖書館建設,2003(4):43-44.
[10]趙煒霞,李慶芬,苑曉燕.基于層次分析法的核心出版社評價體系研究[J].農(nóng)業(yè)網(wǎng)絡信息,2011(7):49.
[11]謝新觀.遠距離開放教育詞典[M].北京:中央廣播電視大學出版社,1999:330.
[12]孫曉東, 焦 , 胡勁松.基于組合權重的灰色關聯(lián)理想解法及其應用[J].工業(yè)工程與管理,2006(1):62-66.
[13]邱菀華.管理決策與應用熵學[M].北京:機械工業(yè)出版社,2002:140-163.
[14]曾紅巖,羅明英,坤燕昌.學科文獻核心出版社測算方法研究[J].圖書情報工作.2011(11):52-55.
[15]蔡迎春.基于綜合分析法的核心書目及核心出版社的測定[J].圖書館雜志, 2009(1):4-9.