■李軍
Hirsch教授于2005年提出的h指數(shù)在國內(nèi)外信息計量和科學(xué)評價領(lǐng)域引起了很大的反響。它不僅用于對科學(xué)家個人或群體學(xué)術(shù)績效的評價,同時也應(yīng)用于對學(xué)術(shù)期刊影響力及專利信息的評價研究。本文旨在通過對h指數(shù)的相關(guān)介紹,分析了h指數(shù)評價科研人員學(xué)術(shù)產(chǎn)出時的影響因素,最后提出了若干修正及校正方法和建議,對于h指數(shù)在國內(nèi)的準(zhǔn)確應(yīng)用具有重要的意義。
如何評價科研人員的學(xué)術(shù)成就和學(xué)術(shù)影響,是人們一直在努力探索的課題。多數(shù)科研人員認(rèn)為同行評議是評價一個科研人員學(xué)術(shù)成就的最基本的方法,如果同行評議機制嚴(yán)格、得當(dāng)、評審專家作風(fēng)正派、了解情況全面,能夠得出客觀公正的定性評價結(jié)果。但在評議機制不夠嚴(yán)格和信譽制度不夠完善的情況下,往往存在重人情拉關(guān)系、本位主義等現(xiàn)象,影響到評價工作的客觀公正性。因此,一些文獻計量學(xué)家開始采用引文量、期刊影響因子等指標(biāo)來對學(xué)術(shù)成就進行定量評價,然而研究發(fā)現(xiàn),這些傳統(tǒng)的文獻計量指標(biāo)有微觀層次上,特別是對科學(xué)家個人進行學(xué)術(shù)評價時存在很多問題。
2005年,美國加州大學(xué)圣地亞哥分校物理學(xué)家J.E.Hirsch提出了一種新的文獻計量方法—h指數(shù)(h-index)用以評價科學(xué)家個人的學(xué)術(shù)成就。該指數(shù)創(chuàng)新性地將科學(xué)家學(xué)術(shù)論文的產(chǎn)出量(論文數(shù))和質(zhì)量(引文數(shù))結(jié)合為一個單一指標(biāo),意在用于衡量科研人員個人學(xué)術(shù)成就。h指數(shù)剛一公布就引起了廣泛的關(guān)注,Nature和Science都相繼進行了報道。h指數(shù)不僅用于對科學(xué)家個人或群體學(xué)術(shù)績效的評價,同時也應(yīng)用于對學(xué)術(shù)期刊影響力的評價研究及專利信息中專利權(quán)人的研究。因此,本文旨在通過對h指數(shù)的相關(guān)介紹,指出并分析h指數(shù)在評價科研人員學(xué)術(shù)產(chǎn)出時的影響因素,并提出了若干修正及校正方法和建議,對于h指數(shù)在國內(nèi)的準(zhǔn)確應(yīng)用具有重要的意義。
Hirsch將科學(xué)家個人h指數(shù)定義為:當(dāng)且僅當(dāng)某科學(xué)家發(fā)表的NP篇論文中有h篇論文每篇至少獲得了h次的引文數(shù),其余的NP-h篇論文中各篇論文的引文數(shù)都小于或等于h時,此h值就是該科學(xué)家的h指數(shù)。他認(rèn)為h指數(shù)能夠準(zhǔn)確地反映出科研人員的學(xué)術(shù)成就,一個人的h指數(shù)越高,則表明他的論文及學(xué)術(shù)影響力就越大。h指數(shù)把文章的被引用率作為衡量研究工作的內(nèi)在指標(biāo),而論文數(shù)量作為參考指標(biāo),這在一定程度上反應(yīng)了科研工作者的個人成就,但它也可以用于評價工作者的群體和學(xué)術(shù)期刊。
Hirsch提出h指數(shù)的初衷就是用于對科學(xué)家個人總體學(xué)術(shù)成就的評價。h指數(shù)巧妙地將數(shù)量指標(biāo)(發(fā)表的論文數(shù)量)和質(zhì)量指標(biāo)(被引頻次)結(jié)合在一起,同時對論文產(chǎn)出力和論文影響力進行測量,克服了以往各類單項指標(biāo)的缺點與不足。h指數(shù)高不僅表明評價對象發(fā)表的論文質(zhì)量高,而且表明高質(zhì)量論文的數(shù)量多,因而相比傳統(tǒng)文獻計量單項指標(biāo)只能體現(xiàn)數(shù)量的缺憾有明顯優(yōu)勢,是近年文獻計量學(xué)指標(biāo)研究的一項重要成果和進展。
據(jù)Hirsch的定義:“一個科學(xué)家的分值為h,當(dāng)且僅當(dāng)他/她所發(fā)表的N篇論文中有h篇論文每篇至少被引用了h次,而其余論文每篇至多被引用了h次”。h指數(shù)的基本應(yīng)用是基于引文分析的個人學(xué)術(shù)產(chǎn)出和影響力,然而h指數(shù)的準(zhǔn)確應(yīng)用受到諸多因素影響。如定義中所指“作者所發(fā)表N篇論文”這一說法就存在很大爭議,因定義對N篇論文的歸屬權(quán)問題沒有做進一步的闡釋,這N篇指的是所有參與的N篇(包括本人作為第一作者、通訊作者等),還是作為第一作者的N篇或作為通訊作者的N篇,還有作者重名、學(xué)科、數(shù)據(jù)庫及自引等問題。這些因素都將影響其h指數(shù)計算的準(zhǔn)確性。
國內(nèi)外各數(shù)據(jù)庫中作者重名問題一直影響著學(xué)術(shù)評價指標(biāo)的準(zhǔn)確性,h指數(shù)也不例外。根據(jù)Hirsch的定義及數(shù)據(jù)模型推理可以看出,h指數(shù)代表四層意思:h篇論文;每篇至少被引h次;總被引至少h2次;總被引大約為(3~5)h2。h指數(shù)相差1,總被引大約相差3~5倍(2h一1),h指數(shù)的增加體現(xiàn)的是作者論文數(shù)量變化過程中的部分質(zhì)變。因次,作者h(yuǎn)指數(shù)測算的準(zhǔn)確性至關(guān)重要。
在我國,重名問題尤為嚴(yán)重??茖W(xué)引文索引等一些國外權(quán)威數(shù)據(jù)庫中,我國科學(xué)家的名字只取漢語拼音的首字母,更加混淆了作者身份。部分?jǐn)?shù)據(jù)庫公司己經(jīng)意識到這一問難的嚴(yán)重性,并在這方便做了很多技術(shù)方面的嘗試,如Scopus數(shù)據(jù)庫的作者身份標(biāo)示系統(tǒng) (author identifloation),為每個作者分配一個固定 ID(Ideniification,身份識別碼),且支持中國作者名字的漢語拼音全拼檢索。此外,每個ID均有明確的單位標(biāo)示,這在很大程度上緩解了重名問題對作者h(yuǎn)指數(shù)的影響。然而,還有很多數(shù)據(jù)庫目前還沒有能力實現(xiàn)或正在實現(xiàn)以上技術(shù)。如何利用這些數(shù)據(jù)庫自身檢索特點結(jié)合相關(guān)手動檢索技術(shù)更好地減少重名問題對于作者h(yuǎn)指數(shù)的影響,對h指數(shù)準(zhǔn)確應(yīng)用具有重要意義。
根據(jù)Hirsch的定義,h指數(shù)適用的前提條件是作者應(yīng)發(fā)表一定數(shù)量的論文,且這些論文要被相關(guān)數(shù)據(jù)庫收錄。其適用范圍總體上應(yīng)以從事理論研究及基礎(chǔ)研究的科研人員為主?;A(chǔ)研究成果多強調(diào)學(xué)術(shù)價值,其績效表現(xiàn)多以科學(xué)論文和學(xué)術(shù)專著為主。應(yīng)用研究成果以應(yīng)用前景為評價標(biāo)準(zhǔn),績效表現(xiàn)形式以技術(shù)論文、技術(shù)專著和專利為主,專利形式比論文形式更能體現(xiàn)其技術(shù)特征。但這并不妨礙h指數(shù)的應(yīng)用,因從事技術(shù)研究開發(fā)的科學(xué)家,也有論文發(fā)表,甚至比從事基礎(chǔ)研究的科學(xué)家還要多,且從事基礎(chǔ)研究的科學(xué)家,同樣也有專利產(chǎn)出等等??茖W(xué)家所從事科研工作的性質(zhì)通過其所在學(xué)科得以反映,因此,可以通過學(xué)科進行科研工作類型分類。
學(xué)科間規(guī)模、發(fā)展階段、發(fā)展速度、活躍程度等特征不同,學(xué)科間科研人論文產(chǎn)出及引文規(guī)律也不盡相同,甚至學(xué)科內(nèi)也是如此,因此,學(xué)科間學(xué)科內(nèi)研人員之間h指數(shù)也應(yīng)不同。Hirsch對各個領(lǐng)域的科學(xué)家進行了統(tǒng)計分析,發(fā)各學(xué)科有成就的科學(xué)家確實有相對較高的h指數(shù)值,且各學(xué)科間h指數(shù)存在很差異。物理領(lǐng)域h指數(shù)最高的E.Witten,h=110;生物學(xué)家當(dāng)中h指數(shù)最高SolomonH.Snyder,高達191,其次為加州理工學(xué)院生物學(xué)家David Baltimore,其h值為160。Hirsch通過測算發(fā)現(xiàn)生命科學(xué)領(lǐng)域科學(xué)家的h指數(shù)要明顯高于理學(xué)領(lǐng)域科學(xué)家的h指數(shù)。這表明h指數(shù)像其他指標(biāo)一樣,不太適合直接用于科間科學(xué)家之間的比較。
各學(xué)科間科學(xué)家個人h指數(shù)的不可比性,在宏觀層面上應(yīng)表現(xiàn)為學(xué)科間h指數(shù)的差異。仿照Hirsch的定義,將學(xué)科h指數(shù)界定為“某學(xué)科的h指數(shù)是指該學(xué)科有h篇最低被引為h次的論文”。由于學(xué)科劃分的相對性和層次性,同屬醫(yī)學(xué)一級學(xué)科的各二級學(xué)科間也應(yīng)具備學(xué)科h指數(shù)的差異。通過系統(tǒng)分析醫(yī)學(xué)一級學(xué)科的各二級學(xué)科間h指數(shù)的差異,進一步說明學(xué)科對于科研人員h指數(shù)的影響,并提出可行的校正方法,以使得學(xué)科間科研人員h指數(shù)具有可比性。
h指數(shù)是基于引文分析的評價指標(biāo),基于引文分析指標(biāo)多少會受到作者自引的影響。自引要分別對待惡性自引和良性自引,惡性自引近乎炫耀家底,良性自引可以見出研究的系列性、漸進性,體現(xiàn)學(xué)術(shù)成長歷程和延續(xù)性,是正常學(xué)術(shù)規(guī)范,無可厚非。然而,當(dāng)引文指標(biāo)用于評價科學(xué)家個人學(xué)術(shù)成就時,類似論文作者自引部分理應(yīng)排除,因自引并不能體現(xiàn)該文章學(xué)術(shù)影響力。自引又包括作者本人自引和合作者的引用。當(dāng)然,自引會增大作者h(yuǎn)指數(shù),但Hirsch在文章中說作者自引對于h指數(shù)的影響很小,即使需要校正也是少數(shù)。有人分析了一組生物進化學(xué)領(lǐng)域科學(xué)家的h指數(shù),發(fā)現(xiàn)排除自引后h指數(shù)平均降低了12.3%,信息科學(xué)高影響力科學(xué)家自引排出后h指數(shù)最多的下降了3,平均下降了0.9%或6.6%。本文則分別以國內(nèi)化學(xué)部有效增選院士和ISI生物與生物化學(xué)及化學(xué)領(lǐng)域高被引科學(xué)家為例進一步探討自引對于作者h(yuǎn)指數(shù)影響,以及自引校正必要性。
以上針對文獻計量新指標(biāo)h指數(shù)定義及評價科學(xué)家個人學(xué)術(shù)成就過程中所存在的主要影響因素進行了研究,其中包括數(shù)據(jù)庫選擇、作者重名、科研工作性質(zhì)、學(xué)科及作者自引等問題。分析這些影響因素對于h指數(shù)影響的基礎(chǔ)上,提出了若干修正及校正方法和建議,其中包括:
(1)針對作者重名問題對于國內(nèi)科學(xué)家h指數(shù)影響,提出了組合檢索策略并對作者單位組合檢索進行了深入研究。針對科學(xué)家經(jīng)常變遷單位問題,提出測算頻繁變遷工作的科研人員的h指數(shù)時,應(yīng)充分調(diào)查其工作履歷,進行多機構(gòu)復(fù)合檢索,以便提高查全率;針對大學(xué)及機構(gòu)因合并、建制、擴充等因素更換單位名稱而相應(yīng)數(shù)據(jù)庫沒有及時進行相應(yīng)修改等問題,提出檢索這類作者論文應(yīng)格外注意,應(yīng)進行單位改名前后多機構(gòu)組合檢索;針對機構(gòu)名稱變更或書寫不規(guī)范等因素所引起的檢索不全等問題,可通過單位郵編組合進行檢索。
(2)針對科研工作性質(zhì)對作者h(yuǎn)指數(shù)的影響,理論結(jié)合檢索實踐對h指數(shù)適用性進行了初步分類:從事基礎(chǔ)理論類性質(zhì)研究工作的科研人員適用性較高;從事技術(shù)應(yīng)用開發(fā)類性質(zhì)研究工作適用性一般;從事保密性質(zhì)類研究工作的科研人員基本上不適用。
(3)針對學(xué)科因素對作者h(yuǎn)指數(shù)的影響,提出將不同學(xué)科科技人員個人的h指數(shù)進行標(biāo)化后比較或分學(xué)科比較,標(biāo)化方法:將科學(xué)家個人h指數(shù)除以其學(xué)科h指數(shù),再乘上100。
(4)針對國內(nèi)外作者自引比例差異,不同學(xué)科作者自引比例差異,提出用排除自引后h指數(shù)后進行評價會更準(zhǔn)確。
然而,準(zhǔn)確評價科學(xué)家個人學(xué)術(shù)成就是個很復(fù)雜的工程,其中除以上述涉及的問題外,還包括其年齡、從事科研時間、性別、國家語種差別、“馬太效應(yīng)”、論文“友情互引”及“論文反引”等問題,這些問題的存在在很大程度上限制了基于引文分析指標(biāo)潛能的發(fā)揮。單純就文獻計量指標(biāo)而言,h指數(shù)、論文總數(shù)、引文總數(shù)、篇均被引次數(shù)、高被引論文次數(shù)等均不同程度存在以上問題,因此,應(yīng)用時均需綜合全面考慮?;谝陨戏治觯髡遠(yuǎn)指數(shù)相對較適用于國內(nèi)科學(xué)精英的學(xué)術(shù)產(chǎn)出和學(xué)術(shù)影響力評價,且應(yīng)遵守“同庫同行同單位同性同年齡段相比”原則。
評價科研人員的學(xué)術(shù)成就,僅憑其發(fā)表的論文總數(shù)并不妥,還要看這些論文的質(zhì)量。但將期刊的影響因子等同論文的質(zhì)量指標(biāo)也是不妥的,必須具體地看其論文的情況,總體地衡量其論文的被引用情況。Hirsch提出的h指數(shù)巧妙地將數(shù)量指標(biāo)(發(fā)表的論文數(shù)量)和質(zhì)量指標(biāo)(被引頻次)結(jié)合在一起,同時對論文產(chǎn)出力和論文影響力進行測量,克服了以往各種單項指標(biāo)的缺點與不足。盡管文獻計量學(xué)家一再告誡,用文獻計量學(xué)方法評價科研績效的最小單位應(yīng)該是科研小組,對科研人員個人進行績效評價意義不大,甚至是危險的。但是,在現(xiàn)實的科研管理中,經(jīng)常會有對個人績效進行評價的需求,因此,不能回避這一問題,而是采取措施,不斷地改進和完善個人層面的績效評價工作。
[1]趙基明,邱均平,黃凱,劉兵紅.一種新的科學(xué)計量指標(biāo).中國科學(xué)基金[J].2008(2).
[2]趙明基,舒明全.基于CSSCI的《中國圖書館學(xué)報》h指數(shù)及核心作者測定[J].中國圖書館學(xué)報,2008(2).
[3]劉合艷,房俊民,苑彬成.h指數(shù)研究及應(yīng)用概述[J].情報理論與實踐,2009(11).