編譯 張文韜
太多沒有引用率的論文代表了一堆無用或沒有意義的研究?實際上,Web of Science的記錄表明,只有不到10%的科學(xué)文章沒有被引用過。不過沒有引用率的比例不高不等于說取得越來越有價值的科學(xué)發(fā)現(xiàn)。
曾獲得諾貝爾獎的遺傳學(xué)家奧利弗·史密斯(Oliver Smithies)2017年 1月去世,享年91歲。他是個非常謙遜的科研工作者,生前經(jīng)常提及自己“最大的失誤之一”——1953年他發(fā)表了一篇有關(guān)測量滲透壓的文章。他表示該文從來沒有被引用過。不僅如此,在2014年德國林道會議上,他對學(xué)生們說:“沒有人引用過這篇文章,也沒有人采用過這個方法?!?/p>
事實上,史密斯沒有意識到,他的論文并非完全沒有吸引力。在文章發(fā)表后的10年內(nèi),有9篇論文引用了它。類似的錯覺很容易理解。不管是對其數(shù)量還是對學(xué)術(shù)界的影響,很多科學(xué)家對于沒有引用率的論文懷有錯誤印象。
1990年,《科學(xué)》期刊發(fā)表了一篇具有爭議性的文章:一項廣泛、重復(fù)的估算表明,超過一半的學(xué)術(shù)文章在發(fā)表之后5年中沒有被引用過。信息學(xué)家葉溫·韋斯特(Jevin West)在西雅圖市華盛頓大學(xué)從事大規(guī)模的學(xué)術(shù)文獻樣本研究,他表示科學(xué)家確實為此煩惱。畢竟,引用率是被廣泛承認的學(xué)術(shù)影響力的衡量指標。閱讀量不僅是一個標志,而且也證明其對后續(xù)實驗是否有用。研究人員擔心,太多沒有引用率的論文代表了一堆無用或沒有意義的研究。韋斯特說:“在晚宴上,不知有多少人問過我,有多少論文從來沒有被引用過?”
實際上,沒有引用率的科研論文并非總是無用的。另外,加拿大蒙特利爾大學(xué)的信息學(xué)家文森特·拉里維埃爾(Vincent Larivière)指出,實際上并沒有那么多無引用率的文章。
在已經(jīng)發(fā)表的研究工作中,這個黑暗的角落常被人遺忘。為了更好地了解情況,《自然》期刊通過數(shù)據(jù)挖掘的方法,希望找出到底有多少論文實際上是沒有被引用過的。當然,不可能得出非常準確的答案,因為引用的數(shù)據(jù)庫不夠完整。但是很顯然,對于科學(xué)引文索引數(shù)據(jù)庫——Web of Science上的12 000種核心期刊,零引用率的論文比普遍認為的要少得多。
Web of Science的記錄表明,只有不到10%的科學(xué)文章沒有被引用過。但是實際數(shù)字可能更低,因為這個數(shù)據(jù)庫里大部分的零引用率文章實際上被人在其他地方引用過。
這并不一定意味著我們無須擔心低水平研究的數(shù)量,因為還有數(shù)千種期刊沒有被Web of Science收錄,同時,對于科學(xué)工作者用毫無意義的文章填充自己簡歷的擔憂也是真實存在的。
有人也許會被過去的報道中所說的有大量文章未被引用而嚇到,新的數(shù)字可能會使他們放心一些。仔細審視某些未被引用的論文,發(fā)現(xiàn)它們?nèi)匀皇怯杏玫?,有人閱讀過,盡管這個數(shù)據(jù)經(jīng)常被忽略了。Clarivate公司的高級分析師戴維·潘朵貝瑞(David Pendlebury)說:“沒有引用率不能簡單與文章是無用或者是沒有價值的劃等號。”
“大量無引用率的論文充斥著各種期刊”這個觀點可以追溯到1990年和1991年在《科學(xué)》期刊上發(fā)表的2篇文章。1990年發(fā)表的文章指出,在1981年至1985年發(fā)表的論文中,發(fā)表后5年中沒有引用記錄的有55%。但是這個分析有誤導(dǎo)性,主要因為作者統(tǒng)計的發(fā)表文章包括了讀者來信、稿件更正、會議摘要和其他編輯資料等,這些文章本身就不可能獲得引用。如果排除這些文章、僅留下研究論文和綜述的話,零引用率就會直線下降。如果超過5年進行統(tǒng)計的話,零引用率更為減少。
2008年,拉里維埃爾等人對Web of Science的數(shù)據(jù)開展新的研究發(fā)現(xiàn),不僅無引用率的文章比預(yù)想的少,而且數(shù)十年來,無引用率的文章比例也在下降?!蹲匀弧菲诳埨锞S埃爾和卡西迪·杉本(Cassidy Sugimoto)做了無引用文獻分析的更新和詳細說明。
新的數(shù)據(jù)統(tǒng)計了研究論文和綜述文章,表明在大部分學(xué)科中,在發(fā)表后5~10年零引用率的論文比例趨于穩(wěn)定,盡管每個學(xué)科的比例有所不同(參見前圖)。在2006年發(fā)表的所
有生物醫(yī)學(xué)論文中,只有4%至今沒有獲得引用。在化學(xué)領(lǐng)域,這個數(shù)字是8%,物理學(xué)的數(shù)字接近11%(如果把科學(xué)家引用自己論文的情況剔除,這個比例還會升高,在某些學(xué)科甚至?xí)?0%)。在工程技術(shù)學(xué)科,2006年Web of Science數(shù)據(jù)庫中無引用率是24%,大大高于自然科學(xué)。拉里維埃爾表示,這個更高的比例可能與很多論文的技術(shù)性質(zhì)有關(guān),只能解決特定的問題,而不是為其他人的進一步研究提供經(jīng)驗。
整體來看,1900年至2015年,Web of Science中收錄了各個學(xué)科的3 900萬篇研究論文,其中約21%沒有被引用。這并不令人吃驚,這些無引用率的論文發(fā)表在不知名的期刊上,而幾乎所有發(fā)表在知名期刊上的論文都獲得了引用。歌學(xué)術(shù)網(wǎng)站上搜索時,黑內(nèi)貝格發(fā)現(xiàn),很多零引用率論文實際上是被Web of Science索引的其他工作引用,但是由于數(shù)據(jù)錄入錯誤或者拼寫錯誤而被遺漏了。此外還有不在Web of Science索引中的期刊和書籍中的引用。黑內(nèi)貝格工作了20小時后,發(fā)現(xiàn)比例又縮小了5倍,僅僅只有0.3%了。
類似的問題導(dǎo)致我們不可能知道無引用率論文的準確數(shù)量:想大規(guī)模重復(fù)黑內(nèi)貝格的手工核對要耗費大量時間。此外,不同的學(xué)科受到類似錯漏的影響也不同。例如,Web of Science記錄,2006年發(fā)表的65%人文學(xué)科論文沒有引用率。的確,大量人文科學(xué)文獻沒有被引用,部分原因是:與自然科學(xué)相比,人文科學(xué)的新研究成果更少依賴于之前累積的知識。但是,Web of Science沒有準確反映這個方面,因為它忽略了許多相關(guān)期刊和書籍。
國家之間進行比較也有類似情況。Web of Science 表明,與美國和歐洲科學(xué)家的論文相比,由中國、印度和俄羅斯等國科學(xué)家撰寫的文章更容易被忽視。但是拉里維埃爾說,如果考慮到這個數(shù)據(jù)庫沒有追蹤很多地區(qū)性的期刊,差距其實并沒有那么大。
拉里維埃爾指出,盡管絕對數(shù)值很高,但是Web of Science上零引用率文章比例還是明顯下降。互聯(lián)網(wǎng)讓搜索和引用相關(guān)論文變得易如反掌(推動論文的開放獲取可能也有幫助)。但是拉里維埃爾警告說,對于圖中的趨勢不要過度解讀。他的團隊在2009年的一項研究中發(fā)現(xiàn),從未引用的比例正在下降,因為科學(xué)家們發(fā)表更多的論文,在參考文獻處提到了更多的文章。荷蘭萊頓大學(xué)的文獻統(tǒng)計學(xué)研究人員盧多·沃爾特曼( Ludo Waltman)表示同意,“這個圖并不能說明,產(chǎn)生了越來越多有用的科學(xué)工作?!?/p>
沃爾特曼指出,很多的論文只是勉強逃離了“從未被引用”的窘境:沃爾特曼和拉里維埃爾的獨立計算表明,在Web of Science的論文中,只有1~2次引用的文章數(shù)量超過0次引用的文章數(shù)量。“我們知道,很多引用是很膚淺的或者敷衍的。”他說到。而在紐約Marxe公共和國際關(guān)系學(xué)院的健康經(jīng)濟學(xué)家達利亞·雷勒(Dahlia Remler)看來,它們可能只是學(xué)者之間互助引用,“即使高引用率的研究也可能是一個游戲,學(xué)者們互相引用,卻沒有為任何人帶來進步?!彼f。
這些數(shù)據(jù)只是給出了部分答案。但是要想分析全部文獻還是不切實際的。
要核對一小部分論文已經(jīng)很困難。例如,2012年,為了驗證一篇論文的荒謬結(jié)論(它聲稱大約10%諾貝爾獎獲得者的研究從未被引用過),布拉格查爾斯大學(xué)的生物學(xué)家彼得·黑內(nèi)貝格(Petr Heneberg)決定審查13位諾貝爾獲獎人在Web of Science的記錄。他最初在Web of Science上查找,無引用率的數(shù)字接近1.6%。隨后,在谷
有些研究人員可能還是會把無引用率的文章視為沒有價值。畢竟,如果這些文章重要,怎么會沒有人提到它們呢?
這只是一種可能性,而并不絕對。美國路易斯安那州立大學(xué)的植物學(xué)家邁克爾·麥克羅伯(Michael MacRoberts)說,對研究人員產(chǎn)生影響的論文實際上比體現(xiàn)在引用中的論文多得多。在2010年的一篇分析引文缺點文章中,麥克羅伯引用了他自己1995年在德克薩斯州發(fā)現(xiàn)石松(Palhinhaea cernua)的論文。這是該文第一次也是唯一的一次被引用,但是這個信息早已被記錄在植物地圖集和大型在線數(shù)據(jù)庫中;利用這些數(shù)據(jù)庫的人其實是在使用這篇文章和數(shù)以千計類似的植物報告中的數(shù)據(jù)?!斑@些所謂的從未被引用的文章中的數(shù)據(jù)被人們使用,但是它們確實沒有被引用。”他說。
沒有引用率的文章也有人讀。2010年,紐約市衛(wèi)生與心理健康署的研究人員發(fā)表了研究論文,用軟件分析唾液檢測HIV的不足。幾年前,在臨床上曾經(jīng)暫停使用檢測試劑盒(后來恢復(fù))。作者想用臨床經(jīng)驗作為個案研究,探討在出現(xiàn)問題時,軟件是否能被用于分析試劑盒效用。
這個圖并不能說明產(chǎn)生了越來越多有用的科學(xué)工作
漫長的等待 對于希望自己的論文獲得首次引用的研究人員來說,阿爾伯特·佩克(Albert Peck)的故事是很勵志的。佩克1926年發(fā)表了有關(guān)玻璃缺陷的論文,直到2014年才獲得了第一次引用。在20世紀50年代,制造廠家能夠在沒有缺陷的情況下制造出平滑玻璃,這篇論文完全沒有引起重視。而2014年,英國劍橋大學(xué)的材料學(xué)研究者凱文·諾爾斯(Kevin Knowles)在Google上偶然發(fā)現(xiàn)了這篇論文,當時他正在研究如何利用玻璃缺陷產(chǎn)生散射光。他現(xiàn)在已經(jīng)在4篇論文中引用此文。他聲稱:“我喜歡在寫論文時,挑選不引人注目的文章?!?/p>
錯過引用期 2016年,里斯本大學(xué)的醫(yī)學(xué)生弗朗西斯科·皮尼亞-馬丁斯(Francisco Pina-Martins)發(fā)表了一篇論文解讀基因序列數(shù)據(jù),他很肯定該文不會被引用,因為文中提到的技術(shù)是由454生物技術(shù)公司開發(fā)的,已經(jīng)被淘汰了。早在2012年,他就在GitHub程序分享網(wǎng)站上上傳了他的數(shù)據(jù)分析軟件,其軟件被一些論文所引用。但是,他表示,之所以這個研究的論文發(fā)表用了4年,主是因為涉及罕見的問題,連進行評議的同行也看不懂。
死胡同 很多關(guān)于無引用率文獻的故事結(jié)局是不愉快的。2010年,神經(jīng)科學(xué)家阿德里亞諾·切卡雷利(Adriano Ceccarelli)在PLoS ONE上發(fā)表了有粘菌基因調(diào)控的論文。他要求繼續(xù)進行研究的項目申請被拒絕,論文也沒有得到引用?!把芯坑袝r候就是這樣,辛苦了很久最后卻進入了死胡同?!彼f,“在資助者看來,我的想法是沒有價值的?,F(xiàn)在我只能教書,等著退休的那一天。假如我得到了資助,我明天就開始研究工作。”
他們發(fā)表在PLoS ONE上的論文沒有被引用過,但是有超過1 500次的閱讀量,下載量也接近500次,文章的共同作者,如今杜克國際健康研究所的喬·埃格爾(Joe Egger)注意到,“這篇文章的目標是改善公共衛(wèi)生實踐,而不是真正推動科學(xué)領(lǐng)域的發(fā)展?!?/p>
還有其他一些文章,可能會因為終結(jié)了進一步研究的可能性而沒有引用率,英國卡迪夫大學(xué)的化學(xué)家尼克拉斯·布爾馬(Niklaas Buurma)說。2003年,布爾馬和他的同事發(fā)表了一篇關(guān)于“等容性爭議”的論文:關(guān)于在反應(yīng)過程中阻止溶劑收縮或膨脹是否有用的爭論,通常發(fā)生在溫度變化時。從理論上講,這個技術(shù)上具有挑戰(zhàn)性的實驗可能會有助于了解溶劑如何影響化學(xué)反應(yīng)速率。但布爾馬的測試顯示,化學(xué)家不會從這種類型的實驗中學(xué)到新的信息。他說:“我們就是要證明有些事情是不值得去做的。對于這篇完全無引用的論文,我感到非常自豪?!?/p>
奧利弗·史密斯在林道會議上發(fā)言時說,盡管他自己那篇1953年的論文沒有被引用,但是他認為那篇論文還是有價值的。他告訴聽眾,為論文所做的工作幫助他獲得博士學(xué)位,成為一名完全成熟的科學(xué)家。實質(zhì)上,它是未來諾貝爾獎獲得者所受到的科學(xué)訓(xùn)練的代表。 “我享受當時的過程,”他說,“我學(xué)會了如何做好科學(xué)研究?!痹谑访芩沟哪夸浝锎_實至少有一篇真正沒有引用率的論文:1976年的一篇文章表明一種特定的免疫系統(tǒng)基因位于人類第15號染色體上。但即使這樣也是重要的。美國馬薩諸塞州波士頓哈佛醫(yī)學(xué)院遺傳學(xué)家拉朱·庫切拉帕蒂(Raju Kucherlapati)是這篇論文的共同作者,他說,這篇文章是與史密斯實驗室長期合作的開始,在小鼠遺傳學(xué)方面的工作最終為史密斯贏得2007年諾貝爾生理學(xué)或醫(yī)學(xué)獎。 “對我來說,”庫切拉帕蒂說,“那篇論文的意義是讓我認識了奧利弗。”