劉春麗 盛南洪
(1.中國(guó)醫(yī)科大學(xué)圖書館,沈陽(yáng),110122; 2.中國(guó)醫(yī)科大學(xué)健康管理學(xué)院,沈陽(yáng),110122)
科學(xué)論文經(jīng)常需要耗費(fèi)數(shù)月,甚至數(shù)年時(shí)間,經(jīng)過(guò)嚴(yán)格的同行評(píng)議和編輯,才能最終在學(xué)術(shù)期刊上發(fā)表,進(jìn)而得以在學(xué)術(shù)共同體內(nèi)傳播。預(yù)印本服務(wù)器是作者先于同行評(píng)審之前,將研究結(jié)果以預(yù)印本論文的形式通過(guò)相應(yīng)服務(wù)器發(fā)布的學(xué)術(shù)交流媒介。近年來(lái),生命科學(xué)領(lǐng)域推出了bioRxiv、medRxiv、ChemRxiv等多個(gè)預(yù)印本服務(wù)器,吸引了該領(lǐng)域內(nèi)科學(xué)家對(duì)預(yù)印本論文的大量使用。
2020年新冠疫情爆發(fā)后,COVID-19預(yù)印本論文的激增,引發(fā)了全球關(guān)于預(yù)印本對(duì)信息傳播的影響[1]、控制預(yù)印本論文質(zhì)量[2]、提高預(yù)印本論文發(fā)布標(biāo)準(zhǔn)[3-5]的爭(zhēng)論與反思。在疫情剛剛爆發(fā)不久的2019年年末至2021年年初,科研人員、臨床專家及政策制定者亟需COVID-19的最新研究成果和病例報(bào)道,雖然生物醫(yī)學(xué)領(lǐng)域的幾大頂刊如《Lancet》《New England Journal of Medicine》等[6]為COVID-19研究加快審稿速度和出版周期,但仍然無(wú)法滿足學(xué)者們大量、迫切的學(xué)術(shù)交流需求,預(yù)印本服務(wù)器成為早期研究者發(fā)布科研論文草稿的首選。雖然批評(píng)人士批評(píng)預(yù)印本論文缺乏嚴(yán)格同行評(píng)議,但毫無(wú)疑問(wèn),預(yù)印本論文加速了科技傳播與交流,在學(xué)術(shù)交流系統(tǒng)中與傳統(tǒng)期刊論文互為補(bǔ)充,扮演了重要角色[7-8]。
目前,大多數(shù)基礎(chǔ)科學(xué)期刊,包括《Science》雜志[9]表示,他們接收預(yù)印本論文,甚至許多期刊直接通過(guò)bioRxiv界面接受投稿。期刊《Lancet》也認(rèn)為,預(yù)印本平臺(tái)的使用不會(huì)影響之后在同行評(píng)議期刊上的發(fā)表?!禠ancet》雜志推出了自己的預(yù)印本專區(qū)[10],可以有更多機(jī)會(huì)聽(tīng)取其他學(xué)者意見(jiàn),不斷完善稿件;有的開(kāi)放存取期刊直接讓作者在預(yù)印本平臺(tái)提交論文,再根據(jù)arXiv編號(hào)獲取論文進(jìn)行同行評(píng)審,即先公開(kāi)、再評(píng)議;也有期刊允許作者將論文提交到預(yù)印本數(shù)據(jù)庫(kù),編輯部根據(jù)社區(qū)評(píng)議結(jié)果決定是否采用[11-13]。那么,論文在期刊上正式發(fā)表前作者將其于預(yù)印本平臺(tái)提前公開(kāi)分享,是否對(duì)論文今后學(xué)術(shù)影響力或社會(huì)影響力有一定促進(jìn)作用值得探討。
在預(yù)印本上提交或分享論文是否會(huì)帶來(lái)更高或更廣的影響力,國(guó)內(nèi)外已有學(xué)者效仿“開(kāi)放獲取引用優(yōu)勢(shì)”進(jìn)行了“預(yù)印本引文優(yōu)勢(shì)”和“預(yù)印本社會(huì)關(guān)注度優(yōu)勢(shì)”的探索性研究。
早期大部分研究集中在以arXiv預(yù)印本為樣本,主要研究預(yù)印本論文的引文優(yōu)勢(shì)及影響因素。如有實(shí)證研究發(fā)現(xiàn),arXiv預(yù)印本論文相比同期刊的非預(yù)印本論文獲得了更多引文[14-19]。導(dǎo)致預(yù)印本論文引文優(yōu)勢(shì)的影響因素[14,20]主要包括預(yù)印本因?yàn)橛懈鼜V的可獲得性,增加了讀者人數(shù),進(jìn)而引發(fā)“開(kāi)放存取效應(yīng)”;由于論文可以被早期獲得而累積了更多引文,即“早期訪問(wèn)效應(yīng)”;作者偏好將高質(zhì)量論文存儲(chǔ)到預(yù)印本數(shù)據(jù)庫(kù)中,即“自我選擇效應(yīng)”。
Moed[15]分析1992—2005年期間24種凝聚態(tài)物理領(lǐng)域的arXiv預(yù)印本論文發(fā)現(xiàn),arXiv預(yù)印本論文相對(duì)于同期刊發(fā)表的非預(yù)印本論文具有引文優(yōu)勢(shì),但在控制早期瀏覽效應(yīng)和杰出作者導(dǎo)致的質(zhì)量偏倚效應(yīng)下,可消除大部分的引文優(yōu)勢(shì)。但也有研究跟蹤arXiv論文引文率的縱向改變發(fā)現(xiàn),當(dāng)論文出版五年后,早期獲取效應(yīng)較少能支持引文優(yōu)勢(shì)[16,21]。有作者認(rèn)為引文優(yōu)勢(shì)源自質(zhì)量效應(yīng),由用戶自我選擇他們的高質(zhì)量論文存儲(chǔ)到預(yù)印本數(shù)據(jù)庫(kù),進(jìn)而驅(qū)動(dòng)的質(zhì)量偏倚[14,20],或者高質(zhì)量論文更可能被選擇可獲取、進(jìn)一步促進(jìn)被引用[22]。
近兩年來(lái)有學(xué)者開(kāi)始嘗試基于bioRxiv預(yù)印本為樣本的研究,除引文優(yōu)勢(shì)外,也證實(shí)存在Altmetrics社會(huì)關(guān)注度優(yōu)勢(shì)。如Serghiou等[23]抽取bioRxiv中2013—2017年的30%的預(yù)印本論文作為樣本(776篇),選同一時(shí)期出版的同一本期刊的最多5篇非預(yù)印本論文作為配對(duì)樣本(3647篇),采用Friedman檢驗(yàn)發(fā)現(xiàn),預(yù)印本論文的Crossref引文及Altmetrics分?jǐn)?shù)均顯著高于非預(yù)印本論文。Fraser等[24]對(duì)2013—2017年出版的7087篇bioRxiv預(yù)印本論文,選取同一種期刊,在同時(shí)期出版的7087篇非預(yù)印本論文作為對(duì)照組(實(shí)驗(yàn)組和對(duì)照組均滿足文獻(xiàn)類型是article或review,參考文獻(xiàn)數(shù)大于0),負(fù)二項(xiàng)回歸分析表明,在控制影響因子、開(kāi)放存取類型、作者數(shù)、文獻(xiàn)類型(是否是綜述)因素情況下,預(yù)印本論文與非預(yù)印本論文相比有顯著的Scopus引文優(yōu)勢(shì)和推文提及、博客提及、Mendeley保存優(yōu)勢(shì)。
關(guān)于臨床影響力的評(píng)價(jià)或預(yù)測(cè),比較有代表性的是Grant等[25]考察出版物與臨床實(shí)踐指南的引文鏈接,并假設(shè)被臨床實(shí)踐指南引用的出版物對(duì)健康領(lǐng)域產(chǎn)生影響力。也有學(xué)者利用醫(yī)學(xué)主題詞來(lái)測(cè)量基礎(chǔ)研究與應(yīng)用研究之間的科學(xué)轉(zhuǎn)化交互活動(dòng),進(jìn)而反映基礎(chǔ)研究的臨床轉(zhuǎn)化程度。如Weber[26]將PubMed論文投射到一個(gè)被稱為“生物醫(yī)學(xué)三角”的圖上,將論文集從“動(dòng)物”或“分子/細(xì)胞”類型向“人類”類型的移動(dòng)定義為“臨床轉(zhuǎn)化(translation)”;Hutchins等[27]通過(guò)機(jī)器學(xué)習(xí)方法提取包含上述三類主題詞及化學(xué)/藥物、疾病和治療/診斷方法的論文比率、論文每年被引率等多種指標(biāo),預(yù)測(cè)未來(lái)被臨床試驗(yàn)或臨床實(shí)踐指南引用的概率,即臨床轉(zhuǎn)化潛力(Approximate Potential to Translate,APT)。由于APT指標(biāo)開(kāi)發(fā)時(shí)間較短,目前還較少被應(yīng)用于生物醫(yī)學(xué)論文臨床影響力評(píng)價(jià)相關(guān)研究。相比較而言,Hutchins開(kāi)發(fā)的APT指標(biāo)無(wú)論在計(jì)算方法、效度及開(kāi)放共享上都具有較強(qiáng)的先進(jìn)性。
關(guān)于預(yù)印本影響力優(yōu)勢(shì)的定量測(cè)度,基本上圍繞以被引次數(shù)為代表的學(xué)術(shù)影響力、以Altmetrics分?jǐn)?shù)為代表的社會(huì)關(guān)注度兩個(gè)維度。其中,研究預(yù)印本引文優(yōu)勢(shì)的稍多,而研究預(yù)印本社會(huì)關(guān)注度優(yōu)勢(shì)的較少。Serghiou等[23]和Fraser等[24]發(fā)表的有關(guān)bioRxiv存檔的期刊論文影響力優(yōu)勢(shì)研究中分別使用了Friedman非參數(shù)檢驗(yàn)和負(fù)二項(xiàng)回歸方法。我們認(rèn)為前人的研究還存在以下問(wèn)題:
一是現(xiàn)有研究缺乏更多維度的預(yù)印本影響力優(yōu)勢(shì)檢驗(yàn)。英國(guó)卓越研究框架[28-30](the Research Excellence Framework,REF)指出,科研評(píng)價(jià)不僅要考察以知識(shí)促進(jìn)為主的科學(xué)影響力,也應(yīng)評(píng)價(jià)科研產(chǎn)生的社會(huì)影響力,即科研對(duì)經(jīng)濟(jì)、社會(huì)、文化、公共政策或服務(wù)、健康、環(huán)境或生命質(zhì)量的作用、改變或收益。而Altmetrics測(cè)量的更多是公眾對(duì)學(xué)術(shù)研究的“討論”或“關(guān)注”程度,并不是真正意義上的社會(huì)影響力[31-32]。對(duì)生物醫(yī)學(xué)領(lǐng)域研究而言,除了建立學(xué)術(shù)知識(shí)基礎(chǔ)外,是否在衛(wèi)生健康領(lǐng)域產(chǎn)生收益,或者說(shuō)是否將基礎(chǔ)醫(yī)學(xué)研究轉(zhuǎn)化到臨床應(yīng)用則是科研成果對(duì)該領(lǐng)域產(chǎn)生社會(huì)影響力的重要評(píng)價(jià)內(nèi)容。但到目前為止,國(guó)內(nèi)外未見(jiàn)研究預(yù)印本論文臨床轉(zhuǎn)化潛力優(yōu)勢(shì)的文獻(xiàn)報(bào)道。
二是生物科學(xué)不同子領(lǐng)域可能對(duì)預(yù)印本影響力優(yōu)勢(shì)檢驗(yàn)存在影響,在以往研究中未被重視。是否不同子領(lǐng)域的預(yù)印本存檔后發(fā)表的期刊論文影響力優(yōu)勢(shì)表現(xiàn)不同,或者不同子領(lǐng)域的預(yù)印本存檔后發(fā)表的期刊論文影響力優(yōu)勢(shì)更側(cè)重在某個(gè)影響力維度,都是值得研究的問(wèn)題。
三是關(guān)于預(yù)印本論文影響力優(yōu)勢(shì)的檢驗(yàn)方法多使用線性回歸模型(一般線性模型或廣義線性模型)[23-24],而論文被引次數(shù),特別是社會(huì)關(guān)注度(Altmetric Attention Score,AAS)和臨床轉(zhuǎn)化潛力指標(biāo)屬于非正態(tài)分布,不適合做線性回歸分析;更重要的是線性回歸無(wú)法揭示預(yù)印本存檔對(duì)被引次數(shù)、社會(huì)關(guān)注度的影響趨勢(shì)的變化過(guò)程,但分位數(shù)回歸則可以很好地解決這個(gè)問(wèn)題。到目前為止,未見(jiàn)應(yīng)用此方法研究預(yù)印本期刊論文影響力優(yōu)勢(shì)的中外文文獻(xiàn)。
鑒于此,本文以bioRxiv預(yù)印本平臺(tái)為例,選取神經(jīng)科學(xué)、生物信息學(xué)、遺傳學(xué)三個(gè)子領(lǐng)域,通過(guò)分位數(shù)回歸方法驗(yàn)證bioRxiv預(yù)印本平臺(tái)存檔的期刊論文是否具有引文、社會(huì)關(guān)注度及臨床轉(zhuǎn)化潛力多維度影響力優(yōu)勢(shì),為生物醫(yī)學(xué)專家及學(xué)者積極選擇預(yù)印本進(jìn)行知識(shí)分享行為的潛在收益提供實(shí)證依據(jù)。
bioRxiv是生命科學(xué)領(lǐng)域預(yù)印本的免費(fèi)在線存檔和發(fā)布服務(wù)平臺(tái),又細(xì)分為25個(gè)子類別,我們以生物信息學(xué)、神經(jīng)科學(xué)和遺傳學(xué)三個(gè)子學(xué)科領(lǐng)域?yàn)槔M(jìn)行實(shí)證研究,借鑒陳悅等[19]的樣本選取方法,依據(jù)預(yù)印本論文量選取每個(gè)子學(xué)科領(lǐng)域五種期刊論文為實(shí)驗(yàn)組論文研究對(duì)象。
為了檢驗(yàn)同一本期刊中,曾在bioRxiv自存檔的期刊論文與未曾在bioRxiv自存檔的期刊論文相比較是否有多維度影響力優(yōu)勢(shì),我們借鑒了Serghiou等[23]的配對(duì)方法,為每篇bioRxiv自存檔的期刊論文(實(shí)驗(yàn)組論文),選取同一期刊、發(fā)表日期或發(fā)表月份或發(fā)表卷、期相同的論文作對(duì)照(對(duì)照組論文)。相匹配的實(shí)驗(yàn)組和對(duì)照組論文的期刊分布情況見(jiàn)表1。
表1 三個(gè)子學(xué)科領(lǐng)域代表性期刊及實(shí)驗(yàn)組論文與對(duì)照組論文數(shù)(篇)
利用bioRxiv提供的API(https://api.biorxiv.org/),獲取三個(gè)子學(xué)科領(lǐng)域2014—2018年間已在期刊出版的預(yù)印本論文目錄,根據(jù)“published_doi”字段,在WOS核心合集數(shù)據(jù)庫(kù)中檢索bioRxiv自存檔的論文所發(fā)表期刊名稱、出版時(shí)間(出版年、卷、期)、作者所屬國(guó)家、隸屬機(jī)構(gòu)、論文被引次數(shù)等全記錄信息。對(duì)照組論文按照同一種期刊、相同發(fā)表年、月的匹配方法在WOS核心合集數(shù)據(jù)庫(kù)中獲取數(shù)據(jù)。除在WOS核心合集中檢索兩組論文的被引次數(shù)外,在Altmetric.com平臺(tái)獲取AAS指標(biāo);在iCite平臺(tái)獲取臨床轉(zhuǎn)化潛力APT指標(biāo);用DOI來(lái)獲取Altmetric指標(biāo)信息,于是刪掉了無(wú)DOI的論文;此外,僅保留實(shí)驗(yàn)組和對(duì)照組中文獻(xiàn)類型是article或review的論文;通過(guò)參照預(yù)印本存檔時(shí)間和論文發(fā)表時(shí)間,刪除極少量的后印本論文。相關(guān)數(shù)據(jù)的檢索日期為2021年4月15日。
在回歸分析中,實(shí)驗(yàn)組和對(duì)照組論文合為一個(gè)樣本,通過(guò)對(duì)“bioRxiv”變量標(biāo)注“是”與“否”來(lái)區(qū)分。參考相關(guān)文獻(xiàn)[33-41],篩選了10個(gè)論文內(nèi)、外部特征作為控制變量(如表2所示),檢驗(yàn)在控制論文內(nèi)、外部特征情況下,期刊論文曾在bioRxiv預(yù)印本平臺(tái)存檔是否對(duì)論文被引次數(shù)、社會(huì)關(guān)注度和臨床轉(zhuǎn)化潛力產(chǎn)生的影響。
表2 控制變量名稱及數(shù)據(jù)來(lái)源
首先,借鑒Moed[15]和Fraser等[24]的計(jì)算公式,分別計(jì)算在bioRxiv自存檔的三個(gè)子領(lǐng)域期刊論文的引文優(yōu)勢(shì)、社會(huì)關(guān)注度優(yōu)勢(shì)及臨床轉(zhuǎn)化潛力優(yōu)勢(shì)。
其次,在控制論文內(nèi)、外部特征等影響因素情況下,應(yīng)用分位數(shù)回歸方法驗(yàn)證bioRxiv預(yù)印本存檔對(duì)論文多維度影響力的影響。傳統(tǒng)的線性回歸分析主要關(guān)注均值,但當(dāng)樣本數(shù)據(jù)中存在較多異常值,線性回歸模型的估計(jì)值可能會(huì)存在較大偏差。由于本研究涉及的因變量均為非正態(tài)分布,用中位數(shù)描述更為合理。因此,本研究選擇分位數(shù)回歸來(lái)檢驗(yàn)因變量在不同百分位數(shù)下受自變量的影響,可描述因變量的全局特征,通常不受離群點(diǎn)的影響,結(jié)果更為穩(wěn)健。
4.1.1 引文優(yōu)勢(shì)
借鑒荷蘭萊頓大學(xué)Moed[15]基于arXiv存檔預(yù)印本的期刊論文篇均引文影響力計(jì)算引文優(yōu)勢(shì)的方法,引文優(yōu)勢(shì)(Citation Impact Differential,CID)的計(jì)算公式為:CID=100*(CPPb-CPPnb)/((CPPb+CPPnb)/2)。其中,CPPb代表bioRxiv自存檔的期刊論文的篇均被引量,CPPnb代表非bioRxiv自存檔的期刊論文的篇均被引量,其數(shù)值范圍是-200(CPPb=0)到200(CPPnb=0)。如果CPPb和CPPnb的值都為0,則此時(shí)CID的值定義為0。計(jì)算結(jié)果見(jiàn)表3。
表3 三個(gè)子學(xué)科領(lǐng)域代表性期刊逐年引文優(yōu)勢(shì)分布
4.1.2 社會(huì)關(guān)注度優(yōu)勢(shì)
借鑒Fraser等[25]提出的預(yù)印本平臺(tái)自存檔的期刊論文的社會(huì)關(guān)注度優(yōu)勢(shì)計(jì)算方法,社會(huì)關(guān)注度優(yōu)勢(shì)(Altmetrics Impact Differential,AID)計(jì)算公式為:AID=100*(APPb-APPnb)/((APPb+APPnb)/2)。其中,APPb代表bioRxiv自存檔的期刊論文的篇均AAS分?jǐn)?shù),APPnb代表非bioRxiv自存檔的期刊論文的篇均AAS分?jǐn)?shù),AID數(shù)值范圍是-200(APPb=0)到200(APPnb=0)。計(jì)算結(jié)果見(jiàn)表4。
表4 三個(gè)子學(xué)科領(lǐng)域代表性期刊逐年社會(huì)關(guān)注度優(yōu)勢(shì)分布
4.1.3 臨床轉(zhuǎn)化潛力優(yōu)勢(shì)
為了考察bioRxiv自存檔的期刊論文臨床轉(zhuǎn)化潛力優(yōu)勢(shì),本文提出論文臨床轉(zhuǎn)化潛力優(yōu)勢(shì)(APT Impact Differential,簡(jiǎn)稱PID)的概念及計(jì)算公式:PID=100*(PPPb-PPPnb)/((PPPb+PPPnb)/2)。其中,PPPb代表bioRxiv自存檔的期刊論文的篇均APT預(yù)測(cè)值,PPPnb代表非bioRxiv自存檔的期刊論文的篇均APT預(yù)測(cè)值,PID數(shù)值范圍是-200(PPPb=0)到200(PPPnb=0)。計(jì)算結(jié)果見(jiàn)表5。
表5 三個(gè)子學(xué)科領(lǐng)域代表性期刊逐年臨床轉(zhuǎn)化潛力優(yōu)勢(shì)分布
總體上,2014—2018年bioRxiv自存檔的期刊論文引文優(yōu)勢(shì)、社會(huì)關(guān)注度優(yōu)勢(shì)及臨床轉(zhuǎn)化潛力優(yōu)勢(shì)計(jì)算結(jié)果見(jiàn)表6。
表6 2014—2018年bioRxiv自存檔的期刊論文多維度影響力優(yōu)勢(shì)匯總
4.2.1 被引次數(shù)的分位數(shù)回歸
表7列出了自變量在因變量被引次數(shù)各設(shè)定分位數(shù)(q=0.1、0.25、0.5、0.75、0.9)的影響參數(shù)估計(jì)值。結(jié)果表明,在控制10個(gè)論文內(nèi)、外部特征情況下,期刊論文在bioRxiv平臺(tái)存檔對(duì)被引次數(shù)的各分位數(shù)是正向影響,且均有統(tǒng)計(jì)學(xué)意義(p<0.01)。但在不同的被引次數(shù)分位數(shù)下,期刊論文在bioRxiv平臺(tái)存檔對(duì)被引次數(shù)的影響程度不同。在被引次數(shù)較低水平(0.1分位數(shù))時(shí),bioRxiv存檔的期刊論文被引次數(shù)是未存檔的0.855倍;而在被引次數(shù)中等水平(0.5分位數(shù))時(shí),bioRxiv存檔的期刊論文被引次數(shù)是未存檔的3.101倍;到被引次數(shù)較高水平(0.9分位數(shù))時(shí),bioRxiv存檔的期刊論文被引次數(shù)是未存檔的9.169倍??傊?,隨著論文被引次數(shù)的增加,bioRxiv存檔對(duì)被引次數(shù)的正向影響逐漸加大,當(dāng)論文被引次數(shù)處于相對(duì)高水平時(shí),bioRxiv存檔對(duì)論文被引的影響是論文被引次數(shù)相對(duì)較低水平的影響參數(shù)的近8.1倍。
表7 被引次數(shù)的不同分位數(shù)參數(shù)估計(jì)——神經(jīng)科學(xué)領(lǐng)域
4.2.2 社會(huì)關(guān)注度(AAS)的分位數(shù)回歸
表8列出了自變量在因變量AAS各設(shè)定分位數(shù)(q=0.1、0.25、0.5、0.75、0.9)的影響參數(shù)估計(jì)值。結(jié)果表明,在控制10個(gè)論文內(nèi)、外部特征情況下,期刊論文在bioRxiv平臺(tái)存檔對(duì)AAS的各分位數(shù)是正向影響,且均有統(tǒng)計(jì)學(xué)意義(p<0.01)。但在不同的AAS分位數(shù)下,期刊論文在bioRxiv平臺(tái)存檔對(duì)AAS的影響程度不同。在AAS較低水平(0.1分位數(shù))時(shí),bioRxiv存檔的期刊論文AAS是未存檔的1.250倍;而在AAS中等水平(0.5分位數(shù))時(shí),bioRxiv存檔的期刊論文AAS是未存檔的7.294倍;到AAS較高水平(0.9分位數(shù))時(shí),bioRxiv存檔的期刊論文AAS是未存檔的27.990倍??傊?,隨著論文AAS的增加,bioRxiv存檔對(duì)AAS的正向影響逐漸加大,當(dāng)論文AAS處于相對(duì)高水平時(shí),bioRxiv存檔對(duì)論文AAS的影響是論文AAS相對(duì)較低水平的影響參數(shù)的近22.4倍。
表8 社會(huì)關(guān)注度(AAS)的不同分位數(shù)參數(shù)估計(jì)——神經(jīng)科學(xué)領(lǐng)域
4.2.3 臨床轉(zhuǎn)化潛力(APT)的分位數(shù)回歸
表9列出了自變量在因變量APT各設(shè)定分位數(shù)(q=0.1、0.25、0.5、0.75、0.9)的影響參數(shù)估計(jì)值。結(jié)果表明,在控制10個(gè)論文內(nèi)、外部特征情況下,期刊論文在bioRxiv平臺(tái)存檔對(duì)APT的0.1、0.25分位數(shù)是負(fù)向影響,而對(duì)APT的0.5、0.75和0.9分位數(shù)是正向影響,且均有統(tǒng)計(jì)學(xué)意義(p<0.01)。在APT較低水平(0.1分位數(shù)和0.25分位數(shù))時(shí),bioRxiv存檔的期刊論文APT低于未存檔的期刊論文,但影響系數(shù)非常??;而在APT中等水平(0.5分位數(shù))時(shí),bioRxiv存檔的期刊論文APT是未存檔的0.181倍;在APT中等水平(0.75分位數(shù))時(shí),bioRxiv存檔的期刊論文APT是未存檔的0.304倍;到APT較高水平(0.9分位數(shù))時(shí),bioRxiv存檔的期刊論文APT是未存檔的0.156倍。可見(jiàn),只有當(dāng)期刊論文APT水平處于接近中等水平時(shí),bioRxiv存檔正向影響APT,且影響參數(shù)隨APT水平升高逐漸增加,到0.75分位數(shù)時(shí)影響參數(shù)最高(0.304),接下來(lái),bioRxiv存檔對(duì)APT的影響參數(shù)又逐漸下降。
表9 臨床轉(zhuǎn)化潛力(APT)的不同分位數(shù)參數(shù)估計(jì)——神經(jīng)科學(xué)領(lǐng)域
4.3.1 被引次數(shù)的分位數(shù)回歸
表10列出了自變量在因變量被引次數(shù)各設(shè)定分位數(shù)(q=0.1、0.25、0.5、0.75、0.9)的影響參數(shù)估計(jì)值。結(jié)果表明,在控制10個(gè)論文內(nèi)、外部特征情況下,期刊論文在bioRxiv平臺(tái)存檔對(duì)被引次數(shù)的0.5、0.75、0.9分位數(shù)是正向影響,且有統(tǒng)計(jì)學(xué)意義(p<0.01),但在0.1和0.25分位數(shù)的影響無(wú)統(tǒng)計(jì)學(xué)意義。在被引次數(shù)中等水平(0.5分位數(shù))時(shí),bioRxiv存檔的期刊論文被引次數(shù)是未存檔的2.411倍;在被引次數(shù)的0.75分位數(shù)時(shí),bioRxiv存檔的期刊論文被引次數(shù)是未存檔的9.549倍;到被引次數(shù)較高水平(0.9分位數(shù))時(shí),bioRxiv存檔的期刊論文被引次數(shù)是未存檔的19.864倍。可見(jiàn),從被引次數(shù)中等水平開(kāi)始,隨著論文被引次數(shù)的增加,bioRxiv存檔對(duì)被引次數(shù)的正向影響逐漸增大。
表10 被引次數(shù)的不同分位數(shù)參數(shù)估計(jì)——生物信息學(xué)領(lǐng)域
4.3.2 社會(huì)關(guān)注度(AAS)的分位數(shù)回歸
表11列出了自變量在因變量AAS各設(shè)定分位數(shù)(q=0.1、0.25、0.5、0.75、0.9)的影響參數(shù)估計(jì)值。結(jié)果表明,在控制10個(gè)論文內(nèi)、外部特征情況下,期刊論文在bioRxiv平臺(tái)存檔對(duì)AAS的各分位數(shù)是正向影響,且均有統(tǒng)計(jì)學(xué)意義(p<0.01)。但在不同的AAS分位數(shù)下,期刊論文在bioRxiv平臺(tái)存檔對(duì)AAS的影響程度不同。在AAS較低水平(0.1分位數(shù))時(shí),bioRxiv存檔的期刊論文AAS是未存檔的0.750倍;而在AAS中等水平(0.5分位數(shù))時(shí),bioRxiv存檔的期刊論文AAS是未存檔的4.582倍;到AAS較高水平(0.9分位數(shù))時(shí),bioRxiv存檔的期刊論文AAS是未存檔的12.133倍??傊S著論文AAS的增加,bioRxiv存檔對(duì)AAS的正向影響逐漸加大,當(dāng)論文AAS處于相對(duì)很高水平時(shí),bioRxiv存檔對(duì)論文AAS的影響是論文AAS相對(duì)較低水平的影響參數(shù)的近16.1倍。
表11 社會(huì)關(guān)注度(AAS)的不同分位數(shù)參數(shù)估計(jì)——生物信息學(xué)領(lǐng)域
4.3.3 臨床轉(zhuǎn)化潛力(APT)的分位數(shù)回歸
表12列出了自變量在因變量APT各設(shè)定分位數(shù)(q=0.1、0.25、0.5、0.75、0.9)的影響參數(shù)估計(jì)值。結(jié)果表明,在控制10個(gè)論文內(nèi)、外部特征情況下,期刊論文在bioRxiv平臺(tái)存檔對(duì)APT的各分位數(shù)均是正向影響,且均有統(tǒng)計(jì)學(xué)意義(p<0.01),但在0.1、0.25和0.5分位數(shù)的參數(shù)估計(jì)值非常?。辉?.75分位數(shù)和0.9分位數(shù)時(shí),bioRxiv存檔的期刊論文APT分別是未存檔的0.063倍和0.117倍。
表12 臨床轉(zhuǎn)化潛力(APT)的不同分位數(shù)參數(shù)估計(jì)——生物信息學(xué)領(lǐng)域
4.4.1 被引次數(shù)的分位數(shù)回歸
表13列出了自變量在因變量被引次數(shù)各設(shè)定分位數(shù)(q=0.1、0.25、0.5、0.75、0.9)的影響參數(shù)估計(jì)值。結(jié)果表明,在控制10個(gè)論文內(nèi)、外部特征情況下,期刊論文在bioRxiv平臺(tái)存檔對(duì)被引次數(shù)的各分位數(shù)是正向影響,且均有統(tǒng)計(jì)學(xué)意義(p<0.01)。但在不同的被引次數(shù)分位數(shù)下,期刊論文在bioRxiv平臺(tái)存檔對(duì)被引次數(shù)的影響程度不同。在被引次數(shù)較低水平(0.1分位數(shù))時(shí),bioRxiv存檔的期刊論文被引次數(shù)是未存檔的0.955倍;而在被引次數(shù)中等水平(0.5分位數(shù))時(shí),bioRxiv存檔的期刊論文被引次數(shù)是未存檔的2.437倍;到被引次數(shù)較高水平(0.9分位數(shù))時(shí),bioRxiv存檔的期刊論文被引次數(shù)是未存檔的22.759倍??傊?,隨著論文被引次數(shù)的增加,bioRxiv存檔對(duì)被引次數(shù)的正向影響逐漸加大,當(dāng)論文被引次數(shù)處于相對(duì)高水平時(shí),bioRxiv存檔對(duì)論文被引的影響是論文被引次數(shù)相對(duì)較低水平的影響參數(shù)的近23.8倍。
表13 被引次數(shù)的不同分位數(shù)參數(shù)估計(jì)——遺傳學(xué)領(lǐng)域
4.4.2 社會(huì)關(guān)注度(AAS)的分位數(shù)回歸
表14列出了自變量在因變量AAS各設(shè)定分位數(shù)(q=0.1、0.25、0.5、0.75、0.9)的影響參數(shù)估計(jì)值。結(jié)果表明,在控制10個(gè)論文內(nèi)、外部特征情況下,期刊論文在bioRxiv平臺(tái)存檔對(duì)AAS的各分位數(shù)是正向影響,且均有統(tǒng)計(jì)學(xué)意義(p<0.01)。但在不同的AAS分位數(shù)下,期刊論文在bioRxiv平臺(tái)存檔對(duì)AAS的影響程度不同。在AAS較低水平(0.1分位數(shù))時(shí),bioRxiv存檔的期刊論文AAS是未存檔的1.070倍;而在AAS中等水平(0.5分位數(shù))時(shí),bioRxiv存檔的期刊論文AAS是未存檔的4.791倍;到AAS較高水平(0.9分位數(shù))時(shí),bioRxiv存檔的期刊論文AAS是未存檔的26.437倍??傊?,隨著論文AAS的增加,bioRxiv存檔對(duì)AAS的正向影響逐漸加大,當(dāng)論文AAS處于相對(duì)高水平時(shí),bioRxiv存檔對(duì)論文AAS的影響是論文AAS相對(duì)較低水平的影響參數(shù)的近24.7倍。
表14 社會(huì)關(guān)注度(AAS)的不同分位數(shù)參數(shù)估計(jì)——遺傳學(xué)領(lǐng)域
4.4.3 臨床轉(zhuǎn)化潛力(APT)的分位數(shù)回歸
表15列出了自變量在因變量APT各設(shè)定分位數(shù)(q=0.1、0.25、0.5、0.75、0.9)的影響參數(shù)估計(jì)值。結(jié)果表明,在控制10個(gè)論文內(nèi)、外部特征情況下,期刊論文在bioRxiv平臺(tái)存檔對(duì)APT的0.25、0.75和0.9分位數(shù)均是正向影響,且均有統(tǒng)計(jì)學(xué)意義(p<0.01),但參數(shù)估計(jì)值極小。在0.75分位數(shù)和0.9分位數(shù)時(shí),bioRxiv存檔的期刊論文APT分別是未存檔的0.066倍和0.085倍。
表15 臨床轉(zhuǎn)化潛力(APT)的不同分位數(shù)參數(shù)估計(jì)——遺傳學(xué)領(lǐng)域
本研究發(fā)現(xiàn),神經(jīng)科學(xué)領(lǐng)域bioRxiv自存檔的期刊論文具有年均40.19%的引文優(yōu)勢(shì)、年均68.80%的AAS優(yōu)勢(shì)和年均21.74%的臨床轉(zhuǎn)化潛力優(yōu)勢(shì);生物信息學(xué)領(lǐng)域bioRxiv自存檔的期刊論文具有年均67.92%的引文優(yōu)勢(shì)、年均23.43%的AAS優(yōu)勢(shì)和年均5.06%的臨床轉(zhuǎn)化潛力優(yōu)勢(shì);遺傳學(xué)領(lǐng)域bioRxiv自存檔的期刊論文具有年均57.91%的引文優(yōu)勢(shì)、年均74.53%的AAS優(yōu)勢(shì)和年均15.54%的臨床轉(zhuǎn)化潛力優(yōu)勢(shì)。
上述結(jié)果中,引文優(yōu)勢(shì)在40.19-67.92%之間,均低于陳悅等[19]發(fā)現(xiàn)的圖書情報(bào)領(lǐng)域arXiv論文108.95%和機(jī)器人領(lǐng)域arXiv論文83.56%的引文優(yōu)勢(shì)。而AAS優(yōu)勢(shì)這一結(jié)果與Serghiou 等[23]的結(jié)果一致,并在一定程度上支持了Fraser等[24]報(bào)告的bioRxiv自存檔的期刊論文在tweets、Blog Feeds、Mendeley上有顯著優(yōu)勢(shì)的結(jié)論。但Fraser研究的是部分Altmetrics指標(biāo),不是AAS總分,還是有不同之處。此外,我們通過(guò)分位數(shù)回歸方法揭示了隨著論文被引次數(shù)、AAS水平的提高,bioRxiv存檔對(duì)被引次數(shù)及AAS的影響參數(shù)的變化趨勢(shì),對(duì)以往研究結(jié)果提供了更豐富的信息和更細(xì)致的補(bǔ)充。
更重要的是,本研究提出了“臨床轉(zhuǎn)化潛力優(yōu)勢(shì)”這一概念,并參考引文優(yōu)勢(shì)和AAS優(yōu)勢(shì)公式計(jì)算,通過(guò)分位數(shù)回歸檢驗(yàn)發(fā)現(xiàn),不同學(xué)科領(lǐng)域存在略微差異。對(duì)生物信息學(xué)而言,期刊論文在bioRxiv存檔對(duì)APT的各分位數(shù)均是正向影響;但對(duì)神經(jīng)科學(xué)和遺傳學(xué)而言,當(dāng)APT水平較低時(shí),影響可能是負(fù)值或無(wú)統(tǒng)計(jì)學(xué)意義,而APT到了較高水平時(shí),影響均是正值。但bioRxiv存檔對(duì)APT的參數(shù)估計(jì)值要遠(yuǎn)遠(yuǎn)小于對(duì)被引次數(shù)和AAS的參數(shù)估計(jì)值。這從臨床轉(zhuǎn)化的維度評(píng)價(jià)了bioRxiv自存檔期刊論文的影響力優(yōu)勢(shì),是一個(gè)較新的嘗試。
在回歸分析中,我們?cè)诳刂普撐膬?nèi)、外部特征的情況下檢驗(yàn)預(yù)印本存檔的影響力優(yōu)勢(shì)。Fraser等[24]曾在對(duì)預(yù)印本論文引文優(yōu)勢(shì)和推文、博客提及以及Mendeley保存等優(yōu)勢(shì)的檢驗(yàn)中,使用負(fù)二項(xiàng)回歸方法,控制了影響因子、OA、作者數(shù)、文獻(xiàn)類型、美國(guó)國(guó)籍第一作者、美國(guó)國(guó)籍通訊作者、第一作者學(xué)術(shù)年齡、通訊作者學(xué)術(shù)年齡、女性第一作者和女性通訊作者等10個(gè)影響因素。在我們的研究中,除影響因子、文獻(xiàn)類型和作者數(shù)以外,其余7個(gè)控制變量均與Fraser等的研究不同。在本研究中,作者性別、國(guó)別和語(yǔ)種對(duì)被引次數(shù)、AAS的影響[42-43]未被控制,與臨床轉(zhuǎn)化潛力密切相關(guān)的影響因素還未明確發(fā)現(xiàn),需要在后續(xù)研究中予以完善。
通過(guò)對(duì)2014—2018年間bioRxiv自存檔的期刊論文在被引次數(shù)、社會(huì)關(guān)注度和臨床轉(zhuǎn)化潛力方面的影響力優(yōu)勢(shì)進(jìn)行研究,得出如下結(jié)論:
一是bioRxiv自存檔的期刊論文在被引次數(shù)、社會(huì)關(guān)注度和臨床轉(zhuǎn)化潛力方面具有多維度的影響力優(yōu)勢(shì),其中,臨床轉(zhuǎn)化潛力優(yōu)勢(shì)稍弱。
二是在bioRxiv自存檔的不同學(xué)科子領(lǐng)域期刊論文影響力優(yōu)勢(shì)表現(xiàn)不同。三個(gè)學(xué)科間相比較而言,神經(jīng)科學(xué)子領(lǐng)域更側(cè)重于社會(huì)關(guān)注度和臨床轉(zhuǎn)化潛力優(yōu)勢(shì);生物信息學(xué)子領(lǐng)域更側(cè)重于被引次數(shù)和臨床轉(zhuǎn)化潛力優(yōu)勢(shì);而遺傳學(xué)子領(lǐng)域更側(cè)重于被引次數(shù)和社會(huì)關(guān)注度優(yōu)勢(shì)。
三是bioRxiv自存檔對(duì)不同水平的論文被引次數(shù)、社會(huì)關(guān)注度和臨床轉(zhuǎn)化潛力的影響程度不同。具體來(lái)講,在三個(gè)學(xué)科子領(lǐng)域中,隨著論文被引次數(shù)或社會(huì)關(guān)注度的增加,bioRxiv存檔對(duì)被引次數(shù)或社會(huì)關(guān)注度的正向影響逐漸增大。但對(duì)臨床轉(zhuǎn)化潛力而言,在較低水平時(shí),影響程度非常小,甚至存在負(fù)向影響的情況;而在較高水平時(shí),隨著論文臨床轉(zhuǎn)化潛力的增加,bioRxiv存檔對(duì)臨床轉(zhuǎn)化潛力的正向影響逐漸提高。
當(dāng)前,科技評(píng)價(jià)改革是國(guó)家關(guān)注的重要領(lǐng)域之一,全面準(zhǔn)確評(píng)價(jià)科技成果的科學(xué)、技術(shù)、經(jīng)濟(jì)、社會(huì)、文化價(jià)值被列為主要工作措施之首。如何評(píng)價(jià)科技成果的多元價(jià)值至今仍然是亟待突破的難題。本文在前人研究基礎(chǔ)上,選取了生物信息學(xué)、神經(jīng)科學(xué)、遺傳學(xué)領(lǐng)域的預(yù)印本論文為研究對(duì)象,正是在新冠疫情的社會(huì)背景下,嘗試探索性評(píng)價(jià)包括被引次數(shù)、社會(huì)關(guān)注度及臨床轉(zhuǎn)化潛力在內(nèi)的預(yù)印本論文多元價(jià)值優(yōu)勢(shì),具有一定的學(xué)術(shù)開(kāi)拓性和實(shí)踐應(yīng)用價(jià)值。在未來(lái)工作中,將進(jìn)一步探索對(duì)不同學(xué)科領(lǐng)域論文及其他類型科技成果的多元價(jià)值評(píng)價(jià)及影響因素分析,呼吁科技評(píng)價(jià)真正回歸多元價(jià)值導(dǎo)向,為我國(guó)科技評(píng)價(jià)體系改革提供實(shí)證依據(jù)。