何子偉,張 琦,徐延浩,張文英
(1.主要糧食作物產(chǎn)業(yè)化湖北省協(xié)同創(chuàng)新中心/長江大學(xué)農(nóng)學(xué)院,湖北荊州 434025;2.長江大學(xué)圖書館,湖北荊州 434025)
小麥是主要糧食作物,其大多數(shù)重要農(nóng)藝性狀和經(jīng)濟學(xué)性狀屬于數(shù)量遺傳性狀,受多基因控制且易受環(huán)境影響。解析這些性狀基因座(quantitative trait locus,QTL)的數(shù)目、位置及其遺傳效應(yīng),開發(fā)與目標基因緊密連鎖的分子標記,可為闡釋遺傳基礎(chǔ)[1-4]、挖掘優(yōu)異基因[5-8]及分子標記輔助選擇[9-10]奠定堅實基礎(chǔ)。
文獻計量學(xué)是一種統(tǒng)計分析文獻的方法,能夠從多維度客觀定量地梳理學(xué)科研究的整體布局、學(xué)科優(yōu)勢、研究中心、優(yōu)勢團隊,挖掘研究熱點[11-13],已被廣泛應(yīng)用于作物科學(xué)研究領(lǐng)域。其中,有代表性的報道包括超級稻研究發(fā)展態(tài)勢的定量分析[14-15]、作物分子標記輔助育種的國際發(fā)展態(tài)勢分析[16]、中國科研機構(gòu)在作物科學(xué)研究領(lǐng)域的競爭力分析[17]、轉(zhuǎn)Bt基因抗蟲水稻研究的發(fā)展動態(tài)分析[18]、小麥總體研究態(tài)勢的計量分析[19]、分子標記在植物研究應(yīng)用的趨勢分析[20]等。近年來,越來越多的小麥相關(guān)性狀QTLs被定位,尚未見有關(guān)此方面研究的計量文獻報道。
本文利用Web of Science核心合集數(shù)據(jù)庫,對2008-2017年發(fā)表的小麥QTL定位的文獻進行計量統(tǒng)計,從刊文數(shù)量、期刊分布、發(fā)文國家、研究機構(gòu)、論文影響力和研究方法等方面分析小麥QTL定位研究的現(xiàn)狀和發(fā)展趨勢,有助于了解全球小麥研究的發(fā)展狀況,明確未來研究方向,以期為我國該領(lǐng)域進一步發(fā)展提供科學(xué)參考。
數(shù)據(jù)來源為Web of Science核心合集數(shù)據(jù)庫,檢索期限為2008-2017年。
在Web of Science核心合集數(shù)據(jù)庫中,采用高級檢索模式,以“TS=(wheat and QTL mapping)”作為檢索詞,限定語言為“English”,論文類型為“Article”,時間跨度為“2008-2017”。對檢索結(jié)果利用Web of Science自帶的引文報告分析和文獻計量在線分析網(wǎng)站(http://bibliometric.com/results.html)對數(shù)據(jù)進行處理,采用Microsoft Excel 2013、Cite Space、VOSviewer和Sigma Plot 12.5等軟件制作圖表。
在Web of Science核心合集數(shù)據(jù)庫中,共檢索到2008年至2017年10年間收錄的小麥QTL定位論文1 292篇。統(tǒng)計分析可知,全球每年刊發(fā)小麥QTL定位的文獻數(shù)量和被引用頻次整體上呈上升趨勢(圖1)。自2011年開始,全球年刊發(fā)小麥QTL定位的論文數(shù)量保持在100篇以上,總引用頻次在1 000次以上,且對小麥QTL 定位研究的熱度和關(guān)注度在近四年呈穩(wěn)步上升態(tài)勢。
圖1 2008-2017年小麥QTL 定位文獻刊文數(shù)量及引用頻次年度走勢
2008-2017年全球刊發(fā)小麥QTL定位論文數(shù)量排名前10位國家、機構(gòu)、出版物和研究方向列于表1。按照國家排序,中國發(fā)文數(shù)量最多,為390篇,占總數(shù)的30.19%;美國居第二,為358篇,占總數(shù)的27.71%。按照機構(gòu)分類,美國農(nóng)業(yè)部農(nóng)業(yè)研究局發(fā)文最多,為108篇,占所有記錄的8.13%;排名第二位是中國農(nóng)業(yè)科學(xué)院,為102篇,占7.90%??钠诳幸浴禩heoretical and Applied Genetics》、《Euphytica》和《Molecular Breeding》三種期刊發(fā)文數(shù)量最多,分別占記錄總數(shù)的18.36%、10.80%和9.57%。小麥QTL定位研究的學(xué)科領(lǐng)域主要集中在Plant sciences、Agriculture和Genetics heredity,分別占記錄總數(shù)的63.31%、57.82%和42.80%。
表1 2008-2017年全球刊發(fā)小麥QTL定位論文數(shù)量前十的國家、機構(gòu)、出版物和學(xué)科領(lǐng)域Table 1 Top ten countries, institutions, publications and research directions with the most publications on the QTL mapping in wheat from 2008 to 2017
在2008-2017年,從小麥QTL 定位研究被引用頻次最多的10篇文獻(表2)看,被引用頻次最高的一篇論文出自日本,其引用頻次為409次。在這10篇論文中,來自中國的有3篇,但中國引用頻次最高的一篇論文僅排名在第5位,為104次。由此可以看出,中國在小麥QTL定位研究領(lǐng)域具有很大的提升空間,與世界上其他國家的頂尖科研水準相比還存在較大差距。
2008-2017年刊發(fā)小麥QTL定位論文位居前十的期刊均來自歐美發(fā)達國家(表3)。這些國家近現(xiàn)代以來科技起步較早,在科學(xué)研究上一直處于國際前沿,是全球分子生物學(xué)、基因組研究的發(fā)源地,底蘊深厚。這些上榜期刊在學(xué)術(shù)界享譽度較高,辦刊水平較高。
通過利用文獻計量在線分析網(wǎng)站(http://bibliometric.com/results.html)對Web of Science檢索結(jié)果的分析,發(fā)現(xiàn)在被引用論文較多的前十位作者中,有四位來自中國,其中三位作者發(fā)表論文總被引用次數(shù)名列前茅,來自中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所的陳新民研究員以論文總被引頻次271次居第一位(表4),說明中國在小麥QTL研究領(lǐng)域的研究成果已得到同行關(guān)注和認同。但與此同時,也可以看到中國作者論文的平均被引用頻次普遍較低,結(jié)合表2中中國論文單篇引用頻次低的結(jié)果表明,中國仍然缺乏高影響力研究成果。另外,中國學(xué)者以通訊作者發(fā)表論文的被引頻次明顯低于美國的學(xué)者,說明中國在小麥數(shù)量性狀基因定位領(lǐng)域的競爭力有待進一步提升。
統(tǒng)計結(jié)果(圖2)表明,RIL(recombinant inbred lines)和DH(doubled haploid)這兩種作圖群體在近些年采用最多。在被使用的所有QTL定位統(tǒng)計分析軟件中,MapChart、WinQTLCart、JoinMap、MapMaker、MapQTL的使用較與其他軟件頻繁,MapChart和JoinMap的使用次數(shù)呈逐年遞增趨勢。SIM(single-index model)、MQM(multiple-QTL model)、IM(interval mapping)、CIM(composite interval mapping)、ICIM(inclusive composite interval mapping)和MIM(multiple interval mapping)是常用統(tǒng)計分析模型,其中MQM、CIM以及ICIM使用次數(shù)呈逐年遞增趨勢。在分子標記方面,STS(sequence tagged sites)、SSCP(single-strand conformation polymorphism)、RFLP(restriction fragment length polymorphism)、SNP(single nucleotide polymorphism)是近三年使用頻率最高的分子標記類型。
表2 2008-2017年被引頻次前十的文獻Table 2 Top ten cited papers from 2008 to 2017
表3 SCIE數(shù)據(jù)庫中刊發(fā)小麥QTL定位論文期刊(前十)Table 3 Periodicals of the QTL mapping in wheat since 2008 to 2017(top 10)
表4 2008-2017全球刊發(fā)小麥QTL定位論文作者引用情況(前十)Table 4 Authors in the literature of the QTL mapping in wheat since 2008 to 2017(top 10)
圖2 小麥QTL定位研究作圖群體、分析軟件、統(tǒng)計模型及分子標記統(tǒng)計
根據(jù)VOSviewer分析圖(圖3),resistance、yield、height、length、field等詞匯處于聯(lián)系中心的位置,在熱點分布圖中這幾個詞顏色最深,表明抗性、產(chǎn)量和形態(tài)相關(guān)性狀是小麥QTL定位研究熱點,這些性狀與小麥的生產(chǎn)實踐息息相關(guān)。
從利用CiteSpace軟件以出版年為標準分類制作的引用關(guān)系圖(圖4)可以看出,從2008到2017年(色彩由藍至紅)論文之間的引用越來越密切,表明研究者越來越關(guān)注同行的研究成果。
圖3 小麥QTL定位研究熱點分布圖
圖4 論文引用關(guān)系圖
在利用文獻計量在線分析網(wǎng)站(http://bibliometric.com/results.html)制作的國家間合作關(guān)系圖(圖5)中,存在合作關(guān)系的兩個國家間以彩色線條連接,一個國家的彩色陰影面積越大說明與其合作存在和關(guān)系的國家數(shù)目越多。目前,在小麥QTL定位研究領(lǐng)域全世界的國家/地區(qū)間的合作關(guān)系十分緊密,其中以美國、中國、加拿大、澳大利亞、印度和德國與其他國家聯(lián)系最為密切,這幾個國家近年的刊文數(shù)量均居于全球前列,這也與這些國家的刊文數(shù)量較多相一致。
根據(jù)CiteSpace軟件分析(圖6)的結(jié)果,全球2008-2017年間刊發(fā)的小麥QTL定位論文都存在學(xué)科交融,即針對同一問題利用不同學(xué)科的知識與技術(shù)手段共同研究。結(jié)合表2可知,在小麥QTL定位研究領(lǐng)域,分子生物學(xué)、植物生理學(xué)、生物化學(xué)、遺傳學(xué)、栽培學(xué)、育種學(xué)等聯(lián)系十分密切。另外,由于QTL定位需要使用到數(shù)量遺傳模型,因此數(shù)學(xué)與計算機編程也是常用知識之一。
圖5 國家間合作關(guān)系圖
從2005年開始國際小麥基因組測序聯(lián)盟(international wheat genome sequencing consortium, IWGSC)啟動小麥基因組測序計劃,到2017年底美國約翰霍普金斯大學(xué)Steven L Salzberg課題組二代(Illunina)和三代測序(PacBio)技術(shù)的應(yīng)用[21],麥類基因組測序發(fā)展十分迅速。受此影響,2008-2017年全世界小麥QTL定位研究的論文成果在整體數(shù)量上呈現(xiàn)逐年增長趨勢,雖然2013年的論文數(shù)量比2012年有所減少,但2013年后增長趨勢更加迅猛。2008年以來,中國實施海外高層次人才引進計劃、青年千人計劃和國家高層次人才特殊支持計劃等優(yōu)秀人才吸引計劃,各科研院校,工作單位也大量吸收優(yōu)秀海外留學(xué)人員,提高了行業(yè)的整體技術(shù)水平。2009年至2017年,中國發(fā)表的小麥QTL定位論文數(shù)量不斷增加,在2014年論文數(shù)量首次超越美國成為全球第一,2008-2017年小麥QTL定位研究領(lǐng)域影響力前十名的研究機構(gòu)和作者中,來自中國的科研單位、作者占據(jù)了記錄總數(shù)的30%左右,在數(shù)量上與美國并駕齊驅(qū)。然而,中國的發(fā)表論文的數(shù)量但存在“大文章少,小文章多”的現(xiàn)象,論文總體學(xué)術(shù)影響力與世界頂尖水平相比仍存在較大差距[22]。
圖6 小麥QTL定位領(lǐng)域?qū)W科交叉關(guān)系圖
本研究針對文獻中涉及的作圖群體、軟件、分子標記和統(tǒng)計分析模型種類進行了分析,結(jié)果顯示,近年來用于研究的分子標記種類越來越多,如SSR、STS、SNP等。同時,由于QTL定位研究是一種遺傳概率的統(tǒng)計分析,不同的遺傳模型、不同的算法公式往往適用于不同的研究對象,不適當?shù)乃惴?、模型會?dǎo)致遺傳概率計算錯誤或者假陽性現(xiàn)象,所以科研人員在利用特定統(tǒng)計分析模型時會傾向性采用某些軟件進行數(shù)據(jù)分析,利于精確計算和降低假陽性,例MQM模型與MapChart、WinQTLCart、JoinMap、JMP、MapMaker、MapQTL這幾種軟件的配套使用,這與蘇成付等[23]研究結(jié)果基本一致。
從圖3可以看出,目前小麥QTL定位的研究熱點依然與小麥生產(chǎn)實踐緊密聯(lián)系,側(cè)重于產(chǎn)量、逆境、生產(chǎn)環(huán)境、基因定位等方面。這與近年來分子標記輔助育種[16]、水稻熱點研究指標[24]、棉花高頻引用論文[25]的研究趨勢相符合。與此同時,近年來中國在水稻[14-15]、果樹[26]、蛋白[27]、昆蟲[28]等領(lǐng)域刊發(fā)的論文均出現(xiàn)數(shù)量占優(yōu)、質(zhì)量不高的現(xiàn)象,缺乏高影響力、高質(zhì)量的論文。這與目前國內(nèi)的科研評價體系及科研人員對科研成果數(shù)量的片面追求有關(guān)?!按笪恼隆背诵枰茖W(xué)研究的長期積淀與積累外,還需要合作。已發(fā)表的“大文章”絕大多數(shù)由多名成員、多家研究機構(gòu)合作完成,跨領(lǐng)域、跨國別組建科研團隊聯(lián)合攻關(guān)是大勢所趨[29]。因此,我國在小麥QTL定位領(lǐng)域需要進一步加大與其他國家的交流與合作,我國各學(xué)科之間也需要加強交叉與交流。