戰(zhàn)斌慧 周雪平
摘要
在過去的十幾年中,測序技術(shù)的發(fā)展為分子生物學(xué)領(lǐng)域帶來了革命性的變化。第二代測序(next-generation sequencing,NGS)技術(shù)以快速、高靈敏性、高通量、非序列依賴性等特點(diǎn)極大地促進(jìn)了病毒診斷學(xué)研究領(lǐng)域的發(fā)展。NGS技術(shù)可以在不了解病毒的生物學(xué)特性、血清學(xué)特點(diǎn)及基因組信息情況下快速檢測未知病毒。通過對總核酸樣本進(jìn)行NGS可以獲得某個(gè)特定生態(tài)環(huán)境或種植系統(tǒng)中的所有病毒序列,即病毒組。通過大量的NGS數(shù)據(jù)可以分析寄主中某一病毒的基因組變化、構(gòu)建病毒的準(zhǔn)種以及研究病毒的進(jìn)化和起源。本文介紹了高通量測序的方法在植物和昆蟲病毒檢測中的應(yīng)用。
關(guān)鍵詞
第二代測序; 植物病毒; 昆蟲病毒; 檢測
中圖分類號:
S 432.1
文獻(xiàn)標(biāo)識碼: A
DOI: 10.16688/j.zwbh.2018326
Application of next-generation sequencing technology in
detection of plant and insect viruses
ZHAN Binhui, ZHOU Xueping
(State Key Laboratory for Biology of Plant Diseases and Insect Pests,Institute of Plant
Protection,Chinese Academy of Agricultural Sciences, Beijing 100193, China)
Abstract
In the past decade, the development of sequencing technology has induced revolutionary changes in molecular biology. Next-generation sequencing (NGS) has considerably promoted the development of research on viral diagnostics characterized by rapidity, high sensitivity, high throughput, sequence-independent, etc. NGS made it possible to rapidly detect unknown viruses without knowing the biological characteristics, serological characteristics, and genome information. The whole viral genomes in a particular ecosystem or cropping system, namely virome, could be sequenced through NGS of the total nucleic acids. Viral genome variability, reconstruction of quasispecies, evolution and origin within the host can be obtained by analyzing massive NGS data. In this article, we provide the overview of the process of NGS technology and its applications in detection of plant and insect viruses.
Key words
next-generation sequencing; plant virus; insect virus; detection
病毒是一種個(gè)體微小、結(jié)構(gòu)簡單,沒有細(xì)胞結(jié)構(gòu)的特殊生物,只能在活細(xì)胞內(nèi)寄生并依賴宿主細(xì)胞實(shí)現(xiàn)增殖。它們種類繁多、數(shù)目龐大,是自然界中最為豐富和多樣的生命體[1-2]。根據(jù)宿主的不同,可以將其分為植物病毒、動物病毒、真菌病毒等。其中,侵染植物及昆蟲的病毒與農(nóng)業(yè)生產(chǎn)密切相關(guān)。植物病毒素有植物癌癥之稱,其暴發(fā)和流行嚴(yán)重危害作物生長,威脅糧食生產(chǎn)。據(jù)不完全統(tǒng)計(jì),全球每年因植物病毒病造成的損失約占糧食作物總產(chǎn)量的10%[3-4]。昆蟲是農(nóng)業(yè)生態(tài)系統(tǒng)的重要組成部分,其數(shù)目眾多,占已知?jiǎng)游镂锓N的70%以上。已知的昆蟲病毒種類有1 000多種,然而,目前對昆蟲病毒的研究主要集中在對有益昆蟲病毒病進(jìn)行防控以及利用昆蟲病毒防治有害昆蟲[5]。因而,對植物及昆蟲病毒進(jìn)行快速而有效的診斷、發(fā)掘新的病毒資源對于增強(qiáng)防控措施、保護(hù)農(nóng)業(yè)生產(chǎn)安全具有重要意義。
傳統(tǒng)的病毒檢測方法主要有:生物學(xué)測定法、電子顯微鏡觀察法[6]、以酶聯(lián)免疫吸附反應(yīng)為代表的血清學(xué)檢測法[7]、基于核酸分析的PCR檢測法[8]等。生物學(xué)測定法及電子顯微鏡觀察法是最為經(jīng)典的病毒檢測技術(shù),可用于病毒的初步檢測。利用生物學(xué)測定法檢測植物病毒時(shí),主要依據(jù)病毒在指示植物上產(chǎn)生的癥狀進(jìn)行診斷,診斷存在主觀性;利用電子顯微鏡觀察法可以直觀地觀察到病毒粒子的存在,但是要求病毒在寄主中具有較高的濃度,而且無法進(jìn)行種的區(qū)分。在過去的幾十年中,血清學(xué)方法及PCR技術(shù)為病毒診斷帶來了突破性的研究成果,鑒定了大量病毒。然而,上述傳統(tǒng)方法的應(yīng)用均需對病毒的生物學(xué)特性、血清學(xué)特性、基因組結(jié)構(gòu)、核酸序列等有預(yù)先了解,是針對某種或者某類病毒的特異性檢測。在針對未知病毒開展的非特異性檢測時(shí),以上方法則缺乏優(yōu)勢,檢測時(shí)間周期長,極大限制了對病毒病害的了解。第二代測序(next-generation sequencing,NGS)技術(shù)克服以上傳統(tǒng)檢測方法的缺點(diǎn),其所具有的非序列依賴性及高靈敏性為病毒診斷帶來了重大的革新[5,9-10]。本文對高通量測序的方法及其在植物和昆蟲病毒檢測、資源發(fā)掘及進(jìn)化中的應(yīng)用作了系統(tǒng)介紹。
1 高通量測序技術(shù)
1977年,Sanger等利用雙脫氧核苷酸末端終止法進(jìn)行DNA測序,標(biāo)志著第一代測序技術(shù)的誕生[11-12]。盡管第一代測序技術(shù)已經(jīng)廣泛應(yīng)用于生命科學(xué)研究的各個(gè)領(lǐng)域,但由于其成本高、低通量、速度慢等缺點(diǎn),無法高效解讀所面臨的海量生物信息。2005年,454公司(后被Roche收購)研發(fā)的高通量測序系統(tǒng)Genome Sequencer 2. 0 System標(biāo)志著NGS技術(shù)的誕生,使得對遺傳信息的分析進(jìn)入了一個(gè)新的時(shí)代,具有里程碑式的意義。主流的測序平臺有Roche公司的基于焦磷酸測序(pyrosequencing)原理的454/GS FLX測序平臺、Illumina公司的基于合成法測序(sequencing by synthesis,SBS)原理的GAII/HiSeq平臺及ABI公司的基于連接法測序(sequencing by ligation,SBL)原理的SOLiD平臺[13]。由于測序原理的不同,每種測序平臺各有其優(yōu)缺點(diǎn)[5,9]。Roche的454/GS FLX測序平臺具有最長的讀長,可達(dá)700~1 000 bp,并且運(yùn)行時(shí)間短,但是通量低,價(jià)格昂貴,并且在多聚物測量時(shí)具有較高的錯(cuò)誤率;Illumina公司的GAII/HiSeq平臺是目前應(yīng)用最為廣泛的測序平臺,具有通量高、運(yùn)行速度快、成本低等優(yōu)點(diǎn),具有最高的性價(jià)比,但是在讀取復(fù)雜模板如高GC或高AT模板時(shí),錯(cuò)誤率較高;ABI公司的SOLiD平臺是目前第二代測序技術(shù)中準(zhǔn)確率最高的測序平臺,在15倍覆蓋率時(shí)測序準(zhǔn)確度可達(dá)99.999%,但是讀長短,僅有75 bp,且運(yùn)行時(shí)間較長。經(jīng)過十幾年的發(fā)展,各種高通量測序平臺也都在不斷改進(jìn)和發(fā)展??蒲腥藛T可以根據(jù)研究的需求不同,選擇相應(yīng)的測序平臺。
2 利用NGS檢測病毒的流程
除了在生物信息學(xué)、生物進(jìn)化研究、群體遺傳學(xué)等方面的應(yīng)用外,NGS已被應(yīng)用于病毒的鑒定、診斷及病毒資源的挖掘中。利用NGS技術(shù)檢測病毒和發(fā)掘病毒資源的實(shí)驗(yàn)流程主要包括:樣品制備、文庫構(gòu)建、平臺測序、數(shù)據(jù)分析以及結(jié)果驗(yàn)證[5,14]。
2.1 樣品制備及文庫構(gòu)建
樣品的制備是NGS的關(guān)鍵步驟,它將直接影響文庫的構(gòu)建進(jìn)而影響測序的深度。與寄主基因組相比,病毒基因組的含量相對較低。所以,除了利用總DNA或總RNA制備文庫外,多種有利于提高病毒基因組核酸含量的樣品制備方法被應(yīng)用于病毒檢測的實(shí)例中,如測序核酸采用去核糖體RNA的總RNA(ribosomal RNA depleted total RNA,rRNA-depleted totRNA)、雙鏈RNA(dsRNA)、病毒粒子相關(guān)的核酸(virion associated nucleic acids,VANA)、多聚腺苷酸化的RNA(poly(A)RNA)及與健康植物抑制消減雜交后的RNA等(表1)。
表1 用于檢測病毒的不同類型核酸樣品
Table 1 Different types of nucleic acids for virus detection
病毒依據(jù)其核酸組成及其復(fù)制特征,可以被分為以下幾類:雙鏈DNA病毒,單鏈DNA病毒,雙鏈RNA病毒,正義單鏈RNA病毒,負(fù)義單鏈RNA病毒[15]。在試驗(yàn)過程中應(yīng)當(dāng)根據(jù)病毒核酸的性質(zhì)及其在侵染過程中的特點(diǎn),選擇不同的核酸樣品進(jìn)行文庫制備和NGS測定。
dsRNA是RNA病毒在侵染循環(huán)過程中所產(chǎn)生的特有的形態(tài),因此,利用dsRNA作為測序核酸可以高效地獲得病毒的特異序列,提高測序的深度。Al-Rwahnih等[16]利用NGS檢測引起西拉葡萄衰退癥狀的病毒時(shí),分別提取了總RNA和dsRNA制備文庫。測序結(jié)果表明,利用dsRNA構(gòu)建的文庫中病毒來源的reads數(shù)占總reads數(shù)的52.7%(54 605/103 597),而利用總RNA構(gòu)建的文庫中病毒來源的reads數(shù)僅占1.94%(1 275/65 587),說明通過提取dsRNA富集了較多的病毒dsRNA,提高了檢測的靈敏性。數(shù)據(jù)分析發(fā)現(xiàn)共有沙地葡萄莖痘伴隨病毒Grapevine rupestris stem pitting-associated virus (GRSPaV)、沙地葡萄葉脈羽化病毒Grapevine rupestris vein-feathering virus (GRVFV)等6個(gè)已知病毒及類病毒和一個(gè)新病毒西拉葡萄病毒1號Grapevine syrah virus-1 (GSyV-1)侵染西拉葡萄。另外,利用dsRNA作為檢測病毒的核酸樣品是檢測真菌病毒的最主要方法。利用此方法可以有效地檢測RNA病毒,但卻不能有效地檢測DNA病毒[17]。另外,雙鏈RNA的提取花費(fèi)時(shí)間久,操作復(fù)雜。
利用VANA進(jìn)行NGS測序是更為直接有效鑒定病毒的方法。近年來,利用此策略已經(jīng)成功測定了多種植物及昆蟲病毒。例如,Candresse等[18]利用454測序平臺測定了命名為VARX和VSDA的兩個(gè)甘蔗樣品的VANA,除了已知的埃及甘蔗線條病毒Sugarcane streak Egypt virus (SSEV)外,還發(fā)現(xiàn)一種DNA病毒,命名為甘蔗白線條病毒Sugarcane white streak virus (SWSV)。數(shù)據(jù)分析表明,來源于SSEV的reads數(shù)在VARX和VSDA樣品中分別占53.7%(1 398/2 612)和75%(1 227/1 635),覆蓋整個(gè)SSEV基因組159倍和138倍;來源于SWSV的reads數(shù)在VARX和VSDA樣品中分別占23.9%(625/2 612)和16.1%(264/1 635),覆蓋整個(gè)基因組81倍和29倍。表明通過純化VANA能夠有效去除基因組的序列,達(dá)到最大化富集病毒核酸的目的。但是,對于無外殼蛋白包裹的病毒此方法則無法制備樣品。另外,不同科屬的病毒粒子提取方法差異較大,當(dāng)樣本中可能包含兩種或幾種病毒時(shí),不能用同一種方法同時(shí)提取所有的病毒粒子。因而,在對檢測樣本了解較少的前提下,樣品制備困難較大。
利用富集poly(A)RNA的方法制備樣本,可以用于檢測DNA和RNA病毒,但是不能檢測沒有poly(A)結(jié)構(gòu)的病毒。Wylie和Jones[19]提取分離了水仙和朱頂紅樣品的poly(A)RNA,并以此為模板構(gòu)建文庫測序,檢測到了麝香石竹潛隱病毒屬和馬鈴薯Y病毒屬的7個(gè)不同的病毒分離物。Wylie等[20]以相似的方法檢測到分離自澳大利亞的百香果木質(zhì)病毒Passion fruit woodiness virus (PWV),病毒的RNA占分離的poly(A)RNA的7.38%。
在植物病毒鑒定中,抑制消減雜交技術(shù)被用于樣品的制備,Adams等[21]利用未感染病毒的cDNA對感病植物的cDNA進(jìn)行消減雜交,并利用NGS鑒定到了黃瓜花葉病毒屬的新病毒,名為蛇鞭菊輕斑駁病毒Gayfeather mild mottle virus (GMMV)。Monger等[22-23]也利用構(gòu)建抑制消減文庫的方式檢測到了木薯褐條病毒Cassava brown streak virus (CBSV)和美人蕉黃條病毒Canna yellow streak virus (CaYSV)。但是,抑制消減文庫的構(gòu)建需要花費(fèi)大量的時(shí)間,因而并不適合高通量樣品的檢測和病害診斷。
目前,總RNA測序適用于多種類型的病毒基因組,均能夠檢測DNA病毒及RNA病毒,并且樣品制備相對簡單,可被大部分的檢測實(shí)驗(yàn)室使用。據(jù)統(tǒng)計(jì),僅在2009至2014年間,就有30例利用總RNA構(gòu)建的文庫進(jìn)行NGS測序檢測植物病毒的實(shí)例被報(bào)道[17],然而在檢測較低滴度的病毒時(shí)有很大的不足。去除總RNA中含量豐富的rRNA,增加病毒RNA的相對含量則克服了以上缺點(diǎn)。研究表明,以rRNA-depleted totRNA構(gòu)建文庫能夠使病毒RNA的相對含量提高10倍[24]。Liu等[25]利用感病的小麥和帶毒的葉蟬樣品分別構(gòu)建rRNA-depleted totRNA文庫,通過測序檢測到一種新的經(jīng)葉蟬傳播的彈狀病毒,名為小麥黃條紋病毒W(wǎng)heat yellow striate virus (WYSV)。Xin等[26]通過分析感病西瓜樣品的rRNA-depleted totRNA文庫,檢測到兩種新的負(fù)義單鏈RNA病毒,并建議歸屬為布尼亞病毒目Bunyavirales白纖病毒科Phenuiviridae。
另外,小RNA(sRNA)測序也是鑒定病毒最常用的方法之一。自2009年,Donaire等[27]和Kreuze等[28]證明可以利用病毒來源的sRNA進(jìn)行病毒基因組的組裝以鑒定植物中的已知和未知病毒后,這一方法被廣泛應(yīng)用于未知病毒的鑒定。依據(jù)的原理是病毒的侵染會誘導(dǎo)寄主的RNA沉默機(jī)制發(fā)揮作用,產(chǎn)生病毒來源的sRNA。通過對寄主中sRNA的測序及分析可以鑒定寄主中的病毒種類。該種方法應(yīng)用范圍廣,可以檢測不同類型的DNA及RNA病毒[29]。迄今,應(yīng)用該方法已成功檢測30多種植物病毒[17]。但對于某些產(chǎn)生sRNA較少的持久性病毒或者潛隱性病毒,可能不能精確地組裝病毒基因組。
2.2 平臺檢測及數(shù)據(jù)分析
在檢測某種植物或昆蟲病毒時(shí),可根據(jù)側(cè)重檢測的病毒種類或已有的提示,提取或富集相應(yīng)的核酸樣本,根據(jù)檢測需要,選取相應(yīng)的測序平臺獲得高通量的測序數(shù)據(jù)。數(shù)據(jù)分析是利用NGS檢測病毒的關(guān)鍵點(diǎn)和難點(diǎn)。以下以分析總RNA或rRNA-depleted totRNA測序數(shù)據(jù)為例,說明數(shù)據(jù)分析的過程[5]。第一步,原始數(shù)據(jù)處理,運(yùn)用EMBOSS、CLC Genomic Workbench等軟件去掉兩端的接頭、去掉低質(zhì)量的數(shù)據(jù)等,獲得clean reads。第二步,去掉基因組的數(shù)據(jù)(可選),若已知寄主的基因組數(shù)據(jù)庫,可利用CLC Genomic Workbench等軟件將獲得的clean reads與參考基因組比對,篩選出不能比對到參照基因組的序列做進(jìn)一步分析。第三步,將篩選的序列利用CLC Genomic Workbench進(jìn)行從頭拼接,然后將獲得的片段(contigs)進(jìn)行BLAST分析。第四步,對具有同源性的片段進(jìn)一步組裝,并比對NCBI核酸及蛋白數(shù)據(jù)庫,揭示病毒的種類。
2.3 結(jié)果驗(yàn)證
根據(jù)獲得的contigs,提取寄主的核酸,運(yùn)用PCR、反轉(zhuǎn)錄PCR、cDNA末端快速擴(kuò)增(rapid amplification of cDNA ends,RACE)等技術(shù)驗(yàn)證病毒并擴(kuò)增病毒基因組的全長序列。
3 NGS在植物及昆蟲病毒檢測及發(fā)掘中的應(yīng)用
3.1 疑難雜癥的病原診斷及新病毒的發(fā)現(xiàn)
基于NGS可應(yīng)用于非特異性檢測病毒的特點(diǎn),很多農(nóng)業(yè)生產(chǎn)中的疑難雜癥可以利用NGS進(jìn)行診斷。?;ㄈ~型萎縮病是經(jīng)濟(jì)作物桑樹上的重要病害,感病的植株較健康植株矮小,葉片花葉、卷曲,嚴(yán)重影響桑樹的經(jīng)濟(jì)價(jià)值[30]。在長達(dá)數(shù)十年中,此病的病原未能明確,因而不能得到有效的防治。通過sRNA測序,從感病植株中檢測到一種新的DNA病毒,研究表明該病毒與?;ㄈ~型萎縮病具有極大地相關(guān)性,命名為?;ㄈ~萎縮相關(guān)病毒Mulberry mosaic dwarf associated virus (MMDaV)[31]。我國是西瓜的主要生產(chǎn)國,種植面積及產(chǎn)量均居世界首位。病毒病害是限制西瓜產(chǎn)量的重要因素之一。2015-2016年,Xin等[26]在對河南開封的西瓜病害開展的田間調(diào)查中發(fā)現(xiàn)了表現(xiàn)花葉、卷曲癥狀的西瓜植株。利用總RNA測序及sRNA測序檢測引起此病害的病毒,鑒定出了兩種負(fù)義單鏈RNA病毒,命名為西瓜皺葉病毒1號Watermelon crinkle leaf-associated 1 (WCLaV-1)和西瓜皺葉病毒2號Watermelon crinkle leaf-associated 2 (WCLaV-2)。進(jìn)一步的接種試驗(yàn)表明WCLaV-1能夠引起與田間西瓜相似的皺葉癥狀。2013-2014年,Chen等[32]在云南和貴州省玉米病毒病的調(diào)查中發(fā)現(xiàn)表現(xiàn)典型的黃化、花葉癥狀的玉米植株。利用sRNA測序鑒定引起此病害的病毒,發(fā)現(xiàn)一種新的病毒,命名為玉米黃化花葉病毒Maize yellow mosaic virus (MaYMV)。2006-2007年,蜜蜂的蜂群崩潰失調(diào)?。╟olony collapse disorder, CCD)席卷美國的22個(gè)州,同時(shí)在法國、德國、澳大利亞等國也引起嚴(yán)重危害[33]。CCD的主要癥狀是大量的成年工蜂在短期內(nèi)突然消失在蜂巢外,沒有任何尸體,只有蜂王、卵、未成年工蜂殘存在蜂巢中。為了探究CCD的病因,Cox-Foster等[34]從來自美國患CCD的蜂群和來自美國及澳大利亞的健康蜂群中提取總RNA構(gòu)建文庫測序,生物信息學(xué)分析從患CCD的蜂群中發(fā)現(xiàn)了7種病毒而從健康蜂群中發(fā)現(xiàn)了5種病毒。通過比對發(fā)現(xiàn),以色列急性麻痹病毒Israeli acute paralysis virus (IAPV)與克什米爾蜜蜂病毒Kashmir bee virus (KBV)可能與CCD有關(guān),通過進(jìn)一步的研究確認(rèn)IAPV與CCD的相關(guān)性最大。
近年來,通過NGS技術(shù)鑒定了很多不引起明顯癥狀的潛隱性病毒,極大地豐富了病毒的資源?;旌喜《究艫malgaviridae是由國際病毒分類委員會于2013年設(shè)立的一個(gè)新科,它由一類dsRNA病毒組成。因兼具整體病毒科Totiviridae和分體病毒科Partitiviridae的特征,故稱為混合病毒科。此科包含4個(gè)確定種,其病毒粒子在侵染的植物組織中很難被純化和觀察到,并且并不能確定它們與寄主植物的某種癥狀具有相關(guān)性[35]。因而,發(fā)現(xiàn)此科病毒的侵染以及鑒定此科的病毒均具有很大的難度。然而,近兩年由于生物信息學(xué)的快速發(fā)展,通過高通量的數(shù)據(jù)分析,發(fā)現(xiàn)和鑒定了很多之前未發(fā)現(xiàn)的病毒,極大地豐富了此科病毒的種類。例如,Nibert等[36]通過分析轉(zhuǎn)錄組數(shù)據(jù),從12種不同的植物中篩選到19個(gè)包含混合病毒科病毒的序列。其中的16段序列包含預(yù)測混合病毒的全長編碼區(qū)。Park等通過分析大葉藻[37]和菠菜[38]的轉(zhuǎn)錄組數(shù)據(jù),鑒定了兩種侵染大葉藻及一種侵染菠菜的混合病毒科病毒。
3.2 病毒組的鑒定
宏基因組學(xué)(metagenomics)是以測序?yàn)槭侄畏治瞿硞€(gè)特定生態(tài)環(huán)境中整個(gè)微生物群體的基因組。在病毒學(xué)研究領(lǐng)域,基于NGS的宏基因組學(xué)分析使得研究某個(gè)特定生態(tài)系統(tǒng)或種植系統(tǒng)中的所有病毒成為可能。整個(gè)病毒的群體被稱為病毒組(virome)。2009年,Roossinck等[39]發(fā)起了一個(gè)研究病毒生物多樣性的調(diào)查。他們收集了10~20 g植物材料用于宏基因組測序。這些植物材料采集于美國俄克拉荷馬州東北部的高草草原保護(hù)區(qū)(具有較低的植物多樣性)和哥斯達(dá)黎加西北部關(guān)納卡斯帝保護(hù)區(qū)(具有較高的植物多樣性),涉及15個(gè)科400余個(gè)樣品。生物信息學(xué)分析表明高達(dá)70%的樣品中有病毒的同源序列,包括雀麥花葉病毒科、花椰菜花葉病毒科、分體病毒科、馬鈴薯Y病毒科等11個(gè)科的病毒,還包括一些未分類的病毒。2012年,Wylie等[40]從17種植物120個(gè)不同的植物葉片中提取總RNA并分離poly(A)RNA用于NGS分析。從中鑒定到20種帶poly(A)RNA尾的RNA病毒,其中16個(gè)為已知病毒,4個(gè)為新病毒。2011年,Coetzee等[41]從南非的一個(gè)葡萄園中隨機(jī)選取了44個(gè)葡萄藤蔓,從中分離dsRNA,構(gòu)建文庫并進(jìn)行NGS。利用生物信息學(xué)方法構(gòu)建病毒群體,包含4種已知的病毒及幾種新病毒,其中葡萄卷葉伴隨病毒3號Grapevine leafroll-associated virus 3 (GLRaV-3)為優(yōu)勢病毒,包含該病毒的reads數(shù)占總reads數(shù)的59%。
番茄是一種重要的經(jīng)濟(jì)作物,病毒病是限制番茄生產(chǎn)的主要因素。我國是番茄的主要生產(chǎn)國,為了研究番茄病毒在我國的分布特點(diǎn),為番茄病毒病防治提供線索,Xu等[42]從我國主要番茄栽培區(qū)采集了170個(gè)疑似病毒侵染的番茄樣品。通過sRNA測序及數(shù)據(jù)分析獲得侵染我國番茄的病毒組,共檢測到21種已知病毒、一個(gè)新發(fā)現(xiàn)的番茄病毒以及兩種類病毒。病毒種類涉及12個(gè)屬,其中正義單鏈RNA病毒是主要的群體。89%的樣品為混合侵染,包含兩種或三種病毒。通過分析病毒組還發(fā)現(xiàn),在我國主要侵染番茄的病毒有番茄花葉病毒Tomato mosaic virus (ToMV)、番茄黃化曲葉病毒Tomato yellow leaf curl virus (TYLCV)、馬鈴薯Y病毒Potato virus Y (PVY)、南方番茄病毒Southern tomato virus (STV)等10種病毒。分析番茄病毒組可以檢測到重組事件的發(fā)生率,黃瓜花葉病毒Cucumber mosaic virus (CMV)和ToMV在正義-正義鏈重組和正義-負(fù)義鏈重組中均具有較高的重組率。另外,通過病毒組的分析還可以預(yù)測病毒的起源及進(jìn)化等,利用各個(gè)地區(qū)TYLCV不同株系的基因組序列構(gòu)建進(jìn)化樹,發(fā)現(xiàn)所有已經(jīng)報(bào)道的來自中國的TYLCV株系在進(jìn)化樹中歸于一支,表明其具有共同的起源;篩選56個(gè)代表株系,利用貝葉斯系統(tǒng)發(fā)育法分析其進(jìn)化率,推測TYLCV可能早在1996年就已經(jīng)在我國發(fā)生,早于2006年的首次報(bào)道。
3.3 病毒準(zhǔn)種的構(gòu)建
由于較高的突變和重組效率,病毒(特別是RNA病毒)是進(jìn)化最快的生物之一。某一寄主中的病毒群體并不是單一的序列,而是包含很多不完全一致但是相似度極高的病毒基因組序列,稱為病毒的準(zhǔn)種(quasispecies)[43]。了解準(zhǔn)種的遺傳信息對于了解病毒的變異、進(jìn)化、傳播、毒性、躲避寄主的防御反應(yīng)等均具有重要的意義。利用NGS構(gòu)建病毒的準(zhǔn)種、了解其群體變異主要集中在與人類疾病相關(guān)的病毒研究中,如登革病毒[44]、手足口病毒[45]、乙型肝炎病毒[46]等。近年來,利用NGS對植物和昆蟲病毒準(zhǔn)種的研究也取得了一些進(jìn)展。Fabre等[47]利用NGS技術(shù)分析了4種具有不同替換位點(diǎn)及致病性特點(diǎn)的PVY變體在感病寄主辣椒中的種群動態(tài),并結(jié)合數(shù)學(xué)模型描述了自然選擇和遺傳漂變在改變病毒的進(jìn)化動力學(xué)中具有重要作用。Cornman等[48]通過NGS研究了侵染蜜蜂的蜜蜂畸翅病毒和IAPV的群體遺傳變異,闡明不同區(qū)域不同樣品間的單核苷酸多態(tài)性譜與侵染滴度和寄主種群數(shù)目具有相關(guān)性。Huang等[49]通過NGS分析和比對水稻條紋病毒Rice stripe virus (RSV)在自然寄主水稻和試驗(yàn)寄主本氏煙中的遺傳多樣性,發(fā)現(xiàn)在本氏煙中共有1 675處位點(diǎn)發(fā)生替換而在水稻中僅有341處,表明RSV在本氏煙中具有更高的遺傳多樣性,推測與寄主適應(yīng)性相關(guān)。
4 優(yōu)勢和局限性
與傳統(tǒng)的病毒檢測方法相比,NGS的優(yōu)勢主要表現(xiàn)在以下幾個(gè)方面。(a)NGS檢測具有非序列依賴性,不需要依賴于病毒的序列特征或者生物學(xué)特征[14]。分析獲得的NGS數(shù)據(jù)時(shí),可以通過序列同源性或者非序列同源性兩種方式來分析潛在的病毒序列。序列同源性的方式是基于未知病毒可能與已報(bào)道的病毒序列具有一定程度的同源性,進(jìn)而推測獲得的contigs可能包含與已知病毒具有同源性的新病毒[5];非序列同源性的方式則是采用逐漸過濾重疊sRNA的方式,發(fā)現(xiàn)與已知病毒序列完全不具有同源性的新病毒[50]。(b)NGS檢測具有快速、靈敏性高的特點(diǎn)。利用傳統(tǒng)檢測方法檢測未知病毒時(shí),由于對病毒的序列及生物學(xué)特性了解甚少,所以檢測花費(fèi)的時(shí)間會非常長,甚至不能取得理想的檢測結(jié)果。而NGS一般在幾天內(nèi)即可完成測序反應(yīng),數(shù)據(jù)分析及結(jié)果驗(yàn)證也可在較短時(shí)間內(nèi)完成[51]。(c)NGS可以同時(shí)檢測多種不同核酸類型的病毒。不論是DNA病毒或者RNA病毒均能夠在一次總RNA或sRNA測序反應(yīng)中被檢測到[17]。實(shí)際應(yīng)用中也可提取不同類型的核酸構(gòu)建文庫,以提高測序的準(zhǔn)確性、靈敏性及廣泛性[52]。(d)NGS可同時(shí)檢測多個(gè)樣本,樣品檢測具有高通量的特點(diǎn)??蓪⒚總€(gè)樣品的cDNA帶上特異性的序列,這樣可同時(shí)檢測來自于不同地區(qū)的不同種寄主中病毒的種類、分布以及變異進(jìn)化等特征[39]。
NGS的局限性主要包括:(a)相較于Sanger測序而言,NGS的錯(cuò)誤率相對較高且讀長較短。(b)NGS需要科研人員掌握較高的生物信息學(xué)技術(shù)。NGS會產(chǎn)生海量的數(shù)據(jù),如何對這些遺傳信息進(jìn)行篩選和分析,需要研究人員精通生物信息學(xué)分析方法。(c)目前NGS不能獲得全長的基因組序列,特別是在5′端和3′端的非編碼區(qū),因而需要結(jié)合RACE-PCR等方法才能獲得完整的病毒序列[5]。對于某些滴度比較低的病毒,在組裝后僅能獲得較短的contigs,需要與其他分子生物學(xué)試驗(yàn)結(jié)合才能確定病毒的存在。(d)通過NGS能夠獲得病毒的遺傳信息,但是還需要掌握病毒的傳播方式、寄主范圍等生物學(xué)特性才能對新病毒進(jìn)行分類以及證實(shí)病毒與某種疾病之間的相關(guān)性[14,51]。
5 結(jié)語
NGS的誕生為病毒學(xué)研究帶來了新的方法,極大地推動了病毒學(xué)研究的發(fā)展。植物病毒和昆蟲病毒與農(nóng)業(yè)生產(chǎn)緊密相連,未來隨著NGS的成本降低以及廣泛推廣,其將在病毒病快速診斷、病毒資源發(fā)掘、病毒組分析、準(zhǔn)種構(gòu)建等研究領(lǐng)域取得更為顯著的成果,為農(nóng)業(yè)的健康生產(chǎn)提供理論指導(dǎo)。以PacBio為代表的三代測序平臺能夠直接針對單個(gè)分子進(jìn)行測序,具有準(zhǔn)確率高、讀長長、無GC偏好性等特點(diǎn),但目前測序費(fèi)用昂貴未能被廣泛推廣,期望未來該技術(shù)能夠促進(jìn)病毒學(xué)研究的發(fā)展。
參考文獻(xiàn)
[1] SUTTLE C A. Marine viruses-major players in the global ecosystem [J].Nature Reviews Microbiology,2007,5(10):801-812.
[2] SUTTLE C. The viriosphere: the greatest biological diversity on earth and driver of global processes [J]. Environmental Microbiology,2005,7(4):481-482.
[3] STRANGE R N,SCOTT P. Plant disease: a threat to global food security [J]. Annual Review of Phytopathology,2005,43(1):83-116.
[4] COUTTS R. Plant viruses: new threats to crops from changing farming practices [J]. Nature,1986,322(6080):594.
[5] LIU Sijun,VIJAYENDRAN D,BONNING B C. Next generation sequencing technologies for insect virus discovery [J]. Viruses,2011,3(10):1849-1869.
[6] GOLDSMITH C S,MILLER S E. Modern uses of electron microscopy for detection of viruses [J]. Clinical Microbiology Reviews,2009,22(4):552-563.
[7] KOENIG R. Indirect ELISA methods for the broad specificity detection of plant viruses[J]. Journal of General Virology,1981,55(1):53-62.
[8] ORTIZ V,CASTRO S,ROMERO J. Optimization of RT-PCR for the detection of bean leaf roll virus in plant hosts and insect vectors [J]. Journal of Phytopathology,2010,153(2):68-72.
[9] BARBA M,CZOSNEK H,HADIDI A. Historical perspective,development and applications of next-generation sequencing in plant virology [J]. Viruses,2014,6:106-136.
[10] HADIDI A,F(xiàn)LORES R,CANDRESSE T,et al. Next-generation sequencing and genome editing in plant virology [J]. Frontiers in Microbiology,2016,7:1325.
[11] SANGER F,NICKLEN S,COULSON A R. DNA sequencing with chain-terminating inhibitors[J]. Proceedings of the National Academy of Sciences of the United States of America,1977,74:5463-5467.
[12] SANGER F,AIR G M, BARRELL B G,et al. Nucleotide sequence of bacteriophage φx174 DNA[J]. Nature,1977,265(5596):687-695.
[13] LIU Lin,LI Yihu,LI Siliang,et al. Comparison of next-generation sequencing systems [J]. Journal of Biomedicine & Biotechnology,2012,2012:251364.
[14] 錢亞娟,徐毅,周琦,等. 利用深度測序技術(shù)發(fā)掘植物病毒資源[J]. 中國科學(xué):生命科學(xué),2014,44(4):351-363.
[15] 赫爾. 馬修斯植物病毒學(xué)[M]. 范在豐,李懷芳,韓成貴,等,譯.北京:科學(xué)出版社,2007:190-207.
[16] AL-RWAHNIH M,DAUBERT S,GOLINO D,et al. Deep sequencing analysis of RNAs from a grapevine showing syrah decline symptoms reveals a multiple virus infection that includes a novel virus [J]. Virology,2009,387(2):395-401.
[17] ROOSSINCK M,MARTIN D P,ROUMAGNAC P. Plant virus metagenomics: Advances in virus discovery [J]. Phytopathology,2015,105(6):716-727.
[18] CANDRESSE T,F(xiàn)ILLOUX D,MUHIRE B,et al. Appearances can be deceptive: revealing a hidden viral infection with deep sequencing in a plant quarantine context [J/OL]. PLoS ONE,2014,9:e102945.
[19] WYLIE S J,JONES M G K. Complete genome sequences of seven carlavirus and potyvirus isolates from Narcissus and Hippeastrum plants in Australia,and proposals to clarify their naming [J]. Archives of Virology,2012,157(8):1471-1480.
[20] WYLIE S J,JONES M G K. The complete genome sequence of a passion fruit woodiness virus isolate from Australia determined using deep sequencing,and its relationship to other potyviruses [J]. Archives of Virology,2011,156(3):479-482.
[21] ADAMS I P,GLOVER R H,MONGER W A,et al. Next-generation sequencing and metagenomic analysis: a universal diagnostic tool in plant virology [J]. Molecular Plant Pathology,2009,10(4):537-545.
[22] MONGER W A,ALICAI T,NDUNGURU J,et al. The complete genome sequence of the Tanzanian strain of Cassava brown streak virus and comparison with the Ugandan strain sequence [J]. Archives of Virology,2010,155(3):429-433.
[23] MONGER W A,ADAMS I P,GLOVER R H,et al. The complete genome sequence of Canna yellow streak virus[J]. Archives of Virology,2010,155(9):1515-1518.
[24] ADAMS I,F(xiàn)OX A. Diagnosis of plant viruses using next-generation sequencing and metagenomic analysis [M]∥WANG A, ZHOU X. Current research topics in plant virology. Switzerland:Springer Cham,2016:323-335.
[25] LIU Yan,DU Zhenzhen,WANG Hui,et al.Identification and characterization of wheat yellow striate virus,a novel leafhopper-transmitted nucleorhabdovirus infecting wheat [J]. Frontiers in Microbiology,2018,9:468.
[26] XIN Min,CAO Mengji,LIU Wenwen,et al. Two negative-strand RNA viruses identified in watermelon represent a novel clade in the order Bunyavirales [J]. Frontiers in Microbiology,2017,8:1514.
[27] DONAIRE L,WANG Yu,GONZALEZ-IBEAS D,et al. Deep-sequencing of plant viral small RNAs reveals effective and widespread targeting of viral genomes [J]. Virology,2009,392(2):203-214.
[28] KREUZE J F,PEREZ A,UNTIVEROS M,et al. Complete viral genome sequence and discovery of novel viruses by deep sequencing of small RNAs: a generic method for diagnosis,discovery and sequencing of viruses [J]. Virology,2009,388(1):1-7.
[29] PECMAN A,KUTNJAK D,GUTIRREZ-AGUIRRE I,et al. Next generation sequencing for detection and discovery of plant viruses and viroids: comparison of two approaches [J]. Frontiers in Microbiology,2017,8:1998.
[30] 薛松,陶成. 桑樹花葉卷葉病的發(fā)生及防治[J]. 中國蠶業(yè),2003,24(1):35.
[31] MA Yuxin,NAVARRO B,ZHANG Zhixiang,et al. Identification and molecular characterization of a novel monopartite geminivirus associated with mulberry mosaic dwarf disease [J]. Journal of General Virology,2015,96(8):2421-2434.
[32] CHEN Sha,JIANG Guangzhuang,WU Jianxiang,et al. Characterization of a novel polerovirus infecting maize in China [J]. Viruses,2016,8:120.
[33] VAN ENGELSDORP D,MEIXNER M D. A historical review of managed honey bee populations in Europe and the United States and the factors that may affect them [J]. Journal of Invertebrate Pathology,2010,103:S80-S95.
[34] COX-FOSTER D L,CONLAN S,HOLMES E C,et al. A metagenomic survey of microbes in honey bee colony collapse disorder [J]. Science,2007,318(5848):283-287.
[35] KRUPOVIC M, DOLJA V V, KOONIN E V. Plant viruses of the Amalgaviridae family evolved via recombination between viruses with double-stranded and negative-strand RNA genomes [J]. Biology Direct,2015,10:12.
[36] NIBERT M L,PYLE J D,F(xiàn)IRTH A E. A+1 ribosomal frameshifting motif prevalent among plant amalgaviruses [J]. Virology,2016,498:201-208.
[37] PARK D,GOH C J,KIM H,et al. Identification of two novel amalgaviruses in the common eelgrass (Zostera marina) and in silico analysis of the amalgavirus+1 programmed ribosomal frameshifting sites [J]. Plant Pathology Journal,2018,34(2):150-156.
[38] PARK D,HAHN Y. Genome sequences of spinach deltapartitivirus 1,spinach amalgavirus 1,and spinach latent virus identified in spinach transcriptome[J]. Journal of Microbiology & Biotechnology,2017,27(7):1324-1330.
[39] ROOSSINCK M J,SAHA P,WILEY G B,et al.Ecogenomics: using massively parallel pyrosequencing to understand virus ecology [J]. Molecular Ecology,2010,19(S1):81-88.
[40] WYLIE S J,LUO Hao,LI Hua,et al. Multiple polyadenylated RNA viruses detected in pooled cultivated and wild plant samples [J]. Archives of Virology,2012,157(2):271-284.
[41] COETZEE B,F(xiàn)REEBOROUGH M J,MAREE H J,et al. Deep sequencing analysis of viruses infecting grapevines: virome of a vineyard [J]. Virology,2010,400(2):157-163.
[42] XU Chenxi,SUN Xuepeng,TAYLOR A,et al. Diversity,distribution,and evolution of tomato viruses in china uncovered by small RNA sequencing [J/OL].Journal of Virology,2017,91(11):e00173-17.
[43] LAURING A S,ANDINO R. Quasispecies theory and the behavior of RNA viruses [J/OL]. PLoS Pathogens,2010,6:e1001005.
[44] CHININMANU K,SUTTITHEPTUMRONG A,SANGSRAKRU D,et al. Feasibility of using 454 pyrosequencing for studying quasispecies of the whole dengue viral genome [J]. BMC Genomics,2012,13:S7.
[45] WRIGHT C F,MORELLI M J,THéBAUD G,et al. Beyond the consensus: dissecting within-host viral population diversity of foot-and-mouth disease virus by using next-generation genome sequencing [J]. Journal of Virology,2011,85(5):2266-2275.
[46] LI F,ZHANG D,LI Y,et al. Whole genome characterization of hepatitis B virus quasispecies with massively parallel pyrosequencing [J].Clinical Microbiology and Infection,2015,21(3):280-287.
[47] FABRE F,MONTARRY J,COVILLE J,et al. Modelling the evolutionary dynamics of viruses within their hosts: a case study using high-throughput sequencing [J/OL]. PLoS Pathogens,2012,8:e1002654.
[48] CORNMAN R S,BONCRISTIANI H,DAINAT B,et al. Population-genomic variation within RNA viruses of the western honey bee,Apis mellifera,inferred from deep sequencing [J]. BMC Genomics,2013,14:154.
[49] HUANG Lingzhe,LI Zefeng,WU Jianxiang,et al. Analysis of genetic variation and diversity of rice stripe virus populations through high-throughput sequencing [J].Frontiers in Plant Science,2015,6:176.
[50] WU Qingfa,WANG Ying,CAO Mengji,et al. Homology-independent discovery of replicating pathogenic circular RNAs by deep sequencing and a new computational algorithm [J]. Proceedings of the National Academy of Sciences of the United States of America,2012,109(10):3938-3943.
[51] 馬宇欣,李世訪. 高通量測序技術(shù)在鑒定木本植物雙生病毒中的應(yīng)用[J]. 植物保護(hù),2016,42(6):1-10.
[52] LOCONSOLE G,GIAMPETRUZZI A,ROBERTO R,et al. Next-generation sequencing and metagenomic analysis advances in plant virus diagnosis and discovery [J]. Journal of Plant Pathology,2012,94:48-49.
(責(zé)任編輯: 楊明麗)