何 沛,蘇代發(fā),楊俊譽,肖 煒,劉志華*,崔曉龍*
(1.云南中煙工業(yè)有限責任公司技術中心,中國云南昆明650231;2.云南大學生命科學學院,中國云南昆明650091)
核苷酸序列測定作為最重要的分子生物學分析方法之一,不僅能為遺傳信息的揭示和基因表達調(diào)控等基礎生物學研究提供重要數(shù)據(jù),而且在基因診斷和基因治療等應用研究中也發(fā)揮著重要的作用。為了進行快速、準確的基因測序,Sanger等[1]于1977年提出了快速測定DNA序列的鏈終止法,此后的四十多年時間里,測序技術取得了相當大的發(fā)展,出現(xiàn)了新的測序技術(包括二代測序技術等)[2]。然而,隨著遺傳信息的不斷揭示,第一代測序技術已經(jīng)不能滿足科學研究的需要,因此2005年第二代測序技術(next-generation sequencing,NGS)應運而生[3]。第二代測序技術克服了第一代測序技術的缺點,凸顯出其快速、高通量和低成本的巨大優(yōu)勢,這一細致、全面的測序方法為基因組和轉(zhuǎn)錄組的深入研究提供了可能[4]。
與Sanger測序技術相比,NGS是一種一次能對幾十萬到幾百萬的核酸分子進行測序的高通量測序技術,這種高通量測序使得人們對一個物種的轉(zhuǎn)錄組和基因組進行細致、全貌的分析成為可能。目前,NGS在生物學中的應用包括:全基因組測序,主要目的在于測得某一物種的全部基因組,如擬南芥[5]、大腸桿菌[6]等;宏基因組測序,其主要目的在于解讀微生物群體的多樣性與豐度,探求微生物與環(huán)境、微生物與宿主之間的關系,發(fā)掘和研究新的、具有特定功能的基因,目前廣泛應用于海洋生物、植物、人類疾病等候選病毒資源的發(fā)掘及病毒多樣性的研究[7~8];轉(zhuǎn)錄組測序,涵蓋全部mRNA和small RNA的測序與分析[8];擴增子測序,包括16S rDNA測序、18S rDNA測序、轉(zhuǎn)錄間隔區(qū)(internal transcribed spacer,ITS)測序及目標區(qū)域擴增子測序等,是一種高靶向性的測序方法,用于分析特定基因組區(qū)域中的基因變異。
在市場上占據(jù)優(yōu)勢的三大主要測序平臺包括Roche公司的454平臺、Illumina公司的Solexa和HiSeq平臺及Applied Biosystems(ABI)公司的SOLiD平臺[9~14]。由于454及SOLiD平臺存在序列讀長、費用等方面的瑕疵,所以當前二代測序主要以Illumina為測序平臺。本文對煙草中所涉及的二代測序技術進行了綜述,以期為相關領域研究者提供新的思路。
第一個煙草基因組測序項目于2003年由美國煙草基因組計劃啟動[15~16],對栽培種煙草Hicks Broadleaf的開放閱讀框進行了測序[17],并于2007年完成測序工作,得到了約689 Mb的序列。Matsuoka等[18]為了解析植物細胞在細胞分裂過程中和細胞分裂終止后基因表達的變化,用cDNA基因芯片研究了煙草BY-2細胞系生長過程中基因表達的變化,得到了約9 200條表達序列標簽(expression sequence tags,ESTs)片段,與之對應的基因有7 000個,研究發(fā)現(xiàn):對數(shù)期細胞主要表達DNA/染色體復制基因的同源物;而平穩(wěn)期(stationary phase)細胞則表達多種與受體激酶、信號轉(zhuǎn)導和轉(zhuǎn)錄因子相關的基因。法國與英國合作發(fā)起了歐洲煙草EST計劃[19],其以烤煙品種K326、白肋煙21和白肋煙TN86為材料,選取植株生長的不同階段(發(fā)芽期、幼苗期、打頂前后期和成熟期)分別制備植物樣本(種子、根、莖、梗、葉片和花)。該項研究從由56 000份樣本組成的11個標準化cDNA文庫中得到了一個龐大的煙草EST數(shù)據(jù)集,其研究結(jié)果為推動煙草基因研究進程做出了重大貢獻。
中國于2010年啟動煙草基因組計劃,2011年完成了絨毛狀煙草(Nicotiana tomentosiformis)和林煙草(Nicotiana sylvestris)的全基因組序列圖譜[20];2012—2016年完成了標記數(shù)最多、密度最高的煙草分子遺傳連鎖圖譜[21~24];2014年構(gòu)建了首張煙草單倍體型圖,揭示了煙草百年育種進程[20];同時,建立了煙草基因組數(shù)據(jù)庫,其匯集基因序列、基因芯片、突變體、代謝組等所有產(chǎn)出的數(shù)據(jù)資源,已經(jīng)成為國際上覆蓋煙草基因組數(shù)據(jù)最全面、體系最完整、最有應用和研究價值的數(shù)據(jù)庫和云計算平臺[20]。
目前已用二代測序技術對N.tomentosiformis等7種煙草屬植物的基因組進行了測序,其基因組大小從1.70 Gb到4.60 Gb不等[25~28],具體信息見表1。
此外,現(xiàn)有研究中也有對煙草葉綠體進行全基因組測序的相關報道。Asaf等[29]對煙草N.otophora的葉綠體全基因組進行了測序,發(fā)現(xiàn)其葉綠體基因組有156 073 bp,共有163個基因,蛋白質(zhì)編碼基因有110個;而N.sylvestris、N.tabacum、N.tomentosiformis和N.undulata的葉綠體基因組分別為 155 941 bp、155 943 bp、155 745 bp 和155 863 bp,所含有的基因分別為140個、144個、140個和156個,蛋白質(zhì)編碼基因分別為111個、98個、110個和111個。
表1 7種煙草屬植物的基因組測序Table 1 Genome sequencing of seven tobacco species
Huang等[30]以煙草K326的烤煙葉為材料,通過免培養(yǎng)方式對陳化與未陳化烤煙葉的細菌多樣性進行分析,結(jié)果顯示從未陳化、陳化的烤煙葉中分別鑒定出23個和15個細菌,芽孢桿菌屬(Bacillus)和假單胞菌屬(Pseudomonas)是陳化與未陳化烤煙葉中的優(yōu)勢屬。Su等[31]以陳化與未陳化津巴布韋烤煙葉為材料,用免培養(yǎng)方式對其中細菌的多樣性和系統(tǒng)發(fā)育進行了研究,結(jié)果顯示從陳化、未陳化的烤煙葉中分別得到65個和84個運算分類單元(operational taxonomic units,OTUs),兩種烤煙葉中的優(yōu)勢種各有不同;來自兩種材料的細菌可以分為兩個分支,其中陳化烤煙葉中的細菌又可以分為兩個獨立的亞分支。Wang等[32~33]以來自紅河和楚雄兩地的陳化烤煙(aging flue-cured tobaccos,AFTs)為材料,用高通量測序?qū)﹃惢緹煴砻娴募毦鄻有赃M行了研究,同時對細菌潛在的遺傳能力進行了預測,結(jié)果表明在陳化烤煙表面的主要細菌可以分為7門、36科、48屬,芽孢桿菌(Bacillus spp.)在兩種陳化烤煙表面普遍存在;該研究團隊通過重建未觀察到的狀態(tài)對群落進行系統(tǒng)發(fā)育研究(phylogenetic investigation of communities by reconstruction of unobserved states,PICRUSt),發(fā)現(xiàn)陳化烤煙微生物群落具有諸如香味的生物合成及降解有害化合物的潛在代謝能力。
Tyx等[34]以美國產(chǎn)的干鼻煙、濕鼻煙和蘇丹toombak為材料,用二代測序技術對其中細菌的多樣性和分類豐度(taxonomic abundances)進行了研究,結(jié)果表明細菌可以分為4門、33科,美產(chǎn)干鼻煙包括4門,濕鼻煙的優(yōu)勢門為硬壁菌門(Firmicutes),toombak的優(yōu)勢門為放線菌門(Actinobacteria)和硬壁菌門(Firmicutes),這為進一步研究無煙煙草產(chǎn)品獨特的微生物和化學環(huán)境奠定了基礎。Al-Hebshi等[35]以來自4個國家的無煙煙草(包括 American moist snuff,Swedish snus,Sudanese toombaks和Yemeni shammah)為材料,通過二代測序技術對其中細菌的組成和功能進行了研究,結(jié)果顯示:在物種水平上得到491個分類群(specieslevel taxa),分屬于11門、178屬;瑞典鼻煙的物種豐富度和多樣性最高,而Yemeni shammah最低,只含芽孢桿菌(Bacillus spp.);美國鼻煙中芽孢桿菌屬(Bacillus)、類芽孢桿菌屬(Paenibacillus)和大洋芽胞桿菌(Oceanobacillus spp.)的豐度最高;在假定的“高致癌性”產(chǎn)品中,編碼鎘/鋅和鎳轉(zhuǎn)運系統(tǒng)的基因很豐富。
常安然等[36]以四川涼山州健康現(xiàn)蕾期煙草的根際土為材料,利用Illumina MiSeq高通量測序技術對根際土壤細菌進行分析,發(fā)現(xiàn)環(huán)境因子有機質(zhì)、pH、含水量和土壤速效氮對健康現(xiàn)蕾期煙草根際土壤細菌有顯著影響。曹毅等[37]以貴州省煙草科學研究院福泉煙草青枯病病圃內(nèi)的土壤為材料,用454焦磷酸測序技術對土壤中的細菌組成進行了分析,其研究結(jié)果暗示部分細菌群落可能與煙草青枯病的發(fā)生相關。施河麗等[38]通過宏基因組測序?qū)η嗫莶“l(fā)病煙株與健康煙株的根際土壤的細菌群落進行了研究,發(fā)現(xiàn)健康煙株根際土壤的細菌多樣性、pH、養(yǎng)分及有益菌均要高于患病煙株根際土壤。張笑宇等[39]分析了易感黑脛病煙田與健康煙田煙草在不同生育期內(nèi)的根際土壤微生物動態(tài),發(fā)現(xiàn)在煙草生長過程中微生物多樣性呈下降趨勢,健康煙田的細菌多樣性優(yōu)于患病煙田,煙草患黑脛病主要與病原菌增加、土壤微生物群落結(jié)構(gòu)改變及多樣性降低有關。
張藝潔等[40]采用Illumina MiSeq高通量測序技術,對不同施肥處理下連作植煙土壤進行了細菌和真菌的多樣性分析。其研究結(jié)果表明施肥可以明顯改變連作土壤中細菌與真菌的結(jié)構(gòu),為種煙區(qū)土壤環(huán)境因子與微生物群落多樣性研究提供了理論依據(jù)。Xiao等[41]以湖南省境內(nèi)連續(xù)種植煙草1年、4年、5年和12年的土壤為材料,通過Illumina平臺對土壤微生物群落進行了分析。其研究結(jié)果表明冬季休耕期與作物生長后期的土壤微生物群落存在顯著差異;作物的發(fā)病與土壤細菌群落、冬季休耕期、作物生長后期某些細菌屬的存在顯著相關;在冬季休耕期,土壤細菌的豐度低,而由冬季休耕期向作物生長后期轉(zhuǎn)變時,土壤中的細菌豐度增加;在作物生長后期,由于土壤生物量低,故而這個時期傾向于病害高發(fā)。Lei等[42]以來自安徽省池州市的土壤為材料,通過高通量測序研究了煙-稻輪作耕作方式對土壤細菌多樣性和組成的影響。其研究結(jié)果表明用生石灰或白云石粉塵覆蓋煙草-水稻秸稈、減少施肥會對土壤性質(zhì)及微生物多樣性和組成產(chǎn)生影響;水稻秸稈還田可顯著提高土壤微生物的多樣性和豐度,而隨著施肥量的增加,土壤微生物的多樣性和豐度明顯降低,以上信息提示施肥量對細菌群落組成有影響。
穆淑媛[7]通過Illumina HiSeqTM2000平臺對煙草(N.tabacum)NC89進行了轉(zhuǎn)錄組測序,在對所得序列進行注釋后發(fā)現(xiàn)約有14.61%的單基因簇(unigenes)與植物的生長發(fā)育相關。龍妮[2]以N.glauca、N.noctiflora、N.cordifolia、N.knightiana、N.setchellii和N.tomentosiformis 6種煙草野生種為材料,通過Illumina HiSeq 2000平臺首次對這6種野生煙草的轉(zhuǎn)錄組進行了報道,并對其中的抗性基因、與抗性相關的轉(zhuǎn)錄因子及煙堿轉(zhuǎn)導基因進行了鑒定,為煙草抗病品種的選育提供了理論依據(jù)。表2列舉了N.sylvestris[26]、N.tomentosiformis[26]和N.benthamiana[43]3種煙屬植物基因轉(zhuǎn)錄組測序的相關信息,其測序所用材料涉及根、葉、花等煙草組織。
此外,Faino等[44]通過深度RNA測序測定了感染大麗輪枝菌(Verticillium dahliae)煙草N.benthamiana的轉(zhuǎn)錄組,發(fā)現(xiàn)其總轉(zhuǎn)錄組大小為38.7 Mb,與擬南芥的轉(zhuǎn)錄組相當。其研究結(jié)果為病原脅迫下的茄科模式植物提供了一個轉(zhuǎn)錄本目錄(catalogue of transcripts)。段勝常[45]以接種長柄鏈格孢菌(Alternaria longipes)和鏈格孢菌(Alternaria alternata)后的煙草V2和NC89為材料,通過Illumina HiSeq 2000平臺對其RNA進行轉(zhuǎn)錄組測序,篩選出了大量潛在的抗病基因,為煙草疾病預防及煙草育種方面的研究奠定了基礎。王新[46]通過對接種青枯菌菌株后的易感煙草和抗病煙草進行轉(zhuǎn)錄組測序,篩選出了大量以上調(diào)為主的差異基因,并發(fā)現(xiàn)在接種青枯菌后,煙草會啟動相關基因的表達及多條代謝通路以抵御病原菌的侵染。
Fan等[47]以感染甜菜壞死黃脈病毒(beet necrotic yellow vein virus,BNYVV)的煙草N.benthamiana為材料,通過基于轉(zhuǎn)錄組的深度測序揭示了煙草對含有或缺失RNA4的BNYVV侵染的應答。結(jié)果表明由甜菜壞死黃脈病毒的RNA4所引起的涉及RNA沉默、泛素-蛋白酶體途徑、纖維素合成和赤霉素代謝的基因的表達改變可在植物上表現(xiàn)出嚴重的癥狀。Geng等[48]以煙草N.benthamiana為材料,通過轉(zhuǎn)錄組測序研究了煙草脈帶花葉病毒(tobacco vein banding mosaic virus,TVBMV)野生型及減毒突變體接種對煙草轉(zhuǎn)錄組的影響,結(jié)果表明接種野生型及突變體1 d后,與翻譯相關的基因表達上調(diào),而與脂質(zhì)合成和代謝、應對胞外及外部刺激相關的基因則被下調(diào),在接種10 d后,與光合作用相關的基因被抑制;野生型及突變體對參與RNA沉默途徑的基因有不同程度的干擾;感染野生型病毒后,水楊酸和乙烯信號通路被誘導,而茉莉酸信號通路卻被抑制。Huang等[49]以煙草N.tabacum為材料,通過二代測序技術對感染番茄帶狀斑原卵病毒(tomato zonate spot orthotospovirus,TZSV)的煙草進行了轉(zhuǎn)錄組分析,在對煙草轉(zhuǎn)錄組從頭組裝后鑒定出135 395個單基因簇(unigenes);煙草感染TZSV后得到2 102個差異表達基因(differentially expressed genes,DEGs),其中1 518個DEGs被誘導,而584個DEGs則被抑制,該研究結(jié)果有助于進一步了解植物對正痘病毒(orthotospovirus)感染的復雜反應機制。Li等[50]通過HiSeqTM2500平臺對感染煙草曲莖病毒(tobacco curly shoot virus,TbCSV)的煙草N.benthamiana進行了轉(zhuǎn)錄組測序,發(fā)現(xiàn)油菜素內(nèi)酯(brassinosteroid,BR)和茉莉酸(jasmonic acid,JA)的合成及轉(zhuǎn)導相關基因顯著發(fā)生了改變,當植物(煙草植株)受到病毒侵染時,與植物防御系統(tǒng)相關的基因顯著上調(diào)表達,這些結(jié)果為煙草抵御病原菌侵擾奠定了研究基礎。
表2 3種煙屬植物的基因轉(zhuǎn)錄組測序Table 2 Transcriptome sequencing of three tobacco species
表3 二代測序技術用于煙草病毒的鑒定Table 3 Tobacco virus detection using next-generation sequencing technology
Chen等[51]以煙草系K326為材料,通過對煙草葉片進行干旱脅迫和干旱后澆水研究了煙草葉片中的干旱脅迫相關基因及microRNA,功能注釋表明表達顯著上調(diào)的基因與抗氧化、刺激和應激反應相關,而與細胞周期和光合作用過程相關的基因則表達下調(diào);在干旱條件下,5個microRNA家族(miR398、miR390、miR162、miR166 和miR168)存在差異調(diào)節(jié),該研究結(jié)果為從多個分子遺傳水平上進一步研究煙草響應干旱脅迫的分子機制奠定了基礎。張柳等[52]借助二代測序技術研究了煙草在逆境脅迫下(低降雨量)的基因表達情況,結(jié)果表明雨量降低時上調(diào)表達的基因大多是與抗旱以及離子運輸或者次生代謝物合成有關的基因(包括干旱脅迫基因及與黃酮類物質(zhì)和萜類吲哚生物堿合成相關的基因)。
二代測序技術除了可用于基因組測序、宏基因組測序和轉(zhuǎn)錄組測序外,還可用于煙草病毒的檢測與鑒定。王芳等[53]以安徽省的煙草樣品為材料,通過二代測序技術對煙草干擾小RNA(small interfering RNA,siRNA)進行了測序,以檢測煙草RNA病毒。結(jié)果顯示該方法可用于檢測煙草中的天然RNA病毒。王浩軍等[54]用二代測序技術對安徽皖南煙區(qū)的siRNA進行了測序,建立了一種可在田間對煙草病毒病進行檢測和發(fā)現(xiàn)煙草新病毒的體系,以實現(xiàn)對大田煙草病毒的調(diào)查。劉悅等[55]用二代測序技術建立了一種可用于檢測植物病毒的方法,為通過宏基因組檢測植物病毒奠定了基礎。二代測序技術不僅可對已有煙草病毒進行檢測,還可對某些地區(qū)新發(fā)現(xiàn)的煙草病毒進行鑒定。當前已有將二代測序技術用于煙草病毒鑒定的相關報道[56~57],表3所列病毒中的BrYV-AH和ChiVMV為安徽煙區(qū)首次發(fā)現(xiàn)。
雖然二代測序技術在當前市場上占有主導地位,但仍面臨儀器昂貴等劣勢,已經(jīng)無法滿足部分生命科學的研究。隨著科技的不斷進步、測序技術的不斷發(fā)展,以單分子實時測序技術為代表的三代測序技術(third-generation sequencing)已應用于酵母[58]、兔[59]、高粱[60]、玉米[61]、小麥[62]和棉花[63]等物種,而在煙草中只有漸狹葉煙草(N.attenuata)和歐布特斯煙草(N.obtusifolia)兩個野生煙草進行了第三代測序[11],其他煙草基因組則使用的是第二代測序技術和組裝方法,且部分注釋工作當時尚未完成。新技術的涌現(xiàn),將為煙草基因組、轉(zhuǎn)錄組等測序工作帶來契機,尚未完成基因組與轉(zhuǎn)錄組測序的煙草可把握時機,填補煙草基因組測序空缺,擴充并完善煙草基因組與轉(zhuǎn)錄組數(shù)據(jù)庫,構(gòu)建煙草基因組圖譜;同時可對之前已完成測序的煙草進行重測序、重注釋,以期發(fā)現(xiàn)或發(fā)掘新基因,便于加快煙草的育種進程及煙草抗逆機制的解析,為煙草行業(yè)的蓬勃發(fā)展奠定理論依據(jù)。