陳琦 吉嘉銘 徐逸卿
摘 要:物種進(jìn)化樹的構(gòu)建分析是比較基因組學(xué)中的重要研究內(nèi)容,為了探索和推測煙草的進(jìn)化關(guān)系和演變進(jìn)程,本研究對茄目茄科的一年生野生煙草的線粒體基因組序列進(jìn)行分析。其基因組中包括40個(gè)蛋白編碼基因、4個(gè)rRNA基因和23個(gè)tRNA基因?;谕暾募?xì)胞器基因組和其他27種植物物種,采用MTTree構(gòu)建了一棵鄰接的系統(tǒng)發(fā)育樹,借助其完備的基因組數(shù)據(jù)庫和完善的可視化功能用于評估它們的系統(tǒng)關(guān)系和演化進(jìn)程。完整線粒體基因組及系統(tǒng)發(fā)育樹將有助于進(jìn)一步分析煙草屬的物種,為茄目茄科植物的進(jìn)化與起源提供了重要的依據(jù)。
關(guān)鍵詞:煙草;MTTree;系統(tǒng)發(fā)育樹;線粒體基因組
中圖分類號:Q941+.2 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-2064(2019)08-0041-03
0 引言
煙草Nicotiana attenuata屬茄目茄科,是一種生長在北美洲西部的一年生草本植物。由于在其自身本土環(huán)境中與不同的植物、昆蟲和微生物之間豐富多樣的相互作用,煙草自1994年起被用作生態(tài)模式物種[1]。煙草可以誘導(dǎo)尼古丁、揮發(fā)物和酚醛類物質(zhì)相互反應(yīng),具備一定的藥用價(jià)值。
本研究采用煙草線粒體基因組構(gòu)建了系統(tǒng)發(fā)育樹。線粒體在細(xì)胞的代謝調(diào)節(jié)中起重要的作用[2],攜帶了遺傳信息,是分析生物進(jìn)化的重要材料。研究組合了完整的煙草線粒體基因組序列,提供更加完整的信息以便于分析煙草的原始生長環(huán)境和其他的煙草物種合成尼古丁的交互作用。系統(tǒng)發(fā)育樹是一種分支圖,顯示了各實(shí)體之間的推斷進(jìn)化關(guān)系。[3]傳統(tǒng)的系統(tǒng)遺傳學(xué)依賴于通過測量和量化具有代表性的生物的表型特性獲得的形態(tài)學(xué)數(shù)據(jù),現(xiàn)今的分子系統(tǒng)遺傳學(xué)則使用編碼基因或核苷酸序列作為分類的依據(jù)。
1 材料和方法
1.1 實(shí)驗(yàn)數(shù)據(jù)
本實(shí)驗(yàn)采用了煙草Nicotiana attenuata和其他27種植物的線粒體基因組數(shù)據(jù)來構(gòu)建系統(tǒng)發(fā)育樹,從而分析研究煙草及相近物種的親緣關(guān)系和進(jìn)化過程。煙草是一個(gè)生態(tài)模式物種,基因組長約2.26Gb,高于植物模式物種擬南芥。從基因數(shù)據(jù)中選用其保守的蛋白編碼基因,這些保守序列在物種進(jìn)化過程中基本不變[4]且突變速率慢,是研究生物進(jìn)化的可靠材料。
1.2 實(shí)驗(yàn)工具軟件
以線粒體細(xì)胞器基因組數(shù)據(jù)來構(gòu)建系統(tǒng)發(fā)育樹是比較基因組學(xué)的重要內(nèi)容。早期的軟件多使用基于距離矩陣的聚類算法,不斷合并距離最小的兩個(gè)節(jié)點(diǎn)同時(shí)構(gòu)建新的距離矩陣。新的算法使用最大似然法和最大簡約法如RAxml[5],使用序列對比的ClustalW[6]以及使用鄰接法的 MrBayes[7]等。計(jì)算之前需要使用者自主尋找并上傳相應(yīng)的基因數(shù)據(jù)或序列文件。上述軟件側(cè)重?cái)?shù)據(jù)的計(jì)算,絕大多數(shù)都沒有提供可視化的輸出接口。MTTree(http://bio.njfu.edu.cn/MTTree/service/)是一個(gè)使用線粒體基因組構(gòu)建系統(tǒng)發(fā)育樹的在線平臺。自發(fā)布以來已得到了廣泛應(yīng)用,便捷的數(shù)據(jù)選擇和自由的計(jì)算方式以及可視化結(jié)果極大提高了效率,相比其他軟件最大的優(yōu)勢在于無需提前從全球各數(shù)據(jù)庫下載基因序列,若有自主測序所得的序列也可直接上傳至平臺。如表所示,經(jīng)比較本研究選用MTTree構(gòu)建系統(tǒng)發(fā)育樹。
MTTree的數(shù)據(jù)庫提供了所有已被NCBI收錄的線粒體基因組數(shù)據(jù),可選擇物種并挑選需要的基因。許多建樹軟件僅提供命令行操作,不便于生物領(lǐng)域的科研人員使用。高通量測序逐漸普及,獲取到大量基因數(shù)據(jù)并被更新到數(shù)據(jù)庫,阻礙了精細(xì)化分析。MTTree整合了使用不同算法的軟件,并提供了圖形界面的可視化操作,計(jì)算完成后會自動將數(shù)據(jù)結(jié)果繪制成樹狀圖,顯示效果直觀便于分析比對。
2 方法
本研究面向煙草的線粒體基因組數(shù)據(jù),利用MTTree平臺的線粒體基因組數(shù)據(jù)庫和系統(tǒng)發(fā)育樹構(gòu)建能力對煙草和另外27個(gè)植物物種的基因數(shù)據(jù)進(jìn)行匹配比對、構(gòu)建系統(tǒng)發(fā)育樹并將數(shù)據(jù)結(jié)果可視化,最終獲取一幅直觀的樹狀圖,為做進(jìn)一步的相關(guān)研究提供依據(jù)。系統(tǒng)發(fā)育樹的構(gòu)建流程如圖1所示。研究人員從線粒體基因數(shù)據(jù)庫中檢索挑選所需用于實(shí)驗(yàn)的物種,或自主上傳物種基因數(shù)據(jù)。MTTree從數(shù)據(jù)庫中檢索出基因數(shù)據(jù)并進(jìn)行基因片段的比對,在各物種基因序列中高頻出現(xiàn)的相同或相似的基因?qū)⒈粰z索出來用于建樹,以提高計(jì)算精度。通過數(shù)據(jù)迭代和高頻檢索的方式向真實(shí)的物種進(jìn)化發(fā)育過程靠近。研究人員可選用鄰接法、貝葉斯法、MCMC法等不同的算法來構(gòu)建發(fā)育樹,配置可通過圖形界面完成。
首先在物種選擇頁使用物種名或RefSeq編號選擇煙草和其他27個(gè)植物物種(Citrullus lanatus、Cucumis sativus, Cucurbita pepo,Glycine max, Lotus japonicas,Medicago truncatula,Vitis vinifera,Malus domestica,Gossypium raimondii,Carica papaya,Batis maritima,Arabidopsis thaliana,Brassica napus,Ajuga reptans, Salvia miltiorrhiza,Asclepias syriaca,Rhazya stricta,Capsicum annuum,Nicotiana tabacum,Phoenix dactylifera,Oryza sativa,Triticum aestivum,Sorghum bicolor,Zea mays,Cycas taitungensis,Ginkgo biloba,Marchantia polymorpha)?;蜻x擇界面提供了這28個(gè)物種的全部基因供研究人員選擇。該界面默認(rèn)提供了自動選擇的功能,能夠自主計(jì)算配對選在物種間重復(fù)頻率最高的基因。本研究選中23個(gè)保守的蛋白編碼基因。為滿足不同使用者的不同需求,如計(jì)算算法、迭代次數(shù)、是否使用核苷酸序列、生成格式等參數(shù),所需物種序列列表,所選基因列表等原始數(shù)據(jù)都可以由研究人員自主確定。
3 結(jié)果和分析
以上的系統(tǒng)發(fā)育樹構(gòu)建方法及作圖對揭示煙草及茄科的親源關(guān)系、進(jìn)化歷史等過程具有積極的作用。本研究使用MTTree計(jì)算構(gòu)建煙草的系統(tǒng)發(fā)育樹數(shù)據(jù)結(jié)果如圖2所示,共耗時(shí)22小時(shí)20分鐘以鄰接矩陣法對基因數(shù)據(jù)進(jìn)行了1萬次迭代計(jì)算。樹的每個(gè)分支的末端是該物種的編號,節(jié)點(diǎn)上的數(shù)字是引導(dǎo)參考值。結(jié)果以Newick格式描述了各物種結(jié)點(diǎn)之間的分支關(guān)系和邊緣長度。如圖3所示,MTTree將Newick格式的數(shù)據(jù)結(jié)果進(jìn)行了可視化的處理提供了直角生成樹。由此樹中獲得的各個(gè)物種間的親緣關(guān)系與進(jìn)化歷程與YiqingXu等人的研究結(jié)果大致一致[8]。
4 結(jié)果和分析
計(jì)算建樹軟件的出現(xiàn)和普及極大的推動了系統(tǒng)發(fā)育學(xué)的發(fā)展。近年來更多的工具能簡便高效地建立一個(gè)物種的系統(tǒng)發(fā)育樹。通過比對,我們發(fā)現(xiàn)煙草與同屬茄目的辣椒在基因序列上具有極高的相似性,進(jìn)化歷程十分接近,推測這兩個(gè)物種可能有著相同的祖先。本研究結(jié)合了MTTree的基因組數(shù)據(jù)庫以及高質(zhì)量的圖形計(jì)算界面和可視化服務(wù),直觀地表現(xiàn)出了煙草及其他一些物種的進(jìn)化歷程和親緣關(guān)系,推測了煙草和辣椒的相似性,為追溯茄目植物的起源提供了重要的依據(jù)。
參考文獻(xiàn)
[1]]Ian T. Baldwin,Lynn Staszak-Kozinski,Robert Davidson. Up in smoke: I. Smoke-derived germination cues for postfire annual, Nicotiana attenuata torr. Ex. Watson[J].Journal of Chemical Ecology,1987,20(9).
[2]Binbin Lei,Shuangshuang Li,Guozheng Liu,Zhiwen Chen,Aiguo Su,Pengbo Li,Zhaohu Li,Jinping Hua. Evolution of mitochondrial gene content: loss of genes, tRNAs and introns between Gossypium harknessii and other plants[J].Plant Systematics and Evolution,2013,299(10):1889-97.
[3]Hodge T , Cope M J T V . A Myosin Family Tree[J]. Journal of Cell Science,2000,113 Pt 19(19):3353-3354.
[4]Ohta K T . On Some Principles Governing Molecular Evolution[J]. Proceedings of the National Academy of Sciences of the United States of America,1974,71(7):2848-2852.
[5]Stamatakis A . RAxML-VI-HPC : maximum likelihood-based phylogenetic analyses with thousands of taxa and mixed models[J].Bioinformatics,2006,22.
[6]Chenna R, Sugawara H, Koike T, et al. Multiple sequence alignment with the Clustal series of programs[J].Nucleic Acids Research,2003,31(13):3497-500.
[7]Huelsenbeck JP, Ronquist F.MRBAYES: Bayesian inference of phylogenetic trees[J].2001,17(8):754-5.
[8]Yiqing Xu,F(xiàn)uquan Zhang,Kun Hu. The complete mitochondrial genome sequence of an annual wild tobacco Nicotiana attenuata[J]. Mitochondrial DNA Part B,2017,2(2).