摘 要:柯薩奇病毒A組16型(Coxsackie virus A16,CoxA16)病毒是引起手足口病(Hand,foot and mouth disease,HFMD)的主要病原體。為了解不同地區(qū)CoxA16病毒株的系統(tǒng)進(jìn)化關(guān)系,收集了NCBI數(shù)據(jù)庫中注釋有具體地區(qū)分布的23條CoxA16全基因組序列,分別采用Kimura 2-parameter法和E距離法對(duì)病毒株進(jìn)行親緣關(guān)系分析。結(jié)果表明,基于E距離的系統(tǒng)進(jìn)化樹最大程度地吻合了Kimura 2-parameter遺傳距離法構(gòu)建的系統(tǒng)進(jìn)化樹,且E距離法普適性較強(qiáng),頗具應(yīng)用潛力,為更精確地判斷病毒株之間的進(jìn)化關(guān)系提供了一條新途徑。
關(guān)鍵詞:CoxA16病毒;全基因組;Kimura 2-parameter遺傳距離;E距離;進(jìn)化樹
中圖分類號(hào):Q939.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-060X(2014)17-0013-03
Phylogenetic Relationship of Coxsakie Virus A16 Based on Genomes Sequence and E Distance
XIANG Yan1,3,XU Xi-lin1,3,ZHANG Yong-sheng1,3,TAN Si-qiao1,3,LI Ke1,3,HU Xiao-tian1,3,ZHOU Wei1,2,3
(1.Hunan Key Laboratory for Biology and Control of Plant Diseases and Insect Pests, College of Plant Protection, Hunan Agricultural University, Changsha 410128, PRC; 2.Chenzhou Company , Hunan Tobacco Corporation, Chenzhou 423000, PRC; 3.Hunan Engineering Technology Research Center for Biopesticide and Pharmaceutic Processing, Hunan Agricultural University, Changsha 410128, PRC)
Abstract:Coxsackie virus A16(CoxA16)is a major etiological agent of the hand, foot and mouth disease(HFMD). To learn the phylogenetic relationship of CoxA16 genomes from different regions, all genomes of CoxA16 strains in NCBI were collected to construct genome phylogenetic trees based on Kimura 2-parameter and E distance. The results showed that the phylogenetic tree with E distance was the best fit to the one with Kimura 2-parameter distance;and E distance with wide adaption had the potential to analyze phylogenetic relationship in CoxA16. This study will provide a new method for CoxA16 evolution research.
Key words:coxsackie virus A16 (CoxA16);genome; Kimura 2-parameter distance; E distance; phylogenetic tree
收稿日期:2014-07-16
基金項(xiàng)目:國(guó)家自然科學(xué)基金青年項(xiàng)目(31301388);湖南省自然科學(xué)基金(14JJ3092);湖南省科學(xué)技術(shù)廳科技計(jì)劃項(xiàng)目(2014GK3046);湖南農(nóng)業(yè)大學(xué)大學(xué)生創(chuàng)新性實(shí)驗(yàn)計(jì)劃項(xiàng)目(71);中國(guó)博士后面上項(xiàng)目(2014M562109)
作者簡(jiǎn)介:向 妍(1988-),女,湖南祁東縣人,碩士研究生,主要從事生物信息學(xué)研究。
通訊作者:周 瑋
手足口?。℉and foot and mouth disease,HFMD)是一種常見的高發(fā)傳染病,全年均可發(fā)病,好發(fā)于夏秋季,以嬰幼兒發(fā)病為主。2008年以來,我國(guó)手足口病呈高流行態(tài)勢(shì)[1]。柯薩奇病毒A組16型(Coxsackie virus A16,CoxA16)病毒和腸道病毒71型(Entero virus 71,EV71)是引起HFMD的主要病原體。與EV71相比,CoxA16導(dǎo)致的HFMD癥狀較輕,極少引起嚴(yán)重的神經(jīng)系統(tǒng)癥狀。因此,針對(duì)CoxA16的基礎(chǔ)研究也較薄弱。
CoxA16病毒基因組為長(zhǎng)約7 410 bp的單股正鏈RNA,病毒顆粒呈球形,為二十面體立體對(duì)稱,無包膜。它包括5’端和3’端的非編碼區(qū)和中間一個(gè)單一、較長(zhǎng)的開放讀碼框架(Open Reading Frame,ORF),依次由VP4、VP2、VP3、VP1、2A、2B、2C、3A、3B、3C、3D共11個(gè)基因組成,主要編碼含2 193個(gè)氨基酸的多聚蛋白,可分為P1、P2、P3三個(gè)區(qū)。病毒外殼由結(jié)構(gòu)蛋白VP1、VP2、VP3和VP4構(gòu)成,其中VP1、VP2、VP3裸露于病毒外殼表面,VP4隱藏于病毒外殼內(nèi)[2]。2A到3D分別編碼P2、P3非結(jié)構(gòu)蛋白。
系統(tǒng)進(jìn)化分析是生物信息學(xué)中的重要研究領(lǐng)域,它的主要研究手段是從一組同源的DNA或蛋白質(zhì)序列出發(fā),計(jì)算各個(gè)序列之間的進(jìn)化距離,進(jìn)而構(gòu)建反映物種進(jìn)化關(guān)系的進(jìn)化樹。構(gòu)建進(jìn)化樹的方法主要分為三類,即距離法,簡(jiǎn)約法和似然法。距離法通過各個(gè)物種之間的比較,根據(jù)一定的假設(shè)(進(jìn)化距離模型)推導(dǎo)出類群之間的進(jìn)化距離,構(gòu)建一個(gè)進(jìn)化距離矩陣。該研究在鄰接法(Neighbor-Joining,NJ)的基礎(chǔ)上,以兩種不同距離矩陣構(gòu)造進(jìn)化樹。Kimura 2-parameter遺傳距離是目前常用的進(jìn)化樹構(gòu)建方法,E距離法則是以不同堿基電子共振能為基礎(chǔ),類比于群落相似性發(fā)展而來的新的距離方法[3]。該研究選取目前為止所有的CoxA16病毒株全基因序列進(jìn)行分析和研究,通過兩種不同距離方法構(gòu)建進(jìn)化樹,為CoxA16遺傳學(xué)背景和進(jìn)化關(guān)系研究提供更加適宜的距離矩陣模型。
1 材料與方法
1.1 試驗(yàn)數(shù)據(jù)來源
從美國(guó)國(guó)立生物技術(shù)信息中心(NCBI)下載全部CoxA16病毒株基因組序列(數(shù)據(jù)更新截至2013年11 月19 日)。為了數(shù)據(jù)的后續(xù)分析及準(zhǔn)確性,進(jìn)一步從獲得的病毒株序列中篩選出注釋有具體地區(qū)分布和多聚蛋白的病毒株CDS序列,作為分析對(duì)象。
1.2 距離法構(gòu)建進(jìn)化樹
1.2.1 基于Kimura 2-parameter模型的進(jìn)化樹構(gòu)造 采用NJ建樹時(shí),蛋白質(zhì)序列常使用Poisson Correction模型,核酸序列常使用Kimura 2-parameter模型。該研究以基因組序列為對(duì)象,故選擇Kimura 2-parameter模型構(gòu)造進(jìn)化樹。普遍認(rèn)為,當(dāng)Bootstrap值>70時(shí),認(rèn)為構(gòu)建的進(jìn)化樹較為可靠。如果Bootstrap值太低,則進(jìn)化樹拓?fù)浣Y(jié)構(gòu)可能有誤,進(jìn)化樹不可靠。因此,該研究將Bootstrap值設(shè)置為1 000。在MEGA 5.1中打開序列文件,輸入數(shù)據(jù)類型選擇“Nucleotide Sequences”,從Substitution Model中選擇“Kimura 2-parameter model”,再點(diǎn)擊“Compute”,構(gòu)建進(jìn)化樹。
1.2.2 基于E距離參數(shù)模型的進(jìn)化樹構(gòu)造 E距離矩陣是類比于群落間相似性而產(chǎn)生的。在群落生態(tài)學(xué)中,為了準(zhǔn)確地對(duì)群落分類,除研究種間關(guān)連度以外,還可比較兩個(gè)群落之間的相似程度。根據(jù)群落中的物種數(shù)來估計(jì)相似性指數(shù),公式為s=2c/(a+b),其中s為相似性指數(shù),a為樣本(或群落)A中物種數(shù),b為樣本(或群落)B中的物種數(shù),c為兩樣本(或兩群落)中共有的物種數(shù)[4]。與相似性指數(shù)相對(duì)應(yīng)的相異性指數(shù),計(jì)算公式為D=1-S。若將待比較的兩個(gè)序列看作兩個(gè)群落并按位比較,可用群落相異性指數(shù)公式來計(jì)算兩個(gè)群落序列間的分子進(jìn)化距離。按能量計(jì)算群落相異性指數(shù),已知各堿基電子共振能比值為A‥G‥C‥T=0.32‥0.27‥0.23‥0.17,
類似地,E距離可定義為:E=1-2c /(a+b)。其中a為序列A的分子能量,b為序列B的分子能量,c為序列A和序列B相同的分子能量。E距離最大程度地吻合了形態(tài)學(xué)分類結(jié)果。實(shí)驗(yàn)室在前期研發(fā)了計(jì)算序列兩兩比對(duì)與E距離計(jì)算批處理程序,成功地應(yīng)用于以堿基分子質(zhì)量和二電子共振為基礎(chǔ)的研究中。因此,該研究也采用此程序,先得到序列之間的E距離矩陣,而后利用MEGA5.1構(gòu)建基于NJ法和E距離參數(shù)模型的系統(tǒng)進(jìn)化樹。
2 結(jié)果與分析
2.1 CoxA16參考病毒株信息
截止至2013年11 月19 日,GanBank共收錄48條CoxA16病毒株基因組序列,去掉地區(qū)注釋不明的序列后共保留23條(覆蓋至我國(guó)8個(gè)省市和4個(gè)外國(guó)國(guó)家),長(zhǎng)度介于7 278~7 439 bp之間;它們的CDS長(zhǎng)度相同,均為6 582 bp。所選病毒株分離時(shí)間介于1994~2011年間,其中廣東省分離的毒株最多(表1)。
2.2 兩種類型進(jìn)化樹的比較
Kimura 2-parameter距離矩陣,E距離矩陣見表2,由此構(gòu)建的CoxA16 23條病毒株的系統(tǒng)發(fā)育樹見圖1。從表2中可以看出,目前流行病毒株之間的親緣關(guān)系較近,且與最早出現(xiàn)的南非原型株(G10)之間已有一定差異;只有安徽阜陽病毒株(FY18)和原型毒株(G10)距離最近,這與其他相關(guān)研究的結(jié)論一致[5]。
由圖1可知,兩種不同距離進(jìn)化樹基本一致,23條CoxA16病毒株基本分為3個(gè)大的分支。這說明基于E距離構(gòu)建進(jìn)化樹的方法是可行的。Kimura 2-Parameter distance法和E距離法構(gòu)建的系統(tǒng)進(jìn)化樹唯一的差別在于馬來西亞的PM07病毒株和PM99病毒株的進(jìn)化距離。在Kimura 2-Parameter distance法構(gòu)建的系統(tǒng)進(jìn)化樹中,PM00和KO08聚為一類,再與PM07、PM99并列聚為一類;而在E距離法構(gòu)建的系統(tǒng)進(jìn)化樹中,PM00和KO08聚為一類,再與PM99聚為一類,然后再與PM07聚為一類。
3 小結(jié)與討論
多序列比對(duì)計(jì)算距離矩陣是一種傳統(tǒng)的系統(tǒng)進(jìn)化樹構(gòu)建方法,但是當(dāng)序列數(shù)目較多時(shí),其結(jié)果難免會(huì)出現(xiàn)偏差[6]。而MEGA提供了包括Kimura 2-parameter距離在內(nèi)的十余種不同的距離指標(biāo),雖然這些距離都不同程度地存在一定的局限性,例如常用的Kimura
2-parameter距離雖然考慮了轉(zhuǎn)換和顛換的替換率差異并做了校正,但其對(duì)不同位點(diǎn)替換速率相等和核苷酸頻率相等的假定在多數(shù)情況下并不成立。因此,研究針對(duì)病毒株的全基因組序列構(gòu)建了基于E距離的系統(tǒng)進(jìn)化樹構(gòu)建新方法。結(jié)果表明,E距離法構(gòu)建的系統(tǒng)進(jìn)化樹與Kimura 2-parameter距離法構(gòu)建的系統(tǒng)進(jìn)化樹實(shí)現(xiàn)了最大程度地吻合,且E距離法普適性較強(qiáng),頗具應(yīng)用潛力,為更精確地判斷病毒株之間的進(jìn)化關(guān)系提供了一條新途徑,但其應(yīng)用效果還需更多實(shí)例來驗(yàn)證。
參考文獻(xiàn):
[1] 郭瑞玲,李燕霞,馬艷霞,等. 腸道病毒CoxA16 IgG血清流行病學(xué)研究[J]. 中華疾病控制雜志,2011,15(9):819-821.
[2] 衛(wèi)燦東,李琳琳,何雅晴,等. 中國(guó)柯薩奇病毒A組16型部分VP1區(qū)序列測(cè)定及系統(tǒng)進(jìn)化分析[J]. 病毒學(xué)報(bào),2005,21(3):223-227.
[3] 袁哲明,歐陽芳,吉洪湖,等. 基于堿基分子質(zhì)量和π電子共振能的幾種新距離在系統(tǒng)發(fā)育重建中的應(yīng)用[J]. 生命科學(xué)研究,2005,9(1):77-83.
[4] 張孝曦,李運(yùn)甓,陳常銘. 昆蟲生態(tài)及預(yù)測(cè)預(yù)報(bào)[M]. 第三版. 北京:中國(guó)農(nóng)業(yè)出版社,2002. 158-160.
[5] 高風(fēng)華,郭中敏,陸家海. 148 株柯薩奇病毒A組16型的多序列比對(duì)及遺傳進(jìn)化分析[J]. 中華疾病控制雜志,2012,16(5):400-403.
[6] 王方圓. 基于序列兩兩比較的進(jìn)化樹構(gòu)造方法研究[D]. 北京:北京工業(yè)大學(xué)碩士學(xué)位論文,2008.
(責(zé)任編輯:成 平)