甕青芬, 趙卓, 曹振民, 翟卿
(河南農(nóng)業(yè)大學植物保護學院,河南 鄭州 450002)
蝴蝶是重要的環(huán)境指示昆蟲,種類眾多。菜粉蝶(Pierisrapae)隸屬于鱗翅目 (Lepidopetera),粉蝶科(Pieridae),粉蝶屬(Pieris),在中國各地都有分布。菜粉蝶幼蟲主要危害十字花科、百合科、菊科等9科35種植物[1]。目前有關菜粉蝶的研究主要集中在外部形態(tài)、線粒體基因組特征和系統(tǒng)發(fā)育、生態(tài)毒理、電生理等方面[2-6]。昆蟲線粒體基因組是閉合環(huán)狀的雙鏈DNA分子,包括37個基因和一段控制區(qū),37個基因包括13個蛋白質(zhì)編碼基因(PCG)、22個轉(zhuǎn)運RNA基因(tRNA)和2個核糖體RNA(rRNA),控制區(qū)又叫A+T富含區(qū)[7]。線粒體基因組進化速率較快、結(jié)構(gòu)簡單、含有豐富的遺傳進化信息[8-9]。許多學者也對粉蝶科不同屬進行了不同的研究。如許麗等[10]基于線粒體cox1和cytb基因得出黃粉蝶亞科不是單系群,遷粉蝶亞科和豆粉蝶亞科聚為一支,粉蝶屬、云粉蝶屬和飛龍粉蝶屬有較近的關系。汪江等[11]基于nad1和cox1基因部分序列,以靈奇尖粉蝶為外群,對中國遷粉蝶屬的系統(tǒng)發(fā)育關系進行分析。倪艷等[12]基于cox1、cox2和cytb基因部分序列分析了斑粉蝶屬系統(tǒng)發(fā)育。郝娟娟[13]基于線粒體基因組對6種粉蝶的系統(tǒng)發(fā)育關系進行分析,得出粉蝶屬與襟粉蝶屬互為姐妹群關系,斑粉蝶屬與絹粉蝶屬互為姐妹群關系。丁昌萍等[14]基于cox1和EF-1α基因得出妹粉蝶屬應歸于絹粉蝶屬。本研究基于線粒體基因組對菜粉蝶和粉蝶科部分屬間系統(tǒng)發(fā)育關系進行分析,以期為粉蝶科屬級分類階元的系統(tǒng)發(fā)育提供依據(jù)。
本研究所用的菜粉蝶成蟲體長17 mm,翅展52 mm,于2019-8-20采自魯山縣堯山鎮(zhèn)西大河,無水乙醇里浸泡,-20 ℃冰箱保存。
取1只完整菜粉蝶胸部肌肉組織,根據(jù)天根公司血液/細胞/組織基因組DNA提取試劑盒(TIANamp Genoic DNA Kit)步驟獲取總DNA。
總DNA由中國北京諾和基因生物信息技術有限公司利用Illumina HiSeq 2500平臺進行二代測序,將得到的原始序列利用NGS QC工具箱[15]修剪序列片段,刪除低質(zhì)量序列、未配對序列,質(zhì)控后序列利用IDBA-tran[16]來進行組裝拼接。
將組裝拼接得到的contigs通過IDBA-tran構(gòu)建Blast本地數(shù)據(jù)庫,利用GenBank中已有近緣種的線粒體基因組進行比對搜索,將比對得到的近似線粒體基因組序列基于默認設置并選擇無脊椎動物線粒DNA(invertebrate mitochondrial DNA,InvMtDNA),在Mitos(http://mitos.bioinf.uni-leipzig.de/index.py)[17]下注釋分析,將分析后的線粒體基因組在NCBI Blast 和BOLD 數(shù)據(jù)庫進行分子鑒定,該線粒體基因組屬于菜粉蝶(Pierisrapae),與形態(tài)鑒定結(jié)果一致[18]。
蛋白質(zhì)編碼基因利用MEGA 5 軟件[19]翻譯比對。使用Gblocks v0.91[21]刪除模糊對齊的位點,每一個tRNA和rRNA基因都在MAFFT[20]服務器上對齊,采用“E-INS-i”策略。使用Gblocks v0.91[21]對對齊不良的區(qū)域進行修剪。不同基因類型的比對用FASconCAT_v1.0連接[22]。編制3種不同的連鎖矩陣:(1)PCG_nt(13個PCGs的核苷酸序列),(2)PCG_aa(13個PCGs的氨基酸序列),(3)PCGnt+RNA(13個PCGs、22個tRNA基因和2個rRNA基因的組合核苷酸序列)。
利用OGDRAW網(wǎng)站(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)繪制線粒體基因組結(jié)構(gòu)圖。使用MEGA 5軟件[19]對菜粉蝶線粒體基因組的13個蛋白質(zhì)編碼基因(PCG)密碼子使用頻率和堿基組成進行分析。根據(jù)Mitos分析結(jié)果繪制22個tRNA二級結(jié)構(gòu)。
本研究基于菜粉蝶線粒體基因組結(jié)合GenBank中已有的16個(13種粉蝶和作為外群的3種蛾,登錄號見圖3)線粒體基因組數(shù)據(jù)構(gòu)建系統(tǒng)發(fā)育樹,利用IQ-TREE(http://iqtree.cibiv.univie.ac.at/)網(wǎng)上服務器[23-24]構(gòu)建最大似然樹(ML),使用的模型如表1,最大似然樹的節(jié)點支持率由自舉檢驗置信度(3 000次重復)進行評估。在CIPRES Science Gateway(https://www.phylo.org/portal2/login!input.action) 網(wǎng)上服務器用MrBayes構(gòu)建貝葉斯樹(BI),貝葉斯樹的節(jié)點支持率由貝葉斯后驗概率(Bayesian posterior probabilities)表示。
表1 ModelFinder選擇的分區(qū)方案和最適合的模型Table 1 The partitioning scheme and the best-fitting models selected by ModelFinder
菜粉蝶(P.rapae)的線粒體基因組長度為15 106 bp,包括37個基因和一段控制區(qū),其中,A、T、G、C的平均含量分別為35.4%、43.6%、11.2%、9.8%,A+T的含量明顯高于G+C的含量。菜粉蝶線粒體基因組結(jié)構(gòu)如圖1所示,基因組注釋結(jié)果如表2。線粒體基因組提交至NCBI數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/WebSub/),登錄號為MW448362。
13個蛋白質(zhì)編碼基因的A、T、G、C的平均含量分別為33.2%、44.8%、11.3%、10.6%,A+T的含量明顯高于G+C的含量。其中cox1、cox2、nad2、nad3、nad4、nad4L、nad5、nad6、cox3、cytb、atp8和atp6基因的起始密碼子均為典型的ATN,nad1
注:加粗線條外側(cè)表示基因方向為順時針,內(nèi)側(cè)表示基因方向為逆時針。 Note: The outer circle indicates that the gene direction is clockwise, while the inner circle indicates that the gene direction is anticlock wise.圖1 菜粉蝶線粒體基因組結(jié)構(gòu)Fig.1 Mitochondrial genome structure of Pieris rapae
表2 菜粉蝶線粒體基因組注釋結(jié)果
基因的起始密碼子為GTG;nad1、nad2、nad4、nad4l、nad6、cox1、cox2、cox3、cytb和atp6基因的終止密碼子均以TAA或TAG結(jié)尾,nad3基因以TAG結(jié)尾,nad5基因以ATT結(jié)尾,atp8基因以TGA結(jié)尾。13個蛋白質(zhì)編碼基因的密碼子平均使用頻率中,亮氨酸(Leu)、異亮氨酸(Ile)、苯丙氨酸(Phe)和絲氨酸(Ser)平均使用頻率較高,依次是14.605%、11.701%、10.193%和8.824%。半胱氨酸(Cys)、精氨酸(Arg)、谷氨酰胺(Gln)、天冬氨酸(Asp)和組氨酸(His)使用頻率較低,分別是0.894%、1.452%、1.620%、1.731%和1.731%。atp8基因中出現(xiàn)的氨基酸種類最少,谷氨酸(Glu)、天冬氨酸(Asp)、組氨酸(His)、丙氨酸(Ala)、精氨酸(Arg)、甘氨酸(Gly)、蘇氨酸(Thr)和纈氨酸(Val)未出現(xiàn)。半胱氨酸(Cys)未出現(xiàn)在atp6、nad6和cox1基因中,nad2基因中未出現(xiàn)組氨酸(His)、纈氨酸(Val)和天冬氨酸(Asp),出現(xiàn)19種氨基酸的基因有4個,有7個基因序列中出現(xiàn)20種氨基酸。13個蛋白質(zhì)編碼基因的密碼子使用頻率如表3所示。
表3 菜粉蝶線粒體基因組13個蛋白質(zhì)編碼基因密碼子使用頻率Table 3 Relative synonymous codon usage of 13 protein-coding genes of the mitochondrial genome of Pieris rapae
菜粉蝶線粒體基因組中22個tRNA基因的A、T、G、C的含量分別是41.1%、39.2%、11.3%和8.5%,A+T的含量大于G+C的含量。22個tRNA基因的二級結(jié)構(gòu)除trnS1之外皆是典型的三葉草結(jié)構(gòu),trnS1基因缺失DHU臂,二級結(jié)構(gòu)如圖2。每個tRNA基因的長度范圍均在60~71 bp之間。trnG、trnA、trnR、trnN、trnS1、trnE、trnT、trnS2、trnM、trnI、trnW、trnL2、trnK和trnD14個基因由H鏈編碼,另8個基因由L鏈編碼。堿基配對中大多為A-U和G-C,遵循Waston-Crick配對規(guī)律,也有G-U非典型配對和堿基錯配現(xiàn)象。trnA、trnC、trnF、trnG、trnH、trnI、trnL1、trnL2、trnM、trnP、trnQ、trnS1、trnV和trnW出現(xiàn)了非典型配對G-U,trnC和trnS2出現(xiàn)了U-U堿基配對,trnS2還出現(xiàn)了A-G堿基配對,可能是昆蟲線粒體基因組欠缺DNA重組功能導致。
菜粉蝶線粒體基因組中rrnS基因的長度為774 bp,位于trnM和trnV之間,A+T和G+C的含量分別是85.5%和14.5%,rrnL基因的長度為1 262 bp,位于trnL1和trnV之間,A+T和G+C的含量分別是82.7%和17.2%。
控制區(qū)又叫A+T富含區(qū),是線粒體基因組的非編碼序列,菜粉蝶線粒體基因組控制區(qū)位于rrnS基因和trnM基因之間,長度為381 bp。
本研究使用DAMBE軟件用XIA[25]的方法選擇無脊椎動物線粒體 DNA第5套密碼子表對核苷酸序列進行核苷酸替代飽和性分析,分析結(jié)果顯示序列不飽和(Iss=0.259 9,Iss.cSym=0.843 1,Iss.cAsym=0.663 3;Iss:替換飽和指數(shù);Iss.cSym: 假設拓撲結(jié)構(gòu)對稱;Iss.cAsym: 假設拓撲結(jié)構(gòu)不對稱)。
以紫斑谷螟(Pyralisfarinalis)、家蠶(Bombyxmori)和美國白蛾(Hyphantriacunea)作為外群,基于不同屬的14種粉蝶的線粒體基因組的13個蛋白質(zhì)編碼基因的核苷酸序列構(gòu)建ML樹和BI樹。2種樹的拓撲結(jié)構(gòu)一致,僅自舉檢驗置信度和貝葉斯后驗概率不同,用一棵樹表示,如圖3。粉蝶科屬間的系統(tǒng)發(fā)育關系為:((襟粉蝶屬Anthocharis+鶴頂粉蝶屬Hebomoia)+(((絹粉蝶屬Aporia+妹粉蝶屬Mesapia)+斑粉蝶屬Delias)+尖粉蝶屬Appias)+((粉蝶屬Pieris+飛龍粉蝶屬Talbotia)+云粉蝶屬Pontia)))+(黃粉蝶屬Eurema+((遷粉蝶屬Catopsilia+豆粉蝶屬Colias)+鉤粉蝶屬Gonepteryx))。絹粉蝶屬與妹粉蝶屬互為姐妹群,所組類群與斑粉蝶屬互為姐妹群;尖粉蝶屬單獨成一支;粉蝶屬與飛龍粉蝶屬互為姐妹群,兩者組成的類群和云粉蝶屬互為姐妹群;遷粉蝶屬與豆粉蝶屬互為姐妹群,所組類群與鉤粉蝶屬互為姐妹群;襟粉蝶屬和鶴頂粉蝶屬互為姐妹群。
注:+表示GU非典型配對。 Note:+ means GU atypical pairing.圖2 菜粉蝶線粒體基因組22個tRNA基因二級結(jié)構(gòu)Fig.2 The secondary structure of 22 tRNA genes in the mitochondrial genome of Pieris rapae
菜粉蝶線粒體基因組總長度為15 106 bp,包括37個基因和一段控制區(qū)。菜粉蝶線粒體基因組排列方向和順序與已測的其他鱗翅目線粒體基因組方向和順序一致[26-28],未發(fā)生基因重排與缺失。分析線粒體基因組中13個蛋白質(zhì)編碼基因、22個tRNA基因和2個rRNA基因的核苷酸組成,發(fā)現(xiàn)A+T的含量明顯高于G+C的含量,這表明了菜粉蝶線粒體基因組具有明顯的AT偏向性,符合昆蟲線粒體基因組有AT偏向性的特點。
在13個蛋白質(zhì)編碼基因中發(fā)現(xiàn)有11個基因的起始密碼子為典型的ATN。半胱氨酸(Cys)未出現(xiàn)在atp6、nad6和cox1基因中,nad2基因中未出現(xiàn)組氨酸(His)、纈氨酸(Val)和天冬氨酸(Asp),出現(xiàn)19種氨基酸的基因有4個,有7個基因序列中出現(xiàn)20種氨基酸。菜粉蝶線粒體基因組中的tRNA基因,除trnS1之外,有21個基因二級結(jié)構(gòu)皆是典型的三葉草結(jié)構(gòu),trnS1基因缺失DHU臂,這在蛺蝶類、絹蝶類、灰蝶類中也出現(xiàn)過[26,29-31]。每個tRNA基因的長度范圍均在60~71 bp之間,有14個基因由H鏈編碼,8個基因由L鏈編碼。堿基配對中大多遵循Waston-Crick配對A-U和G-C,有G-U堿基配對現(xiàn)象,也有一些堿基錯配現(xiàn)象,如U-U堿基配對、A-G堿基配對。
注:節(jié)點旁數(shù)字表示2個樹的節(jié)點支持率,左邊是ML樹的支持率,右邊是BI樹的后驗概率。 Note:The numbers near the nodes indicate the nodal support rate of the two trees. The left is the bootstrap support for the ML tree, and the right is the posterior probability for the BI tree.圖3 最大似然法和貝葉斯法構(gòu)建的基于線粒體基因組13個蛋白質(zhì)編碼基因核苷酸序列的系統(tǒng)發(fā)育樹Fig.3 A phylogenetic tree constructed by the maximum likelihood and Bayesian methods based on the nucleotide sequence of 13 protein-coding genes in the mitochondrial genome
本研究構(gòu)建了14種蝴蝶的ML樹和BI樹,分析粉蝶科屬間的系統(tǒng)發(fā)育關系,得到的2種樹的拓撲結(jié)構(gòu)一致。分析后發(fā)現(xiàn)粉蝶屬和飛龍粉蝶屬互為姐妹群,親緣關系較近,節(jié)點支持率為99,它們與云粉蝶屬構(gòu)成姐妹群,節(jié)點支持率為100。豆粉蝶屬與遷粉蝶屬互為姐妹群,兩者和鉤粉蝶屬互為姐妹群,此結(jié)果與許麗等[10]和丁昌萍[32]結(jié)果一致。妹粉蝶屬與絹粉蝶屬互為姐妹群,此結(jié)果與丁昌萍[14,32]結(jié)果有差異,丁昌萍支持將妹粉蝶屬并入絹粉蝶屬。鶴頂粉蝶屬和襟粉蝶屬互為姐妹群,此結(jié)果與曹燕[33]的研究結(jié)果一致。小粉蝶屬為單系群,與其余13個蝶屬所構(gòu)成類群聚為一支,支持斑粉蝶屬、尖粉蝶屬、鉤粉蝶屬為單系群。本研究構(gòu)建的系統(tǒng)發(fā)育樹總體的節(jié)點支持率較高(100),個別節(jié)點支持率較低(61),分析原因可能是每個屬所只選取了1個物種,不具有代表性,有的屬未取到樣。