曲春娟 朱悅,2 江晨 曲明靜 王向譽 李曉
(1. 山東省花生研究所,青島 266100;2. 塔里木大學農(nóng)學院,阿拉爾 843300;3. 山東省蠶業(yè)研究所,煙臺 264000)
銅綠麗金龜Anomala corpulenta隸屬于鞘翅目Coleoptera 多食亞目Polyphaga 金龜總科Scarabaeoidea金龜科Scarabaeidae 麗金龜亞科Rutelinae,在我國及日本、朝鮮、東南亞等國廣泛分布,其幼蟲危害玉米、花生、大豆、小麥等多種作物根系或莢果,造成直接或間接經(jīng)濟損失,成蟲經(jīng)常聚集暴食葉片,危害榆樹、楊樹、葡萄等多種林果木[1-2],對其全面深入的研究對農(nóng)林生產(chǎn)具有重要意義。
麗金龜亞科昆蟲全世界已知有235 屬4 200 余種,其中有許多種類是重要的農(nóng)林害蟲[3]。目前麗金龜亞科的系統(tǒng)發(fā)育研究主要是納入在金龜總科和金龜科的研究中,針對麗金龜?shù)难芯縿t相對缺乏。而且尚有諸多問題需要解決,比如麗金龜亞科的單系性有待明確、麗金龜外部形態(tài)趨同現(xiàn)象普遍導致的近緣種區(qū)分困難等[4]。隨著分子生物學和測序技術的發(fā)展,基因序列被廣泛應用到昆蟲的系統(tǒng)發(fā)育學研究中。相比傳統(tǒng)形態(tài)學手段,基因序列在解決趨同進化問題方面更有優(yōu)勢。尤其是線粒體基因因其母系遺傳、進化速率快等特點,在這一領域被廣泛應用[5-6]。對于金龜總科的分子系統(tǒng)學研究,過去主要借助于線粒體單基因、單個核基因或者少數(shù)2-3 個基因的聯(lián)合,例如cox1、cox2、16S rRNA、12S rRNA、cytb、nad1等線粒體基因都是經(jīng)常用于進化分析的分子靶標[7]。然而單個基因不僅所包含的進化信息較少,難以完全解析物種間的系統(tǒng)發(fā)育關系,在選擇壓力和進化速率方面也存在差異,容易導致“長枝吸引”等問題,而完整的線粒體基因組能夠克服上述弊端,成為研究后生動物進化歷史和親緣關系更加強有力的工具[8-9]。以前傳統(tǒng)的線粒體基因組測序主要依賴于通用引物和長片段PCR擴增,效率低下,費事費力;尤其是控制區(qū)高AT含量、連續(xù)重復堿基較多的特點,導致Sanger 測序獲取全長序列比較困難。隨著高通量測序技術的發(fā)展,該策略被逐步應用到線粒體基因組測序中來,成為獲取線粒體基因組序列的更有力手段[10]。
目前已完成線粒體全基因組測序的麗金龜只有日本弧麗金龜Popillia japonica[11]、棉花弧麗金龜Popillia mutans[12]和墨綠彩麗金龜Mimela splendens(MZ064554)。此外還有非全長序列JX412777(Popilliasp.)和JX412788(Adoretussp.)。其中僅弧麗金龜屬Popillia兩個種的線粒體基因組是基于高通量測序組裝獲得。而異麗金龜屬Anomala的線粒體基因組卻未見報道。該屬是麗金龜亞科中種類豐富度最高的屬,已記錄的超過1 000 種[4]。其中的代表性物種之一——銅綠麗金龜是我國華北農(nóng)田三大優(yōu)勢金龜甲之一[13-14],受到昆蟲學家及植保工作者密切關注。針對其開展線粒體全基因組的研究,不僅可以豐富金龜科尤其是麗金龜亞科昆蟲的線粒體基因組信息,而且能夠為銅綠麗金龜?shù)姆肿酉到y(tǒng)學、群體遺傳學及分子生態(tài)學研究提供重要的基礎信息。
本研究利用高通量測序技術Illumina 平臺對銅綠麗金龜進行線粒體基因組測序,完成組裝和注釋后,對其線粒體基因組的結(jié)構(gòu)和基因排列、堿基組成、密碼子使用情況,以及轉(zhuǎn)運RNA(transfer RNA,tRNA)的結(jié)構(gòu)等進行預測分析,結(jié)合已發(fā)表的金龜科線粒體基因組序列對金龜科各亞科、屬和種之間的系統(tǒng)發(fā)育關系進行探討,旨在為麗金龜?shù)南到y(tǒng)發(fā)育研究和線粒體基因組學研究提供方法參考和依據(jù)。
供試銅綠麗金龜成蟲于2020年7月采自山東省花生研究所萊西望城試驗基地,將活體試蟲放入無水乙醇中于-20℃冰箱保存?zhèn)溆?。選擇試蟲胸部和足的肌肉組織提取基因組總DNA,所用提取方法為改進的CTAB 法,采用1%瓊脂糖凝膠電泳和核酸分析儀NanoDrop 2000 分別測定提取DNA 的質(zhì)量和濃度。
1.2.1 Illumina HiSeq 高通量測序 DNA 樣品送至武漢百奧維凡生物科技有限公司構(gòu)建350 bp 的小片段測序文庫和進行高通量測序?;谶吅铣蛇厹y序(Sequencing By Synthesis, SBS)技術和Illumina HiSeq X 測序平臺對所構(gòu)建的測序文庫進行雙端150 bp 測序,利用NGS QC Toolkit 2.3.3[15]將原始測序數(shù)據(jù)進行過濾,去除adapter 序列、低質(zhì)量末端、含N>10%的reads 以及長度小于25 bp 的短片段后,得到11.29 Gb 的clean reads。
1.2.2 序列拼裝、注釋及特征分析 利用SPAdes v3.11.1(http://cab.spbu.ru/software/spades/)[16]拼 接軟件對clean reads 進行拼接,構(gòu)建contigs。使用SSPACE 軟件[17]對contigs 進行擴展延伸,獲得最終的完整線粒體基因組序列。利用MITOS 在線服務器(http://mitos.Bioinf.uni-leipzig.de)[18]對線粒體基因組序列進行功能注釋。并進一步通過與已知金龜科物種的線粒體基因進行同源比對注釋結(jié)果進行核對驗證。利用tRNAscan-SE 軟件(http:∥lowelab.ucsc.edu/tRNAscan-SE/)[19]對tRNA 基因進行查找及二級結(jié)構(gòu)的預測。利用Mega 11[20]分別計算銅綠麗金龜線粒體基因組中各編碼基因的堿基組成、密碼子使用頻率、AT-skew 和GC-skew。
1.2.3 系統(tǒng)發(fā)育分析 為研究銅綠麗金龜在金龜科的系統(tǒng)發(fā)育地位,利用線粒體基因組的13 個蛋白質(zhì)編碼基因(protein-coding genes,PCGs)的核苷酸序列進行系統(tǒng)發(fā)育分析。選取已報道的19 種金龜科昆蟲的線粒體基因組作為參考序列,以牙甲科昆蟲Sphaeridium bipustulatum為外群,采用最大似然法(maximum likelihood,ML)和貝葉斯法(Bayesian,BI)構(gòu)建系統(tǒng)發(fā)育樹。利用Clustal X 2.0[21]對核苷酸序列進行多重比對后,使用Gblocks v0.91b[22]過濾比對結(jié)果,然后采用SequenceMatrix v1.7[23]對每個基因的比對結(jié)果進行串聯(lián)連接?;赟MS 軟件[24]和ModelFinder[25]對建樹數(shù)據(jù)集評估得到的最適替代模型為GTR+I+G。以PhyML3.0 在線分析軟件[26]進行1 000 次bootstrap 運算,構(gòu)建ML 系統(tǒng)發(fā)育樹。利用MrBayes 3 軟件[27]計算200 000 代,每運算100 代取樣保存,舍棄25%的老化樣本,構(gòu)建BI 系統(tǒng)發(fā)育樹。最后使用FigTree v.1.4.3(http://tree.bio.ed.ac.uk/software/figtree)對系統(tǒng)發(fā)育樹進行繪制。
銅綠麗金龜線粒體基因組全長16 673 bp(GenBank 登錄號:OL449520),呈現(xiàn)典型雙鏈閉合環(huán)狀結(jié)構(gòu),包括13 個PCGs、2 個rRNA、22 個tRNA 共37 個基因以及1 074 bp 的AT 富集區(qū),與后生動物線粒體基因組的經(jīng)典基因組成一致。昆蟲線粒體基因組的多數(shù)基因在同一條鏈上編碼,該鏈稱為J 鏈(majority strand);其余少數(shù)基因在另一條鏈上編碼,該鏈稱為N 鏈(minority strand)。對銅綠麗金龜線粒體而言,23 個基因位于J 鏈上,包括9 個PCGs(nad3、cox3、atp6、atp8、cox2、cox1、nad2、cytb和nad6)和14 個tRNA 基因;14 個基因位于N鏈,包括4 個PCGs(nad5、nad4、nad4l和nad1)、8 個tRNA 基因和2 個rRNA 基因(圖1)。與其他昆蟲線粒體一樣,銅綠麗金龜線粒體基因組也存在基因重疊和間隔現(xiàn)象,表現(xiàn)為30 處長度1-41 bp 的堿基重疊現(xiàn)象和5 處長度1-15 bp 的堿基間隔現(xiàn)象(表1)?;蚺挪寂c已報道的其他麗金龜:墨綠彩麗金龜、日本弧麗金龜和棉花弧麗金龜一致,與果蠅代表的祖先模式也一致。
表1 銅綠麗金龜線粒體基因位置與起始終止密碼子Table 1 Locations and start/stop codons of mitochondrial genes in A. corpulenta
圖1 銅綠麗金龜線粒體基因組結(jié)構(gòu)圖Fig. 1 Mitochondrial genome structure of A. corpulenta
總的來看,銅綠麗金龜線粒體基因組中A+T 含量占比75.87%,G+C 含量占比24.13%,表現(xiàn)出明顯的AT 偏向性。其中PCGs、tRNA 基因和rRNA 基因的A+T 含量分別為74.87%、76.54%和75.79%。全基因組的AT-skew 為正值(0.027),GC-skew 為負值(-0.237),表明整個基因組更偏好于使用A 堿基和C 堿基。整個線粒體基因組不同位置對堿基偏好性具有一定差異。22 個tRNA 基因和2 個rRNA 的AT-skew 均為正值,表明其偏好A 堿基;13 個PCGs和2 個rRNA 的AT-skew 均為負值,表明其偏好T堿基;從不同的單基因來看,除atp8外其余12 個PCGs 的AT-skew 外均為負值,J 鏈上的9 個PCGs的GC-skew 均為負值,N 鏈上的4 個PCGs 和rRNA基因的GC-skew 均為正值,與大多數(shù)昆蟲的線粒體基因組AT/GC 偏斜一致(表2)。
表2 銅綠麗金龜線粒體基因組堿基組成Table 2 Base composition in the mitochondrial genome of A. corpulenta
銅綠麗金龜線粒體基因組含有13 個PCGs,序列全長11 212 bp(占比67.25%),除去終止密碼子(37 bp)共編碼3 725 個氨基酸殘基。使用最頻繁的密碼子為UUU(Phe)、UUA(Leu)、AUU(Ile)和UAU(Tyr),而CGC(Arg)、CGG(Arg)、CCG(Pro)和GCG(Ala)使用相對較少(表3),由此也反映了核苷酸組成的AT 偏好性。
表3 銅綠麗金龜線粒體基因組相對同義密碼子使用頻率(RSCU)Table 3 Relative synonymous codon usage(RSCU)in the mitochondrial genome of A. corpulenta
所有PCGs中nad5最長(1 717 bp),atp8最短(157 bp)。除nad4l以TTG 為起始密碼子外,其余PCGs都以ATN 作為起始密碼子,其中nad2、cox3、nad4和cytb以ATG 為起始密碼子,atp6和nad1以ATA為起始密碼子,cox1、atp8和nad5以ATT 為起始密碼子,cox2、nad3和nad6以ATC 為起始密碼子。cox3和nad4以不完整的TA 為終止密碼子,缺失的核苷酸由轉(zhuǎn)錄后3 苷端多聚腺苷酸化補齊[28],其余PCGs 均以TAA 或TAG 為終止密碼子,與昆蟲線粒體基因組普遍使用的終止密碼子一致。
銅綠麗金龜?shù)?2 個tRNA 基因長度范圍為63 bp(tRNACys)到72 bp(tRNALys),總長度為1 450 bp。預測的二級結(jié)構(gòu)如圖2 所示,除tRNASer(AGN)缺失DHU 臂外,其余tRNA 序列都可以折疊成典型的三葉草式二級結(jié)構(gòu)。此外,tRNASer和tRNALeu以雙拷貝形式存在,其余tRNA 基因均僅顯示單拷貝。銅綠麗金龜?shù)膬蓚€rRNA 基因均在N 鏈上,16S rRNA位 于tRNALeu(CUN)和tRNAVal之 間,長 度1 350 bp;12S rRNA在tRNAVal和控制區(qū)之間,長度800 bp。
圖2 銅綠麗金龜線粒體基因組tRNA 二級結(jié)構(gòu)Fig. 2 Putative secondary structures of tRNAs in the mitochondrial genome of A. corpulenta
以 牙 甲 科(Sphaeridiinae) 中 的Sphaeridium bipustulatum為外群,使用已報道的麗金龜亞科(Rutelinae)、金龜亞科(Scarabaeinae)、花金龜亞科(Cetoniinae)、鰓金龜亞科(Melolonthinae)、犀金龜亞科(Dynastinae)、蜉金龜亞科(Aphodiinae)共19 種金龜科昆蟲及本研究測得的銅綠麗金龜線粒體基因組的13 個PCGs 的核苷酸序列,構(gòu)建金龜科昆蟲的ML 和BI 系統(tǒng)發(fā)育樹。結(jié)果顯示兩種建樹方法得到的拓撲結(jié)構(gòu)完全一致,金龜亞科和蜉金龜亞科聚為1 個分支,麗金龜、花金龜、犀金龜和鰓金龜亞科聚為1 個分支,置信值均為100%。除鰓金龜亞科外,各亞科均聚為一支且置信值較高。但與傳統(tǒng)分類不同,鰓金龜亞科的5 個種并未聚為一個支系。各亞科之間的系統(tǒng)發(fā)生關系為(蜉金龜亞科+金龜亞科)+(鰓金龜亞科(花金龜亞科(犀金龜亞科+麗金龜亞科)))(圖3)。
圖3 基于線粒體蛋白質(zhì)編碼基因核苷酸序列構(gòu)建的銅綠麗金龜與其他金龜科昆蟲的系統(tǒng)發(fā)育樹(最大似然法和貝葉斯法)Fig. 3 Phylogenetic tree of A. corpulenta and other insects species of Scarabaeidae based on the mitochondrial protein-coding gene sequences(maximum likelihood and Bayesian)
銅綠麗金龜聚在麗金龜亞科分支系,與墨綠彩麗金龜組成姐妹關系,且置信值均為100%。利用Kimura-2-Parameter 參數(shù)模型計算麗金龜亞科5 個種之間的遺傳距離,結(jié)果所反映的親緣關系與系統(tǒng)發(fā)育樹一致:銅綠麗金龜與墨綠彩麗金龜?shù)倪z傳距離為0.007 9,而與棉花弧麗金龜和日本弧麗金龜?shù)倪z傳距離分別為0.172 7 和0.177 4,與喙麗金龜屬Adoretussp.的遺傳距離則為0.209 9(表4)。
線粒體基因組具有母系遺傳、結(jié)構(gòu)簡單、進化速率快的特點,作為分子標記有其獨特優(yōu)勢,目前被廣泛應用到遺傳學、系統(tǒng)發(fā)育學、生物地理學以及物種診斷學等研究領域[5-6]。隨著測序技術的進步,越來越多的昆蟲線粒體基因組完成測序[5]。這些昆蟲線粒體基因組與其他后生動物線粒體一樣,呈現(xiàn)共同特點:為共價閉合環(huán)狀雙鏈DNA 分子,長度為14-20 kb,通常含有37 個基因,包括13 個PCGs、22 個tRNA 基因、2 個核糖體RNA(ribosomal RNA,sRNA)基因及一個或數(shù)個AT 富集區(qū)[29-30]。
本研究首次測定和分析了銅綠麗金龜?shù)耐暾€粒體基因組,豐富了金龜科的線粒體基因組信息,尤其是為研究異麗金龜Anomala屬在麗亞科中的系統(tǒng)發(fā)育位置提供了數(shù)據(jù)基礎。銅綠麗金龜線粒體基因組全長16 673 bp,與NCBI 已公布的其他3 種麗金龜(墨綠彩麗金龜、日本弧麗金龜和棉花弧麗金龜)的線粒體基因組大小近似(15 148-16 541 bp)[11-12]。包含37 個線粒體基因,排布方式與上述3 種麗金龜完全一致,而且與果蠅Drosophila yakuba也一致[31]。D. yakuba線粒體的基因排布方式代表了昆蟲線粒體基因排布的祖先模式[31],說明銅綠麗金龜線粒體未發(fā)生基因重排現(xiàn)象。
在昆蟲綱中,線粒體基因組的蛋白質(zhì)編碼基因已被廣泛證實可以有效解決不同分類階元的系統(tǒng)發(fā)育問題[5]。本研究以線粒體基因組的13 個蛋白質(zhì)編碼基因作為分子靶標,探索了金龜科6 個亞科(麗金龜亞科、金龜亞科、花金龜亞科、鰓金龜亞科、犀金龜亞科、蜉金龜亞科)的分類學關系[3]。在已公布線粒體基因組序列的幾種麗金龜物種中,日本弧麗金龜、棉花弧麗金龜和墨綠彩麗金龜具有完整的線粒體基因組序列。Adoretussp.(JX412788)的線粒體基因組雖然是部分序列,但包含了完整的13 個PCGs 序列信息,因此也被納入到建樹數(shù)據(jù)集。但Phylloperthasp.(KX087335)和Popilliasp.(JX412777)的線粒體基因組由于缺失部分PCGs的數(shù)據(jù),未被采用。
Table 4 Pairwise genetic distances of mitochondrial protein-coding gene sequences between A. corpulenta and other phytophagous species of Scarabaeidae based on Kimura-2-Parameters
已知的金龜科昆蟲全世界超過30 000 種,按照食性分為糞食性和植食性兩大類[32-33]。其中糞食類包括金龜亞科和蜉金龜亞科,植食類包括犀金龜、花金龜、麗金龜和鰓金龜。本研究構(gòu)建的系統(tǒng)發(fā)育樹也清晰得顯示了金龜科是由這兩個主要群體構(gòu)成的。植食性金龜子各亞科之間的系統(tǒng)發(fā)生關系為鰓金龜亞科+(花金龜亞科+(犀金龜亞科+麗金龜亞科)),與Ayivi 等[33]和Song 等[12]基于線粒體基因組ML 樹和BI 樹的分析結(jié)果一致。麗金龜亞科和犀金龜亞科互為姐妹群,也與目前多數(shù)學者基于形態(tài)學和分子證據(jù)得出的主流觀點一致[4]。此外,麗金龜、犀金龜、花金龜和金龜亞科的單系性均得到很高的支持,說明系統(tǒng)發(fā)育關系可信度較高。同時我們發(fā)現(xiàn)鰓金龜亞科并非單系群,這與之前報道一致[12,33-35]。
在屬級階元關系上,系統(tǒng)發(fā)育樹的結(jié)果顯示麗金龜亞科一支中,異麗金龜屬Anomala與彩麗金龜屬Mimela的親緣關系更近,弧麗金龜屬Popillia次之,而喙麗金龜屬Adoretus較遠,且在該分支上兩種分析方法的置信值均為100%。遺傳距離分析的結(jié)果同樣證明了上述關系,支持了Bouchard 等[3]關于麗金龜亞科的分類系統(tǒng)。但齒爪鰓金龜屬Holotrichia兩個種(暗黑鰓金龜H. parallela和大黑鰓金龜H.oblita)并沒有聚到一起,還需要進一步研究。
本研究對銅綠麗金龜線粒體基因組全序列的測定,豐富了金龜科線粒體基因組的序列信息以及結(jié)構(gòu)和組成信息,為后續(xù)麗金龜科系統(tǒng)發(fā)育關系研究奠定基礎,同時也為銅綠麗金龜?shù)娜后w遺傳學和分子生態(tài)學研究提供了基礎信息。
獲得了銅綠麗金龜線粒體全基因組,其基因的排布方式與墨綠彩麗金龜、日本弧麗金龜和棉花弧麗金龜相同,且與祖先模式一致,系統(tǒng)發(fā)育分析支持麗金龜亞科的單系性,異麗金龜屬Anomala與彩麗金龜屬Mimela的親緣關系較其與弧麗金龜Popillia和喙麗金龜屬Adoretus更近。