夏 晞,彭勁諭,王大瑋,張新洛,李江飛
(西南林業(yè)大學(xué),西南山地森林資源保育與利用教育部重點實驗室/云南省高校林木遺傳改良與繁育重點實驗室,云南 昆明 650224)
密碼子是生物體遺傳信息傳遞過程的一個重要環(huán)節(jié),其中編碼同一種氨基酸的密碼子被稱為同義密碼子[1]。在蛋白質(zhì)翻譯過程中,部分密碼子使用頻率會高于其他同義密碼子,即為密碼子偏好性[2],其產(chǎn)生的主要原因多為突變壓力和自然選擇[3]。密碼子的使用模式會對基因的功能與表達產(chǎn)生一定影響,密碼子偏好性越強則基因表達量就越大[4]。對密碼子使用模式進行分析可以推斷或預(yù)測未知基因的表達和功能[5-7]。
葉綠體基因組因其母系遺傳和擁有大量遺傳信息的特性被廣泛用于系統(tǒng)發(fā)育、物種分類鑒定和遺傳表達等研究中[8-11]。對葉綠體基因組密碼子的使用模式進行分析,根據(jù)最優(yōu)密碼子設(shè)計外源基因表達載體,可為異源基因表達水平的提高提供理論依據(jù)[12]。近年來,大量植物的葉綠體基因組被發(fā)表,隨之這些植物的葉綠體基因組密碼子偏好性也得到了全面的分析[13-16],為探究植物的生命進化和調(diào)控基因表達奠定了基礎(chǔ)[17]。
黃葛榕(Ficusvirens)、榕樹(Ficusmicrocarpa)和異葉榕(Ficusheteromorpha)均屬于???Moraceae)榕屬(Ficus)植物,多分布于熱帶及亞熱帶地區(qū)[18]。榕屬植物在我國南方城市常被用作行道樹以及園藝樹種,在食用、藥用以及工業(yè)方面也具有一定的開發(fā)價值[19-20]。隨著測序技術(shù)的高速發(fā)展,越來越多的榕屬葉綠體基因組得到報道[21],這些研究所獲得的信息為后續(xù)榕屬植物的系統(tǒng)發(fā)育關(guān)系、進化和遺傳多樣性等研究提供理論依據(jù)。本研究基于3種榕屬葉綠體基因組的測序結(jié)果對其同義密碼子使用模式進行比較分析,以期為3種榕屬植物葉綠體基因組在基因工程的應(yīng)用和研究提供理論依據(jù)。
試驗材料采自中國科學(xué)院昆明植物研究所(黃葛榕和榕樹)、西南林業(yè)大學(xué)(異葉榕),采集到的幼嫩葉片立即置于液氮保存,并于當(dāng)日送至安諾優(yōu)達基因科技公司進行葉綠體基因組測序,3種榕屬植物的葉綠體基因組序列已提交至NCBI數(shù)據(jù)庫,序列號為:MW039142(黃葛榕)、MW039144(榕樹)、MW039145(異葉榕)。隨后通過GENEIOUS軟件,選取長度>300 bp以及起始密碼子和終止密碼子正確的CDS序列用于后續(xù)分析。
1.2.1 密碼子組成分析 利用Codon W軟件和CUSP在線軟件分別對篩選后的3種榕屬植物的CDS序列進行分析,并用Excel 2019統(tǒng)計每個CDS的有效密碼子數(shù)(ENC)、GC含量(密碼子不同位置堿基的GC含量,GC1:第1位堿基、GC2:第2位堿基、GC3:第3位堿基)、密碼子數(shù)(N)以及相對密碼子使用度(RSCU),并利用R語言進行熱圖繪制以及相關(guān)性分析。
1.2.2 中性繪圖分析 中性繪圖以GC12(GC1與GC2的平均值)為縱坐標(biāo),GC3為橫坐標(biāo)利用EXCEL繪制散點圖,該分析可以明顯看出GC12與GC3之間的關(guān)系,GC12和GC3的相關(guān)性越顯著,且回歸系數(shù)越接近1,則說明密碼子偏好性越受突變的影響,反之,則說明偏好性更受選擇的影響[22]。
1.2.3 ENC-plot分析 ENC-plot分析以GC3為橫坐標(biāo),ENC值為縱坐標(biāo)進行繪制,并在其中添加ENC標(biāo)準(zhǔn)曲線,具體公式參考F.Wright[23]的方法,編碼基因距離標(biāo)曲越近說明其受突變影響較大,而當(dāng)基因位于標(biāo)曲下方且距離較遠(yuǎn)時則說明受選擇影響較大[24]。
1.2.4 PR2-plot分析 PR2-plot分析也稱堿基奇偶性分析,該分析以G3/(G3+C3)的值為橫坐標(biāo),A3/(A3+T3)的值為縱坐標(biāo),圖中的“十”字交叉中心點代表A=T且C=G,以該點發(fā)出的矢量表示堿基偏移的程度和方向[25]。
1.2.5 最優(yōu)密碼子分析 分別對3種榕屬植物的ENC值進行排序后,篩選兩端各10%的基因構(gòu)建高、低表達庫,最優(yōu)密碼子的確定需要同時滿足RSCU>1(高頻密碼子)且△RSCU≥0.08(高表達密碼子)的條件[26]。
利用Codon W和CUSP在線軟件對3種榕屬植物葉綠體基因組的52條CDS進行分析,結(jié)果見表1。3種榕屬植物的T3和A3含量高于G3含量,表明3種榕屬的第3位堿基以A/T為主。對3個榕屬植物各基因密碼子的GC含量進行統(tǒng)計分析(圖1),發(fā)現(xiàn)GC3含量均低于GC1和GC2,黃葛榕、榕樹和異葉榕大部分的ENC值都在40以上。其中petA基因的ENC含量最高,3種榕屬之間基因的GC含量和ENC值存在一定差異,但差異較小。
圖1 黃葛榕、榕樹、異葉榕葉綠體編碼基因密碼子GC含量
表1 黃葛榕、榕樹、異葉榕葉綠體基因組密碼子第3位堿基組成及GC含量
相關(guān)性分析顯示(圖2),3種榕樹植物的GC1、GC2、GC3與GC呈極顯著相關(guān),GC1和GC2呈顯著相關(guān),說明3種榕屬植物的第1、第2位堿基組成與第3位堿基存在較大差異。此外,還發(fā)現(xiàn)3種榕屬植物中GC3和ENC呈顯著相關(guān),說明第3位堿基對密碼子的偏好性影響大于第1、第2位堿基。與其他2個榕屬植物有所不同的是榕樹的GC2與密碼子數(shù)(N)呈顯著負(fù)相關(guān),其余都為不顯著相關(guān)。
注:*表示相關(guān)性達到顯著水平(P<0.05);**表示相關(guān)性達到極顯著水平(P<0.01)。
中性繪圖分析結(jié)果見圖3,3種榕屬植物的分布范圍基本類似,說明3種榕樹植物的葉綠體基因組較為保守。黃葛榕、榕樹和異葉榕的Pearson相關(guān)系數(shù)分別為0.253、0.247和0.207,進一步說明GC12和GC3的相關(guān)性不顯著,同時,黃葛榕、榕樹和異葉榕的回歸系數(shù)分別為0.338 2、0.330 6和0.266 0,表明3種榕屬植物受選擇影響壓力較大。
圖3 黃葛榕、榕樹、異葉榕中性繪圖分析
對3種榕樹植物的ENC值進行計算,可以更好地評估其CDS序列密碼子的偏好程度,具體結(jié)果見圖4。3種榕屬植物大部分的基因多位于標(biāo)準(zhǔn)曲線以下,說明大部分基因的ENC值與ENC期望值相差較大。隨后又對基因的ENC比值進行了統(tǒng)計分析(表2),結(jié)果發(fā)現(xiàn)位于-0.05~0.05的基因分別有23(黃葛榕)、20(榕樹)、22(異葉榕)個,但大部分基因都位于該區(qū)間以外,表明大部分基因的ENC實際值與ENC期望值差距較大。
圖4 ENC-plot繪圖分析
表2 ENC比值頻率分布
PR2-plot繪圖分析顯示,3種榕樹植物的編碼基因并未均勻分布在4個區(qū)域中,下方分布的基因明顯多于上方區(qū)域,且右下方分布的基因最多,說明第3位堿基在密碼子的選擇上具有一定的偏好性,具體的使用頻率為:T>A、G>C,表明3種榕屬植物不僅受突變影響還受選擇等多重因素的影響(圖5)。
圖5 黃葛榕、榕樹、異葉榕葉綠體基因組PR2-plot繪圖分析
分別對3種榕樹植物的ENC值進行排序,隨后選出兩端各10%的基因作為高、低基因表達庫,并對3種榕屬植物的RSCU以及△RSCU值進行計算(圖6),結(jié)果顯示黃葛榕有24個高頻密碼子,13個以U結(jié)尾,10個以A結(jié)尾,1個以G結(jié)尾,其中有12個為最優(yōu)密碼子;在榕樹中篩選出25個高頻密碼子,以U結(jié)尾的13個,以A結(jié)尾的11個,以G結(jié)尾的1個;異葉榕中有25個高頻密碼子,其中13個以U結(jié)尾,11個以A結(jié)尾,1個以G結(jié)尾,有14個最優(yōu)密碼子。在3種榕屬植物中發(fā)現(xiàn)了9個相同的最優(yōu)密碼子,并且都以A和U結(jié)尾。
圖6 黃葛榕、榕樹、異葉榕密碼子RSCU及最優(yōu)密碼子
以3種榕屬植物的葉綠體基因組數(shù)據(jù)為對象,篩選出52條CDS序列并對其密碼子組成以及偏好性的影響因素進行分析。通過密碼子組成分析發(fā)現(xiàn),3種榕屬植物的第3位堿基以A/T為主,該結(jié)果與近無柄雅榕(Ficusconcinnavar.subsessilis)類似[19],同時還與燈盞花(Erigeronbreviscapus)[16]、梧桐(Firmianapulcherrima)[8]、降香黃檀(Dalbergiaodorifera)[27]等高等植物類似,這可能是與高等植物富含A/T堿基且進化上相對保守有關(guān)[28]。基因表達量的高低可通過ENC值來判定,當(dāng)ENC值小于35時,顯示密碼子偏好性較強,反之,當(dāng)值大于35時則說明密碼子偏好性較弱[29],本研究結(jié)果表明,3種榕屬植物的ENC值都大于40,說明3種榕屬植物密碼子偏好性較弱。
隨后,對3種榕屬植物葉綠體基因組密碼子進行了中性繪圖、ENC-plot以及PR2-plot分析,其目的是更好地了解影響密碼子偏好性的因素。在本研究中,中性繪圖以及ENC-plot和ENC比值分析結(jié)果均顯示3種榕屬植物受自然選擇影響壓力較大[22,24]。PR2-plot繪圖分析發(fā)現(xiàn),3種榕屬的第3位堿基在密碼子使用上具有一定的偏好性,主要偏好為:T>A、G>C,結(jié)果表明,3種榕屬植物葉綠體基因組密碼子不僅受突變影響,還受選擇等多重因素的影響[25]。綜合以上分析,3種榕屬植物葉綠體密碼子的偏好性受突變和選擇的共同影響,但更多的是受選擇影響較大,這與云南藍果樹(Nyssayunnanensi)[30]等相似,但在杜梨(PyrusbetulifoliaBge.)[31]、楊樹(Populusalba)[32]等植物中影響密碼子偏好性的因素主要為突變。說明密碼子偏好性受多種因素影響,不同物間影響密碼子的主要因素也有所不同[31]。3種榕屬植物的密碼子偏好性極其相似,因此推斷3種榕屬植物的進化方式可能相同,還可能與近緣種間葉綠體基因組保守性強有關(guān)[33]。
對3種榕屬植物的最優(yōu)密碼子進行了分析,確定了3種榕屬植物的最優(yōu)密碼子。物種之間親緣關(guān)系越接近,其密碼子使用模式則越相似[34],在本研究中3種榕屬植物有9個相同的最優(yōu)密碼子(UUA、CUU、AUU、UCU、ACU、UAU、CAA、GGU),并且最優(yōu)密碼子都以A或U結(jié)尾,與巨桉(Eucalyptusgrandis)[35]、云南藍果樹(Nyssayunnanensis)[30]、梧桐[8]等研究結(jié)果類似,這可能與高等植物葉綠體基因組密碼子偏好A/U結(jié)尾有關(guān)[36]。