趙洋 楊培迪 劉振 成楊 楊陽
摘要:【目的】分析13種植物actin基因的密碼子組成、密碼子偏性及聚類關(guān)系,了解其密碼子使用模式及影響密碼子使用的因素,為深入研究分子進(jìn)化及物種進(jìn)化提供參考。【方法】運(yùn)用CodonW 1.4.4軟件分析13種植物的肌動蛋白基因(actin)密碼子組成及使用參數(shù),并對影響密碼子偏性的因素進(jìn)行研究。應(yīng)用MEGA 4.1對13條基因的CDS序列進(jìn)行聚類分析,采用SPSS 20.0進(jìn)行密碼子偏性的聚類分析。【結(jié)果】雙子葉植物中actin基因的GC含量為45.0%~51.2%、GC3s含量為36.3%~53.8%,單子葉植物中GC含量為53.0%~58.3%、GC3s含量為60.9%~75.8%;actin基因在單子葉植物中偏愛G/C結(jié)尾的密碼子,雙子葉植物中偏愛A/T結(jié)尾的密碼子。GC和GC3s與有效密碼子數(shù)(ENC)呈極顯著負(fù)相關(guān)(P<0.01),相關(guān)系數(shù)均為-0.906。ENC繪圖分析結(jié)果表明,actin基因密碼子偏性同時(shí)受突變和選擇壓力影響,單子葉植物受選擇壓力影響的程度大于雙子葉植物?;赼ctin基因密碼子偏性的聚類將單子葉植物高粱、玉米聚為一類,水稻、大麥、竹聚為一類,8種雙子葉植物聚為一類。【結(jié)論】actin基因密碼子偏性與堿基組成密切相關(guān),其密碼子偏性在單、雙子葉植物間存在差異,依據(jù)密碼子偏性的聚類能在一定程度上反映物種間的親緣關(guān)系。
關(guān)鍵詞: actin基因;密碼子用法;密碼子偏性
中圖分類號: Q943.2 文獻(xiàn)標(biāo)志碼:A 文章編號:2095-1191(2016)04-0519-05
0 引言
【研究意義】密碼子是生物個(gè)體體內(nèi)進(jìn)行信息傳遞的基本環(huán)節(jié),同義密碼子是指編碼同一種氨基酸的所有密碼子。某一物種或某一基因傾向于使用一種或幾種特定的同義密碼子,被稱作同義密碼子的使用偏性。密碼子使用偏性在生物界中廣泛存在,是一種分子進(jìn)化形式,同一物種或具有親緣關(guān)系的物種中基因一般表現(xiàn)出對同義密碼子的選取具有同樣模式,且密碼子偏性還與蛋白質(zhì)功能等密切相關(guān)。因此,研究密碼子使用偏性具有重要的生物學(xué)意義。植物肌動蛋白(Actin)是細(xì)胞骨架的主要組成成分,高度保守。對植物中actin基因的堿基組成、密碼子使用偏性、密碼子偏性的影響因素、基于密碼子偏性的聚類等進(jìn)行研究分析,有助于了解植物中密碼子使用特性及影響植物密碼子偏性的因素,可進(jìn)一步了解遺傳進(jìn)化機(jī)理?!厩叭搜芯窟M(jìn)展】密碼子偏性研究起初主要集中在原核生物和低等真核生物密碼子偏性與基因表達(dá)的關(guān)系。隨著基因組測序和分子生物學(xué)的發(fā)展,其研究開始傾向于基因組密碼子使用模式、單個(gè)基因或同類基因家族的密碼子使用特性(何閃等,2013;李冠英等,2013;馮慧穎等,2014)。已有研究認(rèn)為,密碼子的使用是在進(jìn)化過程中受多種因素影響所造成,主要壓力有突變壓力(Li,1987)和自然選擇壓力(Kimura,1981)。若基因序列的密碼子使用偏性與GC含量有關(guān),則表明密碼子偏性受突變壓力影響(Chen et al.,2004),如原核生物、古細(xì)菌、真菌、植物和人類基因組中密碼子使用在進(jìn)化中均受突變壓力影響(Hershberg and Petrov,2009;Palidwor et al.,2010)。若密碼子偏性與翻譯有關(guān),則受自然選擇壓力影響(Goetz and Fuglsang,2005;Ingvarsson,2007)。突變—選擇—漂變學(xué)說是目前的主流觀點(diǎn),該學(xué)說認(rèn)為同一個(gè)基因組的密碼子可能同時(shí)受這兩種壓力的影響,突變的發(fā)生具有方向性,同義密碼子使用偏性反映了對最優(yōu)密碼子的選擇和對非同義密碼子“突變—漂變”兩方面的作用(Hershberg and Petrov,2008)?!颈狙芯壳腥朦c(diǎn)】目前,針對多個(gè)植物中同一基因的密碼子偏性的研究較少,對影響密碼子偏性的因素及進(jìn)化關(guān)系的研究也鮮見報(bào)道?!緮M解決的關(guān)鍵問題】采用生物信息學(xué)方法,對植物actin基因的密碼子組成、密碼子偏性及聚類關(guān)系進(jìn)行研究,了解其密碼子使用特性及影響密碼子偏性的因素,為深入研究分子進(jìn)化及物種進(jìn)化提供參考。
1 材料與方法
1. 1 試驗(yàn)材料
13條植物actin基因序列從GenBank獲取,分別為毛白楊(GQ988367)、擬南芥(U39480)、水稻(AY212324)、大麥(AY145451)、白玉蘭(AF281323)、亮葉樺(EU588981)、竹(EU009452)、獼猴桃(EF063572)、煙草(AB158612)、高粱(X79378)、茶樹(HQ235647)、棉花(AY305723)和玉米(EU967073)。
1. 2 密碼子組成和使用特性分析
應(yīng)用CodonW 1.4.4軟件分析各基因密碼子使用特性參數(shù),包括基因的G+C含量(GC),編碼同一氨基酸同義密碼子第3位上G+C的含量(GC3s)、有效密碼子數(shù)(ENC)和氨基酸數(shù)(L_aa),并應(yīng)用SPSS 20.0軟件,采用Pearson相關(guān)系數(shù)進(jìn)行密碼子組成和使用特性各參數(shù)間的相關(guān)性分析。
1. 3 相對同義密碼子使用度計(jì)算
相對同義密碼子使用度(RSCU)為同義密碼子的實(shí)際使用次數(shù)與其無偏性使用次數(shù)的比值,直接反映密碼子使用偏性。密碼子使用無偏性時(shí)RSCU為1,使用次數(shù)較多時(shí)RSCU>1,使用次數(shù)較少時(shí)RSCU<1(Sharp and Li,1987)。ATG是Met的唯一密碼子,TGG是Trp的唯一密碼子,TAA、TGA和TAG為終止密碼子,剔除這5個(gè)密碼子后共計(jì)59個(gè)密碼子,運(yùn)用CodonW程序計(jì)算各基因這59個(gè)密碼子的RSCU。
1. 4 對應(yīng)性分析
基于基因59個(gè)同義密碼子的RSCU,應(yīng)用CodonW進(jìn)行對應(yīng)性分析(Corresponding analysis,COA)。該方法為廣泛用于分析基因間同義密碼子使用偏性主要原因的方法,從多維空間中選取影響力最大的2個(gè)軸,分析基因向量和基因的RSCU差異,推測影響密碼子偏性的主要因素。
1. 5 ENC繪圖分析
有效密碼子數(shù)(ENC)反映同義密碼子使用的偏性程度,其值介于20~61,偏性越強(qiáng)則ENC越小。運(yùn)用ENC繪圖分析對ENC、GC3s間的分布關(guān)系進(jìn)行研究,并探討突變壓力和翻譯選擇壓力對密碼子偏性的影響。標(biāo)準(zhǔn)曲線是密碼子偏性僅受堿基突變壓力影響時(shí)的位置,公式為ENC=2+GC3s+29/[GC3s2+(1-GC3s)2]。密碼子偏性只受突變壓力影響時(shí),位于標(biāo)準(zhǔn)曲線上或緊沿標(biāo)準(zhǔn)曲線下方分布,密碼子偏性除受突變影響,還同時(shí)受選擇壓力影響時(shí),則位于標(biāo)準(zhǔn)曲線下方較遠(yuǎn)的位置(Wright,1990)。
1. 6 基于基因密碼子偏性和CDS的聚類分析
以59個(gè)密碼子的RSCU為變量,13個(gè)基因?yàn)閭€(gè)體,利用SPSS 20.0進(jìn)行聚類分析,類間距離為組內(nèi)聯(lián)接法,基因間距離為平方歐氏距離。運(yùn)用MEGA 4.1的NJ法對13條基因的CDS進(jìn)行聚類分析,重復(fù)抽樣數(shù)為1000。
2 結(jié)果與分析
2. 1 actin基因的密碼子組成和使用性參數(shù)分析
Jiang等(2008)將ENC=35作為偏性強(qiáng)弱的區(qū)分標(biāo)準(zhǔn)。由表1可知,actin基因ENC為37.33~53.95,偏性不強(qiáng)。13種植物actin基因GC含量為45.0%~58.3%,GC3s含量為36.3%~75.8%。其中,雙子葉植物如楊樹、擬南芥、樺樹、煙草、棉花、獼猴桃、茶樹、白玉蘭actin基因的GC含量為45.0%~51.2%,GC3s含量為36.3%~53.8%,除白玉蘭和茶樹外,其他雙子葉植物actin基因的GC和GC3s含量均小于50.0%;單子葉植物如水稻、大麥、高粱、玉米、竹actin基因的GC含量為53.0%~58.3%,GC3s含量為60.9%~75.8%,GC和GC3s含量高于雙子葉植物,且均大于50.0%。可見,單子葉植物偏愛使用G/C結(jié)尾的密碼子,雙子葉植物偏愛使用A/T結(jié)尾的密碼子。
2. 2 actin基因密碼子使用參數(shù)相關(guān)性分析
actin基因密碼子使用特性各參數(shù)間的相關(guān)性分析結(jié)果(表2)表明,ENC與GC3s、GC含量呈極顯著負(fù)相關(guān)(P<0.01,下同),表明同義密碼子第3位的堿基含量直接影響基因的密碼子使用偏性程度,基因的G+C含量越高、使用更多G/C結(jié)尾的密碼子,其密碼子使用偏性越強(qiáng)。
2. 3 actin基因密碼子對應(yīng)性分析
對應(yīng)性分析結(jié)果表明,所給出的12個(gè)軸可以解釋actin基因同義密碼子使用特性的全部變異,第一條軸(Axis1)和第二條軸(Axis2)分別解釋變異的45.87%和9.74%,其余軸則較少。從各密碼子在Axis1和Axis2的分布(圖1)可以看出,A/T結(jié)尾的密碼子全部位于Axis1左側(cè);G/C結(jié)尾的密碼子除TTG、ACG、CGG外,均位于Axis1右側(cè)。
由表2可看出,Axis1上基因的位置與GC、GC3s呈極顯著正相關(guān),尤其是GC,兩者的相關(guān)系數(shù)達(dá)0.990,故位于Axis1右側(cè)的基因GC應(yīng)高于左側(cè)的基因。圖2中單子葉植物基因全部位于Axis1右側(cè),雙子葉植物基因除白玉蘭外全部位于左側(cè)。單子葉植物基因GC均高于雙子葉植物,白玉蘭GC也是雙子葉植物中最高的(表1),表明堿基組成是影響actin基因密碼子使用的主要因素。
2. 4 actin基因ENC繪圖分析
從圖3可以看出,actin基因均位于標(biāo)準(zhǔn)曲線下方,偏離期望曲線,表明除受堿基突變影響外,選擇壓力也對密碼子的使用有影響,且單子葉植物較雙子葉植物位于標(biāo)準(zhǔn)曲線下方更遠(yuǎn)的位置,表明單子葉植物受選擇壓力影響的程度大于雙子葉植物,尤其是高粱和玉米受到的影響相對較大。
2. 5 actin基因密碼子使用和CDS序列的聚類分析
由圖4可看出,actin基因密碼子偏性的聚類將單子葉植物高粱、玉米聚為一類,水稻、大麥、竹聚為一類,8種雙子葉植物聚為一類,說明單、雙子葉植物間actin基因的密碼子使用模式不同,具有各自的使用特點(diǎn)。基于CDS序列的聚類分析結(jié)果(圖5)與之比較存在一定差異,如竹沒有和水稻、大麥聚為一類,而是與高粱、玉米聚在一類。兩種方法的聚類結(jié)果雖然有差異,但均能在一定程度上反映物種間的親緣關(guān)系。
3 討論
雙子葉植物偏愛使用A/T結(jié)尾的密碼子,單子葉植物偏愛使用G/C結(jié)尾的密碼子(Liu et al.,2010; Tatarinova et al.,2010; 趙洋等,2011)。本研究結(jié)果表明,單子葉植物actin基因的GC3s含量大于雙子葉植物,且均大于50.0%,偏愛使用G/C結(jié)尾的密碼子;8種雙子葉植物中有6種的GC3s含量小于50.0%,偏愛使用A/T結(jié)尾的密碼子。該結(jié)果與前人研究結(jié)果(Liu et al.,2010;Tatarinova et al.,2010;趙洋等,2011)基本一致。本研究同時(shí)發(fā)現(xiàn)單子葉植物actin基因G+C含量比雙子葉植物高,與前人研究單子葉植物基因G+C含量高而雙子葉植物G+C含量低的結(jié)果(Kawabe and Miyashita,2003;Wang and Hickey,2007)一致。
分析密碼子使用特性各參數(shù)間的相關(guān)性,發(fā)現(xiàn)密碼子偏性與基因G+C含量和密碼子第3位堿基組成密切相關(guān)。對應(yīng)性分析結(jié)果也表明堿基組成是影響密碼子偏性使用的主要因素。有研究表明,禾本科作物基因G+C含量和密碼子第3位堿基組成對密碼子偏性的形成有重要影響,偏性強(qiáng)的基因偏愛使用G/C結(jié)尾的密碼子(Guo et al.,2007)。ENC繪圖分析結(jié)果表明,13種植物的actin基因密碼子偏性主要受突變影響,同時(shí)還受自然選擇壓力的影響,且其中單子葉植物受選擇壓力的影響程度大于雙子葉植物。
不同物種同一基因的密碼子用法特征也有所不同,基因功能和類型一定的情況下,親緣關(guān)系較近的物種間,同義密碼子用法相似。玉米、水稻、高粱3種作物從基因組學(xué)上來說玉米與高粱的親緣關(guān)系更近一些(Hulbert et al.,1990),根據(jù)單基因密碼子偏性推導(dǎo)的進(jìn)化關(guān)系也是玉米與高粱更近(劉漢梅等,2010;晁岳恩等,2011;馮慧穎等,2014)。本研究中基于actin基因密碼子偏性的聚類分析結(jié)果顯示,玉米、高粱、水稻三者間玉米與高粱的親緣關(guān)系更近,與前人研究結(jié)果相符??梢姡赼ctin基因密碼子偏性的聚類分析結(jié)果在一定程度上能反映出親緣關(guān)系的遠(yuǎn)近。
雖然基于antin基因密碼子偏性和CDS序列的聚類分析結(jié)果不完全相同,但并不能認(rèn)為基于基因密碼子偏性的進(jìn)化關(guān)系錯誤,這種差異之前也有報(bào)道(楊春亮等,2012; 馮慧穎等,2014)。其原因可能是單基因在進(jìn)化上存在較大突變,使密碼子偏性發(fā)生較大變化,而與真實(shí)的分類位置不同。此外,物種是在多因素綜合作用下進(jìn)化,從不同角度分析的結(jié)果可能也會存在差異。同一物種內(nèi)不同基因的密碼子用法有所不同,看家基因和組織特異性基因、低表達(dá)基因和高表達(dá)基因間的密碼子偏性受選擇、突變等的影響程度有明顯差異,主要的進(jìn)化因素亦有不同(Mukhopadhyay et al.,2008),增加系統(tǒng)進(jìn)化分析的基因數(shù)量與類型,或許能予以改進(jìn)。有觀點(diǎn)認(rèn)為,基于同義密碼子使用偏性獲得的聚類分析結(jié)果并不完全與真實(shí)的系統(tǒng)發(fā)育一致,其較小的分類單元結(jié)果比較可靠,較大的分類單元結(jié)果則適合作為傳統(tǒng)方法的補(bǔ)充和參考(Christianson,2005)。本研究結(jié)果表明,依據(jù)密碼子偏性的聚類分析可對系統(tǒng)發(fā)育分析進(jìn)行補(bǔ)充,用于物種進(jìn)化和分子進(jìn)化機(jī)制研究。
4 結(jié)論
本研究結(jié)果表明,actin基因密碼子偏性與堿基組成密切相關(guān),其密碼子偏性在單、雙子葉植物間存在差異,依據(jù)密碼子偏性的聚類能在一定程度上反映物種間的親緣關(guān)系。
參考文獻(xiàn):
晁岳恩,吳政卿,楊會民,何寧,楊攀. 2011. 11種植物psbA基因的密碼子偏好性及聚類分析[J]. 核農(nóng)學(xué)報(bào),25(5):927-932.
Chao Y E,Wu Z Q,Yang H M,He N,Yang P. 2011. Cluster analysis and codon usage bias studies on psbA genes form 11 plant species[J]. Journal of Nuclear Agricultural Sciences,25(5):927-932.
馮慧穎,梁云,徐雷鋒,袁迎迎,袁素霞,劉春,明軍,陳麗靜. 2014. 百合甘油-3-磷酸?;D(zhuǎn)移酶(GPAT)基因密碼子偏性分析及其表達(dá)受體選擇[J]. 分子植物育種,12(1):127-137.
Feng H Y,Liang Y,Xu L F,Yuan Y Y,Yuan S X,Liu C,Ming J,Chen L J. 2014. Analysis of codon bias and phylogenetic relationships of the glycerol-3-phosphate acyltransferase(GPAT) gene in Lilium L.[J]. Molecular Plant Breeding,12(1):127-137.
何閃,張淑杰,修樂山,邢朝斌. 2013. 鯊烯合酶基因的密碼子偏性分析[J]. 基因組學(xué)與應(yīng)用生物學(xué),32(2):232-239.
He S,Zhang S J,Xiu L S,Xing Z B. 2013. Codon usage analysis in squalene synthase gene[J]. Genomics and Applied Bio-
logy, 32(2):232-239.
李冠英,王政,張志燕,方和娣,譚小力. 2013. 甘藍(lán)型油菜WRKY基因家族堿基組成及密碼子使用特性分析[J]. 生物學(xué)雜志,30(4):42-45.
Li G Y,Wang Z,Zhang Z Y,F(xiàn)ang H D,Tan X L. 2013. The base composition and condon use of the WRKY gene family of the Brassica napus[J]. Journal of Biology,30(4):42-45.
劉漢梅,趙耀,顧勇,張懷渝,黃玉碧. 2010. 幾種植物waxy基因的密碼子用法特性分析[J]. 核農(nóng)學(xué)報(bào),24(3):476-481.
Liu H M,Zhao Y,Gu Y,Zhang H Y,Huang Y B. 2010. Characterization of codon usage of waxy genes in several plants[J]. Journal of Nuclear Agricultural Sciences,24(3):476-481.
楊春亮,王良,武斌,趙琳,張曉麗,鐘淑琦. 2012. 大豆GmRAV基因的密碼子偏好性分析[J]. 東北農(nóng)業(yè)大學(xué)學(xué)報(bào),43(7):34-41.
Yang C L,Wang L,Wu B,Zhao L,Zhang X L,Zhong S Q. 2012. Codon bias analysis of soybean GmRAV gene[J]. Journal of Northeast Agricultural University,43(7):34-41.
趙洋,楊陽,劉振,楊培迪. 2011. 茶樹密碼子用法分析[J]. 茶葉科學(xué),31(4):319-325.
Zhao Y,Yang Y,Liu Z,Yang P D. 2011. Analysis of codon usage in tea plant[J]. Journal of Tea Science,31(4):319-325.
Chen S L,Lee W,Hottes A K,Shapiro L,McAdams H H. 2004. Codon usage between genomes is constrained by genome-wide mutational processes[J]. Proceedings of the National Academy of Sciences of the USA,101(10):3480-3485.
Christianson M L. 2005. Codon usage patterns distort phylogenies,from or of DNA sequences[J]. American Journal of Botany,92(8):1221-1233.
Goetz R M,F(xiàn)uglsang A. 2005. Correlation of codon bias measures with mRNA levels:Analysis of transcriptome data from Escherichiacoli[J]. Biochemical and Biophysical Research Communication,327(1):4-7.
Guo X Y,Bao J D,F(xiàn)an L J. 2007. Evidence of selectively driven codon usage in rice:implications for GC content evolution of Gramineae genes[J]. FEBS Letter,581(5):1015-1021.
Hershberg R,Petrov D A. 2008. Selection on codon bias[J]. Annual Review Genetics,42(1):287-299.
Hershberg R,Petrov D A. 2009. General roles for optimal codon choice[J]. PLoS Genetics,5(7):e1000556.
Hulbert S H,Richter T E,Axtell J D,Bennetzen J L. 1990. Genetic mapping and characterization of sorghum and related crops by means of maize DNA probes[J]. Proceedings of the National Academy of Sciences,87(11):4251-4255.
Ingvarsson P K. 2007. Gene expression and protein length influence codon usage and rates of sequence evolution in populus tremula[J]. Molecular Biology and Evolution,24(3):836-844.
Jiang Y,Deng F,Wang H,Hu Z H. 2008. An extensive analysis on the global codon usage pattern of baculoviruses[J]. Ar-
chives of Virology,153(12):2273-2282.
Kawabe A,Miyashita N T. 2003. Patterns of codon usage bias in three dicot and four monocot plant species[J]. Genes & Genetic Systems,78(5):343-352.
Kimura M. 1981. Possibility of extensive neutral evolution under stabilizing selection with special reference to non-random usage of synonymous codons[J]. Proceedings of the National Academy of Sciences of the USA,78(9):5773-5777.
Li W H. 1987. Models of nearly neutral mutations with particular implications for nonrandom usage of synonymous codons[J]. Journal of Molecular Evolution,24(4):337-345.
Liu H M,He R,Zhang H Y,Huang Y B,Tian M L,Zhang J J. 2010. Analysis of synonymous codon usage in Zea mays[J]. Molecular Biology Reports,37(2):677-684.
Mukhopadhyay P,Basak S,Ghosh T C. 2008. Differential selective constraints shaping codon usage pattern of housekee-
ping and tissue-specific homologous genes of rice and Arabidopsis[J]. DNA Research,15(6):347-356.
Palidwor G A,Perkins T J,Xia X. 2010. A general model of codon bias due to GC mutational bias[J]. PLoS One,5(10):e13431.
Sharp P M,Li W H. 1987. The codon adaptation index—a measure of directional synonymous codon usage bias and its potential applications[J]. Nucleic Acids Research,15(3):1281-1295.
Tatarinova T V,Alexandrov N N,Bouck J B,F(xiàn)eldmann K A. 2010. GC3 biology in corn,rice,sorghum and other grasses[J]. BMC Genomics,11:308.
Wang H C,Hickey D A. 2007. Rapid divergence of codon usage patterns within the rice genome[J]. BMC Evolutionary Bio-
logy,7(S1):S6.
Wright F. 1990. The‘effective number of codonsused in a gene[J]. Gene,87(1):23-29.
(責(zé)任編輯 王 暉)