劉嘉欣 陳志陽
摘?要:植物L(fēng)EAFY(LFY)基因編碼植物特有的一類轉(zhuǎn)錄因子,在顯花植物營養(yǎng)生長向生殖生長的轉(zhuǎn)變中起了重要作用。本研究采用同源性檢索、系統(tǒng)進(jìn)化分析和正選擇作用檢測等方法對植物L(fēng)EAFY基因進(jìn)行了系統(tǒng)的進(jìn)化分析,結(jié)果發(fā)現(xiàn)植物L(fēng)EAFY基因最早起源于輪藻,并在陸生植物基因組中穩(wěn)定遺傳下來;不同陸生植物基因組的LEAFY基因具有相似的基因結(jié)構(gòu);單子葉植物的LEAFY基因經(jīng)歷了明顯的正選擇作用,而玉米和油棕中分別具有2個LEAFY基因,且其中的一個經(jīng)歷了正選擇作用,可能與新功能的形成及功能分化有關(guān)。
關(guān)鍵詞:植物;LEAFY基因;系統(tǒng)進(jìn)化;正選擇作用
The origin and evolution of the plant LEAFY gene
Liu Jiaxin?Chen Zhiyang
Jiangsu Key Laboratory of Crop Genetics and Physiology/Key Laboratory of Plant Functional Genomics
of the Ministry of Education/Jiangsu Key Laboratory of Crop Genomics and Molecular Breeding,
Agricultural College of Yangzhou University?JiangsuYangzhou?225009
Abstract:The plant LEAFY(LFY) gene encodes a type of plant-specific transcription factors,which plays an important role in the transformation of vegetative to reproductive growth in flowering plants.In this study,a comprehensive analysis of sequence similarity,phylogenetic analysis and positive selection was performed to investigate the molecular evolution of LEAFY genes in plants.The results revealed that the plant LEAFY genes have first emerged in the streptophyte algae,and then were stably inherited in land plant genomes.Gene structure analysis suggested that plant LEAFY genes shared similar gene structure in different genomes of land plants.In addition,LEAFY genes have undergone positive selection in monocots,whereas only one of both two LEAFY genes in Zea mays and Elaeis guineensis were detected under positive selection,respectively,which might be associated with the formation of novel function and functional divergence.
Key words:Plant;LEAFY gene;Phylogenenetic analysis;Positive selection
植物在由營養(yǎng)生長向生殖生長的轉(zhuǎn)變過程中,需要多個基因協(xié)同調(diào)控。其中LEAFY基因在該過程中具有至關(guān)重要的作用[1]。LEAFY基因編碼植物特有的一類轉(zhuǎn)錄因子,在金魚草中克隆的LEAFY基因FLORICAULA具有啟動植物開花過程并調(diào)控花生長發(fā)育的作用。擬南芥LEAFY基因的突變體具有與金魚草同源基因相似的功能,而過表達(dá)該基因則使得植株花期提前,并且側(cè)枝均被單一花器官所替代。除了調(diào)控花的生長發(fā)育之外,LEAFY基因還具有調(diào)控?zé)煵蓓敹朔稚M織發(fā)育、番茄復(fù)葉發(fā)育和水稻花序分枝等功能[3,4]。
在大部分顯花植物中,LEAFY基因只具有一個拷貝[5],并且每一LEAFY基因通常具有2個內(nèi)含子,其第二個內(nèi)含子經(jīng)常被用來作為被子植物系統(tǒng)發(fā)育分析的參考序列。在玉米基因組中,具有2個LEAFY基因,分別是Zfl1和Zfl2,其突變體具有與其他植物相似的調(diào)控花器官生長發(fā)育的作用,并且在不同的玉米雜種優(yōu)勢群中,具有明顯人工選擇的信號[6]。本文擬基于在基因組水平上對LEAFY基因的鑒定,通過系統(tǒng)進(jìn)化樹分析該基因在植物中的進(jìn)化規(guī)律,并通過正選擇作用的分析,闡明其在禾本科植物進(jìn)化過程中經(jīng)歷的選擇壓力。
1 材料與方法
1.1 植物L(fēng)EAFY基因的鑒定
利用擬南芥(AtLFY)和玉米的LEAFY基因(Zfl1和Zfl2)編碼的蛋白質(zhì)序列作為檢索序列,采用BLASTP檢索Phytozome[9]和NCBI的nr和ref_seq序列數(shù)據(jù)庫,獲得植物代表性物種基因組中的LEAFY同源基因,并下載相應(yīng)的編碼區(qū)序列和基因組序列。
1.2 植物L(fēng)EAFY基因序列分析與系統(tǒng)進(jìn)化樹構(gòu)建
通過Cluster X[7]對所有代表性物種LEAFY蛋白序列進(jìn)行比對,將比對結(jié)果輸入MEGA[8]軟件中,分別采用極大似然法(ML)法和鄰接法(NJ)構(gòu)建系統(tǒng)進(jìn)化樹。極大似然法和鄰接法參數(shù)設(shè)置都為JTT模型,bootstrap重抽樣100次以獲取每一分枝的支持率。系統(tǒng)進(jìn)化樹的顯示利用MEGA軟件。
1.3 正選擇作用檢測
利用PAML[9]中的CODEML軟件包對所有單子葉植物L(fēng)EAFY基因的dN/dS(ω)值進(jìn)行計(jì)算。使用PAL2NAL軟件[10]對代表性物種蛋白質(zhì)和與之對應(yīng)的核苷酸序列進(jìn)行轉(zhuǎn)換,得到對齊的核苷酸序列,將該序列輸入CODEML程序進(jìn)行分析。
利用“位點(diǎn)特異性”模型中的M3/M0和M8/M7進(jìn)行似然比檢驗(yàn)(LRT)。其中M3/M0模型用來檢測編碼位點(diǎn)之間選擇壓力的差異,而M8/M7模型用來對正選擇作用位點(diǎn)進(jìn)行估計(jì)。在每個似然比檢驗(yàn)中,對兩對模型的對數(shù)似然值差數(shù)的2倍(2ΔlnL)進(jìn)行卡方(χ2)測驗(yàn),自由度為模型中參數(shù)個數(shù)的差值。其中M3/M0模型LRT的自由度為3,M8/M7模型LRT的自由度為2。
利用“分枝-位點(diǎn)”模型檢測正選擇對單子葉植物L(fēng)EAFY基因在植物的固定中起到的作用。分別設(shè)定單子葉植物基因簇中的每個基因?yàn)榍熬爸ΓS酁楸尘爸?,進(jìn)行正選擇作用檢測。通過比較備擇假設(shè)和無效假設(shè)對9個單子葉植物L(fēng)EAFY基因受到的選擇壓力進(jìn)行適應(yīng)性分析。在似然比測驗(yàn)為顯著的前提下,進(jìn)一步利用貝葉斯經(jīng)驗(yàn)貝葉斯(BEB)方法計(jì)算前景枝中每個位點(diǎn)經(jīng)歷的正選擇作用后驗(yàn)概率值。
2 結(jié)果與分析
2.1 植物L(fēng)EAFY基因的鑒定
本研究分別以擬南芥和水稻的LEAFY基因作為檢索序列,在NCBI的nr數(shù)據(jù)庫中進(jìn)行了檢索,結(jié)果發(fā)現(xiàn)LEAFY基因僅存在于植物中,在其他物種中沒有發(fā)現(xiàn)同源基因。進(jìn)一步分析發(fā)現(xiàn)在綠藻中也不存在同源基因,但在輪藻Klebsormidium nitens基因組中具有同源基因。除此之外,雖然沒有獲得輪藻Chara vulgaris基因組中的全長基因序列,但在該基因組中也有部分同源序列。而在陸生植物基因組中則普遍具有同源基因。由此表明,LEAFY基因最早起源于輪藻,并傳遞到所有陸生植物中。
為進(jìn)一步闡明該基因在植物中的起源和進(jìn)化模式,本研究篩選了陸生植物18個代表性物種對該基因的進(jìn)化進(jìn)行分析。LEAFY基因在這些物種的基因組中分布不均衡,其中玉米、油棕、小立碗蘚和江南卷柏中具有2個LEAFY基因,而在其他植物的基因組中只具有1個LEAFY基因。
2.2 植物L(fēng)EAFY基因的系統(tǒng)進(jìn)化分析
對18個代表性植物的22個LEAFY基因分別采用極大似然法和鄰接法構(gòu)建了系統(tǒng)進(jìn)化樹,兩種方法構(gòu)建的系統(tǒng)進(jìn)化樹具有相似的拓?fù)浣Y(jié)構(gòu),并且系統(tǒng)進(jìn)化關(guān)系與植物系譜進(jìn)化關(guān)系比較一致。此外,4個物種中具有的LEAFY旁系同源基因均位于進(jìn)化樹的末端或相對末端,表明這些旁系同源基因是其物種基因組與其他主要系譜分化之后通過復(fù)制形成的。進(jìn)一步分析了不同物種LEAFY基因的外顯子/內(nèi)含子結(jié)構(gòu),結(jié)果發(fā)現(xiàn)除了輪藻Klebsormidium nitens的KnLFY基因之外(6個內(nèi)含子),植物L(fēng)EAFY普遍具有2-3個內(nèi)含子,并且內(nèi)含子所在的位置是非常保守的。
2.3 單子葉植物L(fēng)EAFY基因的選擇壓力分析
正選擇檢測的“位點(diǎn)特異性”模型能有效估算一組同源基因的正選擇效應(yīng),本研究基于該模型對單子葉植物L(fēng)EAFY基因進(jìn)行了正選擇檢測。在該模型下,每個位點(diǎn)的dN/dS(ω)值不同,當(dāng)ω>1時,認(rèn)為位點(diǎn)經(jīng)歷了正選擇作用。首先通過比較M0和M3模型估算每個氨基酸位點(diǎn)的ω值,從而判斷同源基因在進(jìn)化過程中是否存在不同的選擇壓力。結(jié)果發(fā)現(xiàn)M0模型下ω估計(jì)值為0.0752,表明純化選擇是單子葉植物L(fēng)EAFY基因進(jìn)化過程中受到的主要選擇壓力。然而基于M3/M0的似然比測驗(yàn)發(fā)現(xiàn)達(dá)到了顯著水平,表明不同氨基酸位點(diǎn)存在選擇壓力的差異。進(jìn)一步通過M8/M7模型的似然比測驗(yàn)鑒定受到正選擇作用的氨基酸位點(diǎn),結(jié)果發(fā)現(xiàn)該基因在單子葉植物中的進(jìn)化受到了正選擇作用的影響。在M8模型下進(jìn)行了貝葉斯后驗(yàn)概率估計(jì),發(fā)現(xiàn)了5個氨基酸位點(diǎn)存在明顯的正選擇作用。
進(jìn)一步利用“分枝-位點(diǎn)”模型檢測9個單子葉植物L(fēng)EAFY基因的正選擇作用位點(diǎn),通過比較備擇假設(shè)和無效假設(shè)對這些基因受到的選擇壓力進(jìn)行適應(yīng)性分析,并通過貝葉斯方法對前景枝每個位點(diǎn)受到的正選擇作用的后驗(yàn)概率進(jìn)行估計(jì)(表2)。玉米Zfl1和Zfl2的LRT結(jié)果為一個顯著一個不顯著,說明正選擇在玉米Zfl1的進(jìn)化中起了重要作用。其中在玉米Zfl1中檢測到2個平均后驗(yàn)概率大于50%的正選擇位點(diǎn)143K和274A,油棕中兩個LEAFY基因的LRT結(jié)果也為一個顯著一個不顯著,同樣在EgLFY1基因中檢測出了正選擇位點(diǎn)166T和331A。說明在玉米和油棕的進(jìn)化過程中,Zfl1和EgLFY1經(jīng)歷了正選擇,進(jìn)化出了新的功能,而Zfl2和EgLFY2經(jīng)歷了純化選擇,保留了其原始的功能。其中正選擇位點(diǎn)143K和274A、166T和331A分別對Zfl1和EgLFY1基因功能的固定起到了關(guān)鍵作用。其余單子葉植物單拷貝LEAFY基因的LRT結(jié)果均未達(dá)到顯著。
3 討論
對植物L(fēng)EAFY基因在主要代表性植物物種中的分布進(jìn)行分析,發(fā)現(xiàn)其同源基因只存在于植物中,并且在綠藻中沒有同源基因,但在輪藻中存在同源基因,由此表明LEAFY基因起源于鏈形植物(包括輪藻和陸生植物)的祖先物種。直系同源基因是指起源于共同祖先但存在于不同物種之間的基因,基因復(fù)制則是在同一物種中發(fā)生的。在所有已測序的基因組中都存在大量的基因復(fù)制現(xiàn)象,通過重復(fù)基因之間的功能冗余,可以保持遺傳系統(tǒng)的穩(wěn)定[11]。本研究對植物L(fēng)EAFY基因的起源以及進(jìn)化模式進(jìn)行分析,發(fā)現(xiàn)該基因在大部分代表性植物物種中僅存在單拷貝,在部分物種,如玉米、油棕、江南卷柏和小立碗蘚中存在基因復(fù)制現(xiàn)象,但也只存在2個拷貝。
選擇壓力(用ω值表示)作為進(jìn)化驅(qū)動力,對基因功能多樣性的形成起到了關(guān)鍵作用,ω<1、ω=1和ω>1分別代表了純化選擇、中性進(jìn)化和正選擇,其中正選擇是物種適應(yīng)環(huán)境的表現(xiàn),有利于獲得新的基因和功能,而純化選擇有助于基因保留有利的功能[12,13]。對單子葉植物L(fēng)EAFY基因的選擇壓力進(jìn)行分析,發(fā)現(xiàn)純化選擇是單子葉植物L(fēng)EAFY基因在進(jìn)化過程中受到的主要選擇壓力,但是在不同基因上存在差異?;蛑貜?fù)是遺傳創(chuàng)新的重要來源,新功能化和亞功能化都是基因家族中重復(fù)基因的進(jìn)化模式[14],在遺傳變異過程中可以使作物獲得新的功能從而應(yīng)對環(huán)境的變化。FLO/LFY在植物從營養(yǎng)生長向生殖生長的轉(zhuǎn)變中起著重要的作用,其玉米中的同源基因Zfl1和Zfl2在生殖發(fā)育中的功能很大程度上是非常保守的[15]。本研究發(fā)現(xiàn),玉米的兩個LEAFY基因中,只有Zfl1基因經(jīng)歷了正選擇作用。正選擇作用往往與新功能的產(chǎn)生或功能分化有關(guān),由此說明玉米的Zfl1和Zfl2基因具有功能分化。這兩個重復(fù)基因的功能分化已經(jīng)通過數(shù)量性狀位點(diǎn)(QTL)定位的方法得到了證實(shí),Zfl1主要行使與開花時間相關(guān)的功能,而Zfl2主要調(diào)控分枝和花序的結(jié)構(gòu)[16]。由此表明,單拷貝基因往往具有保守的功能,而重復(fù)基因往往由于正選擇作用等產(chǎn)生功能分化。
參考文獻(xiàn):
[1]Coen E S,Romero J M,Doyle S,et al.floricaula:a homeotic gene required for flower development in antirrhinum majus[J].Cell 1990,63(6):1311-1322.
[2]張亞萍,習(xí)珺珺,于麗霞,等.LEAFY(LFY)基因在花發(fā)育網(wǎng)絡(luò)調(diào)控中的研究進(jìn)展[J].現(xiàn)代農(nóng)業(yè)科技,2012,9:11-13.
[3]馮延芝,李芳東,王璐,等.LEAFY同源基因系統(tǒng)進(jìn)化及研究進(jìn)展[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2016,36(2):25-32.
[4]Van de Peer Y,Mizrachi E,Marchal K.The evolutionary significance of polyploidy[J].Nature Reviews Genetics,2017,18(7):411-424.
[5]Bomblies K,Wang R L,Ambrose B A,et al.Duplicate FLORICAULA/LEAFY homologs zfl1 and zfl2 control inflorescence architecture and flower patterning in maize[J].Development,2003,130(11):2385-2395.
[6]Goodstein D M,Shu S,Howson R,et al.Phytozome:a comparative platform for green plant genomics[J].Nucleic acids research,2012,40(D1):D1178-1186.
[7]Tuimala J.Using ClustalX for multiple sequence alignment[J].Methods Enzymol,2004,226:383-402.
[8]Kumar S,Stecher G,Tamura K.MEGA7:Molecular Evolutionary Genetics Analysis Version 7.0 for Bigger Datasets[J].Molecular biology and evolution,2016,33(7):1870-1874.
[9]Yang Z.PAML:a program package for phylogenetic analysis by maximum likelihood[J].Bioinformatics,1997,13(5):555-556.
[10]Suyama M,Torrents D,Bork P.PAL2NAL:robust conversion of protein sequence alignments into the corresponding codon alignments[J].Nucleic acids research,2006,34(suppl_2):W609-W612.
[11]Lynch M,Conery J S.The evolutionary fate and consequences of duplicate genes[J].Science,2000,290(5494):1151-1155.
[12]Klassen J L.Pathway evolution by horizontal transfer and positive selection is accommodated by relaxed negative selection upon upstream pathway genes in purple bacterial carotenoid biosynthesis[J].Journal of bacteriology,2009,191(24):7500-7508.
[13]Kosiol C,Vinarˇ T,da Fonseca R R,et al.Patterns of positive selection in six mammalian genomes[J].PLoS genetics,2008,4(8):e1000144.
[14]Sandve S R,Rohlfs R V,Hvidsten T R.Subfunctionalization versus neofunctionalization after whole-genome duplication[J].Nature genetics,2018,50(7):908-909.
[15]Hofer J,Turner L,Hellens R,et al.UNIFOLIATA regulates leaf and flower morphogenesis in pea[J].Current Biology,1997,7(8):581-587.
[16]Bomblies K,Doebley J F.Pleiotropic effects of the duplicate maize FLORICAULA/LEAFY genes zfl1 and zfl2 on traits under selection during maize domestication[J].Genetics,2006,172(1):519-531.
作者簡介:劉嘉欣(1995-),女,江蘇常州人,揚(yáng)州大學(xué)農(nóng)學(xué)院碩士碩士,主要從事作物遺傳育種研究。