張?jiān)?,王佳琪,于子建,許強(qiáng),張嵐,潘玉欣
(華北理工大學(xué)生命科學(xué)學(xué)院,河北 唐山,063210)
MADS-box基因家族是一類(lèi)生物功能豐富,在植物中廣泛存在的序列特殊的同源異型基因。釀酒酵母的MCMI、擬南芥的AGAMOUS、金魚(yú)草的DEFICIENS和人類(lèi)的SRF4四種基因的首字母構(gòu)成MADS-box基因的名稱(chēng)。MADS-box基因的蛋白中都含有1 個(gè)由約58 個(gè)氨基酸組成的保守結(jié)構(gòu)域,即MADS 盒[1]。根據(jù)不同的分類(lèi)標(biāo)準(zhǔn),MADS-box基因可分為Ⅰ型和Ⅱ型(MIKC 型),也可以分成5 個(gè)小類(lèi):Mα、Mβ、Mγ、MIKCc、MIKC*,其中Mα、Mβ、Mγ屬于Ⅰ型,MIKCc、MIKC*屬于Ⅱ型。Ⅰ型植物的MADS-box基因只有1~2 個(gè)外顯子,編碼蛋白缺少K(Keratin-like)-box 域,含有1 個(gè)高度保守的MADS域。MIKC 型MADS-box基因在植物基因組結(jié)構(gòu)和功能的研究方面較為清楚,一般含有6個(gè)內(nèi)含子和7個(gè)外顯子[2]。這類(lèi)型基因通常含有MADS、K-box、I(Intervening)和C(C-terminal)4 個(gè)結(jié)構(gòu)域,MADS 域非常保守,在所有基因中均存在,K-box 域半保守,在大部分基因中存在,I結(jié)構(gòu)域和C結(jié)構(gòu)域的保守性很低。
分布于植物中的MADS-box基因功能豐富,參與了植物生長(zhǎng)發(fā)育的各個(gè)時(shí)期,包括調(diào)控花器官、根的生長(zhǎng)發(fā)育以及雌雄配子、胚胎、種子、果實(shí)的發(fā)育等,也參與調(diào)控光合作用、營(yíng)養(yǎng)代謝、多種脅迫響應(yīng)等途徑[3~5]。MIKC 型MADS-box基因在花發(fā)育的各個(gè)時(shí)期具有重要調(diào)控作用,大部分MIKC 型MADS-box基因都是花器官?zèng)Q定基因[6]。MIKCC型包括14 個(gè)亞類(lèi)AP1、AP3、PISTILLATA(PI)、AGAMOUS(AG)/SEEDSTICK(STK) 、AGAMOUS-LIKE6(AGL6)、AGL12、AGL15、AGL17、BSISTER(BS)、SUPPRESSOR OF OVEREXPRESSION OF CONSTANS1(SOC1)、SHORT VEGETATIVE PHASE(SVP)、FLOWERING LOCUS C(FLC) 、SEPALLATA1(SEP1)[5,7]。MIKCC型基因亞類(lèi)的功能各有不同,如SOC1、FLC、SVP等亞類(lèi)調(diào)控開(kāi)花的時(shí)間,SEP1、AP3、PI和AG亞類(lèi)決定花器官的特異性,AP1亞類(lèi)決定花器官和分生組織的特異性[8,9]。有關(guān)花器官發(fā)育的特異性基因主要源于擬南芥花分化ABCDE模型。參與花器官形態(tài)建成的MIKC 型MADS-box基因AP1屬于A 類(lèi)基因,PI、AP3屬于B 類(lèi)基因,AG屬于C 類(lèi)基因,STK/AGL11和SHP屬于D 類(lèi)基因,SEP1、SEP2、SEP3、SEP4屬于E類(lèi)基因[6]。
MADS-box基因家族的結(jié)構(gòu)和功能在小麥[5]、擬南芥[10]、陸地棉[11]、萵苣[12]和甘藍(lán)型油菜[13]等多種植物中均有研究。擬南芥中共鑒定出107 條MADSbox基因,且根據(jù)進(jìn)化關(guān)系將MADS-box基因劃分為Mα、Mβ、Mγ、MIKCc和MIKC*五類(lèi)[10]。利用已知序列MADS 結(jié)構(gòu)域的多序列比對(duì)以及系統(tǒng)發(fā)育樹(shù)分析,小麥201 條MIKC 型MADS-box基因分為15個(gè)亞類(lèi),家族基因重復(fù)多存在于遠(yuǎn)端端粒區(qū),亞家族內(nèi)基因表達(dá)模式較相似[5]。MADS-box基因表達(dá)模式的不同揭示其進(jìn)化過(guò)程出現(xiàn)了功能分化[11,12]。
多倍化在植物進(jìn)化和物種形成中起著十分重要的作用,豐富了物種基因功能的多樣性,增強(qiáng)了物種的適應(yīng)性[14]。豆科是第三大植物科,是動(dòng)物和人類(lèi)營(yíng)養(yǎng)物質(zhì)的重要來(lái)源。研究表明,約1.3~1.5億年前豆科與其它雙子葉植物共有祖先發(fā)生了一次全基因組三倍化事件,約5900萬(wàn)年前豆科植物共同經(jīng)歷了一次全基因組二倍化事件,大豆在與其它豆科植物分化后約1300 萬(wàn)年前又發(fā)生了一次特異性的全基因組二倍化事件[15]。在大豆基因組中鑒定了57 個(gè)MIKC 型基因,均具有保守的MADS 和Kbox基序,AP1,AG,AP3,PI,SVP和SOC1基因均存在多拷貝現(xiàn)象[8]。全基因組復(fù)制事件對(duì)MIKC 類(lèi)基因的擴(kuò)張起重要作用,導(dǎo)致MIKC 類(lèi)基因在進(jìn)化過(guò)程中被選擇性保留[13],但多倍化對(duì)MIKC 型MADS-box基因擴(kuò)張的影響缺乏深入分析。
本研究基于更新的豆科植物數(shù)據(jù)庫(kù),對(duì)大豆(Glycine max)、蒺藜苜蓿(Medicago truncatula)MIKC型MADS-box基因家族的基因結(jié)構(gòu)、蛋白質(zhì)理化性質(zhì)、保守結(jié)構(gòu)域、系統(tǒng)發(fā)育關(guān)系、共線性與進(jìn)化速率、基因表達(dá)模式、蛋白互作等進(jìn)行分析,為揭示MADS-box家族的生物學(xué)功能奠定基礎(chǔ)。
從TAIR(http://www. arabidopsis. org/. Araport11)下載擬南芥MADS-box基因家族的蛋白序列,從PeanutBase(https://www. peanutbase. org)數(shù)據(jù)庫(kù)下載大豆、蒺藜苜蓿的全基因組數(shù)據(jù),從JGI(https://genome. jgi. doe. gov. v2.1)數(shù)據(jù)庫(kù)下載葡萄全基因組數(shù)據(jù)。利用HMMER[16]軟件(E 值≤0.05),根據(jù)文獻(xiàn)報(bào)道的107 個(gè)擬南芥MADS-box蛋白序列[9]構(gòu)建HMM 模型,在大豆、蒺藜苜蓿和葡萄全基因組數(shù)據(jù)中篩選候選基因,通過(guò)CDD(https://www. ncbi. nlm. nih. gov)、PFAM(http://pfam.xfam. org)、SMART(http://smart. embl-heidelberg.de/)預(yù)測(cè)候選蛋白結(jié)構(gòu)域,去除冗余蛋白序列,最終確定含MADS 結(jié)構(gòu)域的蛋白序列為MADS-box家族成員。
提取大豆、蒺藜苜蓿與葡萄的MADS 結(jié)構(gòu)域蛋白序列,用MAFFT[17,18]對(duì)大豆、蒺藜苜蓿、葡萄和擬南芥包含MADS 結(jié)構(gòu)域的蛋白序列進(jìn)行多序列比對(duì),根據(jù)序列比對(duì)結(jié)果利用IQ-TREE[19]軟件和ModelFinder[20]構(gòu)建系統(tǒng)發(fā)育樹(shù),初步確定其分類(lèi);利用BLAST+[21]將得到的大豆、蒺藜苜蓿和葡萄的MADS-box 蛋白序列與擬南芥的MADS-box 進(jìn)行序列比對(duì),按照擬南芥的功能分類(lèi)[10],對(duì)系統(tǒng)發(fā)育樹(shù)的分類(lèi)進(jìn)行驗(yàn)證,最終確定MADS-box基因的I 型和II型分類(lèi)。
將MIKC 型蛋白序列進(jìn)行MAFFT 比對(duì),利用IQ-TREE 軟件和MODELFINDER(最佳擬合模型:JTT+R7)構(gòu)建系統(tǒng)發(fā)育樹(shù)。參照擬南芥的MIKC 型基因功能分類(lèi)和系統(tǒng)發(fā)育樹(shù)[10],將大豆、蒺藜苜蓿和葡萄的MIKC 型MADS-box基因分類(lèi),并進(jìn)行系統(tǒng)發(fā)育分析。
利用NOTUNG[22]軟件的Rooting Mode 功能將MADS-box基因樹(shù)與物種樹(shù)作比較,推斷基因的復(fù)制與丟失事件。
利 用ExPASy-ProtParam(https://web. expasy.org/protparam/)[23]在線工具預(yù)測(cè)大豆、蒺藜苜蓿MIKC 型MADS-box 蛋白質(zhì)的基本理化性質(zhì),包括氨基酸長(zhǎng)度、分子質(zhì)量、等電點(diǎn)、不穩(wěn)定指數(shù)等。利用亞細(xì)胞定位工具WolF PSORT(https://wolfpsort.hgc.jp/)[24]預(yù)測(cè)MADS-box基因細(xì)胞內(nèi)定位情況。
利用基因結(jié)構(gòu)顯示軟件GSDS[25](http://gsds.cbi.pku.edu.cn/)分析MIKC 型基因結(jié)構(gòu);利用序列分析工具M(jìn)EME[26](http://meme-suite.org/)分析各基因組中MIKC 型MADS-box 蛋白序列保守基序(motif),其中,基序最大發(fā)現(xiàn)數(shù)目為20,基序最大長(zhǎng)度為50;利用數(shù)據(jù)處理工具包TBtools[27]將結(jié)果進(jìn)行可視化。
利用MCScanX[28]預(yù)測(cè)大豆、蒺藜苜蓿和葡萄MIKC 型MADS-box基因的復(fù)制類(lèi)型,并對(duì)其基因組內(nèi)和基因組間的共線性進(jìn)行分析;利用Python 語(yǔ)言編寫(xiě)程序,計(jì)算該基因家族成員共線性基因?qū)﹂g的同義替換率KS值;利用Circos 軟件[29]繪制與多倍化事件相關(guān)的同源關(guān)系圖。
在NCBI 的GEO 數(shù)據(jù)庫(kù)下載大豆轉(zhuǎn)錄組數(shù)據(jù)(https://www. ncbi. nlm. nih. gov/geo/query/acc. cgi?acc=GSE99571)[30],包 括 大 豆 子 葉 期 胚 胎(COT.EP)、大豆早熟期胚胎(EM. EP)、大豆中熟期胚胎(MM.EP)、大豆晚熟期胚胎(AA1.EP)、大豆干種子期(Dry)和大豆幼苗期(SDLG. COT)6 個(gè)組織,計(jì)算三次重復(fù)實(shí)驗(yàn)數(shù)據(jù),取其平均值,并使用軟件TBtools繪制聚類(lèi)熱圖。
利用STRING[31](https://stringdb. org/)數(shù)據(jù)庫(kù)預(yù)測(cè)可能與大豆MIKC 型MADS-box 蛋白相互作用的蛋白質(zhì)。
通過(guò)多序列比對(duì)和系統(tǒng)發(fā)育樹(shù)分析,4 個(gè)物種共鑒定出232 個(gè)MIKC 型MADS-box基因,包括擬南芥45 個(gè)、大 豆92 個(gè)、蒺 藜 苜 蓿45 個(gè)、葡 萄50個(gè)(圖1)。
圖1 4個(gè)物種MIKC型MADS-box基因在不同亞類(lèi)中的數(shù)量分布Fig.1 Quantity distribution of MIKC-type MADS-box genes in different subfamilies of each species
根據(jù)擬南芥MIKC 型基因的功能分類(lèi)和系統(tǒng)發(fā)育樹(shù)[10],將大豆、蒺藜苜蓿、葡萄和擬南芥MIKC 型基因分為MIKCC和MIKC*兩類(lèi),其中MIKCC包括除MIKC*型之外的14個(gè)亞類(lèi)(圖2)。從系統(tǒng)發(fā)育樹(shù)看出,除SVP、SOC1、AGL15亞類(lèi)外其余亞類(lèi)樹(shù)形分布基本符合各物種基因組的多倍化過(guò)程,大豆與蒺藜苜蓿親緣關(guān)系較近。SVP、SOC1、AGL15亞類(lèi)個(gè)別基因不符合基因組的多倍化過(guò)程,而且存在部分基因丟失情況。FLC亞類(lèi)基因在擬南芥發(fā)育過(guò)程中調(diào)控春化開(kāi)花,基因數(shù)量熱圖顯示大豆僅有2 個(gè)FLC類(lèi)基因,蒺藜苜蓿缺少FLC類(lèi)基因。大豆和蒺藜苜蓿AG、AP1和SEP1亞類(lèi)基因數(shù)量相對(duì)較多,基因功能較豐富[32]。
圖2 擬南芥、葡萄、大豆和蒺藜苜蓿MIKC型MADS-box基因家族系統(tǒng)發(fā)育樹(shù)Fig.2 Phylogenetic tree of MIKC-type MADS-box gene family in Arabidopsis,grape,soybean and Medicago
利用NOTUNG 分析MIKC 型MADS-box基因在物種樹(shù)各進(jìn)化節(jié)點(diǎn)上的基因擴(kuò)增與丟失情況(圖3)。4 個(gè)物種的祖先節(jié)點(diǎn)有64 個(gè)基因發(fā)生了復(fù)制,大豆和蒺藜苜蓿的共同祖先節(jié)點(diǎn),18 個(gè)基因被復(fù)制,17 個(gè)基因發(fā)生了丟失,基因整體的數(shù)目沒(méi)有發(fā)生較大的變化。大豆家族基因復(fù)制的數(shù)目(+41)比蒺藜苜蓿(+2)的多,而蒺藜苜蓿家族基因丟失的數(shù)目(-17)比大豆(-9)多,可以得出大豆MADS-box基因發(fā)生了擴(kuò)增,而蒺藜苜蓿的家族基因發(fā)生了丟失。整體來(lái)看,4 個(gè)物種有152 個(gè)MADS-box基因復(fù)制,107個(gè)MADS-box基因丟失。
圖3 擬南芥、葡萄、大豆和蒺藜苜蓿MIKC型MADS-box基因的復(fù)制和丟失Fig.3 Duplication and loss of MIKC-type MADS-box genes in Arabidopsis,grape,soybean and Medicago
編碼大豆MIKC 型MADS-box 蛋白的氨基酸長(zhǎng)度范圍從126 到354,分子量范圍從10915.86 到40409.85kD,等電點(diǎn)范圍從5.30 到10.11(只有極少數(shù)蛋白等電點(diǎn)小于7,MIKC*和BS 亞類(lèi)蛋白等電點(diǎn)小于7)(表1)。編碼蒺藜苜蓿MIKC 型MADSbox蛋白的氨基酸長(zhǎng)度范圍從50到402,分子量范圍從13023.95 到7054.27kD,等電點(diǎn)范圍從5.22 到10.65(只有極少數(shù)蛋白等電點(diǎn)小于7)(表2)。
理化性質(zhì)分析結(jié)果顯示大豆和蒺藜苜蓿MIKC型MADS-box基因所編碼蛋白質(zhì)等電點(diǎn)80%大于7,屬于堿性蛋白。蛋白的不穩(wěn)定系數(shù)大于30,屬于不穩(wěn)定蛋白。
亞細(xì)胞定位結(jié)果(表1 和表2)表明89%以上的MADS-box基因均定位在細(xì)胞核(nucleus),大豆和蒺藜苜蓿均只有7 個(gè)基因位于其他部位,其余基因均位于細(xì)胞核,符合轉(zhuǎn)錄因子的特征。
表1 大豆MIKC型MADS-box蛋白的理化性質(zhì)及亞細(xì)胞定位Table 1 Physicochemical properties and subcellular localization of soybean MIKC-type MADS-box proteins
表2 蒺藜苜蓿MIKC型MADS-box蛋白的理化性質(zhì)及亞細(xì)胞定位Table 2 Physicochemical properties and subcellular localization of Medicago MIKC-type MADS-box proteins
基因結(jié)構(gòu)分析表明MIKC 型MADS-box基因結(jié)構(gòu)比較保守,MIKC*型大部分基因含9~11 個(gè)左右的外顯子,只有兩條含2~3 個(gè)外顯子;其他14 個(gè)亞類(lèi)大部分均有7~8個(gè)左右的外顯子,只有約8%基因含有2~3 個(gè)外顯子,大豆和蒺藜苜蓿均含有較長(zhǎng)的內(nèi)含子。
蛋白質(zhì)基序分析結(jié)果(圖4)表明MIKC 型MADS-box 蛋白均含有MADS 結(jié)構(gòu)域,大部分含有K-box 結(jié)構(gòu)域,但MADS-box 蛋白序列間I 結(jié)構(gòu)域和C 結(jié)構(gòu)域的保守性較低,缺乏共有基序。MADS 結(jié)構(gòu)域由motif1、motif3、motif5 構(gòu)成,所有蛋白中至少含有其中一個(gè)motif,所有的大豆和蒺藜苜蓿蛋白均含有motif1。K-box 結(jié)構(gòu)域由motif2、motif4、motif6、motif7、motif12、motif17 構(gòu)成,不同亞家族K-box 結(jié)構(gòu)域包含的基序略有不同。例如在PI、AP3 亞類(lèi)中K-box 結(jié)構(gòu)域由motif2、motif12 構(gòu)成,在AG/STK,AGL17 亞類(lèi)中K-box 結(jié)構(gòu)域由motif2、motif4、motif6構(gòu)成。MIKC*亞類(lèi)只有一個(gè)基因含有K-box 結(jié)構(gòu)域。總體來(lái)看,motif1、motif2、motif3、motif4 所在蛋白序列數(shù)均占全部家族蛋白80%以上。
圖4 MIKC型MADS-box蛋白基序分析及基因結(jié)構(gòu)分析Fig.4 Protein conserved motif analysis and gene structure analysis in MIKC-type MADS-box genes
基因組復(fù)制是基因家族擴(kuò)張的重要來(lái)源。通過(guò)檢查5種類(lèi)型的基因復(fù)制,即單基因復(fù)制、分散基因復(fù)制、近端基因復(fù)制、串聯(lián)基因復(fù)制和全基因組復(fù)制或片段復(fù)制,發(fā)現(xiàn)83.61%的大豆基因和80%的蒺藜苜?;騺?lái)自全基因組復(fù)制或片段復(fù)制。
共線性分析發(fā)現(xiàn),大豆基因組內(nèi)MIKC 型MADS-box共線基因?qū)?18對(duì)、蒺藜苜蓿31對(duì)、葡萄62對(duì);大豆和蒺藜苜?;蚪M間MIKC 型MADS-box共線性基因?qū)?7 對(duì)、大豆和葡萄109 對(duì)、蒺藜苜蓿和葡萄50對(duì)(圖5)。大豆基因組內(nèi)共線性基因?qū)γ黠@多于其他兩個(gè)物種,蒺藜苜蓿的家族基因共線性基因?qū)ψ钌?,與葡萄也僅共有50對(duì)基因?qū)Α?/p>
圖5 大豆、蒺藜苜蓿、葡萄MIKC型MADS-box基因共線性分析Fig.5 Collinearity analysis of MIKC-type MADS-box genes in soybean,Medicago and grape
同義置換率KS,反映物種之間的分歧時(shí)間和種內(nèi)的加倍事件。已有研究表明,約1.3~1.5 億年前豆科與其它雙子葉植物共有祖先發(fā)生了一次全基因組三倍化事件(KS≈1.31),隨后約在5900 萬(wàn)年前豆科植物發(fā)生了一次共有的全基因組二倍化事件(KS≈0.627),約1300 萬(wàn)年前大豆又發(fā)生了一次特異性 的 二 倍 化 事 件(Ks≈0.164)[15]。大 豆MIKC 型MADS-box基因KS統(tǒng)計(jì)結(jié)果顯示,1%的共線性基因?qū)Γ? 對(duì))處于0~0.164,2.8%的基因?qū)Γ? 對(duì))處于0.164~0.627,5.7%的基因?qū)Γ?8 對(duì))處于0.627~1.310,90.5% 的基因?qū)Γ?87 對(duì))大于1.310(圖6A)。蒺藜苜蓿MIKC 型MADS-box基因KS統(tǒng)計(jì)結(jié)果顯示,3.2%的基因?qū)Γ? 對(duì))小于0.627,9.7%的基因?qū)Γ? 對(duì))處于0.627~1.310,87.1%的基因?qū)Γ?7 對(duì))大于1.310(圖6B)。結(jié)果表明,大豆和蒺藜苜蓿分別有96.3%和96.8% MIKC 型MADS-box基因?qū)εc雙子葉植物共有的三倍化事件以及更古老的加倍事件相關(guān)。
圖6 大豆和蒺藜苜蓿MIKC型MADS-box基因Ks值分析Fig.6 Analysis of KS value of MIKC-type MADS-box genes in soybean and Medicago
大豆MIKC 型各亞類(lèi)基因在大豆不同發(fā)育時(shí)期的表達(dá)模式和表達(dá)量有明顯的區(qū)別(圖7)。大豆發(fā)育時(shí)期分析顯示:AGL12、SVP、MIKC*亞類(lèi)表達(dá)量較低,SEP1亞類(lèi)在各時(shí)期表達(dá)量分布均勻,BS、AGL6亞類(lèi)表達(dá)量相對(duì)較高。在大豆子葉期胚胎(COT.EP)時(shí)期,AP1亞類(lèi)表達(dá)量較高;在大豆早熟期胚胎(EM. EP)時(shí)期,AG/STK和AP3亞類(lèi)表達(dá)量較高;在大豆中熟期胚胎(MM.EP)時(shí)期,MIKC*和BS亞類(lèi)表達(dá)量較高;在大豆晚熟期胚胎(AA1. EP)時(shí)期,AGL17亞類(lèi)表達(dá)量相對(duì)較高,其他14 亞類(lèi)表達(dá)量均較低;在大豆干種子期(Dry),各亞類(lèi)表達(dá)量均較低,幾乎不表達(dá);在大豆幼苗期(SDLG.COT),AP3、PI、FLC、SVP、AGL12亞類(lèi)表達(dá)量較高,其中AGL12基因全部高表達(dá)。AGL15亞類(lèi)中只有g(shù)m206s2g01178在大豆子葉期胚胎(COT.EP)時(shí)期高表達(dá),這與AGL15亞類(lèi)功能相關(guān),AGL15亞類(lèi)基因在在幼胚中高表達(dá),在根、莖、葉和花中不表達(dá),在幼胚形成過(guò)程中具有重要意義,在大豆種子發(fā)育過(guò)程中起重要調(diào)控作用[33,34]。綜上,大豆幼苗期表達(dá)量高于其他時(shí)期,說(shuō)明MIKC 類(lèi)MADS-box基因在植物幼苗發(fā)育過(guò)程中起調(diào)控作用。
圖7 大豆MIKC型MADS-box基因不同發(fā)育時(shí)期的表達(dá)量Fig.7 Expression of MIKC-type MADS-box gene family in soybean at different developmental stages
蛋白質(zhì)相互作用是調(diào)控生物生命活動(dòng)的重要形式。MIKC 型MADS-box 家族蛋白參與多種生物途徑。在線工具STRING 結(jié)果顯示大豆MADS-box家族SVP 和LFY 間存在相互作用。除此二者還分別與調(diào)控植物春化的MAF,光周期的CO 以及開(kāi)花途徑FRI,TSF,TFL,GI,F(xiàn)T,LATE 等10 個(gè)蛋白存在相互作用[34~36](圖8)。
圖8 大豆MIKC型MADS-box蛋白與其它蛋白相互作用網(wǎng)絡(luò)圖Fig.8 Protein interaction network between Glycine max MIKC-type MADS-box proteins and other proteins
MIKC 型MADS-box基因在植物發(fā)育過(guò)程中起核心作用。本研究鑒定出MIKC 型MADS-box基因共232 個(gè),其中,大豆92 個(gè)、蒺藜苜蓿45 個(gè)、葡萄50個(gè)、擬南芥45 個(gè)。根據(jù)系統(tǒng)發(fā)育關(guān)系,4 個(gè)物種MIKC 型基因分為MIKCC和MIKC*兩類(lèi)。MIKCC可進(jìn)一步分為14 個(gè)亞類(lèi)。大豆有2 個(gè)FLC類(lèi)基因,蒺藜苜蓿缺少FLC類(lèi)基因,其原因可能與大豆和蒺藜苜蓿在開(kāi)花過(guò)程中不需要春化有關(guān),導(dǎo)致FLC亞類(lèi)基因在進(jìn)化過(guò)程中丟失[8]
MADS-box基因都是在進(jìn)化過(guò)程中通過(guò)基因重復(fù)事件產(chǎn)生的[8,37]。4 個(gè)物種共同祖先節(jié)點(diǎn)有64 個(gè)基因發(fā)生復(fù)制,推測(cè)雙子葉植物共有的三倍化事件和更古老的加倍事件對(duì)該基因家族的擴(kuò)增產(chǎn)生了積極影響??傮w上4 個(gè)物種MADS-box基因復(fù)制數(shù)目多于基因丟失數(shù)目,說(shuō)明了4 個(gè)物種MIKC 型MADS-box基因在進(jìn)化的過(guò)程中發(fā)生了一定程度基因擴(kuò)增。大豆和蒺藜苜蓿共同祖先節(jié)點(diǎn)基因復(fù)制與丟失數(shù)目基本平衡,說(shuō)明豆科共有的二倍化事件對(duì)該基因家族未產(chǎn)生明顯影響;二者M(jìn)ADS-box基因數(shù)目相比,大豆復(fù)制基因數(shù)目較多,丟失較少,推測(cè)其原因與1300 萬(wàn)年前大豆特異性發(fā)生的一次全基因組二倍化事件相關(guān),共線性分析結(jié)果也印證了該結(jié)論。
理化性質(zhì)分析揭示大豆和蒺藜苜蓿MADS-box蛋白多為性質(zhì)穩(wěn)定的堿性蛋白,主要定位在細(xì)胞核,在細(xì)胞核中發(fā)揮轉(zhuǎn)錄調(diào)控作用。MADS-box不同亞類(lèi)間基因結(jié)構(gòu)較為保守,所含motif 相似,揭示亞類(lèi)功能的保守性[13]?;驈?fù)制類(lèi)型推測(cè)、共線性以及Ks分析結(jié)果顯示,大豆和蒺藜苜蓿中該基因家族的擴(kuò)張主要是全基因組復(fù)制或片段重復(fù)的作用,而且多數(shù)基因來(lái)源于雙子葉植物的三倍化或更古老的事件,再次說(shuō)明全基因組復(fù)制對(duì)MADS-box基因有積極影響[13]。
MIKC 型MADS-box基因同時(shí)對(duì)植物生長(zhǎng)發(fā)育起調(diào)控作用。MADS-box不同亞類(lèi)基因表達(dá)模式不同[10,38,39],在陸地棉中MIKC型MADS-box基因調(diào)控胚胎發(fā)育,控制開(kāi)花時(shí)間等[11]。在高粱中MIKC 型MADS-box基因同樣在花發(fā)育和胚胎發(fā)育過(guò)程中表達(dá)[2]。MIKC 型各亞類(lèi)基因在大豆不同發(fā)育時(shí)期表達(dá)模式也呈現(xiàn)明顯的不同,各類(lèi)基因在不同發(fā)育階段具有不同的功能。本研究結(jié)果表明大豆幼苗期總體表達(dá)量高于其他時(shí)期,其中SVP、SOC1、AGL12亞類(lèi)表達(dá)量較高。SVP、SOC1、AGL12亞類(lèi)在調(diào)控幼苗發(fā)育過(guò)程中確實(shí)起到重大作用,與文獻(xiàn)研究結(jié)果相符[7]。蛋白互作分析結(jié)果表明大豆MIKC 型MADS-box 家族蛋白SVP 與CO、FT 和TFL1 蛋白相互作用,這與文獻(xiàn)中蛋白相互作用的實(shí)驗(yàn)結(jié)果相一致[40]。SVP、LFY、CO、FT和TFL1這些基因相互作用一起調(diào)控植物開(kāi)花發(fā)育。
本研究采用生物信息學(xué)方法對(duì)大豆和蒺藜苜蓿MIKC 型MADS-box基因家族的基因結(jié)構(gòu)、功能、共線性和進(jìn)化過(guò)程進(jìn)行分析,為豆科植物及其他物種MADS-box基因的研究提供重要參考。