孫金波石素華楊 利李鳳麗王興軍*趙術(shù)珍*
(1.山東師范大學生命科學學院,山東 濟南 250014; 2.山東省農(nóng)業(yè)科學院生物技術(shù)研究中心/山東省作物遺傳改良與生態(tài)生理重點實驗室,山東 濟南 250100; 3.山東大學生命科學學院,山東 青島 266237)
花生是世界上重要的油料作物和經(jīng)濟作物,富含脂肪和蛋白質(zhì),另外,花生還富含礦物質(zhì)、維生素、抗氧化劑和改善人體健康的生物活性化合物,如白藜蘆醇、生育酚、精氨酸等,被譽為功能性食品[1]。花生生產(chǎn)區(qū)主要包括美洲(北部、南部和拉丁美洲)、非洲(東部、南部、西部)和亞洲(東部、東南部、西南部)。中國、印度、尼日利亞和美國是主要的花生種植國。中國(42%)和印度(18%)的產(chǎn)量約占全球總產(chǎn)的60%,其次是尼日利亞(7.7%)、美國(4.3%)和印度尼西亞(1.8%)[1]?;ㄉ土空挤N子重量的45%~52%[2],因此進一步提高種子含油量,是花生遺傳改良的重點領(lǐng)域之一。
研究表明,一些轉(zhuǎn)錄因子可以通過調(diào)控油脂合成中關(guān)鍵酶的表達來影響油脂含量,例如WRINKLED1(WRI1)、LEAFYCOTYLEDON1(LEC1)和FUSCA3(FUS3)等[3]。WRI1具有2個AP2保守結(jié)構(gòu)域,屬于AP2/EREBP家族轉(zhuǎn)錄因子,是植物特有的一類轉(zhuǎn)錄因子,含有由60~70個氨基酸組成的AP2/ERF結(jié)構(gòu)域[4-5]。WRI1于1998年首次在擬南芥中發(fā)現(xiàn)[6],其擬南芥突變體和過表達植株中,種子含油量分別降低80%或提高20%[7]。PKp-β1和BCCP2是分別參與糖酵解和脂肪酸合成途徑的酶,研究發(fā)現(xiàn)WRI1在種子中特異性表達增強糖酵解和脂肪酸生物合成基因的mRNA積累,此過程是通過WRI1與PKp-β1和BCCP2啟動子特異性結(jié)合實現(xiàn)的[8]。
研究人員已相繼在擬南芥、油菜、玉米等多種植物中克隆了WRI1基因,其中,在擬南芥中WRI1只有一個成員,而其他植物中WRI1家族成員數(shù)目不等[9],在花生中對此基因的研究較少。花生二倍體野生種和四倍體栽培種基因組序列的完成,為花生油脂合成基因的鑒定提供了重要的基因序列資源。本研究利用花生二倍體野生種和四倍體栽培種基因組信息,在全基因組范圍內(nèi)系統(tǒng)分析了花生的WRI1基因家族,并考查了該基因家族在花生不同組織和莢果不同發(fā)育時期的表達模式,為花生脂肪酸合成途徑的調(diào)控研究提供了重要的理論依據(jù)。
從Tair(https://www.arabidopsis.org/)網(wǎng)站,查找擬南芥(ArabidopsisthalianaL.)基因組中的WRI1基因,獲得其CDS序列。以擬南芥WRI1(At3g4320)基因的蛋白質(zhì)序列為查詢序列,在peanutbase(https://www.peanutbase.org/home)中,利用BLASTP進行同源搜索,利用SMART軟件(http://smart.embl-heidelberg.de/)對花生WRI1候選基因的蛋白進行結(jié)構(gòu)域分析,篩選含有兩個AP2結(jié)構(gòu)域的蛋白序列,去除冗余蛋白,得到花生WRI1蛋白質(zhì)的同源序列。利用phytozome數(shù)據(jù)庫(https://phytozome.jgi.doe.gov/pz/portal.html#! search?show=BLAST)查找大豆(GlycinemaxL.)、苜蓿(MedicagotruncatulaL.)、菜豆(Phaseolus vulgarisL.)的WRI1序列。
從peanutbase數(shù)據(jù)庫中查找花生WRI1基因的序列和染色體物理位置等信息。利用gsds網(wǎng)站(http://gsds.cbi.pku.edu.cn/index.php)對WRI1進行基因結(jié)構(gòu)分析并對已獲得的WRI1序列進行進化分析。
使用ExPaSy提供的在線分析工具Protparam(https://web.expasy.org/protparam/)[10],分析WRI1蛋白質(zhì)序列的一級結(jié)構(gòu),包括氨基酸數(shù)目、等電點、分子量、疏水性等。二級結(jié)構(gòu)預測采用在線分析工具SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_ automat.pl?page=/NPSA/npsa_sopma.html)[11]。利用ProtComp(http://linux1.softberry.com /berry.phtml?topic=protcomppl&group=programs&subgroup=proloc) 對WRI1蛋白進行亞細胞定位預測分析。
利用Clustal X對擬南芥、大豆、菜豆、苜蓿和花生WRI1轉(zhuǎn)錄因子蛋白序列進行多重序列比對,運用MEGA 6.0[12]軟件中的鄰接法(NJ,neighborjoining)構(gòu)建進化樹,校驗參數(shù)Bootstrap設(shè)為500。利用在線軟件WebLogo 3(http://weblogo.berkeley.edu/logo.cgi/)繪制保守結(jié)構(gòu)域LOGO圖[13]。
兩個花生野生種及22個不同組織的RNA-seq數(shù)據(jù)已經(jīng)公布于花生測序網(wǎng)站[14](https://www.peanutbase.org/gene_expression)。對這些信息進行分析,獲得花生WRI1基因在不同組織及不同發(fā)育時期的表達譜數(shù)據(jù)。組織主要包括葉、莖、根、根瘤、雌蕊、雄蕊、花瓣、雌蕊柄、幼果、果皮和種子。其中,包括5個不同發(fā)育時期的種子、3個不同時期的葉以及分別包括2個不同發(fā)育時期的莖、雌蕊柄、幼果和果皮。利用獲得的表達譜數(shù)據(jù),繪制WRI1家族成員的基因表達譜。圖中用顏色深淺表示基因表達的強弱,綠色越深表示基因表達量越低,紅色越深表示基因表達量越高。
利用栽培品種花育31不同組織和不同發(fā)育時期的種子為材料提取RNA,然后反轉(zhuǎn)錄得到cDNA,利用實時定量PCR進行WRI1的表達分析。程序為:50℃ 2 min,95℃ 10 min ,40個循環(huán)的95℃ 15 s,60℃ 1 min。利用2-△△Ct法計算基因相對表達量。
通過同源基因搜索與利用SMART剔除不含保守結(jié)構(gòu)域的蛋白序列后,在AA基因組鑒定到5個WRI1家族成員,BB基因組鑒定到4個WRI1家族成員,栽培種中鑒定到11個WRI1家族成員?;蚪Y(jié)構(gòu)分析表明,花生WRI1基因家族含有大量的外顯子(圖1)。染色體定位結(jié)果表明,在AA基因組中,A04上有3個、A08和A10各1個WRI1,在BB基因組中,4個WRI1基因分別分布在B04、B05、B09和B10染色體上。栽培種中WRI1在15號染色體中有2個,01、04、05、08、10、11、14、17和20號染色體上各有1個(表1)。
利用野生種和栽培種基因組鑒定獲得的20個WRI1成員的氨基酸序列構(gòu)建系統(tǒng)進化樹,并進行結(jié)構(gòu)分析。結(jié)果表明,外顯子數(shù)在6~9個之間,其中Araip.SZ63C.1、Aradu.EJI6Q.1和Araip.RB7C2.1最多,為9個,Arahy.I3YYWX.1、Araip.34E5E.1、Arahy.F5Q2PM.1、Aradu.G1CDJ.1、Arahy.F0M2KT.1、Arahy.5MV2CV.1、Araip.L05NW.1、Arahy.HG2532.2和Arahy.UVRI66.2最少,為6個,但外顯子數(shù)目與聚類并沒有明顯的關(guān)系(圖1)。
表1 WRI1基因的染色體定位和蛋白定位Table 1 Chromosome and protein localization of WRI1
圖1 WRI1的基因結(jié)構(gòu)Fig.1 The gene structure of WRI1
表3 花生WRI1蛋白的二級結(jié)構(gòu)Table 3 Secondary structure of WRI1 protein in peanut
通過對野生種和栽培種花生的20個WRI1家族成員理化性質(zhì)的分析表明,WRI1中氨基酸數(shù)目在315~752個,平均分子量為46.8 kDa,其中Aradu.M2I8I.1的氨基酸數(shù)目最多,為752個,分子量為81.99 kDa,Araip.34E5E.1的氨基酸數(shù)目最少,為315個,分子量為35.94 kDa。WRI1蛋白質(zhì)的等電點在5.29~9.22之間,其中6個蛋白質(zhì)的等電點大于7.5,顯堿性,9個蛋白質(zhì)的等電點小于6.5,顯酸性;疏水性均為負值,屬于親水性蛋白質(zhì)。大多數(shù)WRI1蛋白的不穩(wěn)定系數(shù)大于40,為不穩(wěn)定蛋白,但其中Aradu.M2I8I.1和Araip.RB7C2.1不穩(wěn)定系數(shù)小于40,分別為39.76和36.4,為穩(wěn)定蛋白質(zhì)(表2)。
通過ProtComp網(wǎng)站對野生種和栽培種花生20個WRI1蛋白進行亞細胞定位預測,發(fā)現(xiàn)所有WRI1家族成員均定位在細胞核內(nèi)(表1)。
根據(jù)在線工具SOPMA對二級結(jié)構(gòu)的預測統(tǒng)計發(fā)現(xiàn),20個蛋白質(zhì)的二級結(jié)構(gòu)以無規(guī)則卷曲為主要構(gòu)成元件,以α-螺旋為次要構(gòu)成元件,兩者在各個WRI1蛋白組成中平均比例分別為55.20%和29.92%,兩者之和達到85.12%(表3)。
采用MEGA6軟件的鄰近法,bootstrap值為500,將花生(20個)、大豆(28個)、菜豆(24個)、苜蓿(26個)、擬南芥(1個)的WRI1蛋白質(zhì)構(gòu)建了系統(tǒng)發(fā)育樹。根據(jù)親緣關(guān)系分為A、B、C、D、E、F共6個組,其中A又分為4個亞組,除了E和F,其他組中均有花生WRI1基因的分布,花生WRI1基因在B組中分布最多,為8個。WRI1轉(zhuǎn)錄因子家族成員并未因物種差異單獨地聚為幾類,說明花生與其他物種WRI1成員之間擁有較近的親緣關(guān)系(圖2)。
利用ClustalX 軟件對20個蛋白質(zhì)序列進行多序列比對,結(jié)果表明其保守結(jié)構(gòu)域主要位于蛋白中間位置,兩端較少,其保守結(jié)構(gòu)域由大約150個氨基酸殘基組成(圖3)。其保守結(jié)構(gòu)域中含有大量的丙氨酸(A)和精氨酸(R),但精氨酸有時會被賴氨酸(K)和組氨酸(H)替換,丙氨酸有時會被甘氨酸(G)和絲氨酸(S)替代(圖4)。
利用已公布的花生轉(zhuǎn)錄組數(shù)據(jù),構(gòu)建基因表達熱圖,以推測這些基因的作用。從圖5中可以看出,這些基因的表達模式可以分為4類。第1類的Aradu.EJI6Q.1、Araip.SZ63C.1、Aradu.M2I8I.1、Araip.RB7C2.1、Araip.AXK3N.1、Arahy.UU942A.1與Arahy.UVRI66.2主要在種子中表達,第2類的Arahy.J9H0YQ.1和Arahy.5MV2CV.1在各個組織中均有表達,推測該基因為組成型表達,第3類的Aradu.387PF.1、Arahy.F0M2KT.1、Arahy.I3YYWX.1、Arahy.F5Q2PM與Aradu.G1CDJ.1主要在根瘤中表達,第4類的Arahy.N9BW0I.1、Arahy.RWA9J9.1與Arahy.HG2532.2在各組織的表達量均較低。
圖2 花生、大豆、擬南芥、菜豆和苜蓿WRI1的進化樹分析Fig.2 Phylogenetic analysis of WRI1 in peanut, soybean, Arabidopsis, kidney bean and alfalfa
圖3 WRI1蛋白質(zhì)多序列比對結(jié)果 Fig.3 Multiple sequence alignment of WRI1 protein
圖4 花生WRI1蛋白家族保守域分析Fig.4 Conservative domain analysis of peanut WRI1 protein family
圖5 花生WRI1基因在不同組織器官中的表達譜Fig.5 Expression profile of peanut WRI1 in different tissues and organs
圖6 4個不同發(fā)育時期的花生莢果Fig.6 Four different stages of peanut pods
為研究不同組織和莢果發(fā)育不同時期WRI1基因家族的表達情況,根據(jù)中果皮顏色和厚度,將花生莢果發(fā)育分為4個時期:白色厚期(S1),白色薄期(S2),棕斑薄期(S3),黑斑薄期(S4)(圖6),利用篩選到的20個WRI1基因設(shè)計引物進行qRTPCR表達分析,因為Arahy.N9BW0I.1和Arahy.RWA9J9.1、Arahy.I3YYWX.1和Araip.34E5E.1、Arahy.KP68JR.1和Arahy.HG2532.2、Arahy.UVRI66.2和Aradu.EJI6Q.1、Araip.RB7C2.1和Aradu.M2I8I.1、Arahy.F5Q2PM.1和Aradu.G1CDJ.1以及Arahy.F0M2KT.1、Arahy.5MV2CV.1、Aradu.387PF.1和Araip.L05NW.1的序列分別對比后發(fā)現(xiàn)其同源性很高較難區(qū)分,實驗中用同一引物進行檢測。定量結(jié)果表明,20個WRI1基因表達模式各不相同,但也有共同點。Arahy.UU942A.1、Arahy.N9BW0I.1、Arahy.UVRI66.2、Araip.SZ63C.1、Aradu.M2I8I.1、Araip.RB7C2.1和Araip.AXK3N.1均在種子中有較高的表達量,推測其可能對調(diào)控種子中油脂合成具有重要作用,而其他基因在種子中的表達量較低,且在其他組織中均有表達,可能參與其他調(diào)控過程。
圖7 WRI1在栽培種花生中不同組織的相對表達水平Fig.7 Relative expression levels of WRI1 indifferent tissues in cultivated peanut
WRI1轉(zhuǎn)錄因子主要在油脂積累和胚胎發(fā)育中起重要調(diào)控作用,利用擬南芥wri1突變體研究發(fā)現(xiàn),突變體中表達水平下降的基因大多參與糖酵解和脂肪酸代謝[15]。本研究通過對花生二倍體野生種和四倍體栽培種的蛋白序列分析,篩選鑒定出20個WRI1家族成員,分布于不同的染色體上。前人研究發(fā)現(xiàn),包括擬南芥WRI1在內(nèi)的多數(shù)WRI1基因具有7個外顯子[16],而我們的研究結(jié)果顯示,花生WRI1的外顯子數(shù)在6~9個之間,不同家族成員之間外顯子數(shù)目不完全相同。
通過對花生WRI1基因家族的二級結(jié)構(gòu)分析發(fā)現(xiàn),20個蛋白質(zhì)的二級結(jié)構(gòu)均以無規(guī)則卷曲為主要構(gòu)成元件,α-螺旋為次要構(gòu)成元件,大豆和沙棘WRI1的二級結(jié)構(gòu)也是如此[17-18]。WRI1在不同物種間是相對保守的,通過對20個WRI1的保守結(jié)構(gòu)域分析發(fā)現(xiàn),其保守序列具有高度相似性。通過對WRI1的亞細胞定位預測分析發(fā)現(xiàn),本次篩選到的20個成員均定位在細胞核內(nèi),這與其他植物中WRI1的亞細胞定位基本一致[17-19]。在進化樹中可以發(fā)現(xiàn),多數(shù)栽培種花生中WRI1家族成員均能在野生種AA和BB中找到同源基因。
利用已公布的花生轉(zhuǎn)錄組數(shù)據(jù)分析發(fā)現(xiàn),有7個WRI1基因是在種子發(fā)育過程中特異表達的,因此推測其可能與油脂合成和胚胎發(fā)育等有密切關(guān)系。通過qRT-PCR驗證發(fā)現(xiàn),Arahy.UU942A.1、Arahy.N9BW0I.1、Araip.SZ63C.1和Araip.AXK3N.1在種子發(fā)育過程中均具有較高的表達量,其穩(wěn)定的高表達可促進油脂的合成和積累,這與隨著種子成熟的增加脂肪酸含量逐漸升高的趨勢 是 一 致 的[20]。Arahy.J9H0YQ.1、Arahy.KP68JR.1、Arahy.UVRI66.2、Aradu.M2I8I.1和Araip.RB7C2.1呈現(xiàn)出隨著種子成熟度的增加,表達量逐漸降低或先升高后降低的趨勢。在大豆中的研究結(jié)果相似,GmWRI1a主要在種子中表達,且隨成熟度的增加表現(xiàn)出先升高后降低的趨勢[21],因此推測其可能有相似的功能。大豆中GmWRI1b和GmWRI1c主要在莖和花中表達[21],而Arahy.I3YYWX.1、Arahy.F0M2KT.1和Arahy.F5Q2PM.1在種子中表達量也比較低,其功能可能與大類中的同源基因類似。