陳 云,董燁平,張世鵬,吳 蘇,譚 敏,宋正鑫,劉致浩
(湖北師范大學(xué) 生命科學(xué)學(xué)院,湖北 黃石 435002)
棉花(Gossypiumhirsutum)是世界上最主要的經(jīng)濟(jì)作物,具有產(chǎn)量大、成本低、利用價(jià)值高等優(yōu)點(diǎn)。研究表明,非生物逆境脅迫是影響棉花生長(zhǎng)的主要因素之一,嚴(yán)重時(shí)會(huì)使棉花生長(zhǎng)受到抑制,進(jìn)而導(dǎo)致棉株死亡[1]。隨著全球溫室效應(yīng)的加劇,在夏秋時(shí)節(jié),我國新疆及長(zhǎng)江流域會(huì)經(jīng)常出現(xiàn)短暫或持續(xù)高溫天氣,對(duì)棉花生長(zhǎng)造成嚴(yán)重的負(fù)面影響,導(dǎo)致棉花生長(zhǎng)異常甚至不育。因此,針對(duì)干旱和高溫等非生物脅迫帶來的不利影響,篩選出具有優(yōu)異抗逆性棉花種質(zhì),加強(qiáng)對(duì)棉花抗逆脅迫下生理響應(yīng)機(jī)制的認(rèn)識(shí),鑒定抗逆境相關(guān)基因是當(dāng)前棉花育種的主要研究?jī)?nèi)容[2,3]。
類黃酮是植物體內(nèi)廣泛存在的一類次生代謝物質(zhì),在植物生長(zhǎng)發(fā)育過程中均發(fā)揮多種生理功能。此外,類黃酮在植物抗生物脅迫方面也發(fā)揮著重要作用[4]。目前,植物界中從種子植物到苔蘚植物均發(fā)現(xiàn)了類黃酮的合成和分布[5]。常見的類黃酮有查爾酮、黃酮醇、黃酮、黃烷醇、黃烷酮、花青素等[6]。類黃酮具有很強(qiáng)的抗氧化活性,參與植物的抗逆反應(yīng),表現(xiàn)形式主要有植株的顏色發(fā)生改變,以此來清除逆境脅迫下產(chǎn)生和積累的活性氧[7]。類黃酮生物合成途徑在許多植物中進(jìn)行了研究。目前已經(jīng)在擬南芥(Arabidopsisthaliana)、大豆(Glycine)、葡萄(VitisviniferaL.)等多種植物中分析了催化類黃酮生物合成的酶。目前在植物中已經(jīng)鑒定出26種類黃酮生物合成相關(guān)基因,主要包括查爾酮合成酶(CHS),查爾酮異構(gòu)酶(CHI),黃酮醇合成酶(FLS),異黃酮還原酶(IFR),黃烷酮3-氫化酶(F3H),花青素合成酶(ANS),異黃酮合酶(IFS),二氫黃酮醇4-還原酶(DFR),花色素雙加氧酶(LDOX),花色素還原酶(LAR)等[8]。這些酶在類黃酮生物合成途徑中分別催化不同的反應(yīng)。
查爾酮合成酶(CHALCOME SYNTHASE,CHS)是植物類黃酮生物合成途徑中的第一個(gè)關(guān)鍵酶,它催化丙二酰輔酶A的3個(gè)乙酸單元與對(duì)羥苯丙烯酰輔酶A的一個(gè)乙酸基縮合生成四羥基查爾酮,該產(chǎn)物進(jìn)一步衍生轉(zhuǎn)化構(gòu)成了各類黃酮類化合物[9]。前人的研究表明,查爾酮合成酶不僅催化黃酮類化合物的合成,而且在花青素生物合成,植物根瘤形成,抗生物脅迫和防止紫外線損傷方面均發(fā)揮重要作用[10]。CHS基因因其重要功能而得到廣泛研究。目前,已經(jīng)在多種植物中對(duì)CHS基因家族的調(diào)控和功能進(jìn)行了研究,包括葡萄、非洲菊(GerberajamesoniiBolus)、蘋果(Malusdomestica)、文心蘭(Oncidiumhybridum)、蘭花(Cymbidiumssp.)、金絲桃屬植物(Triadenum)、擬南芥、矮牽牛(PetuniahybridaVilm)和豆等[11]。查爾酮合成酶基因是一個(gè)比較大的多基因家族,并且在基因結(jié)構(gòu)上非常保守[12]。目前,在玉米中已經(jīng)鑒定了14個(gè)完整的CHS基因[13],在矮牽牛中鑒定了6個(gè)CHS基因[14],在大豆中發(fā)現(xiàn)了8個(gè)CHS基因[15],水稻中也已經(jīng)鑒定出27個(gè)CHS基因[16]。
目前關(guān)于CHS基因在植物(尤其是棉花)抗逆方面的研究較少,在陸地棉中該基因家族信息也不清楚。因此,鑒定出陸地棉中的CHS基因?qū)ρ芯吭摶蚣易逶趨⑴c棉花抗逆中的功能角色具有重要的理論意義。
使用hmmsearch在陸地棉全基因組(https://cottonfgd.org/)范圍內(nèi)鑒定同時(shí)包含PF00195 (Clal_sti_synt_C)與PF02797(Clal_sti_synt_N)結(jié)構(gòu)域且E-value小于10-3的蛋白序列,再使用使用NCBI-CDD工具進(jìn)行進(jìn)一步的篩選,完成棉花CHS家族基因的鑒定。利用expasy對(duì)其編碼的蛋白質(zhì)大小、分子量、理論等電點(diǎn)及親水性等理化性質(zhì)進(jìn)行分析。
使用MEGA7.0軟件對(duì)棉花CHS的蛋白序列進(jìn)行系統(tǒng)進(jìn)化分析,Bootstrap設(shè)置為1 000,使用工具TBtools對(duì)進(jìn)化樹進(jìn)行可視化。
根據(jù)棉花全基因組數(shù)據(jù)獲得棉花CHS基因家族的染色體信息,包括基因起始位點(diǎn)信息以及基因所在染色體長(zhǎng)度,然后使用TBtools軟件進(jìn)行染色體定位。
將鑒定的棉花CHS蛋白序列提交到在線MEME工具進(jìn)行保守基序分析。參考其他文獻(xiàn)中有關(guān)CHS基因家族的保守結(jié)構(gòu)域分析結(jié)果,我們將Motif sites設(shè)置為2~500 sites,Width在6~100 wide;接著利用TBtools對(duì)所得結(jié)果進(jìn)行展示。
在棉花基因組數(shù)據(jù)庫中(https://www.cottongen.org/)下載棉花不同生長(zhǎng)時(shí)期的組織中以及在不同脅迫處理?xiàng)l件下的棉花 RNA-Seq數(shù)據(jù),使用perl腳本篩選出CHS基因的表達(dá)量,利用TBtools軟件繪制棉花CHS基因家族表達(dá)熱圖。
通過hmmsearch在陸地棉全基因組(https://cottonfgd.org/)范圍內(nèi)鑒定同時(shí)包含PF00195 (Clal_sti_synt_C)與PF02797 (Clal_sti_synt_N)結(jié)構(gòu)域的蛋白序列,從四倍體棉花基因組數(shù)據(jù)庫中鑒定出35個(gè)GhCHS基因,并按照每個(gè)基因在染色體上的位置順序重新命名(GhCHS01-35)。同時(shí)通過EsPAsy在線網(wǎng)站查詢GhCHS基因家族的基本信息。結(jié)果顯示,這些編碼CHS蛋白的氨基酸長(zhǎng)度范圍在329 aa (GhCHS10)~597 aa (GhCHS23),氨基酸平均長(zhǎng)度約為448.3 aa;分子量在 35.96 kD (GhCHS10)到66.43 kD (GhCHS23),平均分子量為49.9 kD;等電點(diǎn)在5.28 (GhCHS15)~9.42 (GhCHS03),除GhCHS15、GhCHS31、GhCHS33、GhCHS02、GhCHS17、GhCHS09、GhCHS13、GhCHS14、GhCHS24、GhCHS29、GhCHS10、GhCHS26、GhCHS27、GhCHS07外,其余蛋白理論等電點(diǎn)均大于7;除了GhCHS01,GhCHS04,GhCHS07,GhCHS11,GhCHS16,GhCHS19,GhCHS34這7個(gè)蛋白為疏水性蛋白,其他的蛋白均為親水性的蛋白(表1)。
表1 棉花CHS家族基因信息
單獨(dú)使用35個(gè)棉花CHS蛋白序列進(jìn)行進(jìn)化分析,同時(shí)對(duì)它們的基因結(jié)構(gòu)與保守結(jié)構(gòu)域進(jìn)行了分析(圖1)。結(jié)果表明這些CHS蛋白可聚類為7個(gè)支(圖1)。第1支包含10個(gè)CHS蛋白,第2支包含5個(gè),第3支包含4個(gè),第4支只有1個(gè)CHS蛋白,第5支和第6支都只包含2個(gè)CHS蛋白,第7支包含的蛋白數(shù)最多,有11個(gè)?;蚪Y(jié)構(gòu)分析結(jié)果顯示CHS基因的外顯子數(shù)量在1~5個(gè)之間,其中有12個(gè)基因只有一個(gè)外顯子,沒有內(nèi)含子;有一個(gè)基因有5個(gè)外顯子(GhCHS23);有14個(gè)基因有兩個(gè)外顯子一個(gè)內(nèi)含子。保守結(jié)構(gòu)域分析結(jié)果顯示,35個(gè)蛋白中均包含1號(hào)和2號(hào),除了GhCHS23外,其余蛋白均包含10號(hào)Motif,7號(hào)和14號(hào)Motif只存在于第4~7進(jìn)化支中的CHS蛋白,處于相同進(jìn)化支的蛋白基本上具有相同的保守結(jié)構(gòu)域。
圖1 棉花CHS蛋白進(jìn)化樹、基因結(jié)構(gòu)及保守結(jié)構(gòu)域分析
為了了解CHS基因在棉花染色體上的分布情況,我們對(duì)鑒定出的35個(gè)GhCHS基因進(jìn)行了染色體定位分析(圖2)。結(jié)果顯示,32個(gè)基因分別定位在棉花的16條染色體上,GhCHS33、GhCHS34和GhCHS35這3個(gè)基因分別定位于未能組裝到染色體的scaffold6253、scaffold27_A01和scaffold738_A03片段上。其中,A05號(hào)、D02號(hào)和D05號(hào)染色體上分布最多,分別有4個(gè)CHS基因,其余染色體上均含有1~3個(gè)CHS基因。
圖2 棉花CHS 基因在染色體上的定位
為了研究棉花CHS基因在棉花不同組織中的表達(dá)模式,我們從棉花轉(zhuǎn)錄組數(shù)據(jù)庫中篩選出了35個(gè)CHS的組織表達(dá)數(shù)據(jù)。分析了這些GhCHS基因在根、莖、葉、花瓣、花藥以及不同天數(shù)(開花前3d; 開花當(dāng)天0d; 開花后1 d; 3 d; 5d; 10d; 15 d; 20 d)的胚珠和不同天數(shù)(開花后 10d; 15 d; 20 d)的纖維中的表達(dá)情況。依據(jù)組織表達(dá)情況這35個(gè)CHS基因可以分為8支(圖3):第一支的基因(GhCHS9~GhCHS31)在胚珠發(fā)育起始階段優(yōu)勢(shì)表達(dá);第二支的基因(GhCHS18~GhCHS20)在根中優(yōu)勢(shì)表達(dá);第三支的基因(GhCHS12~GhCHS32)在開花后3 d 和5 d的胚珠中優(yōu)勢(shì)表達(dá);第四支的基因(GhCHS23~GhCHS8)在葉片中優(yōu)勢(shì)表達(dá);第五支的基因(GhCHS02~GhCHS29)在花瓣中優(yōu)勢(shì)表達(dá);第六支的基因(GhCHS04~GhCHS27)在纖維中優(yōu)勢(shì)表達(dá);第七支的基因(GhCHS05和GhCHS21)在根、莖、胚珠和纖維中均有較高的表達(dá);第八支的基因(GhCHS06,GhCHS11和GhCHS24)在開花后10 d和15 d的胚珠中優(yōu)勢(shì)表達(dá);這些結(jié)果表明這些CHS基因在棉花的不同組織中發(fā)揮著不同的生物學(xué)功能。
圖3 棉花CHS基因在不同組織中的表達(dá)情況
研究報(bào)道,CHS基因在不同植物中的表達(dá)是由許多生物和非生物脅迫反應(yīng)誘導(dǎo)的[17]。為了研究CHS基因在棉花逆境脅迫中的應(yīng)答情況,利用已報(bào)道的不同脅迫處理?xiàng)l件下的棉花RNA-Seq數(shù)據(jù)分別對(duì)GhCHS基因在干旱、熱、冷及鹽處理下的表達(dá)模式進(jìn)行了分析(圖4)。在干旱處理?xiàng)l件下(圖4A),這些基因的表達(dá)情況分為3類,第一類是基因的表達(dá)量隨著處理時(shí)間的增加而降低(GhCHS05~GhCHS10);第二類是基因的表達(dá)量隨著處理時(shí)間的增加而逐漸增加,在干旱處理12 h達(dá)到最大,然后表達(dá)量逐漸下降(GhCHS03~GhCHS13);第三類是基因的表達(dá)量在干旱處理前期(6 h之前)不斷的增加,而在干旱處理6 h后開始下降(GhCHS25~GhCHS19,GhCHS26);此外,GhCHS11的表達(dá)幾乎不受干旱脅迫的影響。以上結(jié)果表明這些基因可能在植物抗逆的不同階段發(fā)揮功能,分工協(xié)作參與棉花對(duì)不同脅迫的響應(yīng)。
在熱脅迫處理?xiàng)l件下,這些基因的表達(dá)模式與干旱脅迫下的表達(dá)模式很相似,大致可以分為3類(圖4B):第一類隨著熱脅迫處理時(shí)間的增加基因的表達(dá)量顯著下降(GhCHS05~GhCHS10);第二類在熱處理12 h時(shí)基因高量表達(dá)(GhCHS23~GhCHS19);第三類基因在熱處理的早期表達(dá)量較高,而隨著處理時(shí)間的增加表達(dá)量降低(GhCHS20~GhCHS24)。
在鹽脅迫處理?xiàng)l件下,一些CHS基因的表達(dá)在鹽處理的早期(1 h, 3 h)時(shí)升高,隨著處理時(shí)間的增加表達(dá)量下降,比如GhCHS12~GhCHS09(圖4C);一些基因在處理中期高量表達(dá),比如GhCHS29~GhCHS32;另外一些基因在鹽脅迫處理?xiàng)l件下下調(diào)表達(dá)(GhCHS21~GhCHS28)。
在冷脅迫處理?xiàng)l件下,一些CHS基因在處理的早期(1 h)高量表達(dá)(GhCHS18~GhCHS16);一些基因在處理中后期高量表達(dá),比如GhCHS28~GhCHS23;另外一些基因在處理?xiàng)l件下下調(diào)表達(dá)(GhCHS12~GhCHS17) (圖4D)。
圖4 GhCHS家族基因在不同脅迫處理?xiàng)l件下的表達(dá)分析
由于全球氣候變化和土壤鹽漬化,使得非生物脅迫成為限制棉花生長(zhǎng)和產(chǎn)量的主要環(huán)境因素,挖掘一些重要的抗逆基因顯得十分重要。CHS基因是植物中特有的一類基因家族,在植物生長(zhǎng)發(fā)育的各個(gè)時(shí)期都發(fā)揮著重要作用,參與類黃酮生物合成途徑。棉花全基因組測(cè)序的完成使得CHS基因家族的鑒定成為可能。目前,已經(jīng)有很多物種的CHS基因家族成員被鑒定出來。
本研究從基因組水平上初步鑒定并分析了35個(gè)棉花CHS基因家族成員。系統(tǒng)進(jìn)化和序列分析結(jié)果顯示這35個(gè)CHS蛋白可以分為7類,蛋白序列高度保守,并且它們的保守結(jié)構(gòu)域與系統(tǒng)進(jìn)化樹分類基本一致,同一類內(nèi)的GhCHS蛋白通常表現(xiàn)出相似的基因序列組成。此外,大多數(shù)GhCHS基因包括兩個(gè)外顯子和一個(gè)內(nèi)含子,與前人的研究一致。植物通常受到環(huán)境壓力的威脅,包括生物脅迫和非生物脅迫。為了研究棉花CHS基因在植物抗逆中的功能,我們對(duì)棉花CHS基因在不同生長(zhǎng)時(shí)期的組織中以及在干旱、鹽、高溫、低溫等處理下的表達(dá)情況進(jìn)行了分析,結(jié)果顯示不同的GhCHS基因在不同的脅迫條件下表達(dá)具有較大的差異性,暗示了這些CHS基因在棉花對(duì)脅迫條件的應(yīng)答中具有不同的功能。
CHS基因家族調(diào)節(jié)植物的類黃酮代謝,在植物的生長(zhǎng)發(fā)育過程中起著至關(guān)重要的作用。在本研究中,我們對(duì)棉花CHS基因家族進(jìn)行了多項(xiàng)分析,包括蛋白序列分析,系統(tǒng)進(jìn)化分析,染色體定位,基因結(jié)構(gòu)及保守結(jié)構(gòu)域分析等,揭示了棉花CHS基因家族的多樣性和保守性。此外,我們還研究了GhCHS基因在不同生長(zhǎng)時(shí)期的組織中及逆境脅迫下的表達(dá)模式,這些結(jié)果為進(jìn)一步研究CHS家族基因在植物抗逆方面的功能提供了科學(xué)依據(jù)。
Genome-wide identification and expression analysisofCHSgene family inGossypiumhirsutum
CHEN Yun,DONG Ye-ping,ZHANG Shi-peng,WU Su,TAN Ming,SONG Zheng-xin,LIU Zhi-hao