趙慶英,楊俊鸞,李旭凱,楊致榮
(1.山西農業(yè)大學文理學院,山西太谷 030801;2.山西省林木育種研究中心,山西太原 030031;3.山西農業(yè)大學生命科學學院,山西太谷 030801)
棉花是世界上重要的纖維作物之一[1],具有重要的經濟地位,但是我國棉花纖維品質較差,提高棉花纖維的品質是目前棉花研究中的一個重要目標[2-3]。棉花纖維的長度、強度、伸長率等性狀決定其品質,而這些性狀主要由基因型控制。研究與棉花纖維發(fā)育相關基因的表達調控,對棉花纖維品質的改良具有重要的意義[4]。
纖維素是由D-吡喃葡萄糖通過β-1,4-糖苷鍵連接而成的聚合物,是植物、藻類、卵菌細胞壁以及細菌生物膜的主要組成成分[5]。β-1,4-內切葡聚糖酶在植物中有多個成員,統(tǒng)稱為GH9家族,該家族在纖維素的合成與組裝過程中起著重要的作用。GH9酶參與纖維小體的組裝,能夠有效地降解纖維素和植物細胞壁多糖[6],在高等植物中,GH9基因在細胞壁的生物合成、修飾、重塑和降解中起著重要作用,包括細胞的伸長和分化、胞質分裂、器官脫落和果實成熟[7-8]。另外,β-1,4-內切葡聚糖酶還參與了果實催熟和器官脫落過程中木質素的轉變,并且可以誘導纖維素的從頭合成[9]。
GH9家族包括A,B,C共3個亞類,GH9A包括一段跨膜結構、催化結構和N-末端延伸結構。GH9B是一類具有催化結構和信號肽的分泌蛋白。GH9C具有催化結構、信號肽以及C端的纖維素結合結構域(Cellulose bindingmodule,CBM),CBM可以結合到晶體纖維素上,通過催化結構域可以水解人造纖維素聚合酶以及多種植物細胞壁多糖[8,10]。但是,并不是所有物種都符合這種典型結構。
在擬南芥中,編碼GH9A蛋白的基因有KORRIGAN(KOR),KOR2,和 KOR3[8]共 3 個。擬南芥kor-1突變體下胚軸變短,KOR突變導致細胞板畸變、細胞壁不完整和多核細胞的形成,幼苗和成苗變矮,幼苗形態(tài)的嚴重異常以及頂端分生組織以外的所有細胞的伸長受到一定的抑制[11]。KOR缺失突變體植株矮小,纖維素-木葡聚糖網(wǎng)絡發(fā)生改變,說明GH9A成員在纖維素的正確組裝過程中是必需的[9]。
在水稻中,OsGH9A3和B5與纖維素生物合成基因OsCESA1,OsCESA3和OsCESA8具有極高的共表達,表明OsGH9A3和B5基因在初生細胞壁纖維素的合成過程中起作用[7];在楊樹中,PtrKOR與PtrCesA1,PtrCesA2和PtrCesA3基因的共表達對于高度結晶的木質纖維素的合成非常重要[12]。
B亞類的CEL1(At1g70710)在生長的幼嫩組織,尤其在木質部細胞壁增厚過程中具有很高的活性,cel1突變體莖的機械強度減弱,纖維素和木質素的含量顯著降低[8]。微陣列研究表明,B類糖苷水解酶具有許多潛在的功能,包括At1g22880,At2g44570和At2g32990的上調響應IAA作用,At4g39000在雄蕊、雌蕊、種子和胚珠中具有高水平表達[8]。在水稻中,OsGH9B1,OsGH9B3和OsGH9B16基因對木質纖維素結晶度具有修飾作用,GH9Bs則具有降低纖維素結晶度的酶活性,GH9B酶在微纖絲表面產生非結晶纖維素時具有活性[7,13]。OsGH9B8,OsGH9B9,OsGH9B10和OsGH9B11基因與典型的次生細胞壁生物合成的 OsCESA4,OsCESA7和OsCESA9基因共表達,說明其在次生細胞壁合成過程中起作用[14]。
在擬南芥中,GH9C表達下調將導致根毛形成和生長過程中細胞壁的弱化,GH9家族的亞類A和C也已知在纖維素生物合成中相互作用[15]。反向遺傳學方法證實了楊樹類GH9C成員在調節(jié)纖維素結晶度和參與細胞生長過程中具有重要作用。
糖苷水解酶GH9基因家族在擬南芥、水稻等模式植物中的研究較為清楚,但是對其在棉花中的作用機制仍不清楚。
本試驗通過對糖苷水解酶GH9基因家族進行生物信息學分析,旨在為其在棉花中作用機制的深入研究奠定基礎。
利用hmmer[16-17]軟件中的hmmsrarch從擬南芥、水稻、玉米、棉花基因組數(shù)據(jù)中獲得糖苷水解酶GH9基因家族蛋白序列,并運用MEGA 7.0[18]軟件采用鄰位相連法(Neibor-joining)進行聚類分析構建基因系統(tǒng)發(fā)育樹,分析參數(shù)選擇默認值。
通過MEME[19](http://meme-suite.org/tools/meme)在線分析棉花、水稻以及擬南芥等物種GH9家族成員氨基酸序列的保守序列,保守位點寬度設置為6,最大保守序列鑒定數(shù)目設置為10。
利用SWISS-MODEL[20-22]對GH9基因蛋白質三維結構進行建模,建模過程中選擇與提交的目標序列相似度大于25%的模板。
利用R[23]軟件的heatmap函數(shù)制作基因表達熱譜圖。
對棉花、擬南芥、水稻和玉米GH9家族成員構建系統(tǒng)發(fā)育樹,以期揭示不同物種GH9家族成員系統(tǒng)進化關系。棉花、擬南芥、水稻和玉米GH9不同家族成員可以分為GH9A,GH9B和GH9C共3個亞類,同一亞類成員之間發(fā)揮相同或相似的功能。由系統(tǒng)進化樹可知(圖1),3個亞家族沒有明顯地分為3支,可能與糖苷水解酶的結構域的保守性有關。GH9B和GH9C都具有信號肽序列,又具有GH9A和GH9C所具有的催化結構,因此,GH9B既能夠與GH9A分為一支[24],又能與GH9C分為一支。棉花與擬南芥的親緣關系最近,而與水稻和玉米的親緣關系較遠,這是因為棉花和擬南芥同為雙子葉植物,而水稻和玉米是單子葉植物。
表1 不同物種間GH9A蛋白保守模塊
GH9A主要位于質膜,具有一段跨膜結構,對其同一物種不同基因及其不同物種之間的保守序列分析,并對棉花、擬南芥、二穗短柄草、大桉、玉米、水稻、蒺藜苜蓿、楊樹、小立碗蘚、高粱和卷柏物種的GH9A家族跨膜區(qū)比較,結果發(fā)現(xiàn),他們均具有顯著的序列同源區(qū)域,具有一段含有22個氨基酸殘基(表 1)的保守序列 X8GCX12(圖 2),說明GH9A的跨膜區(qū)在物種進化過程中具有保守性。
GH9C一般具有一個纖維素結合結構域(Cellulose binding module,CBM),GH9C 催化活性的多樣性依賴于CBM的類型,對結晶纖維素的有效降解是必須的。CBM_2,CBM_3,CBM_4_9以及 CBM_10均存在于微生物中[25],具有一定的保守性,不同的CBM家族保守性不同(圖3),這可能與CBM家族功能的多樣性有關。CBM_2家族來源于細菌,具有一段保守序列,在進化過程中保守性很強,其功能比較穩(wěn)定,其中,Trp17對CBM_2與纖維素的結合非常重要,能夠加強催化結構域的降解能力,在分解結晶纖維素過程中扮演著重要的角色。CBM49存在于整個植物界中,與CBM_2家族最相似,存在一個保守的色氨酸殘基,表明植物中的CBM49可能與 CBM_2 具有相似的作用[8,26]。
氨基酸序列決定蛋白質構象,許多相似的序列可以決定相同的構象。利用SwissModel(http://swissmodel.expasy.org/)在線預測GhGH9A1蛋白質的三級結構。圖中黑框標注部分為催化結構域(圖4),它在細胞壁的生物合成、重塑和降解中發(fā)揮作用。
對棉花數(shù)據(jù)庫中檢索到的49個GH9基因在11個不同組織中的共表達進行分析,結果發(fā)現(xiàn)(圖5),Gh_D05G1785,Gh_A05G1599,Gh_A08G0869,Gh_D10G0789,Gh_A10G0610,Gh_D01G1428,Gh_A12G0382,Gh_D05G2628,Gh_D12G2309,Gh_D11G 1570,Gh_A11G1419以及Gh_D08G1224基因在葉片中表達量較高,可能與葉片中細胞壁的形成有關。Gh_A07G0348和Gh_D11G1785在花瓣中表達量很高,可能與棉花纖維合成有關。Gh_D12G1280,Gh_D07G0410,Gh_A06G1152,Gh_D06G0838,Gh_A06G0721,Gh_A08G2210和 Gh_D08G2576在花藥中高度表達,Gh_A03G1043,Gh_A02G0972,Gh_D03 G0779,Gh_D03G0738,Gh_A11G1030 和 Gh_D11G 1186在柱頭中高度表達,可能與受精過程有關。Gh_A02G1770,Gh_A07G0769,Gh_D13G0296和Gh_A13G0277在種子中的表達量很高,可能在種子成熟過程中發(fā)揮作用。
糖苷水解酶GH9基因家族在纖維素的合成與修飾、細胞壁的形成、器官生長以及果實脫落等過程中發(fā)揮著重要的作用。通過對棉花GH9家族進行生物信息學分析,解析其基因組特征可為后續(xù)深入研究GH9基因家族的功能奠定基礎,對于研究纖維素的生物合成與降解具有重要的意義。
本研究通過生物信息學分析發(fā)現(xiàn),棉花與同屬于雙子葉的擬南芥GH9基因家族親緣關系最近,與單子葉植物水稻和玉米的親緣關系較遠。棉花、水稻、擬南芥及楊樹等物種的GH9A跨膜結構域均具有一段保守基序,這可能與其功能的相似性有關。GH9C的纖維素結合結構域CBM49具有一個保守的色氨酸殘基,可能在纖維素降解過程中起作用。
通過對棉花GH9基因家族的共表達分析發(fā)現(xiàn),A亞類Gh_D10G0789,Gh_A10G0610基因在葉片中表達量較高,Gh_D06G1285,Gh_A06G2111基因在開花20 d后的纖維中表達量最高。C亞類的Gh_D10G0789,Gh_A10G0610基因在葉片中表達量較高,Gh_D12G2309在莖中表達量較高,Gh_A02G 1000,Gh_A12G2130基因在開花10 d后的纖維中具有較高的表達量,Gh_D03G0738在柱頭中表達量較高。B亞類在各個組織中均有表達,說明B亞類在棉花發(fā)育過程中的功能具有多樣性。棉花GH9基因在各器官中的表達已經有了初步的分析,但是這個基因家族各成員在棉花發(fā)育過程中的具體功能尚不清楚,以上的分析結果能夠為之后研究糖苷水解酶對纖維素的分解、細胞壁的合成及降解的作用機制提供一定的理論基礎。