王謝琴,李瑞雪,張 紅,陳 嬌,于小蓉,劉漢梅
(四川農(nóng)業(yè)大學(xué)生命科學(xué)學(xué)院,四川雅安 625000)
小麥?zhǔn)侨笾饕Z食作物之一,其籽粒富含蛋白質(zhì)、淀粉等多種營養(yǎng)物質(zhì)。在小麥灌漿期,籽粒淀粉合酶活性較高,促進(jìn)了貯藏淀粉的合成和積累,進(jìn)而影響小麥的產(chǎn)量和品質(zhì)。
淀粉合酶催化α-1,4糖苷鍵的形成,具有延伸淀粉鏈的功能。在綠色植物形成早期經(jīng)基因復(fù)制和功能分化產(chǎn)生了六種淀粉合酶亞型,即GBSS、SSⅠ、SSⅡ、SSⅢ、SSⅣ和SSⅤ。按進(jìn)化關(guān)系,將其分為Group A(GBSS、SSⅠ、SSⅡ)和Group B(SSⅢ、SSⅣ、SSⅤ)兩大類。各淀粉合酶亞型經(jīng)功能分化后,具有各自獨(dú)特的底物和產(chǎn)物特異性,催化不同結(jié)構(gòu)和不同鏈長淀粉鏈的延伸。GBSS亞型負(fù)責(zé)直鏈淀粉的合成,SSⅠ、SSⅡ和SSⅢ亞型負(fù)責(zé)支鏈淀粉的合成,分別延長短鏈(聚合度8~12 bp),中等鏈(聚合度13~25 bp)和長鏈(聚合度大于30 bp)。SSⅣ亞型負(fù)責(zé)淀粉顆粒的起始形成,SSⅤ亞型是本課題組近期鑒定并報(bào)道的一個(gè)新的植物淀粉合酶亞型,可影響淀粉顆粒的數(shù)量和大小。典型的淀粉合酶家族包含GT5和GT1結(jié)構(gòu)域,可結(jié)合葡萄糖基供體ADPG,將葡萄糖基轉(zhuǎn)移至糖鏈的非還原端。淀粉合酶各亞型的催化結(jié)構(gòu)域在進(jìn)化中較為保守,但N端的結(jié)合結(jié)構(gòu)域變化較大,決定了其結(jié)合不同鏈長的底物。在進(jìn)化過程中,相同淀粉合酶亞型內(nèi)的基因經(jīng)復(fù)制后拷貝數(shù)增加。在水稻、高粱等二倍體作物中,GBSS亞型有兩個(gè)拷貝,SSⅡ有三個(gè)拷貝,SSⅢ兩個(gè)拷貝,這些基因拷貝在不同組織和不同發(fā)育時(shí)期存在表達(dá)差異,具有獨(dú)特的表達(dá)特性。如編碼GBSSⅠ的基因,主要負(fù)責(zé)胚乳等貯藏器官直鏈淀粉的合成,抑制其表達(dá)會導(dǎo)致直鏈淀粉合成受阻,籽粒表現(xiàn)為糯性。編碼GBSSⅡ的基因主要在根、莖、葉等營養(yǎng)器官中表達(dá),負(fù)責(zé)這些器官中直鏈淀粉的合成。小麥?zhǔn)橇扼w植物,淀粉合酶基因拷貝數(shù)多于二倍體物種;在二倍體植物中存在一個(gè)拷貝,在小麥中就可能存在三個(gè)拷貝。目前,小麥基因組測序已經(jīng)完成,雖然李春艷等對小麥淀粉合酶基因進(jìn)行了鑒定,但并未報(bào)道小麥淀粉合酶基因不同拷貝間的序列特性、表達(dá)差異及分化機(jī)制。因此,本研究對小麥淀粉合酶基因家族所有成員進(jìn)行鑒定,重點(diǎn)分析不同基因拷貝間的表達(dá)差異,并探究引起基因發(fā)生表達(dá)差異的潛在啟動子元件,以期為小麥產(chǎn)量和品質(zhì)改良奠定基礎(chǔ)。
在Gramene數(shù)據(jù)庫(http://www.gramene.org/)中初步檢索獲取已注釋的小麥淀粉合酶基因序列,再以水稻的淀粉合酶蛋白序列為查詢序列,利用SPDE軟件對小麥全基因組進(jìn)行blastp搜索,篩選小麥全基因組中未被注釋的淀粉合酶基因,最后在Pfam數(shù)據(jù)庫進(jìn)行結(jié)構(gòu)域分析,將具有GT5和GT1兩個(gè)典型結(jié)構(gòu)域的序列確定為小麥淀粉合酶基因。
從小麥基因組數(shù)據(jù)庫(http://www.wheatgenome.org),獲取小麥淀粉合酶基因序列的基本信息;通過MG2C在線軟件(http://mg2c.iask.in/mg2c_v2.0/)繪制小麥淀粉合酶基因的染色體定位圖;利用ExPASy在線軟件(https://prosite.expasy.org)分析蛋白分子量(MW)和等電點(diǎn)(pI);利用MEME在線軟件(http://meme-suite.org/tools/meme)和pfam數(shù)據(jù)庫(https://pfam.xfam.org/)預(yù)測保守基序和保守結(jié)構(gòu)域,利用TBtools軟件進(jìn)行可視化。通過Gramene數(shù)據(jù)庫獲取擬南芥()、高粱()、玉米()、水稻()、谷子()的淀粉合酶基因,利用MEGA 7.0軟件構(gòu)建N-J樹,bootstrap設(shè)置為1 000。通過PlantCARE(http://bioinformatics.psb.ugent.be/webtools/PlantCARE/html/)和Place(https://www.dna.affrc.go.jp/PLACE/?action=newplace)在線軟件對小麥淀粉合酶基因起始密碼子上游2 000 bp序列進(jìn)行順式作用元件分析,利用TBtools進(jìn)行順式作用元件的統(tǒng)計(jì)及可視化。
從小麥基因表達(dá)數(shù)據(jù)庫(http://www.wheat-expression.com/)下載小麥品種中國春中淀粉合酶基因在不同組織和不同發(fā)育時(shí)期的表達(dá)數(shù)據(jù),計(jì)算并獲取小麥淀粉合酶基因的差異倍數(shù),采用TBtools軟件將表達(dá)結(jié)果可視化。
通過對小麥全基因組的搜索及蛋白結(jié)構(gòu)域分析,共鑒定到27個(gè)小麥淀粉合酶基因,結(jié)合基因的進(jìn)化樹分支及染色體分布對27個(gè)小麥基因進(jìn)行命名,結(jié)果見表1。淀粉合酶基因集中分布于1A/1B/1D、2A/2B/2D、6A/6B/6D、7A/7B/7D染色體上,可編碼599~1 629個(gè)氨基酸,等電點(diǎn)為4.87~7.50,分子量為58~183 kD。
為了解淀粉合酶基因家族成員間的進(jìn)化關(guān)系,用NJ法構(gòu)建擬南芥、玉米、水稻、高粱、小麥的淀粉合酶蛋白序列的進(jìn)化樹(圖1)。發(fā)現(xiàn)小麥淀粉合酶蛋白家族成員分為Group A和Group B兩大類,Group A包含GBSS、SSⅠ、SSⅡ三個(gè)亞家族,Group B包含SSⅢ、SSⅣ兩個(gè)亞家族。與玉米、水稻、高粱、擬南芥不同的是,小麥淀粉合酶基因家族中沒有SSⅤ亞家族。擬南芥作為雙子葉植物,籽粒胚乳退化,所有淀粉合酶亞家族只有單個(gè)基因拷貝。禾本科作物玉米、水稻、高粱、小麥的淀粉合酶亞家族基因經(jīng)歷了多次復(fù)制,存在多個(gè)基因拷貝。小麥中除SSⅠ和SSⅣ亞家族淀粉合酶基因?yàn)閱慰截愔?,GBSS亞家族存在和兩個(gè)拷貝,SSⅡ亞家族存在、和三個(gè)拷貝,SSⅢ亞家族存在和兩個(gè)拷貝。由于玉米分化后經(jīng)歷了第二次全基因組復(fù)制事件,因此玉米的淀粉合酶基因拷貝數(shù)量最多。
小麥?zhǔn)钱愒戳扼w,存在A、B、D三個(gè)染色體組,對27個(gè)小麥淀粉合酶基因進(jìn)行染色體定位分析發(fā)現(xiàn),大多數(shù)小麥淀粉合酶基因都具有三個(gè)高度同源的基因。但同源群Ⅶ中的B染色體缺少,該基因位于同源群Ⅳ的A染色體上,表明小麥在進(jìn)化過程中,同源群Ⅳ的A染色體與同源群Ⅶ的B染色體相應(yīng)區(qū)段發(fā)生了染色體片段交換(表1)。
表1 小麥淀粉合酶基因家族成員的基本信息Table 1 Basic information of starch synthase gene family members in wheat
At:擬南芥;Os:水稻;Zm:玉米;Sb:高粱;Si:谷子;Ta:小麥。
為揭示小麥淀粉合酶基因的序列特征,根據(jù)其進(jìn)化關(guān)系,比較分析不同拷貝間的基因結(jié)構(gòu)、蛋白質(zhì)保守基序和結(jié)構(gòu)域(圖2和圖3)?;蜻M(jìn)化常伴隨著編碼區(qū)外顯子數(shù)目的增多或減少,進(jìn)而引起蛋白結(jié)構(gòu)域改變以及功能分化。從圖2可以看出,小麥不同淀粉合酶亞家族間和相同亞家族內(nèi)的基因拷貝間,基因的外顯子數(shù)目不同。部分同源群內(nèi)的淀粉合酶基因外顯子數(shù)目和內(nèi)含子相位則比較保守,僅、、的外顯子數(shù)目減少了1~3個(gè),導(dǎo)致5′端編碼區(qū)片段缺失,蛋白序列變短,但與同源基因相比,蛋白結(jié)構(gòu)域并無變化(圖3),因此推測缺失的5′端序列均為非結(jié)構(gòu)域序列,對蛋白功能影響不大。外顯子數(shù)目增加,但沒有改變編碼區(qū)序列長度,僅改變了基因5′端的非編碼區(qū)序列(圖2)。
淀粉合酶家族蛋白都具有典型的GT5和GT1結(jié)構(gòu)域(PF08323和PF00534),SSⅢ亞家族還具有CBM53結(jié)構(gòu)域(PF16760)。利用MEME軟件在小麥淀粉合酶蛋白保守結(jié)構(gòu)域中共鑒定到10個(gè)保守基序,其中,GroupA中淀粉合酶蛋白的motif十分保守,都具有motif1~motif10,且排列順序也一致;而GroupB中淀粉合酶蛋白都缺少motif9和motif10,且SSⅢ亞家族還缺少motif8。推測保守基序差異可能引起不同亞家族蛋白之間的功能特性差異。
小麥淀粉合酶不同亞家族間的基因以及相同亞家族內(nèi)的不同基因拷貝間在不同組織和不同發(fā)育時(shí)期均具有明顯的表達(dá)差異。其中,和是單拷貝,在小麥各個(gè)組織和發(fā)育時(shí)期都有表達(dá),且在籽粒中表達(dá)量較高。、、在進(jìn)化中均產(chǎn)生了多個(gè)拷貝,其中、、在胚乳中特異表達(dá),而、、、在根、莖、葉等營養(yǎng)器官及早期階段的穗中表達(dá)量較高(圖4)。在胚乳中的表達(dá)量顯著高于、、,表明可能在小麥籽粒淀粉合成中扮演著十分重要的角色。
內(nèi)含子相位由內(nèi)含子在基因內(nèi)插入遺傳密碼子3個(gè)核苷酸的位置來確定。內(nèi)含子插入時(shí),若位于兩密碼子之間,則稱為0相位;插入密碼子的第一、二位核苷酸之間,稱為1相位;插入第二、三位之間時(shí),稱為2相位。
圖3 小麥淀粉合酶蛋白保守基序分析
不僅小麥淀粉合酶亞家族間的基因以及相同亞家族內(nèi)的基因拷貝之間存在表達(dá)差異,相同部分同源群內(nèi)的小麥淀粉合酶基因間也存在時(shí)空表達(dá)差異。其中,僅在開花期的穗中有較高的表達(dá)量,而和在穗的不同發(fā)育時(shí)期均有較高的表達(dá)量;在授粉后20 d和30 d的胚乳中表達(dá)量均比和低;在莖和穗中的表達(dá)量比和高;此外,與同源群內(nèi)的其他基因相比,和在不同組織和不同發(fā)育時(shí)期的表達(dá)量均最低。由此可見,小麥相同部分同源群內(nèi)的淀粉合酶基因間在不同組織和不同發(fā)育時(shí)期存在表達(dá)差異。
WE 10:授粉后10 d的整個(gè)胚乳;SE 20:授粉后20 d的淀粉胚乳;WE 20:授粉后20 d的整個(gè)胚乳;TC 20:授粉后20 d的轉(zhuǎn)移細(xì)胞;AL 20:授粉后20 d的糊粉層;SE 30:授粉后30 d的淀粉胚乳;AL and SE 30:授粉后30 d的糊粉層和淀粉胚乳;GR 2:授粉后2 d的籽粒;GR 4:授粉后4 d的籽粒;GR 30:授粉后30 d的籽粒;LSS:幼苗期葉片;LTS:分蘗期的葉片;Leaf 2:授粉后2 d的葉片;RST:幼苗期的根;RTL:三葉期的根;RFL:七葉期的根;SPT:可檢測到兩個(gè)節(jié)點(diǎn)的穗;SPF:七葉期的穗;SPA:開花期的穗;STS:穗長1 cm時(shí)的莖;STT:可檢測到兩個(gè)節(jié)點(diǎn)的莖;STA:開花期的莖。
利用Plant CARE在線軟件分析27個(gè)小麥淀粉合酶基因起始密碼子上游2 000 bp啟動子中的順式作用元件,發(fā)現(xiàn)其含有多種元件,按照功能可分為三大類,即植物激素反應(yīng)類、生物/非生物脅迫類、生長發(fā)育調(diào)控類(圖5)。在生長發(fā)育調(diào)控類元件中,GCN4-motif、AACA-motif、RY-element是已報(bào)道的胚乳特異表達(dá)元件。
圖5 小麥淀粉合酶基因三類順式作用元件的比較分析
為進(jìn)一步了解淀粉合成相關(guān)元件對小麥淀粉合酶基因表達(dá)差異的影響,又用Place在線軟件分析小麥淀粉合酶基因啟動子中與淀粉合成代謝相關(guān)的元件,結(jié)果共鑒定了12種元件(表2)。其中RYREPEATVFLEB4、AACACOREOSGLUB1、GCN4OSGLUB1/GLMHVCHORD分別是PlantCARE軟件預(yù)測到的RY-element、AACA-motif、GCN4-motif元件。Place軟件預(yù)測的RY-element、GCN4-motif元件與PlantCARE預(yù)測結(jié)果相同,但AACA-motif數(shù)目增加,可能是由于PlantCARE數(shù)據(jù)庫未及時(shí)更新,其參考序列水稻AACA-motif元件序列過長 導(dǎo)致。
表2 小麥淀粉合酶基因家族啟動子中預(yù)測到的與淀粉合成相關(guān)的順式作用元件Table 2 Cis-acting elements associated with starch synthesis in the promoters of starch synthase genes in wheat
進(jìn)一步分析發(fā)現(xiàn),淀粉合成代謝相關(guān)順式作用元件總數(shù)在不同基因拷貝間均存在著較大差異。部分胚乳特異表達(dá)元件在胚乳高表達(dá)基因的數(shù)目明顯多于其對應(yīng)的非胚乳特異表達(dá)基因,如RYREPEATVFLEB4、AACACOREOSGLUB1和AGGTOSGLUB1元件在、、中的總數(shù)明顯多于、、和(圖6)。由此表明,相同的淀粉合酶亞家族內(nèi)的基因拷貝間,在長期的進(jìn)化中啟動子序列發(fā)生變化,改變了順式作用元件的類型和數(shù)量,進(jìn)而導(dǎo)致基因出現(xiàn)表達(dá)差異,使得胚乳高表達(dá)的基因拷貝、、存在更多的胚乳特異表達(dá)元件。
小麥相同部分同源群內(nèi)淀粉合酶基因間也存在元件類型和數(shù)量差異,且與其表達(dá)特性差異相符。如和比部分同源群內(nèi)的其他兩個(gè)基因,在不同組織和不同發(fā)育時(shí)期的表達(dá)量均較低。從元件分布來看,的元件數(shù)量均少于和;的元件數(shù)量也均少于和(圖6)。由此可見,生長發(fā)育類元件對小麥部分同源群內(nèi)的淀粉合酶基因表達(dá)差異影響較大。
SUM1:RYREPEATVFLEB4、AACACOREOSGLUB1和ACGTOSGLUB1三類胚乳特異表達(dá)元件的數(shù)量之和;SUM2:除DOFCOREZM元件外,其他所有預(yù)測到的淀粉合成相關(guān)元件的數(shù)量之和。
小麥淀粉合酶經(jīng)基因復(fù)制產(chǎn)生不同淀粉合酶亞型,各亞型內(nèi)又產(chǎn)生不同數(shù)量的基因拷貝,這些拷貝在不同組織和不同發(fā)育時(shí)期均存在明顯的表達(dá)差異。探究小麥淀粉合酶基因主要調(diào)控元件對基因表達(dá)差異的影響,對小麥產(chǎn)量和品質(zhì)改良有重要意義。
在小麥基因組中共鑒定到27個(gè)淀粉合酶基因,由于小麥?zhǔn)橇扼w植物,有三個(gè)染色體組,除缺失的SSⅤ亞家族外,小麥淀粉合酶各亞家族基因數(shù)目之和是二倍體高粱的三倍。水稻SSⅣ亞家族基因存在兩個(gè)拷貝,這與水稻在進(jìn)化過程中發(fā)生染色體大片段復(fù)制有關(guān)。玉米淀粉合酶基因數(shù)目最多,這是因?yàn)橛衩自谘莼卸嘟?jīng)歷了一次全基因組復(fù)制事件。本研究小麥27個(gè)淀粉合酶基因按照進(jìn)化關(guān)系可分為GBSS、SSⅠ、SSⅡ、SSⅢ和SSⅣ五個(gè)亞家族,缺少TaSSⅤ亞家族,通過對麥類植物大麥、烏拉爾圖小麥和節(jié)節(jié)麥全基因組搜索,均未發(fā)現(xiàn)SSⅤ亞家族成員。本課題組曾報(bào)道在藻類、苔蘚類、雙子葉植物(擬南芥)和禾本科作物(水稻、高粱、玉米等)中都存在SSⅤ亞家族,因此推測可能在麥類植物的祖先中丟失了SSⅤ亞家族。
Dian等在水稻中共鑒定出10個(gè)淀粉合酶基因,對其進(jìn)行表達(dá)分析發(fā)現(xiàn),相同亞家族內(nèi)不同基因拷貝間具有明顯的表達(dá)差異,可分為兩組,一組在胚乳中優(yōu)先表達(dá),影響貯藏淀粉合成,另一組主要在葉片中表達(dá),影響瞬時(shí)淀粉合成,如SSⅢ和SSⅣ亞家族內(nèi)水稻淀粉合酶基因各有兩個(gè)拷貝,其中和主要在葉片中表達(dá),而和主要在胚乳中表達(dá)。本研究發(fā)現(xiàn),小麥淀粉合酶基因相同亞家族內(nèi)不同基因拷貝間也具有明顯的表達(dá)差異,如、和在胚乳中特異表達(dá),而、、和在根、莖、葉等營養(yǎng)器官及早期階段的穗中表達(dá)量較高。
Zhao等分析發(fā)現(xiàn),多倍體小麥進(jìn)化中,某些功能基因有多種表達(dá)模式。Pfeifer等對六倍體面包小麥的胚乳特異表達(dá)基因進(jìn)行共表達(dá)分析,發(fā)現(xiàn)部分同源群內(nèi)只有28%的基因?qū)儆谝粋€(gè)共表達(dá)簇,而大多數(shù)分布在不同的共表達(dá)簇上,表明絕大多數(shù)的部分同源基因間存在表達(dá)差異。小麥淀粉合酶基因相同亞家族內(nèi)的基因拷貝在不同組織和不同發(fā)育時(shí)期存在表達(dá)差異,部分同源群基因間也存在表達(dá)差異,但差異程度不及相同亞家族內(nèi)基因拷貝間大。
特定的啟動子元件可以調(diào)控基因在不同組織和不同發(fā)育時(shí)期的表達(dá),胚乳特異表達(dá)元件可引起基因在胚乳中高表達(dá)。Maier等發(fā)現(xiàn)-300CORE是決定玉米醇溶蛋白胚乳特異表達(dá)的必要元件,但本研究發(fā)現(xiàn)此元件的數(shù)目在小麥胚乳高表達(dá)與非胚乳表達(dá)的淀粉合酶基因間并沒有明顯差異。Wu等發(fā)現(xiàn),從水稻貯藏蛋白編碼基因中鑒定的GCN4-motif、AACA-motif、ACGT-motif都是胚乳特異表達(dá)元件,其中,GCN4-motif決定胚乳組織特異性,AACA-motif和ACGT-motif影響胚乳中谷蛋白基因表達(dá)量的高低;當(dāng)AACA-motif和ACGT-motif單獨(dú)存在時(shí),不能發(fā)揮作用,需與GCN4-motif共同作用才能決定胚乳的表達(dá)組織特性。本研究發(fā)現(xiàn),含GCN4-motif元件的小麥淀粉合酶基因數(shù)目較少,AACA-motif和ACGTOSGLUB1(ACGT-motif)元件在胚乳高表達(dá)基因的數(shù)目高于其他基因。Xiang等發(fā)現(xiàn)貯藏蛋白基因在胚乳中特異表達(dá),而淀粉合成相關(guān)基因在胚和胚乳中協(xié)調(diào)表達(dá)。因此,胚乳貯藏蛋白基因中胚乳特異表達(dá)元件與淀粉合酶基因的順式作用元件不完全相同。
胚乳中基因的胚乳表達(dá)特異性受不同類型轉(zhuǎn)錄因子和元件的控制。水稻谷蛋白基因中的GCN4-motif元件主要受bZIP類轉(zhuǎn)錄因子Opaque-2(O2)的調(diào)控,參與基因的胚乳特異性表達(dá)。NAC128和NAC130是玉米胚乳特異性轉(zhuǎn)錄因子,與啟動子區(qū)域中的核心元件ACGCAA結(jié)合,通過調(diào)節(jié)關(guān)鍵淀粉生物合成酶和主要種子貯藏蛋白基因的表達(dá)來協(xié)調(diào)淀粉和蛋白質(zhì)的積累。由此可見,基因的胚乳表達(dá)特異性是由不同轉(zhuǎn)錄因子和順式作用元件相互作用來實(shí)現(xiàn)的。因此,胚乳表達(dá)特異性的調(diào)控機(jī)制非常復(fù)雜,不同物種不同類型基因的具體機(jī)制可能存在一定差異,可通過具有表達(dá)差異的基因拷貝間的元件差異來揭示胚乳特異表達(dá)機(jī)制。