張奇艷,雷忠萍,宋銀,海江波,賀道華
陸地棉擴展蛋白基因的鑒定與特征分析
張奇艷1,雷忠萍2,宋銀1,海江波1,賀道華1
(1西北農(nóng)林科技大學(xué)農(nóng)學(xué)院,陜西楊凌 712100;2西北農(nóng)林科技大學(xué)生命科學(xué)學(xué)院,陜西楊凌 712100)
【】擴展蛋白(Expansin)是細(xì)胞壁的重要組成部分,在植物的生長發(fā)育及逆境脅迫應(yīng)答等方面均發(fā)揮著重要作用?;谌蚪M水平系統(tǒng)鑒定陸地棉Expansin基因家族,并通過生物信息學(xué)及表達模式分析,為揭示擴展蛋白基因在棉花生長發(fā)育中的功能及后續(xù)利用奠定基礎(chǔ)。利用BLAST和HMMER在陸地棉基因組中搜索并鑒定擴展蛋白基因家族成員;利用ClustalW、MEGA、MCScanX、Prot Param、MEME、SignalP、Euk-mPLoc、FancyGene和DnaSP等軟件對其基因序列和蛋白序列進行生物信息學(xué)分析。通過RNA-seq數(shù)據(jù)分析擴展蛋白基因的表達模式和部分同源基因間表達差異,利用qRT-PCR驗證部分?jǐn)U展蛋白基因的表達譜。陸地棉基因組中含有46個EXPA基因、8個EXPB基因、6個EXLA基因和12個EXLB基因,合計72個Expansin基因;四倍體陸地棉中擴展蛋白成員的數(shù)量幾乎是二倍體棉種(亞洲棉與雷蒙德氏棉)的2倍。除GhA02和GhD06 2個染色體外,其余各染色體上均分布有數(shù)目不等的擴展蛋白基因(2—4個),具有部分同源關(guān)系的染色體GhA08和GhD08分別有5個和8個擴展蛋白基因。系統(tǒng)發(fā)育樹顯示,各亞家族成員聚集成群,并且大部分的末端分支均由來源于3個物種的4個(亞)基因組的4個基因組成,如EXPA亞家族的///等等,4個基因之間具有同線性關(guān)系。亞細(xì)胞定位發(fā)現(xiàn)陸地棉所有的擴展蛋白均位于細(xì)胞外?;蚪Y(jié)構(gòu)分析顯示,擴展蛋白基因由3—5個外顯子組成,外顯子-內(nèi)含子結(jié)構(gòu)在進化上高度保守且與氨基酸序列的多樣性一致,且在外顯子上存在密碼子偏好性。RNA-seq數(shù)據(jù)顯示,不同基因在不同時空條件下存在特異性表達,如和相比其他基因在纖維10 DPA和20 DPA中的表達量很高;在不同的組織(如子葉、新葉、老葉、苞葉)中,具有較高的表達量。部分同源基因之間具有不同的表達模式,顯示它們之間功能的異化與互補。qRT-PCR結(jié)果與RNA-seq數(shù)據(jù)基本吻合,如和在纖維發(fā)育的伸長階段高量表達。和在3DPA的胚珠中表達活躍。陸地棉基因組中含72個擴展蛋白基因,其在DNA水平和氨基酸水平具有一致的結(jié)構(gòu)多樣性和進化保守性,在轉(zhuǎn)錄水平具有各異的表達模式,顯示出家族內(nèi)成員間功能上的異化與互補。
陸地棉;擴展蛋白;基因家族;生物信息學(xué);基因表達
【研究意義】棉花是一種重要的纖維作物。棉纖維是由胚珠外表皮的單個細(xì)胞發(fā)育而成,是高度伸長、增厚、沒有分支的單細(xì)胞表皮毛,與擬南芥表皮毛的發(fā)生機制相似。細(xì)胞壁對棉纖維的品質(zhì)起決定作用,是改良棉花品質(zhì)的重要途徑之一。棉纖維的伸長與細(xì)胞壁松弛聯(lián)系密切,擴展蛋白能夠打斷纖維素微絲間的氫鍵,從而使細(xì)胞壁延展疏松[1]。研究表明,擴展蛋白在植物的生長發(fā)育與逆境脅迫應(yīng)答等方面具有重要作用,對棉花的遺傳改良具有潛在價值?!厩叭搜芯窟M展】1992年,Mc Queen-Mason等[2]從黃瓜下胚軸細(xì)胞壁中分離純化得到2個分子量為29和30 kD能誘導(dǎo)細(xì)胞壁恢復(fù)酸生長的蛋白。這種蛋白粗提液可在體外誘導(dǎo)熱失活細(xì)胞壁的重新伸展,但伸展過程受到pH和金屬離子等因素的影響。研究發(fā)現(xiàn),這種現(xiàn)象是由細(xì)胞壁上的一類細(xì)胞壁疏松蛋白介導(dǎo)的,因而將其命名為擴展蛋白(Expansin)[3]。擴展蛋白能夠打斷細(xì)胞壁多糖之間的非共價鍵,從而使細(xì)胞壁聚合物發(fā)生膨壓誘導(dǎo)的蠕動,對細(xì)胞壁起到疏松作用,使細(xì)胞壁的柔韌性增加而松弛[4-5]。隨后,人們相繼從水稻[6]、玉米[7]、擬南芥[6]、大豆[8]、番茄[9]、葡萄[10]等100多個物種的細(xì)胞壁中也鑒定出擴展蛋白,推測擴展蛋白廣泛存在于雙子葉植物和單子葉植物中。研究表明,擴展蛋白能影響植物的生長發(fā)育,諸如促進組織細(xì)胞的生長[11]、種子發(fā)育[12]、根毛起始和根系生長[13-14]、葉和莖的發(fā)育[15-19]、花粉管伸長[20-21]、促進葉柄脫落[16]、果實成熟[22-23]和降低番茄的裂果率[24]等。另外,在植物抗逆性方面,擴展蛋白也發(fā)揮著重要作用,如抗旱性[25-26]、耐鹽性[27-28]、抗高溫[29]和抗病性[30]等。棉花為人類提供了一種優(yōu)良的天然纖維,其發(fā)育過程包含5個彼此重疊的時期,依次為起始期(initiation)、伸長期(elongation)、初生壁向次生壁發(fā)育的轉(zhuǎn)換期(transition)、次生壁合成期(secondary wall biosynthesis)和脫水成熟期(maturation)[31]。研究表明,擴展蛋白在轉(zhuǎn)錄水平上與棉纖維的伸長聯(lián)系緊密[32-33],許多擴展蛋白基因在纖維細(xì)胞的伸長中高度表達[34-35]。Xu等[36]發(fā)現(xiàn)在棉花中過表達可以顯著增加棉鈴數(shù)量,單株棉花纖維產(chǎn)量可增加40%,對纖維品質(zhì)和棉株生長沒有不利的影響。Li等[37]發(fā)現(xiàn)(來自At亞基因組,是Dt亞基因組中的部分同源基因)在次生壁合成和代謝中發(fā)揮重要作用。Bajwa等[38]發(fā)現(xiàn),轉(zhuǎn)棉株的纖維長度和馬克隆值均有顯著提高。以上研究結(jié)果均表明擴展蛋白在棉花中具有重要的作用。【本研究切入點】2012年,Wang等[39]和Paterson等[40]分別完成了棉花D基因組雷蒙德氏棉()的全基因組測序工作;2014年,Li等[41]完成了棉花A基因組亞洲棉()石系亞1號的全基因組測序及組裝工作,繪制出的亞洲棉基因組約為1 694 Mb。在上述成果的基礎(chǔ)上,2015年,Li等[42]和Zhang等[43]分別獨立完成了異源四倍體陸地棉()TM-1的全基因組測序及組裝。隨后,Chen(https://www.cottongen.org/species/Gossypium_ hirsutum/jgi-AD1_genome_v1.1)、Wang等[44]和Hu等[45]分別對棉屬的基因組序列圖譜進行了更新和完善,為在陸地棉全基因組范圍內(nèi)系統(tǒng)進行擴展蛋白基因家族的鑒定、進化和功能分析提供了條件?!緮M解決的關(guān)鍵問題】本研究基于陸地棉及相關(guān)二倍體棉種的基因組測序的序列信息,對棉花擴展蛋白基因家族進行篩選鑒定,并從DNA水平(基因外顯子-內(nèi)含子結(jié)構(gòu)、密碼子偏好性、同線性)、RNA水平(基于RNA-seq和qRT-PCR的基因表達模式、部分同源基因間表達豐度差異)和氨基酸水平(信號肽、模體結(jié)構(gòu)、理化性質(zhì)及亞細(xì)胞定位)對其進化及功能進行分析,為進一步研究擴展蛋白在棉花(纖維)生長發(fā)育等生物學(xué)過程中的功能奠定基礎(chǔ)。
陸地棉基因組數(shù)據(jù)下載于http://mascotton.njau.edu.cn[43],亞洲棉基因組數(shù)據(jù)下載于http://cgp.genomics. org.cn[41]。擬南芥和水稻擴展蛋白家族成員序列信息下載于Daniel Cosgrove實驗室建立的網(wǎng)站http://www.personal.psu.edu/。擴展蛋白成員的搜索步驟參見雷忠萍等[46]。以擬南芥和水稻擴展蛋白基因的序列為query,利用BLAST(ftp://ncbi.nlm.nih.gov/blast/ executables/)軟件,在陸地棉及亞洲棉基因組序列中檢索擴展蛋白基因。然后,利用HMMER(http://hmmer. janelia.org/)軟件鑒定上述準(zhǔn)擴展蛋白成員是否同時含有pfam01357(Pollen_allerg_1)和pfam03330(DPBB_1)2個保守性的特征結(jié)構(gòu)域,HMMsearch的E值設(shè)置為<1E-05。
利用軟件ClustalW對所鑒定的棉花、擬南芥和水稻的擴展蛋白氨基酸序列進行多序列比對分析;利用軟件MEGA v5.0,采用Neighbor-Joining法構(gòu)建擴展蛋白氨基酸序列的系統(tǒng)發(fā)育樹。參照擬南芥及水稻的擴展蛋白的亞家族分類,將棉花的擴展蛋白家族成員歸類到EXPA、EXPB、EXLA和EXLB 4個亞家族中,根據(jù)陸地棉、亞洲棉各擴展蛋白基因與雷蒙德氏棉Expansin基因之間的同線性關(guān)系、系統(tǒng)發(fā)育樹、及其在染色體上的位置順序等信息對各基因進行命名。
通過BLAST比對,將所獲得的各擴展蛋白基因定位到相應(yīng)的染色體上。利用MCScanX軟件分析各擴展蛋白基因之間的同線性關(guān)系。利用Circos軟件圖形化展示擴展蛋白基因在染色體上的物理位置及基因間的同線性關(guān)系。
利用在線軟件Prot Param(http://web.expasy.org/ protparam/)獲取各擴展蛋白的理論等電點(theoretical)、分子量(molecular weight)、蛋白不穩(wěn)定指數(shù)(instability index)、脂溶指數(shù)(aliphatic index)和總平均疏水性(grand average of hydropathy,GRAVY)。利用軟件MEME(http://memesuite.org/tools/meme),通過命令“meme GoExpansinPepSequences.txt -protein- oc.-nostatus-time 18000-maxsize 200000-mod zoops -nmotifs 20-minw 6-maxw 25”對擴展蛋白基因家族成員進行模體(基序,motif)結(jié)構(gòu)分析。利用SignalP(http://www.cbs.dtu.dk/services/SignalP)分析信號肽。利用在線軟件Euk-mPLoc 2.0(http://www.csbio.sjtu. edu.cn/bioinf/euk-multi-2/#)對各擴展蛋白進行亞細(xì)胞定位分析。
通過對各擴展蛋白基因的CDS序列與DNA序列進行BLAST比對,利用http://bio.ieo.eu/fancygene繪制基因外顯子-內(nèi)含子結(jié)構(gòu)圖。利用軟件DnaSP 5.10對陸地棉中擴展蛋白基因密碼子偏好性(Codon usage bias)進行統(tǒng)計。
1.6.1 轉(zhuǎn)錄組(RNA-seq)數(shù)據(jù)分析 為了獲得擴展蛋白基因在不同時空條件的表達特征,參考He等[47]的方法,從NCBI SRA數(shù)據(jù)庫下載2組深度測序(RNA-seq)數(shù)據(jù):SRP059947和SRP017168。利用Tophat將RNA-seq的短讀序列mapping到陸地棉基因組上,利用cufflinks函數(shù)估算擴展蛋白基因在不同時空上的表達水平(fragments per kilobase of exon modelper million reads mapped,F(xiàn)PKM值),通過cuffdiff函數(shù)篩出在不同時空之間存在表達差異的基因。根據(jù)RNA-seq數(shù)據(jù)的分析結(jié)果,挑選13個擴展蛋白基因進行實時熒光定量PCR分析,以便進一步驗證其表達特征。
1.6.2 實時熒光定量PCR(quantitative real-time PCR,qRT-PCR) 于陸地棉材料N874系的花鈴期,取-3、-1、0、3、5、10和15 DPA(days post-anthesis)的棉鈴分離出胚珠,取5、10、15和20 DPA的棉鈴分離出纖維。利用總RNA提取試劑盒(天根,北京)從棉花胚珠和纖維中提取RNA,用NanoDrop 2000和1%的瓊脂糖凝膠電泳檢測RNA的含量和質(zhì)量。以RNA為模板反轉(zhuǎn)錄合成cDNA。qRT-PCR引物下載于西南大學(xué)(http://biodb.swu.edu.cn/qprimerdb),采用UBQ7(AF024716)作為內(nèi)參基因(表1)。用Applied Biosystems QuantStudio 7 Flex實時PCR系統(tǒng)(Applied Biosystems,USA)進行qRT-PCR。反應(yīng)程序:94℃ 3 min;94℃ 45 s,52℃ 45 s,72℃ 45 s,40個循環(huán)。每個qRT-PCR樣品設(shè)置3個重復(fù)。使用2-△△CT法計算相對表達量。
表1 實時熒光定量PCR引物
根據(jù)擬南芥和水稻擴展蛋白的基因序列(作為query),通過BLAST比對搜索過程,初步鑒定出棉屬準(zhǔn)擴展蛋白家族成員。然后通過HMMER檢測pfam01357和pfam03330 2個結(jié)構(gòu)域存在與否,最終確認(rèn)為擴展蛋白。在陸地棉中,共鑒定出72個擴展蛋白家族成員(表2);同時,在二倍體物種亞洲棉中,鑒定出39個擴展蛋白基因,與在雷蒙德氏棉中鑒定出的擴展蛋白數(shù)量一致[46]。其中,同為雙子葉植物的擬南芥、楊樹和大豆中,擬南芥和楊樹的擴展蛋白基因數(shù)量與二倍體棉相近,大豆的擴展蛋白數(shù)量則與四倍體棉相近(表3)?;诒狙芯克b定的棉花、擬南芥和水稻擴展蛋白的系統(tǒng)發(fā)育樹分析,將陸地棉和亞洲棉擴展蛋白劃分為4個亞家族(EXPA、EXPB、EXLA和EXLB)。陸地棉的72個擴展蛋白成員中,46個屬于EXPA亞家族,8個屬于EXPB亞家族,6個屬于EXLA亞家族,12個屬于EXLB亞家族。亞洲棉39個擴展蛋白成員的亞家族分布與雷蒙德氏棉類似,EXPA、EXPB、EXLA和EXLB 4個亞家族的成員數(shù)分別為26、4、3和6個。數(shù)據(jù)顯示,四倍體陸地棉中擴展蛋白成員的數(shù)量幾乎是二倍體棉種(亞洲棉與雷蒙德氏棉)的2倍(四倍體陸地棉中EXPA亞家族的成員數(shù)量(46)比二倍體的數(shù)量(26)的2倍少),說明二倍體經(jīng)過遠(yuǎn)緣雜交和基因組加倍形成四倍體后,擴展蛋白家族內(nèi)的成員得到繼承,僅亞家族EXPA中的個別成員發(fā)生了丟失。在各個亞家族內(nèi),根據(jù)各基因在染色體上的位置順序,對陸地棉擴展蛋白基因進行了命名(表2)。
表2 陸地棉擴展蛋白基因家族成員的鑒定
續(xù)表2 Continued table 2
續(xù)表2 Continued table 2
表3 不同植物擴展蛋白及其各亞家族內(nèi)基因數(shù)目
鑒定結(jié)果顯示,擴展蛋白在陸地棉染色體上呈現(xiàn)不均勻分布,在大多染色體上有2—4個擴展蛋白基因。具有部分同源關(guān)系(homeologous)的GhA08和GhD08 2個染色體具有較多的擴展蛋白基因,分別為5和8個。染色體GhA02和GhD06上沒有擴展蛋白基因。有的基因家族成員在染色體上呈現(xiàn)成簇(cluster)存在的現(xiàn)象,尤其是同一亞家族的成員,如GhD08染色體上的///形成串聯(lián)重復(fù)(tandem duplication)。/、/分別形成了2個小的串聯(lián)重復(fù)。
陸地棉、亞洲棉和雷蒙德氏棉擴展蛋白的系統(tǒng)發(fā)育樹顯示,亞家族EXLA與EXLB的遺傳距離較近,EXPA與其余3個亞家族的相似性較小,表明了各亞家族間的親緣(起源)關(guān)系及進化關(guān)系(圖1)。亞家族內(nèi)的各成員聚集在同一分支中(聚集成群),擁有各自的進化枝。大部分的末端分支由來源于3個物種的4個(亞)基因組的4個基因組成,如:EXPA亞家族的///,EXLB亞家族的///等。4個基因分別來自A基因組、At亞基因組、Dt亞基因組和D基因組,表明擴展蛋白的氨基酸序列在物種間/(亞)基因組間具有平行的相似性,四倍體陸地棉的2個亞基因組(At、Dt)與對應(yīng)的二倍體基因組(A、D)有較近的親緣關(guān)系。
利用軟件MCScanX對棉屬擴展蛋白在(亞)基因組間的同線性進行分析,結(jié)果顯示,系統(tǒng)發(fā)育樹中來源于A、D、At、Dt基因組/亞基因組的4個末端分支基因多具有同線性關(guān)系(圖1系統(tǒng)發(fā)育樹中綠色橢圓表示具有同線性關(guān)系),相互之間屬于垂直同源基因(orthologous),陸地棉的2個亞基因組At與Dt在二倍體物種中也分別存在同線性同源區(qū)段。深入分析進一步表明,各基因組內(nèi)部擴展蛋白之間存在一定的平行同源關(guān)系(paralogous),如圖1系統(tǒng)發(fā)育樹中紫色橢圓所示,顯示了各基因組內(nèi)部擴展蛋白基因的擴張(數(shù)量增加)歷程,即大規(guī)模的染色體片段重復(fù)(segmental duplication)導(dǎo)致了基因家族的擴張,由共同祖先基因組中的15—17個[5]擴張到陸地棉中的72個。
圖1 棉屬擴展蛋白的系統(tǒng)發(fā)育樹、外顯子-內(nèi)含子結(jié)構(gòu)和氨基酸模體結(jié)構(gòu)
四倍體陸地棉的2個亞基因組At與Dt間的同線性分析(圖2)顯示,除個別基因()外,大多數(shù)擴展蛋白基因均位于同線性染色體區(qū)段上,說明AA與DD雜交加倍進化形成AtAtDtDt的陸地棉后,2個亞基因組At與Dt仍保持較高的相似性,并且遺傳了其二倍體祖先基因組的染色體倍增的特點。值得注意的是,這種繼承并不是完全的,擴展蛋白基因在染色體結(jié)構(gòu)上發(fā)生了微小變化。
圖2 陸地棉擴展蛋白基因的染色體位置及亞基因組間的同線性關(guān)系
陸地棉72個擴展蛋白的氨基酸序列長度大多在247—278(除180()、207()和303()外),分子量大多在26.39—30.96 kD(除18.92()、22.54()和33.80()外),平均值為27.76 kD。等電點在4.65—9.90,平均值為8.18,75%的擴展蛋白的等電點大于8.0,即大多數(shù)陸地棉擴展蛋白偏堿性。除個別成員外,擴展蛋白不穩(wěn)定指數(shù)在18.98—43.09,多數(shù)蛋白穩(wěn)定性較好。脂溶指數(shù)在58.78—85.38,平均值達到71.39,其中有14個擴展蛋白的脂溶指數(shù)超過80,屬于嗜熱型蛋白。脂溶指數(shù)較高使得擴展蛋白可以較好地適應(yīng)各種環(huán)境??偲骄杷裕℅RAVY)在-0.247—0.045,均屬于親疏性相當(dāng)?shù)膬尚缘鞍祝ù笥?表示疏水性,小于0表示親水性,介于±0.5之間為兩性蛋白)[49](表3)。利用軟件SignalP分析擴展蛋白信號肽,結(jié)果顯示72個擴展蛋白中55個含有長度不等(17—34 aa)的信號肽。亞家族EXPB的信號肽長度均值為28.5 aa;亞家族EXLA的信號肽長度均值為18.3 aa,顯著地(< 0.01)低于其他3個亞家族。
利用軟件MEME對棉屬3個物種的擴展蛋白氨基酸序列的保守基序(motif)進行分析(圖3),獲得20個(A—T)可靠的基序(e<1.20E-118)。其中EXPA亞家族的羧基端保守基序組合均為BJADF,而氨基端基序組合的種類則多達15種,該亞家族的氨基酸基序P、Q、R和T是不相容(兼容)的,其基序組合與系統(tǒng)發(fā)育樹的呈現(xiàn)結(jié)果一致,均能說明基因的進化關(guān)系。EXPB亞家族的基序組合大多為PECNHKDF和RECNHKTF(除例外)。EXLA亞家族的基序組合保守程度非常高,組合形式都為RQOCNHKLFS。EXLB亞家族的基序組合為PECNQTGLF和PECNHKLF(除和例外)。值得注意的是,EXPA亞家族含有不同于其他亞家族的模體I,EXLA亞家族含有不同于其他亞家族的模體S,該模體構(gòu)成表明,各亞家族擴展蛋白在某些代謝途徑中可能具有特殊功能。
通過軟件Euk-mPLoc 2.0進行亞細(xì)胞定位,結(jié)果表明,陸地棉72個擴展蛋白也全部定位于細(xì)胞外。
圖3 棉屬擴展蛋白家族氨基酸序列模體(基序)
為了在DNA水平進一步了解陸地棉擴展蛋白,對基因的“外顯子-內(nèi)含子”結(jié)構(gòu)進行分析。陸地棉擴展蛋白基因的DNA長度在829—2 185 bp(除外),其基因結(jié)構(gòu)圖(圖1)表明,同一亞家族的擴展蛋白基因在“外顯子-內(nèi)含子”結(jié)構(gòu)上非常相似。除個別基因(和)的內(nèi)含子較長外,系統(tǒng)發(fā)育樹中聚類在一起的基因的外顯子數(shù)目、長度基本一致,內(nèi)含子長度也很接近。表明擴展蛋白基因結(jié)構(gòu)是相對較保守的,在進化上具有一定的保守性,且與氨基酸序列的多樣性保持一致。
密碼子的偏好性分析既可以為基因表達選擇適合的表達系統(tǒng),又能為密碼子的改造而改變基因表達量提供依據(jù)。生物的遺傳密碼中,除色氨酸和甲硫氨酸只有一個密碼子外,其余氨基酸都有一個以上的簡并密碼子。簡并密碼子中,某一密碼子相對同義密碼子使用頻率單值超過60%或者超過該組同義密碼子平均占有頻率的1.5倍的密碼子即為高頻密碼子。對陸地棉72個擴展蛋白基因家族成員的18 455個密碼子進行統(tǒng)計分析(表4),數(shù)據(jù)顯示,UUG、CCU、GCU、AGA、AGG為高頻密碼子;UCG、CCG、ACG、GCG、CGG等第2、3位堿基為C和G的密碼子為稀有密碼子。4個亞家族之間的比較發(fā)現(xiàn),AGG是4個亞家族共有的高頻密碼子,CGG是共有的低頻密碼子;EXPA和EXLA 2個亞家族具有較多相似的偏好性密碼子。
基因的表達與植物的生長發(fā)育密切相關(guān),基于轉(zhuǎn)錄組(RNA-seq)數(shù)據(jù)的時空表達模式可以為探究擴展蛋白基因的功能提供線索。RNA-seq數(shù)據(jù)SRP059947中樣品包括子葉、根、莖、葉(新葉、老葉)、苞葉、花萼、花冠、雌蕊雄蕊、胚珠(0、10、20、30和40 DPA)、纖維(10和20 DPA)共16個組織器官或發(fā)育階段(圖4)。RNA-seq分析表明,在不同組織、不同發(fā)育時期擴展蛋白基因的表達量存在較大差異,如:和在10和20 DPA纖維中的表達量很高,和在30和40 DPA胚珠中高量表達,和分別在10和20 DPA的胚珠中活躍表達,在20 DPA胚珠表達量特別高。在10和20 DPA的胚珠及10和20 DPA的纖維中均高量表達,表明對纖維的伸長(elongation (i.e., primary cell wall synthesis, 3–17 DPA))和纖維次生壁的合成階段(secondary cell walls synthesis (17–23 DPA))有重要貢獻。在根中,、、和表達量很高。在莖中,、和特高量表達;另外,和在莖中也有較高表達水平。在新葉中,、、及的表達量很高。在老葉中,、和高量表達。在子葉(cotyledon)中,、、及的表達量很高。值得注意的是,同時在子葉、新葉、老葉、苞葉(bracts)中均有很高的表達量,推測該基因可能對葉片組織的發(fā)育起到重要作用。在苞葉和花萼(calyxs)中,、有很高的表達量。在花冠(corollas)和雌雄蕊(gynoecium and androecium)中,、、、、、和具有較高的表達量。這些數(shù)據(jù)顯示,不同的Expansin基因,在不同的時空條件下發(fā)揮功能,Expansin基因家族的成員在功能上既各司其職又相互補充。
表4 陸地棉擴展蛋白基因密碼子的相對使用頻率
aa:氨基酸amino acid;Cod:密碼子codon;Freq:頻率frequency
基于轉(zhuǎn)錄組數(shù)據(jù)(RNA-seq)的表達模式分析初步提供了各基因在不同時空條件下的表達特征。對于至少在纖維和胚珠的發(fā)育的某個階段表達豐度很高的基因,為了進一步明確其特異表達情況,本研究挑選13個擴展蛋白基因,通過qRT-PCR進行表達模式的驗證(圖5)。結(jié)果表明,qRT-PCR和RNA-seq均顯示Expansin基因在各種組織/階段中差異表達。和在纖維發(fā)育的伸長階段表現(xiàn)出高表達,其中,在15 DPA表達量最高,有著同樣的表達趨勢。同時,的表達在整個纖維細(xì)胞起始和伸長過程中逐漸增加。和在纖維發(fā)育的10 DPA表達量較高。和在3 DPA的胚珠發(fā)育期間高度表達,在胚珠發(fā)育的10和15 DPA超高量表達,在胚珠發(fā)育的15 DPA高量表達,而在胚珠發(fā)育的3—10 DPA表達量都很高。而和主要在10—15 DPA胚珠和15—20 DPA纖維中表達??偟膩碚f,除了少數(shù)基因外,RNA-seq數(shù)據(jù)和qRT-PCR結(jié)果基本一致,進一步顯示Expansin基因在胚珠/纖維生長和發(fā)育中的潛在功能。
圖4 不同組織及不同時期擴展蛋白基因表達分析
異源四倍體的陸地棉,其基因組中每個基因都具有一個部分同源(homoeologous)基因。具有部分同源關(guān)系的基因?qū)Γ╬air)從同一祖先進化而來,經(jīng)過了漫長的物種進化過程,基因的功能是否發(fā)生變化、表達模式是否相同,通過對RNA-seq數(shù)據(jù)(SRP017168和SRP059947)的分析,對陸地棉中具有同線性的直系同源基因的表達量進行比較,二項分布(binomial distribution)統(tǒng)計分析顯示,具有部分同源關(guān)系的一對基因在相同的時空條件下,其表達模式具有差異。和、和、和、和、和、和這6個部分同源基因?qū)Γ╬air),各基因?qū)χg在不同的時空條件下存在表達差異,At和Dt2個亞基因組的表達豐度不一致。如:幼嫩葉片中,的表達量(位于Dt亞基因)>的表達量(位于At亞基因);在花萼中則相反,的表達量<的表達量。同時也存在一些部分同源基因?qū)Γ缁蚝?,在部分時空條件下表達豐度均很低,但在莖、新葉、花冠中,基因的表達量顯著低于的表達量。這些分析結(jié)果顯示,異源四倍體陸地棉的部分同源基因?qū)λl(fā)揮的作用可能存在差異,或是在進化過程中發(fā)生了功能異化(divergence)。
在植物界,擴展蛋白基因家族包含4個亞家族:EXPA、EXPB、EXLA和EXLB。本研究在陸地棉全基因組水平上對Expansin基因家族進行鑒定與分析,以氨基酸序列中同時含有Pollen_allerg_1和DPPB_1這兩個保守性特征結(jié)構(gòu)域為標(biāo)準(zhǔn),在陸地棉基因組中共鑒定出72個擴展蛋白基因。將陸地棉與擬南芥、水稻的擴展蛋白基因一起進行系統(tǒng)發(fā)育樹分析,結(jié)果顯示,陸地棉中4個亞家族EXPA、EXPB、EXLA、EXLB的基因分別有46、8、6和12個。
陸地棉是由二倍體的祖先物種經(jīng)過遠(yuǎn)緣雜交和染色體加倍進化而來,而二倍體的祖先物種的現(xiàn)代種是亞洲棉和雷蒙德氏棉。因此,為了研究陸地棉中Expansin基因家族的進化特征,本研究參閱了雷蒙德氏棉中Expansin基因鑒定的結(jié)果[46],同時在亞洲棉中進行了Expansin基因的鑒定(圖1的系統(tǒng)發(fā)育樹)。與雷蒙德氏棉和亞洲棉相比,陸地棉擴展蛋白各亞家族的基因數(shù)量幾乎是二倍體棉種的2倍(EXPA亞家族46﹕26;EXPB亞家族8﹕4;EXLA亞家族6﹕3;EXLB亞家族12﹕6),但陸地棉擴展蛋白基因的數(shù)量(72個)少于二倍體雷蒙德氏棉和亞洲棉的擴展蛋白數(shù)量之和(39+39=78),可能原因是在四倍體形成后的進化過程中,染色體片段的復(fù)制(segmental duplication)和重排(chromosomal rearrangement)導(dǎo)致這些(6個)基因因異位(ectopy)而被淘汰或丟失(gene loss)。其他物種中的研究表明,雙子葉植物中EXPA亞家族比EXPB亞家族的擴展蛋白數(shù)量多[48],表2顯示陸地棉中EXPA與EXPB亞家族分別占總擴展蛋白數(shù)量的63.9%和11.1%,亞洲棉和雷蒙德氏棉EXPA與EXPB類擴展蛋白分別占總擴展蛋白的66.7%和10.3%,與前人研究結(jié)果一致。圖1還顯示,各亞家族內(nèi)的親緣關(guān)系相近的基因在基因的“外顯子-內(nèi)含子”結(jié)構(gòu)及氨基酸序列模體(motif)組成等方面具有一定的相似性,表明在Expansin的進化方面,DNA水平的多樣性與蛋白水平的多樣性是基本吻合的。系統(tǒng)發(fā)育樹的拓?fù)浣Y(jié)構(gòu)(topology)也和擬南芥、水稻等植物中的結(jié)果一致,這些是亞家族劃分的有利依據(jù)。利用軟件Euk-mPLoc 2.0對Expansin家族基因進行了亞細(xì)胞定位,結(jié)果顯示所有的Expansin蛋白均定位于細(xì)胞外,推測它們均位于細(xì)胞壁中,可能與Expansin蛋白在棉屬中所起的作用有關(guān)。
植物的共同祖先(last common ancestor)中,4個亞家族EXPA、EXPB、EXLA、EXLB基因的數(shù)量分別是10—12、2、1、2[5]。本研究發(fā)現(xiàn),陸地棉擴展蛋白家族獲得了極大的擴張。大規(guī)模的基因組重復(fù)(large-scale genomic duplication)、平行同源(paralogous)基因及部分同源(homoeologous)基因間功能多樣化(diversification)是生物進化的動力之一[47,55],也是陸地棉擴展蛋白家族極大地擴張(contributed to the expansion of thefamily)的原因。利用軟件MCScanX進行的同線性分析顯示,陸地棉中除了3個串聯(lián)重復(fù)(tandem duplications)區(qū)段(/;/;///)外,其余均為片段重復(fù)(dispersed segmental duplications)。陸地棉進化過程中的多次基因組/染色體片段重復(fù)(duplicated (syntenic) blocks)及微量的丟失(gene loss)使得Expansin基因家族成員擴張到72個。
棉花纖維、胚珠等各種組織的生長發(fā)育與基因的表達豐度密切相關(guān),Expansin基因在這些不同的生命活動階段可能發(fā)揮著重要作用。Orford等[34]克隆了擴展蛋白基因,該基因在纖維發(fā)育的伸長階段特異表達;Ruan等[56]研究表明在纖維伸長階段可觀察到擴展蛋白基因的高量表達;Li等[37]發(fā)現(xiàn)在纖維細(xì)胞伸長期間顯著上調(diào)表達,表明在纖維發(fā)育中具有重要的功能。Bajwa等[38]通過農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化,在棉花中過量表達可以改善纖維品質(zhì)。同樣,Indrais等[57]通過RT-PCR和Northern印跡發(fā)現(xiàn)特異的擴展蛋白對纖維伸長具有貢獻作用。本研究中,RNA-seq數(shù)據(jù)(SRP017168、SRP059947)分析結(jié)果同樣表明(圖4),各擴展蛋白基因在纖維和胚珠的不同發(fā)育時期特異表達。如和相比其他基因在纖維中的表達量很高;和在胚珠30和40 DPA高量表達;在胚珠20 DPA表達量特別高?;赗NA-seq數(shù)據(jù)的分析結(jié)果,對于那些在纖維和胚珠的某個時期高量表達的基因,選擇了13個基因進行qRT-PCR定量驗證,旨在分析Expansin基因?qū)w維發(fā)育過程中的影響和作用,大多數(shù)基因的表達模式與RNA-seq數(shù)據(jù)分析的結(jié)果一致。這些特定時空條件下活躍表達的基因,也許是棉花種質(zhì)創(chuàng)新的重要候選基因。當(dāng)然,少數(shù)基因的基于qRT-PCR的表達模式與RNA-seq數(shù)據(jù)分析結(jié)果存在差異,可能是因為RNA-seq測序樣本與本研究中qRT-PCR棉花材料的不同所致。
陸地棉基因組中含有72個擴展蛋白基因,包括EXPA、EXPB、EXLA和EXLB 4個亞家族的46、8、6和12個基因。在DNA水平和氨基酸水平上具有進化的多樣性與保守性。多數(shù)基因具有表達時空特異性。
[1] SMART L B, VOJDANI F, MAESHIMA M, WILKINS T A. Genes involved in osmoregulation during turgor-driven cell expansion of developing cotton fibers are differentially regulated., 1998, 116(4): 1539-1549.
[2] MCQUEEN-MASON S, DURACHKO D M, COSGROVE D J. Two endogenous proteins that induce cell wall extension in plants., 1992, 4(4): 1425-1433.
[3] COSGROVE D J, LI Z C. Role of expansin in cell enlargement of oat coleoptiles (analysis of developmental gradients and photocontrol)., 1993, 103(4): 1321-1328.
[4] COSGROVE D J. Loosening of plant cell walls by expansions.,2000, 407(6802): 321-326.
[5] COSGROVE D J. Growth of the plant cell wall.,2005, 6(11): 850-861.
[6] SAMPEDRO J, COSGROVE D J. The expansin superfamily., 2005, 6(12): 242.
[7] ZHANG W,YAN HW,CHEN WJ,LIU JY,JIANG CP,JIANG HY,ZHU SW,CHENG BJ. Genome-wide identification and characterization of maize expansin genes expressedin endosperm., 2014, 289(6): 1061-1074.
[8] ZHU Y, WU N, SONG W, YIN G, QIN Y, YAN Y, HU Y. Soybean () expansin gene superfamily origins: segmental and tandem duplication events followed by divergent selection among subfamilies., 2014, 14(1): 1-19.
[9] LU Y E, LIU L F, WANG X, HAN Z H, OUYANG B, ZHANG J H, LI H X. Genome-wide identification and expression analysis of the expansin gene family in tomato., 2016, 291(2): 597-608.
[10] DAL SANTO S, VANNOZZI A, TORNIELLI G B, FASOLI M, VENTURINI L, PEZZOTTI M, ZENONI S. Genome-wide analysis of the expansin gene superfamily reveals grapevine-specific structural and functional characteristics.,2013, 8(4): e62206.
[11] CHOI D, LEE Y, CHO H T, KENDE H. Regulation of expansin gene expression affects growth and development in transgenic rice plants., 2003, 5(6): 1386-1398.
[12] YAN A,WU M J,YAN L M,HU R,ALI I,GAN Y B. AtEXP2 is involved in seed germination and abiotic stress response in., 2014, 9(1): e85208.
[13] CHO H T, COSGROVE D J. Regulation of root hair initiation and expansin gene expression in Arabidopsis., 2002, 14(12): 3237-3253.
[14] LEE D K, AHN J H, SONG S K, CHOI Y D. Expression of an expansin gene is correlated with root elongation in soybean., 2003, 131(3): 985-997.
[15] SHIN J H, JEONG D H, PARK M C, AN G. Characterization and transcriptional expression of the α-expansin gene family in rice., 2005, 20(2): 210-218.
[16] CHO H T, COSGROVE D J. Altered expression of expansin modulates leaf growth and pedicel abscission in., 2000, 97(17): 9783-9788.
[17] KELLER E, COSGROVE D J. Expansins in growing tomato leaves., 1995, 8(6): 795-802.
[18] MADOKA G M, MELLEROWICZ E J, ABE H, SCHRADER J, WINZéLL A, STERKY F, BLOMQVIST K, MCQUEEN-MASON S, TEERI T T, SUNDBERG B. Expansins abundant in secondary xylem belong to subgroup a of the α-expansin gene family., 2004, 135(3): 1552-1564.
[19] 王桂鳳, 施季森. 杉木木材形成過程中差異表達基因的鑒定與功能分析[D]. 南京: 南京林業(yè)大學(xué), 2008.
WANG G F, SHI J S, Identification and functional analysis of differentially expressed genes in differentiating xylem of Chinese fir () by suppression subtractive hybridization[D]. Nanjing: Nanjing Forestry University. (in Chinese)
[20] COSGROVE D J. New genes and new biological roles for expansins., 2000, 3(1): 73-78.
[21] COSGROVE D J, BEDINGER P, DURACHKO D M. Group I allergens of grass pollen as cell wall-loosening agents., 1997, 94(12): 6559-6564.
[22] ROSE J K, BENNETT A B. Cooperative disassembly of the cellulose-xyoglucan network of plant cell wall: Parallels between cell expansion and fruit ripening., 1999, 4(5): 176-183.
[23] FIGUEROA C R, PIMENTEL P, DOTTO M C, CIVELLO P M, MARTíNEZ G A, HERRERA R, MOYA-LEóN M A. Expression of five expansin genes during softening offruit: Effect of auxin treatment., 2009, 53(1): 51-57.
[24] JIANG F L, LOPEZ A, JEON S, DE FREITAS, SERGIO TONETTO, YU Q H, WU Z, JOHN M. LABAVITCH J M, TIAN S K, POWELL, MITCHAM E. Disassembly of the fruit cell wall by the ripening- associated polygalacturonase and expansin influences tomato cracking., 2019, 6(17).
[25] WU Y J, THORNE E T, SHARP R E, COSGROVE D J. Modification of expansin transcript levels in the maize primary root at low water potentials., 2001, 126(4): 1471-1479.
[26] YANG L, ZHENG B, MAO C, QI X, LIU F, WU P. Analysis of transcripts that are differentially expressed in three sectors of the rice root system under water deficit., 2004, 272(4): 433-442.
[27] VESELOV D S, SABIRZHANOVA I B, SABIRZHANOV B E, CHEMERIS A V. Changes in expansin gene expression, IAA content, and extension growth of leaf cells in maize plants subjected to salinity., 2008, 55(1): 101-106.
[28] PITANN B, Z?RB C, MüHLING K H. Comparative proteome analysis of maize (L.) expansins under salinity., 2009, 172(1): 75-77.
[29] XU J C, TIAN J, BELANGER F C, HUANG B. Identification and characterization of an expansin geneassociated with heat tolerance in C3 Agrostis grass species., 2007, 58(13): 3789-3796.
[30] DING X H, CAO Y L, HUANG L L, ZHAO J, XU C G, LI X H, WANG S P. Activation of the indole-3-acetic acid-amido synthetase GH3-8 suppresses expansin expression and promotes salicylate- and jasmonate-independentbasal immunity in rice., 2008, 20(1): 228-240.
[31] HAIGLER C H, BETANCUR L, STIFF M R, TUTTLE J R. Cotton fiber: a powerful single-cell model for cell wall and cellulose research., 2012, 3(104): 1-7.
[32] HARMER S, ORFORD S, TIMMIS J. Characterisation of six a-expansin genes in(upland cotton)., 2002, 268(1): 1-9.
[33] 琚銘, 王海棠, 王立科, 李飛飛, 吳慎杰, 朱華玉, 張?zhí)煺? 郭旺珍. 棉纖維發(fā)育相關(guān)基因時空表達與纖維品質(zhì)的關(guān)聯(lián)分析. 作物學(xué)報, 2009, 35(7): 1217-1228.
JU M, WANG H T, WANG L K, LI F F, WU S J, ZHU H Y, ZHANG T Z, GUO W Z. Associated analysis between temporal and spatial expression of fiber development genes and fiber quality., 2009, 35(7): 1217-1228. (in Chinese)
[34] ORFORD S J, TIMMIS J N. Specific expression of an expansin gene during elongation of cotton fibers., 1998, 1398(3): 342-346.
[35] HARMER S E, ORFORD S J, TIMMIS J N. Characterization of six alpha-expansin genes in(upland cotton)., 2002, 268(1): 1-9.
[36] XU B, GOU J Y, LI F G, SHANGGUAN X X, ZHAO B, YANG C Q, WANG L J. A cotton BURP domain protein interacts with alpha- expansin and their co-expression promotes plant growth and fruit production., 2013, 6(3): 945-958.
[37] LI Y, TU L L, PETTOLINO F A, JI S M, HAO J, YUAN D J, DENG F L, WANG Q, LLEWWLLYN D J, ZHANG X L. GbEXPATR, a species-specific expansin, enhances cotton fiber elongation through cell wall restructuring., 2016, 14(3): 951-963.
[38] BAJWA K S, SHAHID A A, RAO A Q, BASHIR A, AFTAB A, HUSNAIN T. Stable transformation and expression offiber expansin gene to improve fiber length and micron aire value in cotton., 2015, 10(3389): 838.
[39] WANG K B, WANG Z W, LI F G, YE W W, WANG J Y, SONG G L, YUE Z, CONG L, SHANG H H, SHILIN ZHU, ZOU C S, LI Q, YUAN Y L, LU C R, WEI H L, GOU C Y, ZHENG Z Q, YIN Y, ZHANG X Y, LIU K, WANG B, SONG C, SHI N,KOHEL R J, PERCY R G, YU J Z, ZHU Y X, WANG J, YU S X. The draft genome of a diploid cotton., 2012, 44(10): 1098-1103.
[40] PATERSON A H, WENDEL J F, GUNDLACH H, GUO H, JENKINS J, JIN D, LLEWELLYN D, SHOWMAKER K C, SHU S, UDALL J, YOO M J, BYERS R, CHEN W, DORON-FAIGENBOIM A, DUKE M V, GONG L, GRIMWOOD J, GROVER C, GRUPP K, HU G, LEE T H, LI J, LIN L, LIU T, MARLER B S, PAGE J T, ROBERTS A W, ROMANEL E, SANDERS W S, SZADKOWSKI E, TAN X, TANG H, XU C, WANG J, WANG Z, ZHANG D, ZHANG L, ASHRAFI H, BEDON F, BOWERS J E, BRUBAKER C L, CHEE P W, DAS S, GINGLE A R, HAIGLER C H, HARKER D, HOFFMANN L V, HOVAV R, JONES D C, LEMKE C, MANSOOR S, RAHMAN M U, RAINVILLE L N, RAMBANI A, REDDY U K, RONG J K, SARANGA Y, SCHEFFLER B E, SCHEFFLER J A, STELLY D M, TRIPLETT B A, VAN DEYNZE A, VASLIN M F, WAGHMARE V N, WALFORD S A, WRIGHT R J, ZAKI E A, ZHANG T, DENNIS E S, MAYER K F, PETERSON D G, ROKHSAR D S, WANG X, SCHMUTZ J. Repeated polyploidization ofgenomes and the evolution of spinnable cotton fibers., 2012, 492(7429): 423-427.
[41] LI F G, FAN G Y, WANG K B, SUN F M, YUAN Y L, SONG G L, LI Q, MA Z Y, LU C R, ZOU C S, CHEN W B, LIANG X M, SHANG H H, LIU W Q, SHI C C, XIAO G H, GOU C Y, YE W W, XU X, ZHANG X Y, WEI H L, LI Z F, ZHANG G Y, WANG J Y, LIU K, KOHEL R J, PERCY R G, YU J Z, ZHU Y X, WANG J, YU S X. Genome sequence of the cultivated cotton., 2014,(6): 567-572.
[42] LI F G, FAN G Y, LU C R, XIAO G H, ZOU C S, KOHEL R J, MA Z, SHANG H H, MA X F, WU J Y, LIANG X M, HUANG G, PERCY R G, LIU K, YANG W H, CHEN W B, DU X M, SHI C C, YUAN Y Y, YE W W, LIU X, ZHANG X Y, LIU W Q, WEI H L, WEI S J, HUANG G D, ZHANG X L, ZHU S J, ZHANG H, SUN F M, WANG X F, LIANG J, WANG J H, HE Q, HUANG L H, WANG J, CUI J J, SONG G L, WANG K B, XU X, YU J Z, ZHU Y X, YU S X. Genome sequence of cultivated upland cotton (TM-1) provides insights into genome evolution., 2015, 33(5): 524-530.
[43] ZHANG T Z,HU Y , JIANG W K,FANG L, GUAN X Y,CHEN J D,ZHANG J B,SASKI C A,SCHEFFLER B E,STELLY D M,HULSE-KEMP A M,WAN Q,LIU B L,LIU C X,WANG S,PAN M Q,WANG Y K, WANG A W,YE W X, CHANG L J,ZHANG W P, SONG Q X, KIRKBRIDE R C, CHEN X Y,DENNIS E,LLEWELLYN D J,PETERSON D G, THAXTON P,JONES D C,WANG Q,XU X Y, ZHANG H,WU H T, ZHOU L,MEI G F,CHEN S Q,TIAN Y, XIANG D, LI X H,DING J,ZUO Q Y,TAO L N, LIU Y C,LI J, LIN Y,HUI Y Y, CAO Z S,CAI C P,ZHU X F, JIANG Z,ZHOU B L,GUO W Z,LI R Q,CHEN Z J. Sequencing of allotetraploid cotton (L. acc. TM-1) provides a resource for fiber improvement., 2015, 33(5): 531-537.
[44] WANG M J, TU L L, YUAN D J, ZHU D, SHEN C, LI J Y, LIU F Y, PEI L L, WANG P C, ZHAO G N, YE Z X, HUANG H, YAN F L, MA Y Z, ZHANG L, LIU M, YOU J Q, YANG Y C, LIU Z P, HUANG F, LI B Q, QIU P, ZHANG Q H, ZHU L F, JIN S X, YANG X Y, MIN L, LI G L, CHEN L L, ZHENG H K, LINDSEY K, LIN Z X, UDALL J A, ZHANG X L. Reference genome sequences of two cultivated allotetraploid cottons,and., 2019, 51(2): 224-229.
[45] HU Y, CHEN J D, FANG L, ZHANG Z Y, MA W, NIU Y C, JU L Z, DENG J Q, ZHAO T, LIAN J M, BARUCH K, FANG D, LIU X, RUAN Y L, RAHMAN M, HAN J L,WANG K, WANG Q, WU H T, MEI G F, ZANG Y H, HAN Z G, XU C Y, SHEN W J, YANG D F, SI Z F, DAI F, ZOU L F, HUANG F, BAI Y L, ZHANG Y G, BRODT A, BEN-HAMO H, ZHU X F, ZHOU B L, GUAN X Y, ZHU S J, CHEN X Y, ZHANG T Z.andgenomes provide insights into the origin and evolution of allotetraploid cotton., 2019, 51: 739-748.
[46] 雷忠萍, 賀道華, 海江波, 邢宏宜, 趙俊興, 程雪妮. 雷蒙德氏棉擴展蛋白基因家族的鑒定和特征分析. 華北農(nóng)學(xué)報, 2016, 31(6): 44-55.
LEI Z P, HE D H, HAI J B, XING H X, ZHAO J X, CHENG X N. Genome-wide identification and characterization of expansin gene family in., 2016, 31(6): 44-55. (in Chinese)
[47] HE D H, LEI Z P, TANG B S, XING H Y, ZHAO J X, JING Y L. Identification and analysis of the TIFY gene family in., 2015, 14(3): 10119-10138.
[48] 郝西, 理向陽, 臘貴曉, 代丹丹, 楊鐵鋼. 黃瓜擴展蛋白基因家族的鑒定與生物信息學(xué)分析. 分子植物育種, 2015, 13(10): 2280-2289.
HAO X, LI X Y, LA G X, DAI D D, YANG T G. Identification and bioinformatic analysis of the expansin gene family in cucumber., 2015, 13(10): 2280-2289. (in Chinese)
[49] 付海輝, 辛培堯, 許玉蘭, 劉巖, 韋援教, 董嬌, 曹有龍, 周軍. 幾種經(jīng)濟植物UFGT基因的生物信息學(xué)分析. 基因組學(xué)與應(yīng)用生物學(xué), 2010, 30(1): 92-102.
FU H H, XIN P R, XU Y L, LIU Y, WEI Y J, DONG J, CAO Y L, ZHOU J. Bioinformatics analysis of UFGT gene from several economic plants., 2010, 30(1): 92-102. (in Chinese)
[50] KRISHNAMURTHY P, HONG J K, KIM J A, JEONG M J, LEE Y H, LEE S I. Genome-wide analysis of the expansin gene superfamily reveals-specific evolutionary dynamics upon whole genome triplication., 2015, 290(2): 521-530.
[51] 李昊陽, 施楊, 丁亞娜, 徐吉臣. 楊樹擴展蛋白基因家族的生物信息學(xué)分析. 北京林業(yè)大學(xué)學(xué)報, 2014, 36(2): 59-67.
LI H Y, SHI Y, DING Y N, XU J C. Bioinformatics analysis of expansin gene family in poplar genome., 2014, 36(2): 59-67. (in Chinese)
[52] ZHANG S Z, XU R R, GAO Z, CHEN C T, JIANG Z S, SHU H R. A genome-wide analysis of the expansin genes in., 2014, 289(2): 225-236.
[53] ZHU Y, WU N N, SONG W L, YIN G J, QIN Y J, YAN Y M, HU Y K. Soybean () expansin gene superfamily origins: segmental and tandem duplication events followed by divergent selection among subfamilies.ogy, 2014, 14(1): 1-19.
[54] CAREY R E, COSGROVE D J. Portrait of the expansin superfamily in: comparisons with angiosperm expansins., 2007, 99(6): 1131-1141.
[55] CHOTHIA C, GOUGH J, VOGEL C, TEICHMANN S A. Evolution of the protein repertoire., 2003, 300(5626): 1701-1703.
[56] RUAN Y L, LLEWELLYN D J, FURBANK R T. The control of single-celled cotton fiber elongation by developmental lyreversible gating of plasmodesmata and coordinated expression of sucrose and K+transporters and expansin., 2001, 13(1): 47-60.
[57] INDRAIS E, CHEEMA H M N, SAMAD A, BASHIR A. Temporal expression analysis and cloning of cotton () fiber genes., 2011, 13(1): 89-94.
Identification and Characterization of the Expansin Gene Family in upland cotton ()
ZHANG QiYan1, LEI ZhongPing2, SONG Yin1, HAI JiangBo1, HE DaoHua1
(1College of Agronomy, Northwest A&F University, Yangling 712100, Shaanxi;2College of Life Sciences, Northwest A&F University, Yangling 712100, Shaanxi)
【】 Expansins are a group of non-enzymatic proteins found in the plant cell wall, with important roles in plant growth, development, biotic and abiotic stress responses. To date, no systematic study on the molecular characterization, phylogeny and expression profiling of the upland cotton Expansin gene family has yet been conducted. In this study, a genome-wide identification, characterization and expression analysis of the Expansin gene family in upland cotton was performed. 【】 The members of the Expansin gene family in the upland cotton genome were identified by using the bioinformatics tools BLAST and HMMER, and were further analysed by using a combination of the bioinformatics softwares, such as ClustalW, MEGA, MCScanX, Prot Param, MEME, SignalP, Euk-mPLoc, Fancy Gene and DnaSP. The spatiotemporal expression patterns of the upland cotton Expansin gene family, and the differential expression of some Expansin homoeologs during the different stages of growth were determined by publicly available RNA-seq data. The expression patterns of some candidate Expansin genes were further validated by qRT-PCR. 【】 In the allotetraploid upland cotton, 72 expainsin-coding genes are identified, which is approximately twice as many as in the two diploid cotton species (and), and these expansin-coding genes are grouped into four subfamilies: 46 α-expansins (EXPAs), 8 β-expansins (EXPBs), 6 Expansin-like As (EXLAs), and 12 Expansin-like Bs (EXLBs). Except the two chromosomes GhA02 and GhD06, Expansin-coding genes are unevenly distributed across the other chromosomes ranging from 2 to 4, while the chromosomes GhA08 and GhD08 harbors 5 genes and 8 genes, respectively. Phylogenetic tree reveals that the members of the same subfamily are clustered together. In most cases, four Expansin members from the four (sub-)genomes of three cotton species (,and) tends to cluster together within a given clade, for example, EXPA subfamily memberswhich are located on collinear blocks are clustered into a clade. The computational prediction tool shows that all the Expansin proteins are predicted to be extracellular. The exon-intron structure analysis reveals that the upland cotton Expansin-coding genes typically consist of 3-5 exons interrupted by multiple introns, share an evolutionarily conserved exon-intron structure (consistent with the diversity of amino acid sequences), and have codon usage bias. RNA-seq data shows that different Expansin-coding genes are expressed in a stage- and tissue-specific manner during the developmental stages. For example, transcripts forandare highly abundant in the fire 10 days post anthesis (DPA) and 20 DPA when compared with other Expansin-coding genes.is highly expressed in few tissues, including cotyledons, new leaves, old leaves and bracts. Homoeologous genes exhibits different expression profiles, indicating the functional divergence and complementation. The qRT-PCR results are consistent with the RNA-seq data with the same trends for the expression of each Expansin-coding gene. For instance,andare highly expressed during the fiber elongation stage.andare highly expressed in the ovule at 3 DPA.【】The upland cotton genome contains 72 Expansin-coding genes which encode protein exhibiting the same structural diversity and evolutionary conservation as the coding DNA sequences of expansins, and which display diverse and dynamic expression patterns, implying functional conservation and divergence among the members of cotton Expansin genes.
; Expansin; gene family; bioinformatics; gene expression
2019-04-29;
2019-06-18
國家重點研發(fā)計劃(2018YFD0100300)、現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)體系建設(shè)專項資金(CARS-15-44)、全省種質(zhì)資源保護利用(20171010000004)
張奇艷,E-mail:qiyanzhang318@163.com。雷忠萍,E-mail:zhpinglei@nwafu.edu.cn。張奇艷和雷忠萍為同等貢獻作者。通信作者賀道華,Tel:029-87081285;E-mail:daohuahe@nwafu.edu.cn
10.3864/j.issn.0578-1752.2019.21.001
(責(zé)任編輯 李莉)