范 凱 潘鑫峰 毛志君 葉方婷 李兆偉 林偉偉 林文雄
叉柱棉基因家族的鑒定與特征分析
范 凱 潘鑫峰 毛志君 葉方婷 李兆偉 林偉偉 林文雄*
福建農(nóng)林大學(xué)農(nóng)學(xué)院作物遺傳育種與綜合利用教育部重點(diǎn)實(shí)驗(yàn)室, 福建福州 350002
植物小分子熱激蛋白(small heat shock protein, sHSP)是植物熱激蛋白中一類(lèi)分子量最小的基因家族, 該家族具有保守的α-晶體結(jié)構(gòu)域, 在響應(yīng)外界環(huán)境脅迫過(guò)程中具有重要的作用。叉柱棉()有關(guān)sHSP家族的鑒定與特征分析還未見(jiàn)相關(guān)報(bào)道。本研究在叉柱棉中共鑒定了39個(gè)GksHSP成員, 并且可以將GksHSP成員進(jìn)一步分為10個(gè)亞家族。在GksHSP家族中發(fā)現(xiàn)了7個(gè)基因復(fù)制事件, 并且所有的基因復(fù)制事件都是片段復(fù)制事件。棉屬特有的全基因組復(fù)制事件主要導(dǎo)致了GksHSP成員的擴(kuò)增, 其擴(kuò)增還與蛋白激酶家族、線(xiàn)粒體載體蛋白家族以及植物生長(zhǎng)素響應(yīng)蛋白家族有關(guān)。此外, GksHSP家族可能與ABA和茉莉酸甲酯調(diào)控的脅迫響應(yīng)相關(guān), 并且GksHSP26成員及其在陸地棉中的同源基因可能在脅迫響應(yīng)中具有關(guān)鍵的作用。本研究的結(jié)果可以進(jìn)一步為今后叉柱棉和棉花的抗逆育種研究提供一定的理論基礎(chǔ)。
叉柱棉; sHSP; 鑒定; 擴(kuò)增; 功能
在自然環(huán)境中, 植物會(huì)頻繁受到諸如干旱、鹽漬、高溫等脅迫的影響, 這些脅迫嚴(yán)重制約著植物的生長(zhǎng)和發(fā)育過(guò)程, 進(jìn)而影響植物的產(chǎn)量和品質(zhì)。目前已經(jīng)發(fā)現(xiàn)有許多基因家族可以響應(yīng)外界的環(huán)境脅迫, 如WRKY家族[1]、PP2C家族[2]、NAC家族[3]等, 其中植物熱激蛋白(heat shock protein, HSP)是一類(lèi)重要的響應(yīng)外界環(huán)境脅迫的基因家族[4]。
植物熱激蛋白依據(jù)分子量的大小可以進(jìn)一步分為HSP100家族、HSP90家族、HSP70家族、HSP60家族和HSP20家族, 其中HSP20家族是分子量最小的一類(lèi)植物熱激蛋白[5]。HSP20成員的分子量集中在15~42 kD之間, 因此又稱(chēng)為植物小分子熱激蛋白(small heat shock protein, sHSP)[5]。sHSP成員在C端具有長(zhǎng)度大約為80~100個(gè)氨基酸組成的保守的α-晶體結(jié)構(gòu)域, 該結(jié)構(gòu)域主要由β-sandwich結(jié)構(gòu)組成, 其N(xiāo)端具有相對(duì)多樣化的結(jié)構(gòu)[6]。sHSP家族不僅存在于酵母、動(dòng)物等中[7-8], 而且在擬南芥[9]、水稻[10]、番茄[11]、馬鈴薯[12]、棉花[13]、銀杏[14]、簸箕柳[15]等植物中也識(shí)別出許多成員。在植物中, sHSP家族主要以分子伴侶形式保護(hù)其他蛋白質(zhì)免受多種脅迫的傷害, 已有大量的研究表明sHSP成員可以響應(yīng)多種外界脅迫[6]。過(guò)表達(dá)水稻的sHSP成員可以提高水稻植株的抗鹽和抗旱能力[16]。過(guò)表達(dá)苜蓿的sHSP成員可以提高擬南芥植株的抗熱、抗旱以及抗氧化脅迫的能力[17]。過(guò)表達(dá)擬南芥的sHSP成員可以提高擬南芥植株的抗鹽和抗旱能力[18]。
叉柱棉()主要分布在莫桑比克、肯尼亞、坦桑尼亞以及南非等地區(qū), 其可以產(chǎn)生棕色的纖維, 種子呈橢圓狀且無(wú)短絨毛。叉柱棉屬于錦葵科棉族叉柱棉屬, 是常見(jiàn)的重要經(jīng)濟(jì)作物棉花的近緣物種, 是研究棉花進(jìn)化趨勢(shì)的關(guān)鍵物種。叉柱棉常年生長(zhǎng)在高溫地區(qū), 對(duì)其高溫相關(guān)基因的研究有助于揭示其耐高溫調(diào)控機(jī)制并對(duì)棉花的耐高溫育種具有重要的意義。叉柱棉全基因組測(cè)序的完成為研究叉柱棉乃至棉花的耐高溫機(jī)制提供了便利的條件[19]。目前有關(guān)叉柱棉的研究主要集中在揭示其染色體數(shù)目(=12)比棉花染色體數(shù)目(=13)少一條的起因上[19-21], 而叉柱棉基因家族的研究還未見(jiàn)相關(guān)報(bào)道, 其相關(guān)的逆境脅迫研究還處于空白狀態(tài)。本研究主要對(duì)叉柱棉sHSP家族的鑒定、結(jié)構(gòu)特征、系統(tǒng)發(fā)育關(guān)系、保守結(jié)構(gòu)域、基因結(jié)構(gòu)、染色體定位、基因復(fù)制事件、啟動(dòng)子中的順式調(diào)控元件分布等方面進(jìn)行綜合分析, 旨在全面解析叉柱棉sHSP家族的進(jìn)化歷史, 為今后叉柱棉和棉花的抗逆育種研究提供一定的理論基礎(chǔ)。
從Cottongen (https://www.cottongen.org/)中下載叉柱棉的全基因組數(shù)據(jù), 從TAIR (https://www. arabidopsis.org/)中提取擬南芥的sHSP成員, 從CottonFGD (https://cottonfgd.org/)中獲得陸地棉的全基因組數(shù)據(jù)以及表達(dá)譜數(shù)據(jù)。
從pfam數(shù)據(jù)庫(kù)中下載(http://pfam.xfam.org/) sHSP保守區(qū)域的隱馬爾可夫模型(PF00011), 并且使用HMMER 3.0程序獲得候選的叉柱棉sHSP成員(GksHSP)。候選的GksHSP成員進(jìn)一步利用NCBI中的CDD程序(https://www.ncbi.nlm.nih.gov/cdd)確保每一個(gè)GksHSP成員均包含保守的PF00011結(jié)構(gòu)域。
通過(guò)MEME程序(http://meme-suite.org/tools/meme)對(duì)叉柱棉sHSP家族的保守基序進(jìn)行分析, 使用的參數(shù)與之前的研究相一致[22]。識(shí)別出的保守基序利用NCBI中的CDD程序(https://www.ncbi.nlm.nih.gov/cdd)進(jìn)行注釋。使用TBtools軟件對(duì)GksHSP成員的染色體定位以及基因結(jié)構(gòu)的結(jié)果進(jìn)行可視化展示[23]。分別使用ProtParam網(wǎng)站(http://web.expasy.org/protparam/)和SOPMA網(wǎng)站(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)計(jì)算GksHSP蛋白質(zhì)的一級(jí)結(jié)構(gòu)以及二級(jí)結(jié)構(gòu)。
所有的sHSP成員通過(guò)MAFFT軟件進(jìn)行序列聯(lián)配分析。本研究使用最大似然法利用IQ-tree軟件構(gòu)建系統(tǒng)發(fā)育進(jìn)化樹(shù), 其中最合適的模型使用ModelFinder程序進(jìn)行評(píng)估, bootstrap值設(shè)定為1000。進(jìn)化樹(shù)使用MEGA軟件進(jìn)行可視化展示。
GksHSP成員的基因復(fù)制事件主要通過(guò)MCScan (Python version)軟件進(jìn)行識(shí)別, 每個(gè)復(fù)制框中至少包括5個(gè)基因復(fù)制事件, 其余均為默認(rèn)參數(shù), 并且用Circos軟件對(duì)基因復(fù)制關(guān)系進(jìn)行可視化展示。此外, 通過(guò)MCScan (Python version)軟件對(duì)與GksHSP成員復(fù)制事件相關(guān)的微共線(xiàn)關(guān)系進(jìn)行可視化分析, 利用NCBI中CDD程序(https://www.ncbi.nlm.nih. gov/cdd)對(duì)微共線(xiàn)關(guān)系內(nèi)的基因進(jìn)行注釋。另外, 使用TBtools軟件[23]計(jì)算非同義替換率(Ka)、同義替換率(Ks)以及它們的比例(Ka/Ks)。
從CottonGen網(wǎng)站中提取GksHSP成員啟動(dòng)子區(qū)域2000 bp的序列, 通過(guò)PlantCARE數(shù)據(jù)庫(kù)(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)對(duì)其順式調(diào)控元件進(jìn)行識(shí)別。通過(guò)TBtools軟件對(duì)GksHSP成員啟動(dòng)子區(qū)的順式調(diào)控元件的分布圖進(jìn)行可視化分析[23]。
本研究通過(guò)HMMER 3.0程序在叉柱棉基因組中共鑒定出39個(gè)叉柱棉sHSP成員(GksHSP), 并且每一個(gè)GksHSP成員均包含sHSP家族保守的PF00011結(jié)構(gòu)域(表1)。依據(jù)其在染色體上的位置, 將鑒定出的GksHSP成員命名為~。
GksHSP成員編碼氨基酸的長(zhǎng)度在93~327 aa之間, 其分子量介于10.5039~36.8318 kD之間。編碼長(zhǎng)度最短(93 aa)和最小分子量(10.5039 kD)的氨基酸, 而編碼長(zhǎng)度最長(zhǎng)(327 aa)和最大分子量(36.83181 kD)的氨基酸。GksHSP成員理論pI為4.37~9.22, 最低的pI為4.37 (GksHSP11), GksHSP22有最高的pI (9.22)。所有的GksHSP成員均具有典型的4種蛋白質(zhì)二級(jí)結(jié)構(gòu)(α-螺旋、延伸鏈、β-折疊和無(wú)規(guī)則卷曲)。在蛋白質(zhì)二級(jí)結(jié)構(gòu)中, 除了GksHSP31和GksHSP18包含最高比例的α-螺旋結(jié)構(gòu)外, 其余GksHSP成員包含最高比例的無(wú)規(guī)則卷曲結(jié)構(gòu), 而所有的GksHSP成員均包含最低比例的β-折疊結(jié)構(gòu)。
本研究利用IQ-tree軟件對(duì)擬南芥和叉柱棉中sHSP成員進(jìn)行系統(tǒng)發(fā)育分析(圖1)。使用ModelFinder模式計(jì)算發(fā)現(xiàn), JTT+I+G4模型為構(gòu)建該系統(tǒng)發(fā)育關(guān)系中最合適的氨基酸替換模型。按照之前對(duì)sHSP亞家族的分類(lèi)標(biāo)準(zhǔn)[6], 本研究可以將GksHSP成員分為10個(gè)亞家族, 并且每個(gè)亞家族包含不同數(shù)目的GksHSP成員。CI亞家族有18個(gè)GksHSP成員, CII亞家族有5個(gè)GksHSP成員, CP亞家族有3個(gè)GksHSP成員, CIV亞家族、CV亞家族、ER亞家族、MTI/CP亞家族和PX亞家族分別有2個(gè)GksHSP成員, CIII亞家族和MTII亞家族分別有1個(gè)GksHSP成員, 另外還有1個(gè)GksHSP成員不屬于任何亞家族。
在GksHSP家族中, 通過(guò)MEME程序識(shí)別出20個(gè)潛在的保守基序(圖2)。利用CDD程序?qū)@20個(gè)保守基序進(jìn)行注釋發(fā)現(xiàn), 只有3個(gè)基序(motif 1、motif 2和motif 3)注釋為sHSP保守結(jié)構(gòu)域, 其他的基序暫時(shí)沒(méi)有發(fā)現(xiàn)任何注釋信息(表2)?;谶@20個(gè)保守基序的分布, 可以進(jìn)一步將GksHSP家族分成類(lèi)似于系統(tǒng)發(fā)育研究中10個(gè)亞家族。motif 1、motif 2和motif 3存在于大部分的GksHSP成員中, 而其他的基序存在于特定的GksHSP亞家族。例如motif 9和motif 12只存在來(lái)自CII亞家族的GksHSP成員, motif 10和motif 18只存在來(lái)自CIV亞家族的GksHSP成員, motif 11和motif 19只存在來(lái)自CV亞家族的GksHSP成員。
本研究對(duì)GksHSP成員的基因結(jié)構(gòu)進(jìn)行分析, 根據(jù)外顯子和內(nèi)含子的數(shù)量, 可以將GksHSP成員的基因結(jié)構(gòu)分為4種不同的類(lèi)型(圖2)。第1種類(lèi)型包括24個(gè)GksHSP成員, 它們均只含有1個(gè)外顯子, 沒(méi)有內(nèi)含子。第2種類(lèi)型包括2個(gè)外顯子和1個(gè)內(nèi)含子, 有12個(gè)GksHSP成員屬于這種類(lèi)型。除此以外,包括3個(gè)外顯子和2個(gè)內(nèi)含子,和包括4個(gè)外顯子和3個(gè)內(nèi)含子。不同亞家族的基因結(jié)構(gòu)具有一定的保守性, 如CII亞家族和ER亞家族的GksHSP成員只含有第1種類(lèi)型的基因結(jié)構(gòu), CIV亞家族和MTII亞家族的GksHSP成員只含有第2種類(lèi)型的基因結(jié)構(gòu)。
表2 通過(guò)MEME程序識(shí)別有關(guān)GksHSP成員的基序信息
表3 叉柱棉中復(fù)制的sHSP成員的Ka和Ks分析
本研究鑒定的39個(gè)GksHSP成員定位在叉柱棉的11條染色體上, 但在叉柱棉的KI_01染色體上不存在任何GksHSP成員(圖3)。39個(gè)GksHSP成員并非平均分布在這11條染色體上。其中KI_05染色上包含最多的GksHSP成員(11個(gè)), 其次是KI_07染色體(6個(gè))以及KI_12染色體(4個(gè))。KI_06、KI_09和KI_10染色體上各包含3個(gè)GksHSP成員, KI_2_4、KI_03、KI_08和KI_13染色體上各包含2個(gè)GksHSP成員, 而KI_11染色體上僅包括1個(gè)GksHSP成員。另外, 一些GksHSP成員在叉柱棉的染色體上集中存在, 例如KI_05染色體的上半部和下半部以及KI_07染色體的下半部。
在叉柱棉中通過(guò)MCScan軟件共識(shí)別出7個(gè)與sHSP成員有關(guān)的基因復(fù)制事件(表3), 復(fù)制的GksHSP成員主要位于KI_05、KI_06、KI_07、KI_08以及KI_12染色體上(圖4-A)。鑒于相同復(fù)制事件中復(fù)制基因位于不同的染色體上, 所以在叉柱棉中所有的與sHSP成員有關(guān)的復(fù)制事件均為片段復(fù)制事件, 而不是串聯(lián)復(fù)制事件。在GksHSP家族中, 7個(gè)片段復(fù)制事件主要分布在CI亞家族、CII亞家族和CP亞家族中, 其中CII亞家族包含4個(gè)基因復(fù)制事件, CI亞家族包含2個(gè)基因復(fù)制事件, CP亞家族包含1個(gè)基因復(fù)制事件(圖4-B)。本研究對(duì)這些基因復(fù)制事件的Ks值分布進(jìn)行計(jì)算發(fā)現(xiàn), 大部分的基因復(fù)制事件的Ks值集中分布在0.731左右, 僅有1對(duì)復(fù)制基因(/)的Ks值為1.04 (圖4-C)。同時(shí), 本研究對(duì)這些基因復(fù)制事件的Ka/Ks比值進(jìn)行計(jì)算發(fā)現(xiàn), 所有的基因復(fù)制事件的Ka/Ks比值均小于0.25。
在叉柱棉中, 7個(gè)基因復(fù)制事件主要與5個(gè)復(fù)制框(復(fù)制框1~復(fù)制框5)有關(guān), 其中復(fù)制框1和2均包括2個(gè)基因復(fù)制事件, 另外3個(gè)復(fù)制框只包括1個(gè)基因復(fù)制事件(圖5-A~E)。隨后, 對(duì)這些復(fù)制框中的基因進(jìn)行注釋發(fā)現(xiàn), 復(fù)制框中的基因除了包含11個(gè)sHSP成員(PF00011)外, 還主要包含15個(gè)蛋白激酶成員(PF00069)、8個(gè)線(xiàn)粒體載體蛋白(PF00153)以及6個(gè)植物生長(zhǎng)素響應(yīng)蛋白(PF02519) (圖5-F)。其中復(fù)制框1主要包括6個(gè)線(xiàn)粒體載體蛋白、4個(gè)sHSP成員和4個(gè)蛋白激酶成員, 復(fù)制框2主要包括4個(gè)sHSP成員, 復(fù)制框3主要包括8個(gè)蛋白激酶成員和2個(gè)sHSP成員, 復(fù)制框4主要包括4個(gè)蛋白激酶成員、4個(gè)植物生長(zhǎng)素響應(yīng)蛋白和2個(gè)sHSP成員, 復(fù)制框5主要包括2個(gè)蛋白激酶成員、2個(gè)線(xiàn)粒體載體蛋白、2個(gè)sHSP成員和2個(gè)蛋白激酶成員。此外, 對(duì)這5個(gè)復(fù)制框的Ka值、Ks值和Ka/Ks比值進(jìn)行計(jì)算發(fā)現(xiàn), 這5個(gè)復(fù)制框的Ka值和Ka/Ks比值彼此相似, 但對(duì)于Ks值而言, 復(fù)制框1和復(fù)制框2的Ks值顯著低于復(fù)制框4的Ks值, 其他復(fù)制框的Ks值類(lèi)似(圖5-G~I)。
A: 復(fù)制的成員分析, 與GksHSP家族有關(guān)的復(fù)制框使用不同的顏色在染色體上展示。B: 復(fù)制事件在不同亞家族的分布。C: 復(fù)制的同義替換率分布。
A: duplicated relationship ofmembers, the duplicated blocks were shown by the colors. B: the distribution of the duplication events in different subfamilies. C: the distribution of synonymous substation rate about duplicateds.
本研究利用PlantCARE數(shù)據(jù)庫(kù)對(duì)GksHSP成員啟動(dòng)子區(qū)的順式調(diào)控元件進(jìn)行分析發(fā)現(xiàn), 所有的GksHSP成員除了包含真核生物共有的順式調(diào)控元件(如TATA框和CAAT框)外, 還包括一些與脅迫響應(yīng)相關(guān)的順式調(diào)控元件(圖6)。所有的GksHSP成員均包含至少一種與脅迫響應(yīng)相關(guān)的順式調(diào)控元件, 其中包含最多的與脅迫響應(yīng)相關(guān)的順式調(diào)控元件(13個(gè)), 其次為(11個(gè))、(10個(gè))、(10個(gè))和(10個(gè))。在GksHSP家族中, 最多的與脅迫響應(yīng)相關(guān)的順式調(diào)控元件為ABA響應(yīng)元件(64個(gè)), 其次為茉莉酸甲酯響應(yīng)元件(47個(gè))、赤霉素響應(yīng)元件(36個(gè))、低溫響應(yīng)元件(27個(gè))、水楊酸響應(yīng)元件(24個(gè))、MYB結(jié)合位點(diǎn)(22個(gè))和生長(zhǎng)素響應(yīng)元件(21個(gè)), 最少的與脅迫響應(yīng)相關(guān)的順式調(diào)控元件為防御/脅迫響應(yīng)元件(15個(gè))。此外, 來(lái)自相同亞家族的GksHSP成員的啟動(dòng)子區(qū)通常包含類(lèi)似的順式調(diào)控元件。例如大部分CI亞家族的成員的啟動(dòng)子區(qū)包含ABA響應(yīng)元件和茉莉酸甲酯響應(yīng)元件, 大部分CII亞家族的成員的啟動(dòng)子區(qū)包含ABA響應(yīng)元件, CP亞家族的成員的啟動(dòng)子區(qū)均包含低溫響應(yīng)元件。
A~E: 與GksHSP家族有關(guān)的復(fù)制框1 (A)、復(fù)制框2 (B)、復(fù)制框3 (C)、復(fù)制框4 (D)和復(fù)制框5 (E)的微共線(xiàn)分析。F: 與GksHSP家族有關(guān)的5個(gè)復(fù)制框的基因注釋分布。G~I: 與GksHSP家族有關(guān)的5個(gè)復(fù)制框的Ka(G)、Ks(H)和Ka/Ks(I)分析。*表示在< 0.05水平上差異顯著。
A–E: microsyntenic analysis of duplicated block 1 (A), duplicated block 2 (B), duplicated block 3 (C), duplicated block 4 (D), and duplicated block 5 (E). F: the distribution of gene annotation about the five duplicated blocks in the GkHSP family. G–I: Ka (G), Ks (H), and Ka/Ks (I) analysis of the five duplicated blocks in the GkHSP family. * represents significant difference at< 0.05.
本研究利用CottonFGD數(shù)據(jù)庫(kù)對(duì)啟動(dòng)子中包含最多的與脅迫響應(yīng)相關(guān)的順式調(diào)控元件的在陸地棉中的同源基因進(jìn)行識(shí)別發(fā)現(xiàn), 在陸地棉中和是叉柱棉的同源基因(相似度均大于94%) (圖7-A)。隨后在高溫、干旱和鹽脅迫條件下對(duì)和的表達(dá)量進(jìn)行分析發(fā)現(xiàn), 在高溫和鹽脅迫下和的表達(dá)量均顯著上調(diào), 尤其是高溫處理6 h和鹽脅迫處理1 h其表達(dá)量達(dá)到最大值, 但對(duì)干旱脅迫響應(yīng)并不明顯(圖7-B, C)。
GksHSP亞家族用不用的顏色和字母表示。每一個(gè)顏色的方框代表一種順式調(diào)控元件。
The GksHSP subfamilies were denoted by using different colors and letters. Each colored box represents a-regulatory element.
本研究從叉柱棉中識(shí)別出39個(gè)GksHSP成員(表1), 低于許多雙子葉植物中sHSP成員數(shù)量, 如番茄(43個(gè))[11]、馬鈴薯(48個(gè))[12]、棉花(94個(gè))[13]以及小麥(109個(gè))[24]等。叉柱棉中識(shí)別出較少的sHSP成員可能與該物種本身基因組(544 Mb)較小有關(guān)[19]。本研究識(shí)別的每一個(gè)GksHSP成員都具有sHSP家族保守的α-晶體結(jié)構(gòu)域、分子量介于10.5039 kD到36.83181 kD之間、基因結(jié)構(gòu)比較簡(jiǎn)單(大部分外顯子數(shù)量少于2個(gè))等特征(表1和圖2), 這些特征也出現(xiàn)在其他植物的sHSP成員中[5-6]。GksHSP家族通過(guò)系統(tǒng)發(fā)育分析可以進(jìn)一步分為10個(gè)亞家族(圖1), 不同的亞家族含有不同數(shù)量的GksHSP成員, 其中CI亞家族和CII亞家族含有最多的GksHSP成員, CIII亞家族和MTII亞家族含有最少的GksHSP成員。在sHSP家族中, 相似的亞家族分布也出現(xiàn)在擬南芥[9]、水稻[10]、番茄[11]等植物中。在GksHSP家族中, 其保守基序、基因結(jié)構(gòu)和啟動(dòng)子區(qū)的順式調(diào)控元件等的分布也與系統(tǒng)發(fā)育分析中的分布相一致(圖2和圖6)。另外, GksHSP成員在KI_05染色體的上半部和下半部以及KI_07染色體的下半部中集中存在, 表明這些染色體區(qū)段可能是與GksHSP家族有關(guān)的熱點(diǎn)區(qū)域(圖3), 相似的現(xiàn)象也出現(xiàn)在玉米NAC家族[25]、棉花LTP家族[26]、木薯GRAS家族[27]等中。此外, 本研究在GksHSP家族中共發(fā)現(xiàn)7個(gè)基因復(fù)制事件, 而這些基因復(fù)制事件并非平均分布在整個(gè)亞家族中(表3和圖4-B), 其中CII亞家族(4個(gè))和CI亞家族(2個(gè))包括大部分的基因復(fù)制事件。CI亞家族和CⅡ亞家族具有較多的基因復(fù)制事件, 這是導(dǎo)致這2個(gè)亞家族含有更多GksHSP成員的一個(gè)原因。類(lèi)似的基因復(fù)制事件導(dǎo)致不同亞家族含有不同成員的現(xiàn)象也出現(xiàn)在叉柱棉的近緣物種棉花的NAC家族[28]、KUP家族[22]、PEL家族[29]等基因家族中。
A:與其在陸地棉中的同源基因和的氨基酸序列分析。B~C: 在高溫、干旱和鹽脅迫下(B)和(C)的表達(dá)分析。
A: alignment analysis ofand its corresponding orthologous genes in(and). B–C: heat map representation of(B) and(C) expression levels under heat, salt, and drought stresses.
在GksHSP家族中, 所有的復(fù)制事件均與片段復(fù)制事件有關(guān), 并沒(méi)有發(fā)生任何串聯(lián)復(fù)制事件(表3、圖3和圖4-A), 這可能與叉柱棉中由轉(zhuǎn)座子活性等導(dǎo)致基因組的片段化、基因丟失等現(xiàn)象有關(guān)[30-32]。本研究發(fā)現(xiàn)的7個(gè)片段復(fù)制事件均位于5個(gè)復(fù)制框中(圖4-A和圖5-A~E), 表明GksHSP家族的擴(kuò)增主要與叉柱棉的全基因組復(fù)制事件有關(guān)[19]。通過(guò)Ks計(jì)算發(fā)現(xiàn), 大部分的片段復(fù)制事件的Ks值集中位于0.731左右(表3和圖4-C), 這個(gè)時(shí)間正好對(duì)應(yīng)于棉屬特有的全基因組復(fù)制事件所發(fā)生的時(shí)間[33]。因此, GksHSP成員的擴(kuò)增主要發(fā)生在棉屬特有的全基因組復(fù)制事件中。與此同時(shí), 本研究對(duì)與GksHSP家族擴(kuò)增有關(guān)的復(fù)制框區(qū)域進(jìn)行詳細(xì)的分析發(fā)現(xiàn), 這5個(gè)復(fù)制框中含有較多的蛋白激酶成員、線(xiàn)粒體載體蛋白以及植物生長(zhǎng)素響應(yīng)蛋白(圖5-F)。目前很多研究已發(fā)現(xiàn)蛋白激酶、線(xiàn)粒體載體蛋白以及植物生長(zhǎng)素響應(yīng)蛋白均與脅迫響應(yīng)相關(guān)[34-36]。例如擬南芥的蛋白激酶CDPK27成員與植株的抗鹽性有關(guān)[37], 南美杉的線(xiàn)粒體載體蛋白PUMP成員可以響應(yīng)植株的冷害脅迫[38], 過(guò)表達(dá)小麥的生長(zhǎng)素響應(yīng)蛋白TaSAUR75可以提高擬南芥植株的干旱和鹽漬抗性[39]。因此, 在叉柱棉中, GksHSP家族的進(jìn)化可能與蛋白激酶家族、線(xiàn)粒體載體蛋白家族以及植物生長(zhǎng)素響應(yīng)蛋白家族有關(guān)。此外, 本研究發(fā)現(xiàn), 復(fù)制框1和復(fù)制框2的Ks值顯著低于復(fù)制框4的Ks值(圖5-G~I), 并且不同的復(fù)制框中所包含的成員種類(lèi)也是不一樣的(圖5-F), 表明在叉柱棉中與GksHSP家族有關(guān)的不同復(fù)制框的進(jìn)化速率顯著不同。
啟動(dòng)子區(qū)的順式調(diào)控元件在生物學(xué)功能及其調(diào)控過(guò)程中具有非常關(guān)鍵的作用[40]。本研究發(fā)現(xiàn), 在叉柱棉中GksHSP成員的啟動(dòng)子區(qū)包含大量的與脅迫響應(yīng)相關(guān)順式調(diào)控元件, 這表明GksHSP成員可能與植物的脅迫響應(yīng)相關(guān)(圖6)。在所有與脅迫響應(yīng)相關(guān)的順式調(diào)控元件中, 最多的順式調(diào)控元件為ABA響應(yīng)元件(64個(gè)), 其次為茉莉酸甲酯響應(yīng)元件(47個(gè)), 表明大部分GksHSP成員可能與ABA和茉莉酸甲酯調(diào)控的脅迫響應(yīng)相關(guān), 目前已經(jīng)在馬鈴薯[12]、小麥[12]、簸箕柳[15]等植物的sHSP成員的啟動(dòng)子區(qū)發(fā)現(xiàn)類(lèi)似的順式調(diào)控元件分布。此外, 在GksHSP家族中, 來(lái)自CⅠ亞家族的包含最多的與脅迫響應(yīng)相關(guān)的順式調(diào)控元件, 并且在陸地棉中識(shí)別了的同源基因和, 發(fā)現(xiàn)在高溫和鹽脅迫下這2個(gè)同源基因的表達(dá)量顯著上調(diào)(圖7), 其在擬南芥中的同源基因[41]和在水稻中的同源基因[42]也已經(jīng)報(bào)道了可以響應(yīng)多種脅迫。
在叉柱棉中共鑒定了39個(gè)GksHSP成員, 并且可以將GksHSP成員根據(jù)系統(tǒng)發(fā)育關(guān)系進(jìn)一步分為10個(gè)亞家族, 每個(gè)亞家族都具有保守的基序、類(lèi)似的基因結(jié)構(gòu)以及相似的啟動(dòng)子區(qū)的順式調(diào)控元件分布。在叉柱棉中, 棉屬特有的全基因組復(fù)制事件主要導(dǎo)致了GksHSP成員的擴(kuò)增, 與此同時(shí)其擴(kuò)增還與蛋白激酶家族、線(xiàn)粒體載體蛋白家族以及植物生長(zhǎng)素響應(yīng)蛋白家族有關(guān)。此外, GksHSP家族可能與ABA和茉莉酸甲酯調(diào)控的脅迫響應(yīng)相關(guān), 尤其是可以作為叉柱棉抗逆育種的一個(gè)重要候選基因。
[1] Eulgem T, Rushton P J, Robatzek S, Somssich I E. The WRKY superfamily of plant transcription factors.,2000, 5: 199–206.
[2] Schweighofer A, Hirt H, Meskiene I. Plant PP2C phosphatases: emerging functions in stress signaling., 2004, 9: 236–243.
[3] Pinheiro G L, Marques C S, Costa M D, Reis P A, Alves M S, Carvalho C M, Fietto L G, Fontes E P. Complete inventory of soybean NAC transcription factors: sequence conservation and expression analysis uncover their distinct roles in stress response., 2009, 444: 10–23.
[4] Jacob P, Hirt H, Bendahmane A. The heat-shock protein/ chaperone network and multiple stress resistance., 2017, 15: 405–414.
[5] 栗振義, 龍瑞才, 張鐵軍, 楊青川, 康俊梅. 植物熱激蛋白研究進(jìn)展. 生物技術(shù)通報(bào), 2016, 32(2): 7–13
Li Z Y, Long R C, Zhang T J, Yang Q C, Kang J M. Research progress on plant heat shock protein., 2016, 32(2): 7–13 (in Chinese with English abstract).
[6] Waters E R, Vierling E. Plant small heat shock proteins-evolutionary and functional diversity., 2020, 227: 24–37.
[7] Bentley N J, Fitch I T, Tuite M F. The small heat-shock protein Hsp26 ofassembles into a high molecular weight aggregate., 2010, 8: 95–106.
[8] Elicker K S, Hutson L D. Genome-wide analysis and expression profiling of the small heat shock proteins in zebrafish., 2007, 403: 60–69.
[9] Scharf K, Siddique M, Vierling E. The expanding family ofsmall heat stress proteins and a new family of proteins containing α-crystallin domains (Acd proteins)., 2001, 6: 225–237.
[10] Sarkar N K, Kim Y, Grover A. Rice sHsp genes: genomic organization and expression profiling under stress and development., 2009, 10: 393.
[11] 張寧, 姜晶, 史潔瑋. 番茄基因家族的全基因組鑒定、系統(tǒng)進(jìn)化及表達(dá)分析. 沈陽(yáng)農(nóng)業(yè)大學(xué)學(xué)報(bào), 2017, 48(2): 137–144.
Zhang N, Jiang J, Shi J W. Genome-wide identification, phyletic evolution and expression analysis of thegene family in tomato., 2017, 48(2): 137–144 (in Chinese with English abstract).
[12] Zhao P, Wang D, Wang R, Kong N, Zhang C, Yang C, Wu W, Ma H, Chen Q. Genome-wide analysis of the potatogene family: identification, genomic organization and expression profiles in response to heat stress., 2018, 19: 61.
[13] Ma W, Zhao T, Li J, Liu B, Fang L, Hu Y, Zhang T. Identification and characterization of thegene family in, 2016, 6: 1–13.
[14] 何福林, 張斌. 銀杏() GbHsp20基因家族的鑒定及系統(tǒng)進(jìn)化分析. 分子植物育種, 2019, 17: 7368–7376.
He F L, Zhang B. Identification and phylogenetic analysis of GbHsp20 gene family inL., 2019, 17: 7368–7376 (in Chinese with English abstract).
[15] Li J, Zhang J, Jia H, Yue Z, Lu M, Xin X, Hu J. Genome-wide characterization of thegene family in Sreveals its functions under different abiotic stresses., 2018, 19: 3246.
[16] Jung Y J, Nou I S, Kang K K. Overexpression ofgene encoding small heat shock protein enhances tolerance to abiotic stresses in rice., 2014, 2: 370–379.
[17] Li Z Y, Long R C, Zhang T J, Yang Q C, Kang J M. Molecular cloning and characterization of thegene fromL., 2016, 43: 815–826.
[18] Sun W, Bernard C, Cotte B V D, Montagu M V, Verbruggen N., encoding a small heat-shock protein in, can enhance osmotolerance upon overexpression., 2001, 27: 407–415.
[19] Udall J A, Long E, Ramaraj T, Conover J L, Yuan D, Grover C E, Gong L, Arick II M A, Masonbrink R E, Peterson D G, Wendel J F. The genome sequence ofillustrates a descending dysploidy in plants., 2019, 10: 1541.
[20] Elhady S.Isolation and Structural Elucidation of Natural Products fromOliver and(Mast.) Hutch J B. PhD Dissertation of Faculty of Agricultural and Applied Biological Sciences of Ghent University, Ghent, Belgium, 1999.
[21] Wendel J F, Cronn R C. Polyploidy and the evolutionary history of cotton., 2003, 78: 139–186.
[22] Fan K, Mao Z, Zheng J, Chen Y, Li Z, Lin W, Zhang Y, Huang J, Lin W. Molecular evolution and expansion of the KUP family in the allopolyploid cotton speciesand., 2020, 11: 1501.
[23] Chen C, Chen H, Zhang Y, Thomas H R, Frank M H, He Y, Xia R. TBtools: an integrative toolkit developed for interactive analyses of big biological data., 2020, 8: 1194–1202.
[24] Muthusamy S K, Dalal M, Chinnusamy V, Bansal K C. Genome-wide identification and analysis of biotic and abiotic stress regulation of small heat shock protein () family genes in bread wheat., 2017, 211: 100.
[25] Fan K, Wang M, Miao Y, Ni M, Bibi N, Yuan S, Li F, Wang X. Molecular evolution and expansion analysis of the NAC transcription factor in., 2014, 9: e111837.
[26] Li F, Fan K, Ma F, Yue E, Bibi N, Wang M, Shen H, Hasan M M, Wang X. Genomic identification and comparative expansion analysis of thegene family in., 2016, 6: 38948.
[27] Shan Z, Luo X, Wu M, Wei L, Zhu Y. Genome-wide identification and expression of GRAS gene family members in cassava., 2020, 20: 46.
[28] Fan K, Li F, Chen J, Li Z, Lin W, Cai S, Liu J, Lin W. Asymmetric evolution and expansion of the NAC transcription factor in polyploidized cotton., 2018, 9: 47.
[29] Sun H R, Hao P B, Ma Q, Zhang M, Qin Y, Wei H J, Su J J, Wang H T, Gu L J, Wang N H, Liu G Y, Yu S X. Genome-wide identification and expression analyses of the pectate lyase () gene family in cotton (L.)., 2018, 19: 661.
[30] Wang Y, Wang X, Tang H, Tan X, Ficklin S P, Feltus F A, Paterson A H. Modes of gene duplication contribute differently to genetic novelty and redundancy, but show parallels across divergent angiosperms., 2011, 6: e28150.
[31] Soltis D E, Visger C J, Marchant D B, Soltis P S. Polyploidy: pitfalls and paths to a paradigm., 2016, 103: 1146–1166.
[32] Albalat R, Ca?estro C. Evolution by gene loss., 2016, 17: 379.
[33] Wang K, Wang Z, Li F, Ye W, Wang J, Song G, Yue Z, Cong L, Shang H, Zhu S, Zou C S, Li Q, Yuan Y L, Lu C R. The draft genome of a diploid cotton., 2012, 44: 1098–1103.
[34] Ray S, Agarwal P, Arora R, Kapoor S, Akhilesh K T. Expression analysis of calcium-dependent protein kinase gene family during reproductive development and abiotic stress conditions in rice (L. ssp.)., 2007, 278: 493–505.
[35] Haferkamp I, Schmitz-Esser S. The plant mitochondrial carrier family: functional and evolutionary aspects., 2012, 3: 2.
[36] 朱宇斌, 孔瑩瑩, 王君暉. 植物生長(zhǎng)素響應(yīng)基因的研究進(jìn)展. 生命科學(xué), 2014, 26: 407–413.
Zhu Y B, Kong Y Y, Wang J H. Research advances in auxin-responsivegenes., 2014, 26: 407–413 (in Chinese with English abstract).
[37] Zhao R, Sun H, Zhao N, Jing X, Shen X, Chen S. TheCa2+-dependent protein kinase CPK27 is required for plant response to salt-stress., 2015, 563: 203–214.
[38] Valente C, Pasqualim P, Jacomasso T, Maurer J B B, Souza E M D, Martinez G R, Rocha M E M, Carnieri E G S, Cadena S M S C. The involvement of PUMP from mitochondria ofembryogenic cells in response to cold stress., 2012, 197: 84–91.
[39] Guo Y, Jiang Q, Hu Z, Sun X, Zhang H. Function of the auxin-responsive geneunder salt and drought stress., 2018, 2: 181–190.
[40] 郭晉艷, 鄭曉瑜, 鄒翠霞, 李秋莉. 植物非生物脅迫誘導(dǎo)啟動(dòng)子順式元件及轉(zhuǎn)錄因子研究進(jìn)展. 生物技術(shù)通報(bào), 2011, (4): 16–20.
Guo J Y, Zheng X Y, Zou C X, Li Q L. Research progress of-elements of abiotic stress inducible promoters and associated transcription factors., 2011, (4): 16–20 (in Chinese with English abstract).
[41] Sewelam N, Kazan K, Meike H, Maurino V G, Schenk P M. Thegene expression is mediated by diverse signals that link biotic and abiotic stress factors with ROS and can be a useful molecular marker for oxidative stress., 2019, 20: 3201.
[42] Zou J, Liu C, Liu A, Zou D, Chen X. Overexpression ofandenhances drought and salt tole-rance in rice., 2012, 169: 628–635.
Identification and analysis ofgene family in
FAN Kai, PAN Xin-Feng, MAO Zhi-Jun, YE Fang-Ting, LI Zhao-Wei, LIN Wei-Wei, and LIN Wen-Xiong*
Key Laboratory of Ministry of Education for Genetics, Breeding and Multiple Utilization of Crops, College of Agriculture, Fujian Agriculture and Forestry University, Fuzhou 350002, Fuzhou, China
Small heat shock protein (sHSP) has the lowest molecular weight in heat shock protein and sHSP has the highly conserved α-crystallin domain. The sHSP family is very important in response to various stresses, but the identification and analysis of sHSP gene family inhave not been reported. In this study, we identified 39 GksHSPs with 10 subfamilies in. There were seven gene duplication events in GksHSP family and all of duplicated gene pairs were involved in segmental duplication events. The cotton-specific whole genome duplication event primarily resulted in the GksHSP expansion. The GksHSP expansion was also related to the protein kinase, mitochondrial carrier protein, and auxin responsive protein. Besides, GksHSP members might respond to various stresses by ABA/MeJA-mediated pathways, and GksHSP26 and its corresponding orthologous genes inwere very important in stress responses. These results could provide the theoretical basis of the breeding of stress tolerance inand cotton.
; sHSP; identification; expansion; function
10.3724/SP.J.1006.2021.04235
本研究由國(guó)家自然科學(xué)基金項(xiàng)目(31701470), 中國(guó)博士后科學(xué)基金項(xiàng)目(2017M610388, 2018T110637), 福建農(nóng)林大學(xué)科技創(chuàng)新專(zhuān)項(xiàng)基金(CXZX2020007A)和福建農(nóng)林大學(xué)杰出青年科研人才計(jì)劃項(xiàng)目(xjq201917)資助。
This study was supported by the National Natural Science Foundation of China (31701470), the China Postdoctoral Science Foundation (2017M610388, 2018T110637), the Science and Technology Innovation Special Fund of Fujian Agriculture and Forestry University (CXZX2020007A), and the Outstanding Youth Scientific Fund of Fujian Agriculture and Forestry University (xjq201917).
林文雄, E-mail: lwx@fafu.edu.cn
E-mail: fankai@fafu.edu.cn
2020-10-29;
2021-03-19;
2021-03-31.
URL: https://kns.cnki.net/kcms/detail/11.1809.S.20210331.1316.004.html