鄭斌 文定青 武紅霞 鄒明宏 劉恒
摘? 要? bHLH家族作為植物中較大的轉錄因子家族之一,在真核生物生長發(fā)育調控中具有重要作用。本研究基于芒果果實轉錄組數據,利用生物信息學方法鑒定出87個bHLH家族蛋白,其中酸性蛋白所占比例較大,大部分為不穩(wěn)定蛋白,且均為不含信號肽的親水性蛋白,除CL10714.Contig1為膜結合轉錄因子外,其余均不含跨膜結構。芒果bHLH蛋白結構域有多個氨基酸位點保守性較高,87個芒果bHLH蛋白中73個(83.91%)具有E-box結合功能。GO分析發(fā)現芒果bHLH蛋白共注釋到生物學過程、細胞組分和分子功能3大類功能的17個亞類。進化樹分析發(fā)現芒果bHLH蛋白與擬南芥有較高的保守性,并基于進化樹對部分bHLH蛋白的功能進行了預測。本研究結果將為下一步芒果bHLH蛋白的功能研究奠定基礎。
關鍵詞? 芒果;bHLH家族;轉錄因子;生物信息學
中圖分類號? S667.7? ? ?文獻標識碼? A
堿性螺旋-環(huán)-螺旋(basic Helix-Loop-Helix, bHLH)轉錄因子為真核生物蛋白中的一個大家族[1],在生物的生長發(fā)育調控中起著極為重要的作用。bHLH轉錄因子于1989年首次在動物中發(fā)現,因含有bHLH結構域而得名[2]。bHLH結構域由大約60個氨基酸組成,分為堿性氨基酸區(qū)域(basic)和α-螺旋-環(huán)-α-螺旋區(qū)(HLH),堿性氨基酸區(qū)位于bHLH結構域的N端,長度約為15個氨基酸,主要負責與DNA順式元件結合,HLH區(qū)位于該結構域的C-端,由大約40個氨基酸組成,具有形成二聚體的特性[2-4]。
植物中bHLH轉錄因子是僅次于MYB的第二大轉錄因子家族[5],其參與調控抗逆、器官發(fā)育、激素響應及代謝物合成等多個生物學進程[6]。與對照相比,擬南芥中過表達bHLH122基因的株系對干旱、NaCl和滲透脅迫的抗性增強[7];Jiang等[8]發(fā)現bHLH轉錄因子參與了黃瓜果實長度的調控;在擬南芥中,bHLH基因BEE1、BEE2和BEE3參與對油菜素內酯的響應,且這3個基因在油菜素內酯的信號傳導中功能冗余[9];MdbHLH33參與調控蘋果花色素苷的生物合成[10]。
基于高通量測序及生物信息學分析技術,人們已對一些植物的bHLH基因家族進行了挖掘、比較分析和功能預測,并對部分bHLH基因進行了功能分析?;诨蚪M信息,Geng等[11]在甜橙中發(fā)現56個bHLH轉錄因子,其中CsbHLH18通過調控抗氧化基因調節(jié)植株耐寒性及活性氧平衡。芒果素有“熱帶果王”之美譽,含有豐富的糖類、蛋白質、維生素、類胡蘿卜素和鈣質等營養(yǎng)成分,在我國主要分布在海南、廣西、云南、四川、廣東和福建等地,已成為我國熱區(qū)農業(yè)的支柱產業(yè)[12],但目前關于芒果bHLH轉錄因子的研究還鮮有報道。為此,本研究基于芒果果實轉錄組測序結果,利用生物信息學手段對bHLH家族基因進行鑒定和分析,為進一步探究芒果bHLH轉錄因子的功能奠定基礎。
1? 材料與方法
1.1? 材料
芒果蛋白序列來源于構建的轉錄組數據庫(GenBank accession SRP035450)。擬南芥bHLH家族氨基酸序列下載于擬南芥信息資源(TAIR)數據庫(http://www.arabidopsis.org/)。
1.2? 方法
1.2.1? 芒果bHLH家族蛋白的鑒定? 從Pfam 31.0[13]數據庫(http://pfam.xfam.org/)下載HLH結構域種子文件PF00010和PF14215,利用HMMER 3.1b2[14]軟件分別構建Profile HMM(數值表格型隱馬可夫模型),基于Profile HMM分別檢索芒果轉錄組蛋白數據庫并對檢索結果進行整合去冗余,得到候選蛋白。將候選蛋白用SMART[15](http://smart.embl-heidelberg.de/)分析HLH結構域,同時用NCBI blast(https://blast. ncbi. nlm.nih.gov/Blast.cgi)和植物轉錄因子數據庫[16](PlantTFDB)(http://planttfdb.cbi.pku.edu.cn/)進行進一步分析鑒定,篩選出具有全長氨基酸序列的芒果bHLH轉錄因子。
1.2.2? 芒果bHLH家族蛋白生物信息學分析? 基于篩選鑒定的芒果bHLH家族蛋白,利用在線工具ProtParam(http://web.expasy.org/protparam/)對其進行理化性質分析,并用在線軟件SOPMA[17](https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_ sopma.html)分析其二級結構,信號肽的預測應用SignalP 4.1 Server[18](http://www. cbs.dtu.dk/services/SignalP/)軟件進行分析,最后采用TMHMM Server v. 2.0(http://www.cbs. dtu.dk/services/TMHMM/)在線軟件完成跨膜結構分析。
1.2.3? 芒果bHLH家族蛋白結構域分析? 使用BioEdit軟件對芒果bHLH家族蛋白結構域進行比對,將比對結果用在線軟件WebLogo 3(http://weblogo.threeplusone.com/cre ate.cgi)分析結構域序列標簽。
1.2.4? 芒果bHLH家族蛋白系統(tǒng)發(fā)育樹構建及基序分析? 利用MEGA 6.0軟件內置的Clustal W程序對芒果bHLH家族蛋白的氨基酸序列進行比對分析,將比對結果采用鄰接法構建系統(tǒng)發(fā)育樹,選用Poisson模型,并進行自舉評估(Bootstrap),重復次數為1000次,缺失值處理方式為配對狀態(tài)刪除(pairwise deletion),其他參數使用默認值[19]。運用MEME 4.11.02程序[20]分析芒果bHLH家族蛋白的基序,設定基序寬度為6~50,基序數量為5,其余參數為默認值。
1.2.5? 芒果bHLH家族蛋白GO分析? 首先使用Blast2GO 4.0軟件[21]對芒果bHLH家族蛋白序列進行GO(gene ontology)注釋,然后用在線軟件WEGO[22](http://wego.genomics.org.cn/cgi-bin/ wego/index.pl)繪制GO功能分類圖。
1.2.6? 芒果和擬南芥bHLH蛋白進化樹構建? 使用MEGA 6.0軟件采用最大似然法將芒果bHLH蛋白和擬南芥bHLH蛋白共同構建進化樹。
2? 結果與分析
2.1? 芒果bHLH家族成員的獲得
基于從Pfam 31.0數據庫下載的種子文件PF00010和PF14215,使用HMMER 3.1b2軟件從芒果轉錄組49 117個蛋白序列中分別篩選出211個和86個候選蛋白序列,逐個進行結構域及同源比對分析,去除重復及非全長氨基酸序列,共獲得87個芒果bHLH家族蛋白序列(表1),其中最小的bHLH蛋白含89個氨基酸,最大的bHLH蛋白含944個氨基酸。
2.2? 芒果bHLH家族蛋白特性分析
對芒果bHLH家族蛋白進一步進行生物信息學分析(表1),理化性質分析發(fā)現:87個芒果bHLH家族蛋白的相對分子量在10.17~102.47 ku之間,其中含61個酸性蛋白(理論等電點<7)和26個堿性蛋白(理論等電點>7);不穩(wěn)定指數(Ⅱ)分析發(fā)現除Unigene21025和CL12 02.Contig3為穩(wěn)定蛋白外(Ⅱ<40),其余均為不穩(wěn)定蛋白(Ⅱ>40);平均疏水指數均小于0,為親水性蛋白。二級結構分析發(fā)現:芒果bHLH家族蛋白中無規(guī)卷曲和α-螺旋所占比例較大,其中50個為無規(guī)卷曲所占比例最大,36個為α-螺旋所占比例最大,CL5018.Contig2二級結構中α-螺旋和無規(guī)卷曲所占比例一致。87個bHLH家族蛋白均不含信號肽??缒そY構分析發(fā)現CL10714.Contig1含跨膜結構,為膜結合轉錄因子,其余bHLH蛋白均不含跨膜結構。
2.3? 芒果bHLH蛋白結構域分析及分類
使用BioEdit對87個芒果bHLH蛋白的結構域進行比對,并用WebLogo 3獲得芒果bHLH蛋白的結構域序列標簽(圖1)。分析發(fā)現,在芒果bHLH結構域的2個α-螺旋區(qū)內,23和54位點均為疏水性氨基酸亮氨酸(L),100%的20、44和51位點,98.85%的16位點以及97.70%的27位點為疏水性氨基酸(A、F、I、L、M、P、V、W或Y),而這些疏水性氨基酸對bHLH的蛋白二級結構的穩(wěn)定性起著關鍵作用[23]。
在bHLH結構域的堿性區(qū)內,有多個關鍵位點用于識別并結合DNA特定堿基序列,其中9位點的谷氨酸(E)用于與DNA雙螺旋結構的大溝結合[23],分析發(fā)現,73個(83.91%)芒果bHLH結構域的9位點為谷氨酸(E),其中72個在9位點為谷氨酸(E)且12位點為精氨酸(R),而且研究發(fā)現具有9位點為E且12位點為R結構的bHLH蛋白具有識別并結合E-box序列(CANNTG)的功能[24],57個(65.52%)bHLH蛋白結構域在5位點為組氨酸(H)或賴氨酸(K)、9位點為谷氨酸(E)且13位點為精氨酸(R),而在植物中該結構被證實用于識別并結合G-box[25]。在14個9位點不是谷氨酸(E)的bHLH結構域中,有3個bHLH結構域的堿性區(qū)內含5個及以上堿性氨基酸(R、K或H),這3個bHLH蛋白可能在非E-box序列處與DNA結合[4]。11個bHLH結構域9位點不是谷氨酸(E)且堿性區(qū)內含5個以下堿性氨基酸(R、K或H),該類bHLH蛋白不具有結合DNA功能[26]。
2.4? 芒果bHLH家族蛋白進化樹及基序分析
通過MEGA 6.0軟件構建芒果bHLH家族蛋白的系統(tǒng)進化樹。由圖2可知,在進化樹中,相同類型的bHLH蛋白聚在一起,且相近分支的bHLH序列長度及結構域位置相近。
3? 討論
植物bHLH蛋白參與抗逆、生長發(fā)育、生物合成及信號傳導等生理生化過程[35]?;谏镄畔W分析技術,目前已從一些植物如擬南芥[36]、水稻[37]、人參[38]、西瓜[39]、茶樹[40]、葡萄[41]、蘋果[42]等分別鑒定出162、167、169、96、120、110、175個bHLH蛋白。
本研究基于芒果果實轉錄組數據,鑒定出87個bHLH家族蛋白,其中酸性蛋白所占比例較大,大部分為不穩(wěn)定蛋白,且均為不含信號肽的親水性蛋白,此現象與‘短柄櫻桃[43]等多種植物的bHLH家族蛋白相似。除CL10714.Contig1為膜結合轉錄因子外,其余bHLH蛋白均不含跨膜結構,推測CL10714.Contig1與芒果對環(huán)境的脅迫響應有關[44]。大部分芒果bHLH家族蛋白二級結構中無規(guī)卷曲所占比例最大,該結果與云南紅皮梨bHLH轉錄因子一致[45]。
芒果bHLH蛋白結構域有多個氨基酸位點保守性較高,且保守位點與西瓜[39]和蓮[46]bHLH蛋白的分析結果相似。87個芒果bHLH蛋白中的73個(83.91%)具有E-box結合功能,57個(65.52%)具有G-box結合功能,該結果與擬南芥(60.54%)和水稻(56.89%)[37]的分析結果相似。
進化樹上相近分枝的芒果bHLH的基序組成相同,序列長度及結構域位置相近,與擬南芥bHLH的分析結果相似[27]。
芒果bHLH蛋白共注釋到GO分類中生物學過程、細胞組分和分子功能3大類功能的17個亞類,其中56.32% bHLH蛋白注釋到結合功能。
對芒果和擬南芥bHLH蛋白共同構建的進化樹分析發(fā)現,芒果bHLH蛋白與擬南芥有較高的保守性,大部分芒果bHLH蛋白與擬南芥不同亞組的bHLH蛋白聚在一起,推測芒果bHLH蛋白與相近的擬南芥bHLH蛋白具有相似的功能,該分析將為下一步芒果bHLH蛋白的功能分析提供參考?;诖朔椒ǎ珻hen等[47]發(fā)現與擬南芥AtbHLH112同源的水稻OsbHLH068在參與鹽脅迫響應時與AtbHLH112功能一致,參與花期調控時與AtbHLH112功能相反。
bHLH蛋白參與植物的多種生命活動,本研究從芒果轉錄組數據中鑒定87個bHLH家族蛋白,為今后芒果bHLH家族蛋白的研究提供了基礎。由于轉錄組數據的局限性,所鑒定的僅為芒果bHLH家族的部分蛋白序列,因此,芒果bHLH家族蛋白還有待進一步挖掘和研究。本研究僅對部分芒果bHLH蛋白進行了功能預測,其具體功能有待進一步驗證。
參考文獻
Ledent V, Vervoort M. The basic helix-loop-helix protein family: comparative genomics and phylogenetic analysis[J]. Genome Research, 2001, 11(5): 754-770.
Murre C, Mccaw P S, Baltimore D. A new DNA binding and dimerization motif in immunoglobulin enhancer binding, daughterless, MyoD, and myc, proteins[J]. Cell, 1989, 56(5): 777-783.
FerrédAmaré A R, Pognonec P, Roeder R G, et al. Structure and function of the b/HLH/Z domain of USF[J]. The EMBO Journal, 1994, 13(1): 180-189.
Toledoortiz G, Huq E, Quail P H. The Arabidopsis basic/helix-loop-helix transcription factor family[J]. Plant Cell, 2003, 15(8): 1749-1770.
楊鵬程, 周? 波, 李玉花. 植物花青素合成相關的bHLH轉錄因子[J]. 植物生理學報, 2012, 48(8): 747-758.
Kazan K, Manners J M. MYC2: The master in action[J]. Molecular Plant, 2013, 6(3): 686-703.
Liu W, Tai H, Li S, et al. bHLH122 is important for drought and osmotic stress resistance in Arabidopsis, and in the repression of ABA catabolism[J]. New Phytologist, 2014, 201(4): 1192-1204.
Jiang L, Yan S, Yang W, et al. Transcriptomic analysis reveals the roles of microtubule-related genes and transcription factors in fruit length regulation in cucumber (Cucumis sativus L.)[J]. Scientific Reports, 2015, 5: 8031.
Friedrichsen D M, Nemhauser J, Muramitsu T, et al. Three redundant brassinosteroid early response genes encode putative bHLH transcription factors required for normal growth[J]. Genetics, 2002, 162(3): 1445-1456.
Xu H, Wang N, Liu J, et al. The molecular mechanism underlying anthocyanin metabolism in apple using the MdMYB16 and MdbHLH33 genes[J]. Plant Molecular Biology, 2017, 94(1-2): 149-165.
Geng J, Liu J. The transcription factor CsbHLH18 of sweet orange (Citrus sinensis) functions in modulation of cold tolerance and reactive oxygen species homeostasis by regulating the antioxidant gene[J]. Journal of Experimental Botany, 2018, 69(10): 2677-2692.
武紅霞, 許文天, 羅? 純, 等. 芒果果實轉錄組數據組裝及基因功能注釋[J]. 熱帶作物學報, 2016, 37(11): 2191-2198.
Finn R D, Coggill P, Eberhardt R Y, et al. The Pfam protein families database: towards a more sustainable future[J]. Nucleic Acids Research, 2016, 44(Database issue): D279-D285.
Finn R D, Clements J, Eddy S R. HMMER web server: interactive sequence similarity searching[J]. Nucleic Acids Research, 2011, 39(Web Server issue): D29-D37.
Letunic I, Doerks T, Bork P. SMART 7: recent updates to the protein domain annotation resource[J]. Nucleic Acids Research, 2012, 40(Database issue): D302-D305.
Jin J, Tian F, Yang D, et al. PlantTFDB 4.0: toward a central hub for transcription factors and regulatory interactions in plants[J]. Nucleic Acids Research, 2017, 45(Database issue): D1040-D1045.
Geourjon C, Deléage G. SOPMA: significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments[J]. Computer Applic ations in the Biosciences Cabios, 1995, 11(6): 681- 684.
Petersen T N, Brunak S, Von H G, et al. SignalP 4.0: discriminating signal peptides from transmembrane regions[J]. Nature Methods, 2010, 8(10): 785-786.
Hall B G. Building phylogenetic trees from molecular data with MEGA[J]. Molecular Biology and Evolution, 2013, 30(5): 1229-1235.
Bailey T L, Elkan C. Fitting a mixture model by expectation maximization to discover motifs in biopolymers[C]// International Conference on Intelligent Systems for Molecular Biology, 1994: 28-36.
Conesa A, G?tz S, Garcíagómez J M, et al. Blast2GO: a universal tool for annotation, visualization and analysis in functional genomics research[J]. Bioinformatics, 2005, 21(18): 3674-3676.
Ye J, Fang L, Zheng H, et al. WEGO: a web tool for plotting GO annotations[J]. Nucleic Acids Research, 2006, 34(Web Server issue): W293-W297.
Atchley W R, Zhao J. Molecular architecture of the DNA-binding region and its relationship to classification of basic Helix–Loop–Helix proteins[J]. Molecular Biology & Evolution, 2007, 24(1): 192-202.
Ellenberger T, Fass D, Arnaud M, et al. Crystal structure of transcription factor E47: E-box recognition by a basic region helix-loop-helix dimer[J]. Genes & Development, 1994, 8(8): 970-980.
Hudson K A, Hudson M E. A classification of basic Helix-Loop-Helix transcription factors of Soybean[J]. International Journal of Genomics, 2015, 2015(3): 603182.
Atchley W R, Fitch W M. A natural classification of the basic helix-loop-helix class of transcription factors[J]. Proceedings of the National Academy of Sciences of the United States of America, 1997, 94(10): 5172-5176.
Heim M A, Jakoby M, Werber M, et al. The basic helix-loop-helix transcription factor family in plants: a genome-wide study of protein structure and functional diversity[J]. Molecular Biology & Evolution, 2003, 20(5): 735-747.
Wang H, Yang L, Pan J, et al. The bHLH transcription factors MYC2, MYC3, and MYC4 are required for jasmonate-mediated inhibition of flowering in Arabidopsis[J]. Molecular Plant, 2017, 10(11): 1461-1464.
Selote D, Samira R, Matthiadis A, et al. Iron-binding E3 ligase mediates iron response in plants by targeting basic helix-loop-helix transcription factors[J]. Plant Physiology, 2015, 167(1): 273-286.
Li X, Zhang H, Ai Q, et al. Two bHLH transcription factors, bHLH34 and bHLH104, regulate iron homeostasis in Arabidopsis thaliana[J]. Plant Physiology, 2016, 170(4): 2478-2493.
Heisler M G, Atkinson A, Bylstra Y H, et al. SPATULA, a gene that controls development of carpel margin tissues in Arabidopsis, encodes a bHLH protein[J]. Development, 2001, 128(7): 1089-1098.
Rajani S, Sundaresan V. The Arabidopsis myc/bHLH gene ALCATRAZ enables cell separation in fruit dehiscence[J]. Current Biology, 2001, 11(24): 1914-1922.
Liu Y, Ji X, Nie X, et al. Arabidopsis AtbHLH112 regulates the expression of genes involved in abiotic stress tolerance by binding to their E-box and GCG-box motifs[J]. New Phytologist, 2015, 207(3): 692-709.
Li Y, Wang H, Li X, et al. Two DELLA-interacting proteins bHLH48 and bHLH60 regulate flowering under long-day conditions in Arabidopsis thaliana[J]. Journal of Experimen tal Botany, 2017, 68(11): 2757-2767.
劉曉月, 王文生, 傅彬英. 植物bHLH轉錄因子家族的功能研究進展[J]. 生物技術進展, 2011, 1(6): 391-397.
Bailey P C, Weisshaar B. Update on the basic helix- loop-helix transcription factor gene family in Arabidopsis thaliana[J]. Plant Cell, 2003, 15(11): 2497-2502.
Li X, Duan X, Jiang H, et al. Genome-Wide analysis of Basic/Helix-Loop-Helix transcription factor family in Rice and Arabidopsis[J]. Plant Physiology, 2006, 141(4): 1167-1184.
Chu Y, Xiao S, Su H, et al. Genome-wide characterization and analysis of bHLH transcription factors in Panax ginse ng[J]. Acta Pharmaceutica Sinica B, 2018, 8(4): 666-677.
何? 潔, 顧秀容, 魏春華, 等. 西瓜bHLH轉錄因子家族基因的鑒定及其在非生物脅迫下的表達分析[J]. 園藝學報, 2016, 43(2): 281-294.
Cui X, Wang Y, Liu Z, et al. Transcriptome-wide identifica tion and expression profile analysis of the bHLH family genes in Camellia sinensis[J]. Functional & Integrative Ge nomics, 2018, 18(15): 489-503.
尹? 歡, 蔡? 斌, 李成慧, 等. 葡萄bHLH轉錄因子家族全基因組分析[J]. 江西農業(yè)學報, 2013, 25(9): 1-6.
Yang J, Min G, Li H, et al. Identification and expression analy sis of the apple (Malus×domestica) basic helix-loop- helix transcription factor family[J]. Scientific Reports, 2017, 7(1): 28.
應炎標, 朱友銀, 郭衛(wèi)東, 等. 櫻桃bHLH轉錄因子家族基因鑒定及表達分析[J]. 分子植物育種, 2018, 16(14): 4559-4568.
王? 楠, 向鳳寧, 李? 朔. 植物膜結合轉錄因子與脅迫響應[J]. 生命科學, 2016(7): 799-806.
孟富宣, 周? 軍, 辛培堯, 等. 云南紅皮梨bHLH轉錄因子的生物信息學分析[J]. 基因組學與應用生物學, 2013(5): 652-659.
Hudson K A, Hudson M E. The basic helix-loop-helix tran scription factor family in the sacred lotus, Nelumbo Nucifera[J]. Tropical Plant Biology, 2014, 7(2): 65-70.
Chen H, Hsieh-Feng V, Liao P, et al. The function of OsbHLH068, is partially redundant with its homolog, AtbHLH112, in the regulation of the salt stress response but has opposite functions to control flowering in Arabidopsis[J]. Plant Molecular Biology, 2017, 94(4-5): 531-548.