任瑞芳 張紹鵬 蔣 鵬 張 瑞 張 祚 鄭涵予 史夢華 馬曉龍
羊肚菌轉(zhuǎn)錄因子分類和生物信息學分析
任瑞芳1張紹鵬2蔣 鵬1張 瑞1張 祚1鄭涵予1史夢華1馬曉龍3*
(1. 武漢輕工大學 生命科學與技術學院,湖北 武漢 430023;2. 武漢輕工大學硒科學與工程現(xiàn)代產(chǎn)業(yè)學院,湖北 武漢 430023;3. 武漢市農(nóng)業(yè)科學院蔬菜研究所,湖北 武漢 430345)
首次根據(jù)Genbank中已知的7237條羊肚菌序列,對所有編碼轉(zhuǎn)錄因子的序列進行了功能分類,并重點對羊肚菌中的鋅指蛋白(ZFP)編碼序列進行了生物信息學分析。結果表明,Genbank中所有7237條羊肚菌來源的核苷酸序列,有167條是編碼轉(zhuǎn)錄因子的序列,其中88條序列編碼了鋅指蛋白。這些序列都含有相應的保守基序,編碼蛋白質(zhì)的二級結構以α-螺旋為主,三級結構極為相似,功能上以親水性蛋白為主。
羊肚菌;轉(zhuǎn)錄因子;鋅指蛋白;生物信息學
羊肚菌()又名美味羊肚菌,俗稱羊雀菌、包谷菌,是子囊菌中有名的食用真菌,屬于子囊菌亞門()、盤菌綱()、盤菌目(),馬鞍菌科()、羊肚菌屬()[1]。因其菌蓋表面生有許多小凹坑,外觀極似羊肚而得名。羊肚菌性平,味甘寒,無毒;有益腸胃、助消化、化痰理氣、壯腎補陽、補腦提神、強身健體、預防感冒和增強人體免疫力等功效[2]。羊肚菌在全世界都有自然分布,以在法國、德國、美國、印度及中國分布較為廣泛。在我國,羊肚菌分布北至東北三省,南至廣東、福建、臺灣,東至山東,西至新疆、西藏、寧夏、貴州,共28個省、市、自治區(qū),但每個地區(qū)羊肚菌種類資源豐富度不同且有很大差異,其中以甘肅和四川地區(qū)的種類資源較為豐富[3]。
據(jù)報道,羊肚菌的營養(yǎng)成分很豐富,含有多糖、酶類、氨基酸、吡喃酮抗生素、脂肪酸等。羊肚菌的菌絲體含有豐富的氨基酸及其他營養(yǎng)元素,總氨基酸含量大大高于一般食用菌,必需氨基酸含量占比較高,占氨基酸總量的49%。其中決定鮮味的谷氨酸、賴氨酸、天冬氨酸含量尤為突出,是優(yōu)質(zhì)的蛋白源。羊肚菌含有20種以上無機元素,其中微量元素有Zn、Mn、Cu、Co、Cr、Fe、Ni、B、Sr、V等10種,并含有人體必需的Ca、Mg、P等3種常量元素[1]。
轉(zhuǎn)錄因子(Transcription Factor,TF)是一組獨特的DNA結合蛋白,也稱反式作用因子,其可直接或間接與基因啟動子區(qū)域中順式作用元件特異性結合,對基因轉(zhuǎn)錄進行調(diào)控。其主要功能是激活或抑制基因的轉(zhuǎn)錄效應。轉(zhuǎn)錄因子在基因表達調(diào)控中起著核心作用,能夠協(xié)調(diào)很多生物過程,包括分化、發(fā)育、新陳代謝、凋亡、自噬等。在真菌響應外界氮源、生長發(fā)育、次級代謝和抗逆過程中發(fā)揮了重要作用。根據(jù)不同的DNA結合基序,轉(zhuǎn)錄因子主要分為經(jīng)典的鋅指結構、同源結構域和基本螺旋-環(huán)-螺旋三大類。其中,鋅指蛋白(ZFP)是最大的具有序列特異性的DNA結合蛋白家族[4]。鋅指在結構上是多樣的,并且存在于在各種細胞活動中執(zhí)行多種功能的蛋白質(zhì)中,例如復制和修復,轉(zhuǎn)錄和翻譯,代謝和信號傳導,細胞增殖和凋亡[5]。
羊肚菌目前在Genbank數(shù)據(jù)庫中已知的7237條核酸序列條目中找出所有能編碼具有轉(zhuǎn)錄因子活性的序列。將這些序列下載下來進行結構域分析,并鑒定候選序列的結構域[6]。
利用NCBI提供的在線軟件Conserved Domain Search進行結構域分析,然后以結構域類型為依據(jù)將轉(zhuǎn)錄因子進行分類[7]。
運用MEGA X內(nèi)本身具有的Clustal W對羊肚菌ZFP序列進行多序列比對。將比對結果保存,然后基于多序列比對結果,利用MEGA X軟件中ML(maximum likelihood)方法構建生物進化樹。
運用Meme在線平臺對羊肚菌鋅指結構蛋白中的保守基序(motif)進行在線分析,將最大的motif檢索數(shù)值定為12[8]。
(1)一級結構預測。采用ExPASy提供的在線軟件Protparam對鋅指蛋白進行一級結構特性分析。主要包括氨基酸的種類和含量、理化性質(zhì)及相對分子質(zhì)量等。
(2)二級結構預測。利用SOPMA程序?qū)ρ蚨蔷\指結構轉(zhuǎn)錄因子的蛋白質(zhì)二級結構進行在線預測,預測分析二級結構的組成和含量。
(3)三級結構預測。采用Phyre2.0對三級結構進行建模。也可以采用SWISS-MODEL進行三級結構預測[9]。
在Genbank數(shù)據(jù)庫中,屬于羊肚菌的核酸序列共有7237條,有72條scafford長序列(大于1000 bp)中包含有能夠編碼羊肚菌轉(zhuǎn)錄因子的編碼序列,這72條scafford長序列中,70條序列來自于尖頂羊肚菌(),另外2條來自于梯棱羊肚菌()。在這些scafford序列中,能夠編碼具有轉(zhuǎn)錄因子活性的編碼序列(CDS)共有169條。
將169條蛋白候選序列進行結構域分析,有2條沒有找到結構域,其余167條轉(zhuǎn)錄因子按照結構域可以分為28類:①Zn2Cys6,②GATA,③HLH,④Homeobox,⑤HMG-box,⑥ZIP,⑦Forkhead,⑧HSF,⑨Copperfirst,⑩RFX,TAF,?TFⅡ,?zf,?RING-finger,?MADS,?TEA,?SH2,?WD40,?YL1,?PC4,?CCAAT-binding,?Zn ribbon,?p53,?Tfb,?kila-N,?TBP,?spt,?Elongin_A,?Fungal_trans_2(編輯注:受版面限制,詳表未予刊載)。最大的一組轉(zhuǎn)錄因子是Zn2Cys6占40%,第二大類是基本轉(zhuǎn)錄因子(TFⅡ)占11%(圖1)。廣義上來說,含Zn2Cys6,Zn ribbon,zf,RING-finger,GATA[10]的蛋白均屬于鋅指蛋白,共88條[4,5,11]。
為了評估羊肚菌中的鋅指蛋白之間的進化關系,利用MEGA對羊肚菌88條含鋅指結構的轉(zhuǎn)錄因子編碼序列做進化分析,構建蛋白系統(tǒng)發(fā)育樹(圖2)。將系統(tǒng)發(fā)育樹分為11類,第7類最多。以第1類為例,除RPB15307.1、RPB14569.1、RPB11370.1外,均為含有Zn2Cys6的鋅指蛋白,其中RPB14569.1、RPB11370.1含有GATA且屬于同一小分支。含有Zn2Cys6的鋅指蛋白大多同屬一個分支且分支較短,說明它們的親緣關系較近,如RPB14600.1和RPB07552.1,RPB13300.1和RPB15722.1;而它們又屬于不同的大分支,因此在進化過程中可能發(fā)生了變異,變異的程度也存在差別。而含ZIP的鋅指蛋白RPB15307.1與含Zn2Cys6的鋅指蛋白RPB17815.1同屬一個分支,它們之間的親緣關系較近,同源性高。結果表明,羊肚菌鋅指結構轉(zhuǎn)錄因子在進化上具有不同程度的分化。
圖1 羊肚菌各類型轉(zhuǎn)錄因子的分布
通過MEME在線分析得出,羊肚菌鋅指蛋白具有11個保守基序?;?為RACDRCRRRK IKCDG;基序2為PVERELRRRVFWALYVLD;基序3為LVDLYFQNIHPLFPILHRPTF;基序4為KPPCSRCVKLGLECV;基序5為LGLAVRMAQD LGLHRE;基序6為QQQQQQQQQQQQQQH;基序7為LGRPVLINDEDIDVELP;基序8為VPRGY VEELEARLKALEKLL;基序9為QQLHPHQQQQ QQHQQHQQQQQQAQHQQ;基序11為WLLLHY LFNAGLVLL;基序12為LHLSYYATLILLHRP?;?、基序4比較保守,大部分鋅指包合蛋白N端都有分布?;?,基序5,基序6,基序7也比較保守,大部分蛋白都有分布。這些保守基序是重要的結構單位,可以用來分析進化關系,擁有的相同序列越多,表明親緣關系越近。RPB15301.1,RPB14688.1,RPB08201.1和RPB11254.1只含有一個基序,與其他蛋白的進化關系較遠。剩余的鋅指蛋白所含基序較多,進化關系較近[12](圖3)。
蛋白質(zhì)一級結構是指肽鏈中氨基酸排列順序和連接方式,是氨基酸分子結構的基礎,包含了決定蛋白質(zhì)分子所有結構層次構象的全部信息。分析結果顯示:不同的羊肚菌鋅指蛋白在氨基酸的組成、等電點、蛋白質(zhì)分子量和理化性質(zhì)等方面存在著一定的差異。共含有20種基本氨基酸,以絲氨酸、脯氨酸、甘氨酸和亮氨酸為主。pH在5.5~10之間,蛋白質(zhì)分子量為3.1~11.5 kDa,氨基酸數(shù)目最少為259個,最多為1339個。
圖2 羊肚菌鋅指蛋白序列的系統(tǒng)發(fā)育樹(部分圖)
疏水性是決定蛋白質(zhì)三級結構構象的重要因素之一,許多轉(zhuǎn)錄因子都是利用其疏水性區(qū)域與其他蛋白質(zhì)相互作用。疏水性負值越大表示越親水,正值越大表示越疏水,兩性蛋白的疏水性值在0.5~?0.5之間。羊肚菌鋅指蛋白疏水性值均為負值,在?0.06~? 1.3之間,說明它們主要是以親水性蛋白為主[13]。
圖3 羊肚菌鋅指結構轉(zhuǎn)錄因子保守基序(部分圖)
蛋白質(zhì)二級結構的形成,主要是其多肽鏈的主鏈骨架上所含有的羰基和亞氨基,在主鏈骨架盤曲折疊時可以形成氫鍵,依靠這種氫鍵的維持固定,多肽鏈主鏈上的若干肽段可以形成有規(guī)律的空間排布,與R側鏈構象無關。因此,對于羊肚菌鋅指結合蛋白的二級結構預測很有必要,利用SOPMA程序進行預測和分析,結果表明羊肚菌鋅指蛋白家族二級結構是以α-螺旋、延伸鏈、β-折疊、β-轉(zhuǎn)角、無規(guī)卷曲為構成原件,以α-螺旋、無規(guī)卷曲為主。二級結構聚集在一起就能形成超二級結構,參與三級結構的形成,是蛋白質(zhì)發(fā)揮作用的單位[14]。
蛋白質(zhì)的三級結構是建立在二級結構、超二級結構,乃至結構域的基礎上的,與側鏈的相互作用有關。蛋白質(zhì)的三級結構即一個蛋白質(zhì)的立體結構,或稱三維結構,包括多肽鏈中的一切原子的空間排列方式。三級結構穩(wěn)定的主要作用力是非共價鍵,是疏水相互作用、氫鍵、范德華力和靜電作用來維持的特定空間結構。蛋白質(zhì)只有在折疊成特定的結構之后方能行使特定的生物學功能,因此了解蛋白質(zhì)結構對于認識其功能有著重要意義。
利用Swiss-model對88條羊肚菌鋅指包合蛋白的三級結構進行預測。結果表明,大部分鋅指蛋白三級結構組成相似,但又存在差異。圖4是16個有代表性的羊肚菌鋅指蛋白的的三級結構預測圖。它們都是以α-螺旋為主要構件,但α-螺旋的數(shù)目存在差異。雖然有些鋅指蛋白的α-螺旋數(shù)目相等,但是蛋白質(zhì)的三級結構是由α-螺旋、β-轉(zhuǎn)角、β折疊,延伸鏈和無規(guī)卷曲共同組成的,氨基酸數(shù)目存在差異,肽鏈長度存在差異,導致三級結構必然存在著差異。包含鋅指結構的蛋白,它們能結合的鋅離子,根據(jù)結構域數(shù)目和種類的不同,結合1到4個鋅離子不等,以維持依賴鋅離子的蛋白質(zhì)三級結構的穩(wěn)定[15]。
圖4 16個典型的羊肚菌鋅指蛋白質(zhì)三級結構
羊肚菌鋅指蛋白作為羊肚菌轉(zhuǎn)錄因子中最大的一類,對其研究具有重要意義。本實驗對羊肚菌轉(zhuǎn)錄因子蛋白家族進行分類,將167條編碼的具有轉(zhuǎn)錄因子活性的蛋白分成了28類。對羊肚菌編碼鋅指蛋白基因家族進行分析得出,編碼的88個羊肚菌鋅指蛋白以親水性蛋白為主,其二級結構以α-螺旋為主。它們朝著不同方向進行著不同程度的進化,能夠結合不同數(shù)目的鋅離子,維持結構的穩(wěn)定。
鋅在植物生長過程中發(fā)揮著不可或缺的作用。如果使用鋅離子螯合劑脫鋅或用Fe、Al、Cu、Ag、Mn等其他金屬離子代替鋅離子,鋅指蛋白與DNA或RNA等結合特異性就會被明顯抑制,不能形成折疊結構,同時穩(wěn)定的蛋白也會失去支撐力,影響基因表達及脅迫響應,使其喪失大部分功能[16]。鋅指序列主要存在于轉(zhuǎn)錄因子中,越來越多的鋅指蛋白已被證實與生物體內(nèi)的各種RNA代謝有關,能夠提高植物遭受鹽、冷凍、干旱、熱、滲透的耐受性以及病菌感染的生物抗性[17]。
羊肚菌編碼鋅指蛋白基因的研究基礎薄弱,功能研究幾乎是空白,本實驗對羊肚菌中所有編碼鋅指結構的轉(zhuǎn)錄因子序列做了分類和生物信息學分析,為羊肚菌轉(zhuǎn)錄因子的挖掘和功能調(diào)控研究提供了理論依據(jù)。
[1] 辛青霞, 蘆永昌, 趙英, 等. 羊肚菌多糖的提取及含量測定[J]. 四川師范大學學報(自然科學版), 2020, 43(5):671-676.
[2] 任廷遠, 安玉紅. 羊肚菌活性成分及營養(yǎng)保健功能的研究現(xiàn)狀(綜述)[J]. 浙江食用菌, 2010, 18(1): 21-23.
[3] 任怡蓮, 馮銳, 朱金霞, 等. 羊肚菌國內(nèi)外研究現(xiàn)狀及產(chǎn)業(yè)發(fā)展建議[J]. 寧夏農(nóng)林科技, 2020, 61(8): 50-53.
[4] Jen J, Wang Y C. Zinc finger proteins in cancer progression[J]. Journal of Biomedical Science. 2016, 23(1): 53.
[5] Krishna S S, Majumdar I, Grishin N V. Structural classification of zinc fingers: survey and summary[J]. Nucleic Acids Research. 2003, 31(2): 532-550.
[6] 方亦圓, 嚴維, 吳建新, 等. 花生MYB轉(zhuǎn)錄因子的鑒定與生物信息學分析[J]. 生物信息學, 2021, 19(2): 1-15.
[7] 安秀紅, 徐鍇, 厲恩茂, 等. 蘋果抗性相關的谷胱甘肽轉(zhuǎn)移酶基因MdGSTU1的生物信息學和表達分析[J]. 中國農(nóng)業(yè)科學, 2014, 47(24): 4868-4877.
[8] 谷彥冰, 冀志蕊, 遲福梅, 等. 蘋果WRKY基因家族生物信息學及表達分析[J]. 中國農(nóng)業(yè)科學, 2015, 48(16):3221-3238.
[9] 孫雪婧, 杜曉華, 楊孝樸, 等. 牦牛CYGB基因CDS區(qū)克隆與生物信息學分析[J]. 中國農(nóng)業(yè)科學, 2014, 47(13): 2690-2698.
[10] Gao J, Chen Y H, Peterson L C. GATA family transcriptional factors: emerging suspects in hematologic disorders[J]. Experimental Hematology and Oncology. 2015, 4(1): 28.
[11] Carrillo A J, Schacht P, Cabrera I E, et al. Functional profiling of transcription factor Genes in[J]. G3: Genes, Genomes, Genetics. 2017, 7(9): 2945-2956.
[12] 何欣, 葉偉, 高曉霞, 等. 白木香倍半萜合成酶As-SesTPS1基因的克隆、生物信息學和表達分析[J]. 中草藥,2015, 46(5): 733-739.
[13] 董慶龍, 冀志蕊, 遲福梅, 等. 蘋果MADS-box轉(zhuǎn)錄因子的生物信息學及其在不同組織中的表達[J]. 中國農(nóng)業(yè)科學, 2014, 47(6): 1151-1161.
[14] 李思楠, 蘇安玉, 于以成, 等. 大豆再生相關基因GmARF的生物信息學及表達分析[J]. 基因組學與應用生物學, 2015, 34(10): 2187-2193.
[15] 黎幫勇, 胡尚連, 曹穎, 等. 毛竹NAC轉(zhuǎn)錄因子家族生物信息學分析[J]. 基因組學與應用生物學, 2015, 34(8): 1769-1777.
[16] 李琳, 丁峰, 潘介春, 等. 植物鋅指蛋白轉(zhuǎn)錄因子家族研究進展[J]. 熱帶農(nóng)業(yè)科學, 2020, 40(2): 65-75.
[17] 趙麗娟, 易小婭, 曾幼玲. 植物逆境相關C2H2型鋅指蛋白的研究進展[J]. 分子植物育種, 2016, 14(3): 578-585.
Classification of transcription factors inand bioinformatics analysis
Ren Ruifang1Zhang Shaopeng2Jiang Peng1Zhang Rui1Zhang Zuo1Zheng Hanyu1Shi Menghua1Ma Xiaolong3*
(1. School of life Science and Techonogy, Wuhan Polytechnic University, Wuhan, Hubei 430023, China; 2. School of Modern Industry for Selenium Science and Engineering, Wuhan Polytechnic University, Wuhan, Hubei 430023, China; 3. Vegetable Research Institute of Wuhan Academy of Agricultural Sciences, Wuhan, Hubei 430345, China)
In this study, all sequences encoding transcription factors were functionally classified according to 7237sequences known in Genbank for the first time, and the coding sequence of zinc finger protein (ZNF) fromwas analyzed by bioinformatics. The results showed that 167 of the 7237 nucleotide sequences fromin GenBank were sequences encoding transcription factors, of which 88 sequences encoded zinc finger proteins, these sequences contain corresponding conserved motifs. Encoding the secondary structure of proteins is mainly α-helix, its tertiary structure is very similar. It is mainly hydrophilic protein in function. The results of this study will lay a theoretical foundation for further study of the regulatory role of transcription factors in the growth and development of.
; transcription factors; Zinc finger protein; bioinformatics
S646
A
2095-0934(2022)02-127-06
武漢市應用基礎前沿專項(2020020601012297);財政部和農(nóng)業(yè)農(nóng)村部國家現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術體系(CARS-20)
任瑞芳(1997—),女,碩士,主要從事中藥材的分子生物學研究。E-mail:2893468536@qq.com。
馬曉龍(1982—),男,高級農(nóng)藝師,博士,主要從事食藥用菌的栽培育種及生理藥理學研究。E-mail:22843560@qq.com。