劉笑天,仇昊,田莉,師亮,任昂*,趙明文,謝榮
(1.南京農(nóng)業(yè)大學(xué)生命科學(xué)學(xué)院,江蘇 南京 210095;2.西藏自治區(qū)農(nóng)牧科學(xué)院蔬菜研究所,西藏 拉薩 850032)
轉(zhuǎn)錄因子(transcription factor,TF)是一類能夠調(diào)控基因在不同時(shí)間和空間表達(dá)的重要蛋白,在調(diào)節(jié)生物體各種生理活動(dòng)的過程中發(fā)揮重要作用。隨著不同物種的全基因組測序工作相繼完成,對于深入理解轉(zhuǎn)錄因子調(diào)控基因表達(dá)的機(jī)制愈發(fā)重要。
在已有的研究中,靈芝(Ganodermalucidum)不同家族轉(zhuǎn)錄因子在其生長代謝過程中扮演著不同的角色。來自GATA家族的轉(zhuǎn)錄因子AreA在調(diào)節(jié)靈芝酸(ganoderic acid,GA)生物合成的過程中具有雙重功能:一方面,AreA可以通過結(jié)合相關(guān)基因的啟動(dòng)子來增強(qiáng)GA生物合成;另一方面,AreA被激活以促進(jìn)氮的吸收,但此期間NO含量的增加會抑制GA的生物合成[1]。來自APSES家族的轉(zhuǎn)錄因子GlSwi6在靈芝的生長發(fā)育及GA生物合成中起著重要作用,進(jìn)一步的分析表明,胞內(nèi)ROS水平也影響由GlSwi6調(diào)節(jié)的GA生物合成過程[2]。來自C2H2家族的轉(zhuǎn)錄因子GlPacC能夠響應(yīng)環(huán)境pH的變化,其在靈芝的菌絲體生長、子實(shí)體發(fā)育和GA的生物合成中具有重要作用[3]。然而,這些工作僅僅局限于少部分轉(zhuǎn)錄因子,尚有數(shù)量眾多的轉(zhuǎn)錄因子未被發(fā)掘并驗(yàn)證其功能。對于靈芝而言,這一工作的缺失,顯然限制了對其基因表達(dá)及次級代謝調(diào)控的進(jìn)一步研究。
本研究通過檢索真菌模式物種的轉(zhuǎn)錄因子公共數(shù)據(jù)庫,結(jié)合靈芝蛋白庫和全基因組數(shù)據(jù),經(jīng)過比對,將靈芝中可能存在的各轉(zhuǎn)錄因子家族及其成員系統(tǒng)地歸納篩選,并對這些轉(zhuǎn)錄因子同源蛋白在乙酸處理下的轉(zhuǎn)錄組進(jìn)行表達(dá)分析,以期為后續(xù)新的轉(zhuǎn)錄因子的發(fā)掘研究奠定基礎(chǔ)。
從TRANSFAC?Public轉(zhuǎn)錄因子數(shù)據(jù)庫(http://gene-regulation.com/pub/databases/transfac)和FTFD真菌轉(zhuǎn)錄因子數(shù)據(jù)庫(http://ftfd.snu.ac.kr)中篩選出源自于釀酒酵母(Saccharomycescerevisiae)、粗糙脈孢菌(Neurosporacrassa)、裂殖酵母(Schizosaccharomycespombe)、雙色蠟?zāi)?Laccariabicolor)等真菌中常見的若干轉(zhuǎn)錄因子家族,并以它們的蛋白序列作為參考序列,在本地建立BLASTp;此外,基于隱馬爾可夫模型(hidden markov model,HMM),利用HMMER 3.0程序(E-value≤10-5),分別與Chen等[4]公布的靈芝蛋白數(shù)據(jù)庫交叉比對,從中獲得含有保守結(jié)構(gòu)域的同源序列。
使用ClustalW軟件對所獲得的序列進(jìn)行多重比較分析,并利用MEGA 7.0軟件中的鄰接法(neighbor-joining method)繪制系統(tǒng)進(jìn)化樹,bootstrap值設(shè)置為1 000。將篩選到的靈芝轉(zhuǎn)錄因子同源蛋白按照家族進(jìn)行分類,并與靈芝基因組數(shù)據(jù)庫[4]進(jìn)行BLASTn比對,確定各轉(zhuǎn)錄因子同源蛋白在靈芝染色體上的分布。通過ExPASy(https://web.expasy.org/compute_pi/)分析各轉(zhuǎn)錄因子同源蛋白的氨基酸殘基數(shù)、相對分子質(zhì)量及等電點(diǎn)。利用在線預(yù)測工具BUSCA(http://busca.biocomp.unibo.it/)進(jìn)行亞細(xì)胞定位預(yù)測。
參考Ren等[5]的方法使用乙酸對靈芝HG野生型菌株的菌絲進(jìn)行處理。靈芝HG野生型菌株由上海市農(nóng)業(yè)科學(xué)院提供。于PDB培養(yǎng)基中進(jìn)行種子培養(yǎng),28 ℃、150 r·min-1搖床振蕩培養(yǎng)7 d。以5%(體積分?jǐn)?shù))的接種量進(jìn)行發(fā)酵培養(yǎng),28 ℃、150 r·min-1振蕩培養(yǎng)5 d(CYM培養(yǎng)基:10 g·L-1麥芽糖、20 g·L-1葡萄糖、2 g·L-1酵母提取物、2 g·L-1蛋白胨、0.5 g·L-1MgSO4·7H2O、4.6 g·L-1KH2PO4)。培養(yǎng)6 d時(shí),添加乙酸至終濃度為5 mmol·L-1。6 h后收集菌絲,提取RNA。未添加乙酸的對照組及乙酸處理組均設(shè)置3次重復(fù)。Illumina MiSeq Reagent Kit反轉(zhuǎn)錄后構(gòu)建測序文庫,借助Illumina MiSeq平臺進(jìn)行高通量測序。以 |log2(Fold Change)|>1 且-lg(P-value)>1.301表示顯著性的表達(dá)差異。
從TRANSFAC?和FTFD數(shù)據(jù)庫中獲取屬于真菌的若干轉(zhuǎn)錄因子家族,建立本地BLASTp,并利用基于Pfam數(shù)據(jù)庫的HMMER工具對靈芝的蛋白數(shù)據(jù)庫進(jìn)行比對。BLASTp工具篩選到分屬于若干家族的217個(gè)轉(zhuǎn)錄因子同源蛋白,HMMER篩選出152個(gè)。通過交叉比對,去除重復(fù)值,合并比對結(jié)果,共篩選出來自19個(gè)家族的261個(gè)轉(zhuǎn)錄因子同源蛋白(表1)。其中,含有OB-fold、Zn2Cys6和C2H2的成員數(shù)量較多,分別為61、55和40個(gè)。而含有銅拳蛋白(copper fist proteins)、著絲粒蛋白B(centromere protein B)和TATA結(jié)合(TATA binding)結(jié)構(gòu)域的轉(zhuǎn)錄因子同源蛋白數(shù)量較少,均只有1個(gè)。此外,有9個(gè)同源蛋白含有2種轉(zhuǎn)錄因子保守結(jié)構(gòu)域:GL31391_R1、GL24980_R1、GL31253_R1和GL29539_R1都含有Jumonji與C2H2;GL26798_R1、GL18755_R1、GL27347_R1和GL26130_R1都含有APSES與bZIP;GL24061_R1含有bHLH與C2H2。
表1 靈芝中主要轉(zhuǎn)錄因子家族的同源蛋白篩選結(jié)果
將261個(gè)轉(zhuǎn)錄因子同源蛋白按照家族名加序號的命名方式進(jìn)行編號,分析它們的序列特性。ExPASy 的預(yù)測結(jié)果表明,這些同源蛋白相對分子質(zhì)量最小為8.65×103,最大為168.83×103,約94.2%的蛋白相對分子質(zhì)量在120×103以下(圖1-A)。它們的理論等電點(diǎn)為4.06~12.16,多數(shù)小于11.5(圖1-B)。
圖1 靈芝轉(zhuǎn)錄因子家族同源蛋白的基本特性
根據(jù)靈芝染色體基因組信息,運(yùn)行本地BLASTn程序,分析這些同源蛋白在染色體上的分布情況。結(jié)果表明,各個(gè)染色體上所包含的轉(zhuǎn)錄因子同源蛋白數(shù)量存在差異。染色體Chr 3上數(shù)量最多,共有45個(gè),Chr 13則最少,僅有4個(gè),其余染色體上的轉(zhuǎn)錄因子同源蛋白數(shù)量分布較為均勻(圖1-C)。
使用BUSCA在線預(yù)測工具,基于GO注釋對261個(gè)轉(zhuǎn)錄因子同源蛋白進(jìn)行亞細(xì)胞定位預(yù)測(圖1-D)。結(jié)果顯示,有108個(gè)同源蛋白定位于核仁,78個(gè)定位于細(xì)胞質(zhì)。約71.3%的同源蛋白定位于細(xì)胞核與細(xì)胞質(zhì),其他則均勻分布于質(zhì)膜、線粒體和內(nèi)膜系統(tǒng)等。
以研究較為深入的3個(gè)轉(zhuǎn)錄因子家族,即C2H2、Zn2Cys6、HMG家族為例,將其與真菌模式物種釀酒酵母(S.cerevisiae),以及同為擔(dān)子菌的雙孢蘑菇(Agaricusbisporus)和雙色蠟?zāi)?L.bicolor)進(jìn)行對比,計(jì)算各家族轉(zhuǎn)錄因子數(shù)占總基因數(shù)的比例(表2)。在3個(gè)轉(zhuǎn)錄因子家族中,HMG家族在各自物種中所占總基因數(shù)的比例最小。根據(jù)先前的報(bào)道,HMG轉(zhuǎn)錄因子家族能夠與線性DNA結(jié)合,在轉(zhuǎn)錄、復(fù)制等過程中起到關(guān)鍵作用[6]。而C2H2與Zn2Cys6轉(zhuǎn)錄因子則主要參與了生長發(fā)育、代謝調(diào)控和脅迫響應(yīng)等過程[7-8]。此外,從靈芝中篩選到的這3種轉(zhuǎn)錄因子家族同源蛋白所占總基因數(shù)的比例較另外幾個(gè)物種低。
表2 靈芝與真菌模式物種中的3個(gè)轉(zhuǎn)錄因子家族對比
在真核生物中,堿性亮氨酸拉鏈(basic leucine zipper,bZIP)轉(zhuǎn)錄因子是較為龐大和多樣的轉(zhuǎn)錄因子家族之一。真菌中的bZIP轉(zhuǎn)錄因子參與菌絲生長發(fā)育[9]、氨基酸生物合成[10-11]、次級代謝產(chǎn)物的產(chǎn)生[12]和脅迫反應(yīng)[13-14]等生理過程。我們整理了11個(gè)靈芝bZIP轉(zhuǎn)錄因子同源蛋白和來自構(gòu)巢曲霉(Aspergillusnidulans)、稻瘟病菌(Magnaportheoryzae)和粗糙脈孢菌(N.crassa)的bZIP轉(zhuǎn)錄因子,使用MEGA 7.0軟件中的ClustalW對它們的氨基酸序列進(jìn)行多重比較分析,采取鄰接法繪制系統(tǒng)進(jìn)化樹。結(jié)果表明,靈芝中bZIP轉(zhuǎn)錄因子同源蛋白可以分為4個(gè)亞組:GL30843、GL24297、GL24299為第1亞組;GL21653、GL25297、GL25947、GL26688、GL29448為第2亞組;GL17608、GL28195為第3亞組;GL23461為第4亞組(圖2)。第2亞組內(nèi)共有5個(gè)bZIP轉(zhuǎn)錄因子同源蛋白,表明它們可能來源于同一個(gè)祖先,且在進(jìn)化上呈現(xiàn)出更高的分化程度,分工更細(xì)致。除此之外,其他幾個(gè)亞組均勻散布在不同的分支中。
圖2 靈芝bZIP轉(zhuǎn)錄因子同源蛋白進(jìn)化樹
乙酸處理能夠誘導(dǎo)靈芝酸合成[5],該過程與乙酸激活靈芝胞內(nèi)活性氧(reactive oxygen species,ROS)信號相關(guān)[15]。乙酸處理的靈芝菌絲體轉(zhuǎn)錄組數(shù)據(jù)分析表明,在我們比對到的這些假定的轉(zhuǎn)錄因子中,有5個(gè)轉(zhuǎn)錄水平發(fā)生顯著變化。其中,含有TEA結(jié)構(gòu)域的GlTEA-4(GL22568_R1)在乙酸處理后轉(zhuǎn)錄水平顯著下調(diào)了52%。而含有C2H2結(jié)構(gòu)域的GlC2H2-4(GL16029_R1),含有Zn2Cys6結(jié)構(gòu)域的GlZn2Cys6-5(GL16724_R1)、GlZn2Cys6-7(GL17627_R1)和GlZn2Cys6-15(GL21326_R1)在乙酸處理后轉(zhuǎn)錄水平顯著上調(diào),分別增加了119%、312%、129%和205%,但它們的log2(CPM)并不高,表明它們在靈芝中的分布豐度相對較低(圖3)。
圖3 乙酸處理下靈芝轉(zhuǎn)錄因子同源蛋白表達(dá)分析
轉(zhuǎn)錄因子作為一類能夠調(diào)控基因在不同時(shí)間和空間表達(dá)的蛋白,在生物的生長發(fā)育與代謝調(diào)控中具有重要作用。近年來隨著基因組學(xué)(genomics)、蛋白組學(xué)(proteinomics)、代謝組學(xué)(metabolomics)和轉(zhuǎn)錄組學(xué)(transcriptomics)等學(xué)科快速發(fā)展,我們可以從整體角度去認(rèn)識基因、蛋白及其分子間相互作用的機(jī)制。然而,這些研究大多集中在少數(shù)模式物種中,對于非模式物種,例如靈芝,仍然缺少對其轉(zhuǎn)錄因子家族系統(tǒng)而全面的分析。
本研究通過檢索公共轉(zhuǎn)錄因子數(shù)據(jù)庫,將真菌模式物種的轉(zhuǎn)錄因子與Chen等[4]公布的靈芝蛋白數(shù)據(jù)庫進(jìn)行交叉比對,篩選到來自19個(gè)家族的261個(gè)轉(zhuǎn)錄因子同源蛋白。目前,已經(jīng)公開的數(shù)據(jù)庫中對于靈芝轉(zhuǎn)錄因子的收錄并不多。在我們前期的嘗試性工作中,利用在線BLASTp對NCBI中的靈芝條目進(jìn)行對比,僅檢索到23個(gè),利用在線HMMER篩選出的靈芝轉(zhuǎn)錄因子同源蛋白也只有20個(gè),這也說明對于靈芝中轉(zhuǎn)錄因子系統(tǒng)而全面的篩選工作較少,大量預(yù)測的蛋白功能需要進(jìn)一步試驗(yàn)的驗(yàn)證。
在261個(gè)假定的轉(zhuǎn)錄因子中,含有OB-fold、C2H2和Zn2Cys6的家族成員數(shù)目最多?,F(xiàn)有的研究表明,OB-fold參與維持基因組的穩(wěn)定性[16],包括DNA復(fù)制[17]、DNA修復(fù)[18]、細(xì)胞周期調(diào)節(jié)[19]和端粒的維持[20]等;C2H2在真菌的生長發(fā)育[7,21-22]、孢子產(chǎn)生[7]、致病力[21-23]以及脅迫響應(yīng)[24]等方面起到突出的作用;Zn2Cys6轉(zhuǎn)錄因子在代謝調(diào)控[25]、生長發(fā)育[8,26-27]、孢子萌發(fā)[8,26]、附著胞形成[8]、致病力[8,26,28]與脅迫應(yīng)激[8,29]等過程中發(fā)揮關(guān)鍵作用。
乙酸處理?xiàng)l件下,靈芝菌絲體有5個(gè)轉(zhuǎn)錄因子同源蛋白的轉(zhuǎn)錄水平發(fā)生顯著變化,分屬于TEA、C2H2和Zn2Cys6三個(gè)轉(zhuǎn)錄因子家族。據(jù)報(bào)道,含TEA結(jié)構(gòu)域的轉(zhuǎn)錄因子在控制真菌細(xì)胞分裂周期、發(fā)育[30-32]等方面具有重要作用。釀酒酵母中,含TEA的轉(zhuǎn)錄因子Tec1能夠激活G1細(xì)胞周期蛋白,在酵母交配期間則通過降解而被下調(diào),從而實(shí)現(xiàn)酵母不同發(fā)育階段的動(dòng)態(tài)平衡。乙酸處理下,靈芝菌絲體中由于ROS的積累從而導(dǎo)致靈芝酸含量增加[15],在此過程中可能響應(yīng)脅迫的C2H2和Zn2Cys6轉(zhuǎn)錄因子同源蛋白的轉(zhuǎn)錄水平增加,TEA同源蛋白轉(zhuǎn)錄水平降低。這5個(gè)能夠顯著響應(yīng)乙酸處理的轉(zhuǎn)錄因子同源蛋白,它們可能在乙酸誘導(dǎo)靈芝酸合成,激活靈芝胞內(nèi)ROS信號等過程中具有重要作用,值得進(jìn)一步開展研究。