曹 丹,金孝芳*,馬林龍,劉艷麗,郭桂義
(1.湖北省農(nóng)業(yè)科學院果樹茶葉研究所,湖北 武漢 430064;2.信陽農(nóng)林學院/河南省豫南茶樹資源綜合開發(fā)重點實驗室,河南 信陽 464000)
【研究意義】硒是人和動物必需的微量元素之一,過量或不足對機體都有不可忽視的影響[1]。通過調(diào)查發(fā)現(xiàn)我國有近66.7 %的人口不同程度缺硒[2],因其有益與有害的閾值較低,故開發(fā)安全有效的硒資源非常有必要。茶是一種非常流行的飲品,茶樹的富硒能力較強,但是其硒含量因品種、部位和生長環(huán)境的不同而表現(xiàn)出較大的差異[3],茶樹硒累積的分子機理至今尚并不明確。bHLH轉(zhuǎn)錄因子參與植物多種生物學過程,對茶樹bHLH基因進行生物信息學分析,有助于理解其在茶樹硒吸收轉(zhuǎn)運過程中的生物學功能,進一步對利用生物技術(shù)手段調(diào)控茶葉硒含量以及茶樹新品種的培育都具有非常重要的作用?!厩叭搜芯窟M展】轉(zhuǎn)錄因子bHLH(basic helic-loop-helic,bHLH)廣泛存在于真核生物中[4],是植物體內(nèi)第二大家族轉(zhuǎn)錄因子。bHLH結(jié)構(gòu)域約含60個氨基酸,由2個功能不同的區(qū)域組成,一個是能與DNA結(jié)合的堿性區(qū)域[5],另一個是α螺旋-環(huán)-α螺旋結(jié)構(gòu),其中的α螺旋親水又親脂,被不同長度的連接區(qū)分開[6]。bHLH轉(zhuǎn)錄因子內(nèi)部或者轉(zhuǎn)錄因子之間的2個α螺旋可以相互作用,形成同源或者異源二聚體,并與靶基因啟動子區(qū)域的順式作用元件結(jié)合,對下游基因發(fā)揮調(diào)控作用[7]。目前,通過對一些重要物種的研究發(fā)現(xiàn),擬南芥(ArabidopsisthalianaL.)、煙草(NicotianatabacumL.)、水稻(OryzasativaL.)、葡萄(VitisvinferaL.)、玉米(Zeamays)、楊樹(Populustrichocarpa)等中分別含有164、190、180、191、276、183個bHLH轉(zhuǎn)錄因子[8-10]。在植物中該類轉(zhuǎn)錄因子主要參與了與種子萌發(fā)[11-12]、雄性不育[13]、分枝發(fā)育[14]、離子轉(zhuǎn)運[15]、激素應答[16-17]、逆境脅迫[18-19]等過程。茶樹bHLH轉(zhuǎn)錄因子的研究也有一些進展,如CsbHLH2從抗逆性較強的品種‘陜茶一號’中被成功克隆出來[20],趙磊等[21]發(fā)現(xiàn)CsbHLH2和CsbHLH24與茶樹類黃酮合成相關(guān),然而通過對bHLH的進化樹分析發(fā)現(xiàn),在功能已知的第IIIf亞組中,沒有茶樹基因組中的bHLH轉(zhuǎn)錄因子,認為更多的茶樹bHLH需要進一步挖掘;孫彬妹等[22]克隆了2個與擬南芥高度同源bHLH轉(zhuǎn)錄因子GL3和EGL3,分析發(fā)現(xiàn)其參與調(diào)控了花青素的合成。迄今為止,bHLH轉(zhuǎn)錄因子在茶樹硒富集過程中的作用少有報道?!颈狙芯壳腥朦c】本研究團隊對茶樹品種進行了轉(zhuǎn)錄組測序,通過分析篩選出一個表達豐度較高、差異倍數(shù)較大的bHLH轉(zhuǎn)錄因子(Unigene0020663),結(jié)合基因功能注釋,將其命名為CsbHLH62,通過對其進行生物信息學分析,探討其生物學功能?!緮M解決的問題】旨在為進一步驗證該基因功能奠定基礎。
1年生茶苗(鄂茶1號)于2016年夏季在湖北省農(nóng)業(yè)科學院果樹茶葉研究所溫室大棚進行水培培養(yǎng)(處理條件為內(nèi)部資料,未發(fā)表),分別對茶樹的根部及葉片進行轉(zhuǎn)錄組測序,由廣州基迪奧生物科技有限公司完成。
CsbHLH62基因的開放閱讀框采用NCBI中的ORF Finder(https://www.ncbi.nlm.nih.gov/orffinder/)預測,功能結(jié)構(gòu)利用ScanProsite程序(http://www.expasy.org/tools/scanprosite/)分析,編碼產(chǎn)物理化性質(zhì)采用ProtParam程序(https://expasy.org/tools/protparam.html)分析,信號肽分析、跨膜結(jié)構(gòu)域與亞細胞定位分別由在線軟件SignalP4.1(http://www.cbs.dtu.dk/services/SignalP/)、TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)和Cell-PLoc 2.0(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)預測,磷酸位點預測利用在線軟件NetPhos 3.1 Server(http://www.cbs.dtu.dk/services/NetPhos/)進行,二級、三級結(jié)構(gòu)分別由在線程序SMOPA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)和Phyre2(http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)預測,采用軟件DNAman和MEGA6進行多序列比對和同源性分析。
該基因全長933 bp,共編碼277個氨基酸,開放閱讀框(ORF)長831 bp,5’非編碼區(qū)(5’UTR)長102 bp。
利用在線程序ProtParam分析蛋白質(zhì)的理化性質(zhì),得到該基因編碼蛋白的化學方程式為C1318H2122N390O438S9,預測分子量30728.24 kD,共包括4277個原子,理論等電點7.73,脂肪系數(shù)62.64,不穩(wěn)定系數(shù)36.46(不穩(wěn)定指數(shù)大于40時,表示不穩(wěn)定),表明該蛋白穩(wěn)定。
該基因編碼276個氨基酸,組成中最多的氨基酸是絲氨酸(Ser),所占比例為11.6 %,其次是亮氨酸(Leu)和賴氨酸(Lys),均占7.6 %(圖1)。另外,負電荷殘基總數(shù)(Asp+Glu)是36,正電荷殘基總數(shù)(Arg + Lys)是37。
利用Protscale程序預測CsbHLH62編碼產(chǎn)物的疏水性/親水性(圖2),分析氨基酸殘基的分值發(fā)現(xiàn),多肽鏈的第191位具有最高的分值1.422,疏水性最強;第104和106位具有最低的分值-2.933,親水性最強,總平均親水性(Grand average of hydropathicity )為-0.851,整條多肽鏈表現(xiàn)為親水性,故推測該蛋白是一種可溶性蛋白這有利于其發(fā)揮轉(zhuǎn)錄因子的功能。
利用軟件SignalP4.1進行信號肽(Signal peptide)分析,結(jié)果如圖3所示。C-score是原始信號肽裂解位點的分值,數(shù)值越大表明該點出現(xiàn)裂解位點的概率就越大;S-score是信號肽分值,數(shù)值越大表明該氨基酸位于信號肽區(qū)域的可能性就越大,數(shù)值越低表示該氨基酸不含信號肽或者位于成熟蛋白部分;Y-score是基于C值和S值的斜率得出的幾何平均數(shù),是最大可能的信號肽裂解位點;D-score是S均值和Y最大值的加權(quán)平均值,用于區(qū)分信號肽和非信號肽[23]。C、S、Y的最大值值分別是0.109、0.116、0.105,S-mean和D值分別是0.097、0.101,另外Signal peptide結(jié)果顯示為No,表明CsbHLH62編碼的蛋白不存在信號肽,是一種非分泌蛋白。
圖1 氨基酸含量分布Fig.1 Distribution of amino acid content
通過TMHMM分析CsbHLH62蛋白質(zhì)的跨膜結(jié)構(gòu),結(jié)果如圖4所示,CsHLH62編碼的1~277位氨基酸都位于細胞膜表面,另外,蛋白N端位于膜內(nèi)的可能性為0.01881,非跨膜螺旋區(qū)預測值是0,該值大于18表示預測蛋白是跨膜蛋白[23],綜合分析表明CsbHLH62基因編碼產(chǎn)物不是跨膜蛋白質(zhì),在細胞中處于游離狀態(tài)。采用Cell-PLoc 2.0[24]程序進行亞細胞定位分析,結(jié)果表明該基因編碼的蛋白定位于細胞核。
圖2 CsbHLH62編碼蛋白疏水性/親水性分析Fig.2 Hydrophilia/hydrophobicity analysis of CsbHLH62 encoding protein
圖3 CsbHLH62編碼產(chǎn)物信號肽預測Fig.3 Signal peptide prediction of CsbHLH62 encoding protein
利用NCBI上Blast在線工具,對CsbHLH62編碼蛋白進行同源性檢索,發(fā)現(xiàn)其與胡桃(JuglansregiaXP_018844170.1)、綠豆(Vignaradiatavar.RadiataXP_014496615.1)、大豆(GlycinemaxXP_003532257.1)、桃(PrunuspersicaXP_007201182.1)、菜豆 (PhaseolusvulgarisXP_007140690.1)、短小蛇根草 (OphiorrhizapumilaBAU67840.1)、木豆(CajanuscajanXP_020234271.1)、歐洲越橘(VacciniumcorymbosumAOY34395.1)、棗(ZiziphusjujubaXP_015892293.1)的相似性在50 %~70 %,其中與歐洲越橘的序列同源性最高,相似性為68 %。通過對bHLH62編碼氨基酸序列進行同源性分析(圖5),發(fā)現(xiàn)該基因在不同植物間結(jié)構(gòu)上保守性較強。
圖4 CsbHLH62編碼產(chǎn)物跨膜結(jié)構(gòu)域預測Fig.4 Transmembrance domain prediction of CsbHLH62 encoding protein
圖5 bHLH62同源基因氨基酸序列對比Fig.5 Homologous alignments of the bHLH62 genes
采用MEGA6.0鄰接法構(gòu)建系統(tǒng)進化樹(圖6),結(jié)果表明CsbHLH62基因與歐洲越橘bHLH024親緣關(guān)系最近,推測與其具有相似的功能。
將CsbHLH62基因編碼序列輸入ScanProsite在線程序,進行功能結(jié)構(gòu)域搜索,結(jié)果表明該基因編碼蛋白有1個Myc型的螺旋-環(huán)-螺旋(basic helix-loop-helix,bHLH)結(jié)構(gòu)域,該結(jié)構(gòu)域分布在第131~181位氨基酸之間。
數(shù)字表示支持率,分枝長短代表親緣關(guān)系遠近圖6 不同物種的bHLH62編碼產(chǎn)物的系統(tǒng)進化樹Fig.6 Phylogenetic tree of bHLH62 genes in different plants
應用NetPhos 3.1 Server在線軟件對CsbHLH62基因翻譯后磷酸化情況進行分析,結(jié)果如圖所示,該基因編碼的蛋白可能發(fā)生磷酸化的位點有35個,其中絲氨酸(Ser)、蘇氨酸(Thr)和酪氨酸(Tyr)可能發(fā)生磷酸化修飾的位點分別有24、10、1個(圖7~8)。
利用SMOPA程序預測CsbHLH62編碼產(chǎn)物的二級結(jié)構(gòu)。結(jié)果如圖9所示,134個氨基酸形成了無規(guī)則卷曲(Random coil),占整體的48.38 %;86個氨基酸組成α-螺旋(Alpha helia)結(jié)構(gòu),占整個二級結(jié)構(gòu)的31.05 %;延伸鏈(Extended strand)和β轉(zhuǎn)角(Beta turn)分別由35、22個氨基酸殘基構(gòu)成,在所占比例分別為12.64 %和7.94 %。以上結(jié)果表明無規(guī)則卷曲和α-螺旋是CsbHLH62編碼產(chǎn)物的主要結(jié)構(gòu)。
圖7 CsbHLH62編碼產(chǎn)物結(jié)構(gòu)域分析Fig.7 Domain analysis of CsbHLH62 encoding protein
圖8 CsbHLH62編碼產(chǎn)物磷酸位點分析Fig.8 Phosphorylation sites analysis of CsbHLH62 encoding protein
圖9 CsbHLH62編碼產(chǎn)物二級結(jié)構(gòu)預測Fig.9 Secondary structure prediction of CsbHLH62 encoding protein
圖10 CsbHLH62編碼產(chǎn)物三級結(jié)構(gòu)預測Fig.10 3D structure of prediction of CsbHLH62 encoding protein
將 CsbHLH62氨基酸序列提交至Phyre2中進行預測,得到了該基因編碼產(chǎn)物的三維模型(圖10)。
茶樹是一種重要的經(jīng)濟型作物,培育優(yōu)良茶樹品種對于茶產(chǎn)業(yè)的發(fā)展具有重要的意義。前期通過轉(zhuǎn)錄組測序發(fā)現(xiàn)一個在根部表達豐度較高的bHLH轉(zhuǎn)錄因子,該結(jié)果與黃芪響應硒的研究相似[25],但其在硒吸收及累積過程中的生物學功能還不明確,本研究通過對其進行生物信息學分析,為后續(xù)的研究做好準備。
CsbHLH62基因編碼是一種可溶性蛋白,無信號肽,二級結(jié)構(gòu)主要由無規(guī)則卷曲和α-螺旋組成,這與在苦蕎、蘋果和丹參等物種中的bHLH轉(zhuǎn)錄因子的分析結(jié)果一致[26-28],該基因定位在細胞核中,這與在茶樹中另一bHLH轉(zhuǎn)錄因子的研究類似[20]。其中二級結(jié)構(gòu)中的無規(guī)則卷曲所占比例最大,前人認為其可用于分子識別,在蛋白質(zhì)特性和功能中發(fā)揮關(guān)鍵作用[29];而對于該基因的三維結(jié)構(gòu),雖然SWISS-MODEL同源建模應用較廣,但可能會出現(xiàn)目標基因預測模型和模板不一致的情況,而Phyre2使用遠程同源檢測的方法,較好地彌補了這一缺陷[30];此外,CsbHLH62因含有MYC型的bHLH結(jié)構(gòu)域而歸屬于bHLH類轉(zhuǎn)錄因子家族。以往研究發(fā)現(xiàn)MYC類轉(zhuǎn)錄因子是植物茉莉酸信號轉(zhuǎn)導途徑中的核心轉(zhuǎn)錄因子,在植物生長發(fā)育、次級代謝和抵御反應中具有重要的作用[31]。比如擬南芥中的MYC2與JA誘導的許多抗蟲基因正相關(guān),對提高其抵抗蟲害的能力中發(fā)揮重要作用[32]。在煙草中MYC類轉(zhuǎn)錄因子也參與了尼古丁的生物合成[33]。在本研究中,轉(zhuǎn)錄組分析發(fā)現(xiàn)茶樹受到硒的刺激后,茉莉酸類相關(guān)基因的表達發(fā)生顯著變化,根據(jù)bHLH轉(zhuǎn)錄因子的結(jié)構(gòu)特點,猜測CsbHLH62是與茉莉酸類相關(guān)基因的DNA結(jié)合,進而調(diào)控其下游的響應基因,該結(jié)論尚需進一步的試驗驗證。
本研究利用生物信息學手段獲得關(guān)于CsbHLH62基因及其編碼產(chǎn)物的預測結(jié)果,為進一步對該基因的克隆、時空表達特征以及亞細胞定位和功能驗證等奠定前期基礎。