趙 丹, 李 波, 趙德剛,2
(1.貴州大學(xué)農(nóng)業(yè)生物工程研究院/生命科學(xué)學(xué)院,山地植物資源保護(hù)與保護(hù)種質(zhì)創(chuàng)新教育部重點(diǎn)實(shí)驗(yàn)室, 貴陽 550025;2.貴州省農(nóng)業(yè)科學(xué)院,貴州省植物保育技術(shù)應(yīng)用工程研究中心, 貴陽 550006)
泛素化是蛋白質(zhì)組中最常見的翻譯后修飾之一,是細(xì)胞內(nèi)短壽命蛋白和一些異常蛋白降解的普遍途徑。其中E 3連接酶在泛素化過程中主要負(fù)責(zé)對(duì)靶蛋白的特異性識(shí)別,介導(dǎo)26 S蛋白酶體系統(tǒng)對(duì)靶蛋白進(jìn)行泛素化修飾[1],該酶決定著靶蛋白的多樣性與特異性。研究表明,含有U-box 蛋白結(jié)構(gòu)域的泛素連接酶E 3在植物的生長發(fā)育過程中起著重要作用[2],其U-box 保守域含有約70個(gè)氨基酸,U-box 結(jié)構(gòu)域在酵母、植物和動(dòng)物等真核生物中高度保守。
目前,已經(jīng)利用基因組數(shù)據(jù)庫對(duì)多種植物U-box基因家族進(jìn)行了鑒定和分析,其中擬南芥(Arabidopsisthaliana)中鑒定到64個(gè)U-box 蛋白[3],水稻(OryzasativaL.)中鑒定到77個(gè)U-box蛋白[4],蒺藜苜蓿(Medicagotruncatula)中鑒定到41個(gè)U-box蛋白[5],大豆(Glycinemax(L.)Merr.)中鑒定到43個(gè)U-box 蛋白[6],葡萄(VitisviniferaL.)中鑒定到31個(gè)U-box蛋白[7],香蕉(Musaacuminata)中鑒定到91個(gè)U-box蛋白[8],甘藍(lán)(brassicaoleraceaL.)中鑒定到99個(gè)U-box蛋白[9],蘋果中鑒定到69個(gè)U-box蛋白[10],番茄中鑒定到62個(gè)U-box蛋白[11]。許多U-box蛋白在植物生長發(fā)育以及非生物脅迫中發(fā)揮著重要作用[12]。
杜仲(EucommiaulmoidesOliv.)是我國特有的國家戰(zhàn)略資源樹種,既是世界上極具開發(fā)潛力的天然橡膠資源,又是我國特有的名貴藥材和木本油料樹種[13]。杜仲基因組測序的完成,為杜仲基因家族的鑒定提供了數(shù)據(jù)來源。到目前為止,對(duì)杜仲U-box基因家族的研究尚未取得突破進(jìn)展。U-box基因可能在杜仲的生長發(fā)育中起著重要作用,因此對(duì)杜仲U-box基因家族的研究具有重要意義。本研究對(duì)杜仲U-box基因家族進(jìn)行了鑒定及生物信息學(xué)分析,為進(jìn)一步研究該基因家族在杜仲生長發(fā)育等過程中的作用提供理論指導(dǎo)。
杜仲(EucommiaulmoidesOliv.):https://bigd.big.ac.cn/gwh/Assembly/13/show。
擬南芥(Arabidopsisthaliana):https://www.ncbi.nlm.nih.gov/assembly/GCF_000001735.4/。
三葉橡膠(Heveabrasiliensis):https://www.ncbi.nlm.nih.gov/assembly/GCA_0 10458925.1/。
從 Pfam 數(shù)據(jù)庫下載U-box 保守序列 PF 04564,利用Hmmer v3.1 b 1軟件構(gòu)建本地隱馬爾科夫模型(HMM),用下載的杜仲蛋白序列文件搜索獲得杜仲U-box結(jié)構(gòu)候選蛋白。根據(jù)Donna等[14]的方法,從擬南芥數(shù)據(jù)庫和GenBank下載了64個(gè)擬南芥U-box基因序列和蛋白質(zhì)序列。從三葉橡膠基因組數(shù)據(jù)庫(https://www.genome.jp/dbget-bin/www_bfind_sub?dbkey=T 05150&keywords=U-box&mode=bfind&max_hit=1000)中下載了12個(gè)U-box基因序列和蛋白質(zhì)序列。同樣用構(gòu)建的HMM模型分別對(duì)擬南芥、三葉橡膠基因組蛋白序列文件進(jìn)行搜索,所獲結(jié)果與下載的擬南芥、三葉橡膠U-box基因序列和蛋白質(zhì)序列進(jìn)行合并,得到最新的擬南芥、三葉橡膠U-box基因序列和蛋白質(zhì)序列,分別為70個(gè)和51個(gè)。
利用獲得的擬南芥、三葉橡膠的U-box基因CDS序列,與杜仲基因組CDS序列進(jìn)行BLAST檢索,所得序列與隱馬爾科夫檢索含有U-box結(jié)構(gòu)域的候選序列合并,剔除重復(fù)。
將得到的結(jié)果經(jīng)SMART(http://smart.embl-heidelberg.de/smart/set_mode.cgi?NORMAL=1)、NCBI CDD(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)、InterPro(http://www.ebi.ac.uk/interpro/)和Pfam(http://pfam.xfam.org/search)進(jìn)一步分析,剔除無典型U-box結(jié)構(gòu)域的序列,最終獲得杜仲U-box基因家族所有成員,分析U-box結(jié)構(gòu)域長度和位置以及其它結(jié)構(gòu)域類型。利用ExPASy 在線工具(https://web.expasy.org/protparam/)預(yù)測U-box蛋白的等電點(diǎn)、分子量和親水性平均值(Grand average of hydropathicity, GRAVY)。利用Wolfpsort在線工具(https://wolfpsort.hgc.jp/)預(yù)測U-box蛋白的亞細(xì)胞定位。
截取杜仲U-box家族基因蛋白質(zhì)序列中U-box保守結(jié)構(gòu)域,采用Clustalx 1.83軟件進(jìn)行多序列聯(lián)配比對(duì)分析。
利用MEGA 7.0軟件生成杜仲U-box蛋白質(zhì)進(jìn)化樹Newick文件,利用杜仲U-box基因序列ID獲得對(duì)應(yīng)基因序列和轉(zhuǎn)錄本序列,將U-box基因序列、轉(zhuǎn)錄本序列和進(jìn)化樹Newick文件上傳至在線工具GSDS 2.0(http://gsds.cbi.pku.edu.cn/index.php)作圖。
將杜仲和擬南芥U-box蛋白質(zhì)序列構(gòu)建本地fast文件,采用MEGA 7.0程序的進(jìn)化距離鄰接法(Neighbor-Joining,NJ)構(gòu)建系統(tǒng)進(jìn)化樹,生成進(jìn)化樹Newick文件后采用在線工具iTOL(http://itol.embl.de/upload.cgi)作圖。同樣的方法生成杜仲與三葉橡膠U-box蛋白的系統(tǒng)進(jìn)化樹。
利用在線工具M(jìn)EME(http://meme-suite.org/tools/meme)進(jìn)行Motif 檢索,將得到的 Motif 結(jié)構(gòu)基序采用 InterPro(http://www.ebi.ac.uk/interpro/)進(jìn)一步驗(yàn)證其功能。
杜仲材料取自農(nóng)業(yè)生物工程研究院轉(zhuǎn)基因示范基地,于11月份采集雌雄株葉片、枝條以及果實(shí),液氮速凍,-80 ℃冰箱保存?zhèn)溆?。每組材料3個(gè)生物學(xué)重復(fù)。
采用TRIzol RNA法提取植物總RNA,用PrimeScriptTMRT reagent Kit with gDNA Eraser(Perfect Real Time)(TaKaRa, #RR 047 A))試劑盒,將RNA反轉(zhuǎn)錄為cDNA。Prime 3設(shè)計(jì)引物(見表1),內(nèi)參為杜仲EF1α[15],使用Luna?Universal qPCR Master Mix(NEB)熒光染料在CFX ConnectTM熒光定量 PCR 儀進(jìn)行表達(dá)量分析。反應(yīng)程序?yàn)椋?5 ℃ 3 min,95 ℃ 10 s,55 ℃ 20 s,72 ℃ 20 s,75 ℃ 5 s,共40個(gè)循環(huán)。每個(gè)處理3次重復(fù)。用SPSS軟件進(jìn)行顯著性分析(*表示差異顯著(p<0.05),**表示差異極顯著(p<0.01))。
表1 q-PCR引物序列
經(jīng)SMART軟件分析,去除不含典型U-box結(jié)構(gòu)域的序列,從杜仲基因組中鑒定到40個(gè)U-box基因,其U-box結(jié)構(gòu)域的氨基酸數(shù)目在55~67個(gè)之間,其中24個(gè)U-box蛋白的U-box保守結(jié)構(gòu)域含有63個(gè)氨基酸。此外,其中21個(gè)U-box蛋白除了含U-box結(jié)構(gòu)域以外,還含有PLN 03200 superfamily、Arm/Arm_2 superfamily、WD 40 superfamily、STK_N、Rho_N、KAP superfamily的結(jié)構(gòu)域(表2)。
表2 杜仲U-box基因家族的信息
根據(jù)基因家族成員所含其他結(jié)構(gòu)域的不同,將40個(gè)U-box蛋白分為 7類:第Ⅰ類蛋白只含有U-box結(jié)構(gòu)域,有19個(gè);第Ⅱ類蛋白含有PLN 03200 superfamily結(jié)構(gòu)域,有9個(gè);第Ⅲ類蛋白含有Arm/Arm_2 superfamily結(jié)構(gòu)域,有6個(gè);第 Ⅳ類蛋白含有WD 40 superfamily結(jié)構(gòu)域,有2個(gè);第Ⅴ類蛋白含有STK_N結(jié)構(gòu)域,有2個(gè);第Ⅵ類蛋白含有Rho_N結(jié)構(gòu)域、第Ⅶ類蛋白是含有KAP superfamily,同樣都只有1個(gè)成員。
通過ExPASy在線工具預(yù)測,最長的U-box蛋白(GWHPAAAL 018368)有1 486個(gè)氨基酸,分子量為165.1 kD,最短的U-box蛋白(GWHPAAAL 019556)有327個(gè)氨基酸,分子量為36.51 kD。等電點(diǎn)從5.16(GWHPAAAL 017730)到9.34(GWHPAAAL 005414),其中酸性蛋白質(zhì)21個(gè),堿性蛋白質(zhì)19個(gè)。親疏水性統(tǒng)計(jì)發(fā)現(xiàn)27個(gè)杜仲U-box蛋白為親水性(GRAVY<0),13個(gè)杜仲U-box蛋白為疏水性(GRAVY>0),其中親水性最強(qiáng)的(GWHPAAAL 022717)GRAVY值為-0.569,疏水性最強(qiáng)的(GWHPAAAL 025015)GRAVY值為0.14。
利用Wolfpsort在線工具對(duì)杜仲U-box家族成員進(jìn)行亞細(xì)胞定位預(yù)測,結(jié)果顯示該基因家族成員位于細(xì)胞的不同位置,主要位于細(xì)胞核、葉綠體、細(xì)胞質(zhì)。
利用GSDS軟件分析U-box成員的基因特征,結(jié)果發(fā)現(xiàn)杜仲U-box成員之間基因結(jié)構(gòu)存在很大的差異,CAD序列最長(GWHPAAAL018368)為4 458 bp,最短(GWHPAAAL019556)為981 bp。外顯子數(shù)目為1~14個(gè),其中僅含一個(gè)外顯子的U-box基因有18個(gè)(圖1)。
采用Clustalx 1.83軟件對(duì) 40個(gè)杜仲U-box基因家族中U-box保守結(jié)構(gòu)域進(jìn)行多序列聯(lián)配比對(duì)分析。結(jié)果顯示杜仲U-box保守結(jié)構(gòu)域有多個(gè)氨基酸高度保守,如脯氨酸(Pro)、半胱氨酸(Cys)、甲硫氨酸(Met)、天冬氨酸(Asp)、甘氨酸(Gly)、蘇氨酸(Thr)、精氨酸(Arg)、異亮氨酸(Ile)、色氨酸(Trp)、天冬酰胺(Asn),這些保守氨基酸對(duì)穩(wěn)定U-box保守結(jié)構(gòu)域起著關(guān)鍵作用(見圖2)。
通過MEME在線工具分析杜仲U-box蛋白獲得10個(gè)Motif 結(jié)構(gòu)基序。經(jīng) Inter Pro工具分析發(fā)現(xiàn),Motif 1、Motif 2、Motif 4和 Motif 9的數(shù)量最多,是杜仲U-box蛋白最常見 Motif 結(jié)構(gòu)基序,其中Motif 1、Motif 2和 Motif 4 對(duì)維持U-box 蛋白結(jié)構(gòu)是必不可少的(表3和圖3)。Motif 9具有結(jié)合蛋白質(zhì)功能,是ARM保守結(jié)構(gòu)域的組成部分,而U-box-ARM型一般都具有依賴于U-box功能域的E 3泛素連接酶活性,參與泛素/26 S蛋白酶復(fù)合體途徑介導(dǎo)的蛋白降解。
表3 杜仲U-box蛋白最常見Motif 特征
為了進(jìn)一步研究杜仲U-box蛋白的系統(tǒng)進(jìn)化,對(duì)杜仲(40個(gè))分別與擬南芥(71個(gè))和三葉橡膠(51個(gè))的U-box蛋白構(gòu)建系統(tǒng)進(jìn)化樹。結(jié)果表明,杜仲U-box基因間的遺傳距離較接近,如同一個(gè)分支上的GWHPAAAL008984、GWHPAAAL011256、GWHPAAAL011401和GWHPAAAL025939,推測可能來自于同一個(gè)祖先。同樣擬南芥和三葉橡膠的U-box基因家族也有類似的情況(圖4)。
選取杜仲U-box基因家族中U-box-Arm結(jié)構(gòu)域的6個(gè)成員進(jìn)行組織特性表達(dá)分析。結(jié)果表明,在杜仲雌株莖、葉、果和雄株莖、葉中各基因均有表達(dá),其中GWHPAAAL022027在雌株葉、果中表達(dá)較高,GWHPAAAL025437在雄株莖、雌株莖和果中表達(dá)較高,由于U-box-Arm結(jié)構(gòu)域大多與泛素化修飾有關(guān),因此推測泛素化修飾作用參與到杜仲生長發(fā)育的各個(gè)階段(圖5)。
泛素連接酶E 3是泛素蛋白降解途徑中決定底物特異性的重要因子,在擬南芥1 200多個(gè)泛素連接酶E 3中,U-box結(jié)構(gòu)域類的泛素連接酶E 3是具有重要功能的一類[16-18]。目前已鑒定了多個(gè)植物的U-box蛋白。本研究通過生物信息學(xué)方法鑒定獲得了40個(gè)典型的杜仲U-box結(jié)構(gòu)基因家族成員,同時(shí)還分析獲得70個(gè)擬南芥U-box基因家族和51個(gè)三葉橡膠U-box基因家族,其中擬南芥U-box基因家族成員比之前報(bào)道的64個(gè)還多6個(gè)。杜仲U-box基因家族的蛋白質(zhì)大小在36.51~165.1 kD,等電點(diǎn)在5.16~9.34之間,家族成員間的差異較大。亞細(xì)胞定位顯示該基因家族成員主要位于細(xì)胞核、葉綠體、細(xì)胞質(zhì)。此外,由于基因組數(shù)據(jù)為Scaffod版本,因而沒有作染色體定位分析。
根據(jù)家族成員除U-box結(jié)構(gòu)域以外的結(jié)構(gòu)域,將40個(gè)U-box蛋白劃分成7類,僅含U-box結(jié)構(gòu)的成員在杜仲中最多,有17個(gè)。而在植物中研究較多的U-box-Arm結(jié)構(gòu)在杜仲中為第三大類。研究表明,Arm功能域主要參與蛋白-蛋白間的相互作用,在細(xì)胞內(nèi)信號(hào)傳遞、細(xì)胞骨架調(diào)控、核輸入和轉(zhuǎn)錄調(diào)控等過程中起作用[19],而U-box蛋白大多數(shù)都具有E 3泛素連接酶的活性,參與泛素/26 S蛋白酶復(fù)合體的降解過程[20]。U-box和Arm結(jié)合起來共同完成E 3連接酶的功能。U-box基因參與葉、花、果、莖等的生長發(fā)育[21-22]。U-box-Arm結(jié)構(gòu)的基因家族成員在杜仲雌雄株葉、莖、果中均有表達(dá),但表達(dá)高低有很大差異,證明該結(jié)構(gòu)的基因家族成員在組織中發(fā)揮著不同的功能。
綜上,本研究篩選鑒定了40個(gè)U-box蛋白,根據(jù)含有的不同結(jié)構(gòu)域?qū)⑵浞譃?類,其中U-box-Arm蛋白有6個(gè)。通過Real-time分析,U-box-Arm蛋白具有組織特異性。這些結(jié)果為進(jìn)一步研究U-box蛋白在杜仲生長發(fā)育等的作用機(jī)制提供了參考數(shù)據(jù)。