陳 鑫,李然紅,劉 丹,王立鳳
(牡丹江師范學院,黑龍江 牡丹江 157012)
狗棗獼猴桃〔Actinidiakolomikta(Maxim.et Rupr.) Maxim.〕,別名狗棗子,大型落葉藤本植物,主要分布于我國東北、河北、云南等地。狗棗獼猴桃是最耐寒的獼猴桃品種之一,為良好的抗寒育種資源,其在生長發(fā)育過程中葉片顏色會發(fā)生動態(tài)變化,形成白、粉、淺紅和淺綠的斑狀彩葉,其果實柔軟多汁、酸甜可口、富含維生素C,是一種藥食觀賞兼用植物[1-3]。鋅指蛋白(zinc finger proteins,ZFP)是指含有通過結(jié)合Zn2+可以自我折疊形成“手指”結(jié)構(gòu)的一類蛋白質(zhì),主要由半胱氨酸和組氨酸殘基與Zn2+結(jié)合成立體結(jié)構(gòu)[4]。研究發(fā)現(xiàn)[5],鋅指蛋白參與植物的生長發(fā)育、逆境脅迫應(yīng)答等功能,并廣泛存在于動植物和微生物中。WU等[6-7]研究表明,ZFP可以激活水稻種子中赤霉素(GA)合成基因表達,從而打破種子休眠,提高發(fā)芽率,ZFP8通過調(diào)節(jié)細胞分裂素(CK)的信號傳導,能夠促進擬南芥的細胞分化,促進植株生長。ZFP能夠在低溫、干旱、鹽堿等脅迫環(huán)境中發(fā)揮重要作用,番茄、枳、煙草、大豆中的鋅指蛋白ZFP均在逆境環(huán)境中大量表達,巨桉的EgrZFP6能夠參與脅迫響應(yīng)的負調(diào)控,提高植物對低溫的敏感性[8-10]。有關(guān)狗棗獼猴桃ZFP基因的研究國內(nèi)尚未見報道。因此,筆者以狗棗獼猴桃轉(zhuǎn)錄組數(shù)據(jù)為參考,篩選到鋅指蛋白的cDNA序列,利用生物信息學方法對其理化性質(zhì)、疏水性/親水性、蛋白結(jié)構(gòu)功能域、二級結(jié)構(gòu)、三級結(jié)構(gòu)、蛋白質(zhì)修飾位點及同源性等方面進行預(yù)測和分析,以期為狗棗獼猴桃ZFP蛋白功能研究提供參考。
狗棗獼猴桃鋅指蛋白cDNA序列從牡丹江師范學院植物遺傳育種課題組經(jīng)試劑盒提取植物總RNA,反轉(zhuǎn)錄后送測序公司獲得;胡桃(Juglansregia,XP_018811460.1)、葡萄(Vitisvinifera,XP_002278326.1)、羅布斯塔咖啡(Coffeacanephora,CDP13009.1)、小??Х?CoffeaArabica,XP_027084413.1)、蓖麻(Ricinuscommunis,XP_002519824.1)、木薯(Manihotesculenta,XP_021599867.1)、可可樹(Theobromacacao,XP_017972715.1)、胡楊(Populuseuphratica,XP_011028187.1)、毛果楊(Populustrichocarpa,XP_006385648.1)、黃燈籠辣椒(Capsicumchinense,PHU28666.1)、辣椒(Capsicumannuum,XP_016554111.1)、黃麻(Corchoruscapsularis,OMP11099.1)、漿果狀辣椒(Capsicumbaccatum,PHT58273.1)、土瓶草(Cephalotusfollicularis,GAV69097.1)、橙子(Citrussinensis,KDO42906.1)、橡膠樹(Heveabrasiliensis,XP_021679968.1)、番木瓜(Caricapapaya,XP_021912676.1)、榴蓮(Duriozibethinus,XP_022772370.1)、水芙蓉(Nelumbonucifera,XP_010269999.1)、中華獼猴桃原變種(Actinidiachinensisvar.chinensis,PSS11627.1)等植物氨基酸序列在NCBI數(shù)據(jù)庫中下載。
狗棗獼猴桃AkZFP的理化性質(zhì)用ProtParam(https://web.expasy.org/cgi-bin/protparam/ protparam)進行分析;NCBI-CDD進行保守結(jié)構(gòu)域及蛋白家族預(yù)測(https://www.ncbi.nlm.nih.gov/Structure/cdd/);Inter-ProtScan(http://www.ebi.ac.uk/ interpro/search/sequence-search)預(yù)測功能位點;NetNGlyc(http://www.cbs.dtu.dk /services/NetNGlyc/)對N-糖基化位點進行預(yù)測;NetOGlyc(http://www.cbs.dtu.dk/ services/NetOGlyc/)對O-糖基化位點進行預(yù)測;采用SOPMA及PredictProtein 數(shù)據(jù)庫(https://www.predictprotein.org/)對AkZFP進行二級結(jié)構(gòu)及蛋白質(zhì)修飾位點預(yù)測;使用 SWISS-MODEL(http://swissmodel.Expasy.org/)在線軟件預(yù)測蛋白質(zhì)三級結(jié)構(gòu)。從NCBI(https://www.ncbi.nlm.nih.gov/)數(shù)據(jù)庫中獲得20條不同植物的ZFP氨基酸序列信息,利用MEGA5.1軟件的Neighbor-joining法構(gòu)建蛋白質(zhì)系統(tǒng)進化樹。
經(jīng)分析表明,AkZFP基因cDNA全長為788 bp,編碼區(qū)(CDS)為cDNA上第56~733個堿基,共編碼226個氨基酸,分子量24 778.46 Da,理論等電點為5.61,負電荷殘基總數(shù)(Asp+Glu)為21,正電荷殘基總數(shù)(Arg+Lys)為13,分子式為C1082H1649N309O342S10,總原子數(shù)3 392,不穩(wěn)定指數(shù)(instability index,Ⅱ)為51.78,脂肪系數(shù)(Aliphatic index)為64.03,親水性(GRAVY)的平均水平為-0.549,說明該蛋白為親水非穩(wěn)定性蛋白。該蛋白中含量最多的為絲氨酸,占11.5%;其次為脯氨酸和亮氨酸,各占10.2%和9.3%;含量最少的為賴氨酸、蛋氨酸、色氨酸、酪氨酸和纈氨酸,均為1.8%(圖1),吡咯賴氨酸及硒半胱氨酸含量為0。通過ProtScale軟件分析預(yù)測(圖2),該基因蛋白的整個肽鏈中均含有親水性和疏水性氨基酸,得分最大值為1.689,在119個氨基酸處;最小值為-3.122,在第203個氨基酸處。從整體分布看,氨基酸的負值多且分值大,根據(jù)蛋白質(zhì)親水和疏水的得分判定該蛋白為親水蛋白。
圖1 狗棗獼猴桃ZPF基因編碼蛋白質(zhì)的氨基酸組成
Fig.1 Amino acid compositions of protein encoded by theZPFgene ofA.kolomikta
圖2 AkZFP的親水/疏水性
Fig.2 Hydrophilicity/hydrophobicity of AkZFP
經(jīng)SignalP-4.1預(yù)測(圖3),AkZFP蛋白不含信號肽,同時不存在跨膜結(jié)構(gòu)。
注:C值,S值和Y值分別是原始剪切位點、信號肽和綜合剪切位點的分值。
Note:The C value,S value and Y value were the scores of original shear site,signal peptide and comprehensive shear site respectively.
圖3 AkZFP蛋白信號肽及跨膜結(jié)構(gòu)
Fig.3 Signal peptide and transmembranne domain of AkZFP
經(jīng)對AkZFP保守序列及蛋白家族預(yù)測表明(圖4),AkZFP是ZFP基因家族的ZF-C2H2-6成員,其第76~100氨基酸的序列區(qū)域為ZFP6組的保守結(jié)構(gòu)域。
圖4 AkZFP蛋白的保守序列
Fig.4 Conservative protein sequence of AkZFP
經(jīng)對AkZFP的二級結(jié)構(gòu)進行預(yù)測(圖5),該蛋白21.68%可能會形成螺旋,12.83%可能形成延伸鏈,2.65%可能形成轉(zhuǎn)角,62.83%為無規(guī)卷曲,無二硫鍵的形成和特殊的二級結(jié)構(gòu)。用SWISS-MODEL對AkZFP蛋白進行三級結(jié)構(gòu)預(yù)測,結(jié)果(圖6)顯示,AkZFP的功能結(jié)構(gòu)域在第73~105個氨基酸上,同時含有QALGGH手指結(jié)構(gòu)。
圖5 AkZFP蛋白的二級結(jié)構(gòu)預(yù)測
Fig.5 Secondary structure prediction of AkZFP protein
圖6 AkZFP蛋白的三級結(jié)構(gòu)預(yù)測
Fig.6 Tertiary structure prediction of AkZFP protein
經(jīng)預(yù)測,該蛋白內(nèi)有5個潛在的N-糖基化位點,分別在15(NISH)、30(NPSY)、162(NKSL)、183(NSSL)及203(NHTN)氨基酸處。NetOGlyc4.0 server對O-糖基化位點進行預(yù)測,預(yù)測分數(shù)均大于0.5的認為是陽性,故推測該蛋白內(nèi)含23個O-糖基化位點。AkZFP含有4個糖基化位點(N-glycosylation site)分別在第15個、162個、183個、203個氨基酸處,1個酪蛋白磷酸激酶II磷酸化位點(Casein kinase II phosphorylation site)在190個氨基酸處,1個十四烷酰化位點(N-myristoylation site)在92個氨基酸處,1個鋅指C2H2型結(jié)構(gòu)域(Zinc finger C2H2 type domain signature)序列在78個氨基酸處。
狗棗獼猴桃AkZFP氨基酸序列經(jīng)與NCBI數(shù)據(jù)庫中的20種植物氨基酸進行同源性比對表明,狗棗獼猴桃AkZFP與中華獼猴桃原變種親緣關(guān)系較近,而與羅布斯塔咖啡、蓖麻等植物親緣關(guān)系較遠(圖7)。
圖7 ZFP的系統(tǒng)進化樹
Fig.7 System phylogenetic tree of ZFP
鋅指蛋白直接或間接參與植物的生長發(fā)育、根系建成、逆境響應(yīng)及信號調(diào)節(jié)等生理生化過程。目前已經(jīng)從多種植物中克隆到ZFP基因包括擬南芥、大豆、小麥、水稻、矮牽牛等[11]。根據(jù)半胱氨酸和組氨酸殘基的數(shù)目和位置分為C2H2、C4、C6、C4HC3、C3HC4、C2HC、C3H等多種類型,在植物中具有高度保守基因序列QALGGH。試驗利用已測的狗棗獼猴桃轉(zhuǎn)錄組數(shù)據(jù),篩選出狗棗獼猴桃ZFP基因cDNA序列信息,并對其進行了生物信息學分析。結(jié)果表明:ZFP基因cDNA全長為788 bp,編碼區(qū)(CDS)為cDNA上第56~733個堿基,共編碼226個氨基酸,是ZFP-6(PFAM13912)家族的一員,C2H2型,包含1個QALGGH保守序列,屬于親水性、非穩(wěn)定的蛋白,蛋白中絲氨酸、脯氨酸和亮氨酸含量較高,沒有跨膜結(jié)構(gòu)。AkZFP在NCBI數(shù)據(jù)庫中進行BLAST,顯示與狗棗獼猴桃ZFP相比序列中,一致性最高的為90.32%,最低的為44.18%。選取20種植物的氨基酸序列與AkZFP進行比對得出,AkZFP與中華獼猴桃原變種親緣關(guān)系較近,而與羅布斯塔咖啡、蓖麻等植物親緣關(guān)系較遠。為進一步研究狗棗獼猴桃鋅指蛋白基因功能提供了一定的理論基礎(chǔ)。