陳倩玲,何亞鵬,張引弟,趙 航,王雪怡,張小雪
(甘肅農(nóng)業(yè)大學(xué)動(dòng)物科學(xué)技術(shù)學(xué)院,甘肅 蘭州 730070)
核糖體是催化蛋白質(zhì)合成的細(xì)胞器,由1 個(gè)小的40S 亞基和1 個(gè)大的60S 亞基組成。這些亞基由4 種RNA 和大約80 種結(jié)構(gòu)不同的蛋白質(zhì)組成,核糖體蛋白(ribosomal protein,RP)即所有核糖體蛋白質(zhì)組成部分的統(tǒng)稱。RPS20基因是一類參與蛋白質(zhì)生物合成及對(duì)細(xì)胞增殖、分裂、分化、凋亡具有調(diào)控作用的基因[1],RPS20基因編碼的核糖體蛋白是40S 亞基的組成部分,該蛋白屬于核糖體蛋白的S10P 家族,它位于細(xì)胞質(zhì)中。RPS20基因作為核糖體蛋白編碼基因的典型,有多個(gè)加工過的假基因分散在基因組中[2]。有研究表明,RPS20基因RNA 干擾序列成功構(gòu)建包裝干擾慢病毒轉(zhuǎn)染后能有效抑制小鼠結(jié)腸腺癌細(xì)胞(CT26)的生長[3-4]。RPS20基因在豬繁殖與呼吸綜合征病毒復(fù)制中有一定作用[5]。此外,在篩選與豬腦心肌炎病毒(EMCV)VP1 蛋白相互作用的宿主蛋白時(shí)發(fā)現(xiàn),VP1 和RPS20 蛋白之間存在特異性相互作用[6]。對(duì)大鼠RPS20基因的體外功能研究結(jié)果初步表明,核糖體蛋白基因在脾虛證發(fā)生發(fā)展過程中可能具有重要作用[7],對(duì)慢性淺表性胃炎脾氣虛證等患者進(jìn)行基因表達(dá)譜的分析結(jié)果表明,脾氣虛證具有蛋白質(zhì)合成相關(guān)基因下調(diào)的趨勢(shì),其中以核糖體蛋白基因下調(diào)比較顯著,選擇重復(fù)性表達(dá)下調(diào)的RPS20 對(duì)其進(jìn)行生物功能鑒定,RPS20 基因RNA 干擾后使得大鼠小腸上皮細(xì)胞(IEC-6)的形態(tài)結(jié)構(gòu)變化,細(xì)胞的增殖、分化能力,DNA 修復(fù)功能受到抑制,證明RPS20 基因?qū)Υ笫笮∧c上皮細(xì)胞的消化吸收和粘膜損傷修復(fù)功能起重要作用[7-11],與脾氣虛證患者消化吸收功能下降、黏膜損傷修復(fù)能力下降等表現(xiàn)相符合。有關(guān)RPS20 基因及其編碼產(chǎn)物的研究主要是在人類和小鼠上,而在綿羊上的研究比較少。我們通過檢索NCBI 數(shù)據(jù)庫中綿羊的RPS20 基因序列,利用生物信息學(xué)的方法研究了綿羊RPS20 基因及其編碼產(chǎn)物的序列、基本理化性質(zhì)、蛋白質(zhì)結(jié)構(gòu)和生物學(xué)功能等,以期為進(jìn)一步探究該基因的結(jié)構(gòu)和生物學(xué)功能提供參考。
序列均來源于NCBI 網(wǎng)站GenBank 數(shù)據(jù)庫,包括綿羊(XM_004011685.4,XP_004011734.1)、人(NM_001023.4,NP_001014.1)、兔子(NM_00125 3734.1,NP_001240663.1)、雞(XM_040664730.2,XP_040520664.1)、牛(NM_001034438.1,NP_0010 29610.1)、豬(NM_001129954.1,NP_001123426.1)、馬(XM_005613124.3,XP_005613181.1)、鵪鶉(XM_015855656.1,XP_015711142.1)、黑猩猩(XM_016959501.1,XP_016814990.1)、獅子(XM_042924174.1,XP_042780108.1)、野生雙峰駝(XM_032470290.1,XP_032326181.1)11 個(gè)物種的mRNA 序列和氨基酸序列,括號(hào)內(nèi)為GenBank 的登錄號(hào)。
綿羊RPS20 基因開放閱讀框(Open reading frame,ORF)分析采用NCBI 的ORF Finder 程序,基本理化性質(zhì)分析采用Bioedit 分析軟件。綿羊RPS20 蛋白亞細(xì)胞定位采用PSORTⅡ軟件,蛋白潛在信號(hào)肽剪切位點(diǎn)預(yù)測(cè)采用SignalP 3.0 軟件,蛋白跨膜螺旋區(qū)域預(yù)測(cè)采用TMHMM 程序,蛋白保守結(jié)構(gòu)域分析采用Smart 軟件,蛋白親疏水性分析采用Prot Scale 軟件。蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)采用Jpred 軟件,蛋白三級(jí)結(jié)構(gòu)預(yù)測(cè)采用Swiss-model軟件。多序列比對(duì)及同源性分析采用DNAMAN 軟件。
開放閱讀框(Open Reading Frame,ORF)是mRNA 上的一段堿基序列,起始于起始密碼子,結(jié)束于終止密碼子,1 個(gè)ORF 對(duì)應(yīng)1 個(gè)蛋白質(zhì)[12],通過ORF 分析可以證明新的DNA 序列是否能夠?yàn)樘囟ǖ牡鞍踪|(zhì)編碼基因。根據(jù)圖1 可知,該序列最大的開放閱讀框長度為360 bp(起始密碼子位于121 bp 處,終止密碼子位于480 bp 處),編碼了119 個(gè)氨基酸殘基。
圖1 綿羊RPS20 基因序列的ORF 分析
蛋白質(zhì)的基本性質(zhì)包括相對(duì)分子質(zhì)量、等電點(diǎn)pI、氨基酸組成、基因編碼產(chǎn)物的不穩(wěn)定指數(shù)和半衰期等[13]。利用Prot Param 在線工具和Bioedit 軟件對(duì)綿羊RPS20 基因編碼產(chǎn)物的理化性質(zhì)進(jìn)行分析,表明其編碼產(chǎn)物的分子式為C587H995N173O171S5,共含有1 931 個(gè)原子。該編碼產(chǎn)物有119 個(gè)氨基酸殘基數(shù),分子質(zhì)量為13.372 71 KDa,理論等電點(diǎn)pI 為9.95,可知綿羊RPS20 蛋白呈堿性。由圖2 可以看出綿羊RPS20 基因編碼的蛋白氨基酸組成。綿羊RPS20 基因編碼的蛋白中所含氨基酸種類豐富,其中含量最多的是Lys(賴氨酸),所占比例為10.92%;Ile(異亮氨酸)、Thr(蘇氨酸)含量較高,均為10.08%。綿羊RPS20基因編碼產(chǎn)物中不含Tyr(酪氨酸),負(fù)電荷殘基總數(shù)(Asp+Glu)為14,正電荷殘基總數(shù)(Arg+Lys)為23。所編碼產(chǎn)物在哺乳動(dòng)物體外的半衰期為30 h、不穩(wěn)定指數(shù)為32.28。根據(jù)不穩(wěn)定指數(shù)指標(biāo)(>40為不穩(wěn)定;<40 為穩(wěn)定),由于32.28<40.00 可以確定該蛋白屬于穩(wěn)定蛋白。
圖2 綿羊RPS20 基因編碼的蛋白氨基酸組成
從綿羊RPS20 基因蛋白亞細(xì)胞定位結(jié)果可知,綿羊RPS20 蛋白分布在細(xì)胞質(zhì)的可能性最大,為65.2%;分布在線粒體的可能性次之,為17.4%;分布在細(xì)胞核的可能性居第3 位,為13.0%;分布在過氧化物酶體的可能性最小,僅為4.3%。由此可以推斷,綿羊RPS20 基因編碼的產(chǎn)物主要是在細(xì)胞質(zhì)中發(fā)揮生物學(xué)作用。
采用DNAMAN 軟件將綿羊RPS20 蛋白序列與其他一些已發(fā)表的動(dòng)物如人、綿羊、兔子、雞、牛、鵪鶉、黑猩猩、獅子、馬、豬和野生雙峰駝11種動(dòng)物的氨基酸序列進(jìn)行多序列比對(duì)的結(jié)果(圖3、圖4)表明,RPS20 氨基酸序列同源性均為100%。由于RPS20基因的氨基酸序列較短,綿羊與人、牛、黑猩猩、野生雙峰駝等哺乳動(dòng)物的相似性較高。
圖3 11 個(gè)物種的RPS20 基因編碼產(chǎn)物序列的同源性分析
圖4 11 個(gè)物種的RPS20 基因編碼產(chǎn)物序列的同源樹
信號(hào)肽序列本質(zhì)上是蛋白質(zhì)序列中起始于N端的1 段特定氨基酸序列,在引導(dǎo)和轉(zhuǎn)運(yùn)跨膜蛋白和分泌蛋白方面發(fā)揮著重要作用。核糖體是蛋白質(zhì)合成的場(chǎng)所,信號(hào)肽在此合成過程中發(fā)揮重要作用[14-18]。從對(duì)綿羊RPS20 蛋白潛在信號(hào)肽剪切位點(diǎn)的預(yù)測(cè)可知,此基因編碼的產(chǎn)物是否在引導(dǎo)和轉(zhuǎn)運(yùn)跨膜蛋白和分泌蛋白方面發(fā)揮一定作用。從圖5 可以看出,綿羊RPS20 基因編碼產(chǎn)物的C值為0.084、Y 值為0.064、S 值為0.128。由此可知,RPS20 基因的編碼產(chǎn)物無跨膜區(qū),也不存在信號(hào)肽序列,即該蛋白不是分泌性蛋白,也不是跨膜蛋白,主要位于細(xì)胞質(zhì)內(nèi)。
圖5 綿羊RPS20 基因蛋白潛在信號(hào)肽剪切位點(diǎn)分析
采用TMHMM 在線軟件對(duì)于綿羊RPS20 蛋白跨膜螺旋結(jié)構(gòu)進(jìn)行分析預(yù)測(cè),結(jié)果表明綿羊RPS20 基因編碼的蛋白質(zhì)是非跨膜蛋白,即無跨膜結(jié)構(gòu)(圖6)。
圖6 綿羊RPS20 基因蛋白跨膜螺旋結(jié)構(gòu)分析
結(jié)構(gòu)域是蛋白質(zhì)中具有獨(dú)立三級(jí)結(jié)構(gòu)的部分,具有特定功能,因此也是蛋白質(zhì)功能單元。保守結(jié)構(gòu)域具有重要的功能,不能被改變,是基因的核心。由綿羊RPS20 蛋白潛在信號(hào)肽剪切位點(diǎn)預(yù)測(cè)可知,綿羊RPS20 基因編碼的蛋白是非跨膜蛋白。進(jìn)而通過Smart 軟件分析,如圖7 所示,綿羊RPS20 蛋白家族包括原核生物中的小核糖體亞基S10 和真核生物中的小核糖體亞基S20,由于序列較短,沒有跨膜結(jié)構(gòu),也沒有復(fù)雜的跨膜區(qū)域。
圖7 綿羊RPS20 蛋白保守結(jié)構(gòu)域分析
利用Prot Scale 軟件對(duì)綿羊RPS20 蛋白親疏水性分析,結(jié)果(圖8)顯示,該基因編碼蛋白疏水性的最大值為1.200,位于第113 位;最小值為-2.067,位于第75 位。該基因編碼的綿羊RPS20 蛋白屬于親水蛋白。
圖8 綿羊RPS20 基因編碼蛋白質(zhì)的疏水性/親水性預(yù)測(cè)分析
蛋白質(zhì)的高級(jí)結(jié)構(gòu),特別是二、三級(jí)結(jié)構(gòu)決定其生物學(xué)功能,其二級(jí)結(jié)構(gòu)(secondary structure)指的是在它的多肽鏈中具有規(guī)則重復(fù)的構(gòu)象[19],二級(jí)結(jié)構(gòu)是指蛋白質(zhì)第1 個(gè)水平的折疊,即部分蛋白質(zhì)鏈折疊形成一些通用結(jié)構(gòu),這些通用結(jié)構(gòu)在所有蛋白質(zhì)中都能找到[13]。通過Jpred 軟件分析可知(圖9),綿羊RPS20 蛋白二級(jí)結(jié)構(gòu)主要由無規(guī)卷曲結(jié)構(gòu)、α 螺旋和β 折疊三部分構(gòu)成,三者所占比例分別為44.54%、22.69%和32.77%。
圖9 綿羊RPS20 基因編碼蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)
三級(jí)結(jié)構(gòu)(tertiary structure)是指蛋白質(zhì)的多肽鏈在二級(jí)結(jié)構(gòu)甚至結(jié)構(gòu)域基礎(chǔ)上的進(jìn)一步盤繞、折疊,依靠次級(jí)鍵的維系固定形成的特定空間結(jié)構(gòu)[15,20]。通過Swiss-model 在線工具得到的空間構(gòu)象(圖10)可以看出,綿羊RPS20基因編碼蛋白的三級(jí)結(jié)構(gòu)主要由無規(guī)卷曲、α 螺旋和β 折疊盤曲折疊纏繞形成,與二級(jí)結(jié)構(gòu)的預(yù)測(cè)結(jié)果相符。
圖10 綿羊RPS20 基因編碼蛋白的三級(jí)結(jié)構(gòu)的分析結(jié)果
綿羊RPS20基因的最長ORF 長度是360 bp,編碼的氨基酸殘基數(shù)為119。必需氨基酸種類豐富,賴氨酸所占比例最多16.67%;相對(duì)分子質(zhì)量為13.372 71 KDa,理論等電點(diǎn)(pI)為9.95。RPS20基因編碼的產(chǎn)物是穩(wěn)定性強(qiáng)、富含親水氨基酸的非分泌蛋白,也是非跨膜蛋白,無跨膜區(qū)且不存在信號(hào)肽序列。亞細(xì)胞定位的結(jié)果顯示,綿羊RPS20 蛋白在細(xì)胞質(zhì)中發(fā)揮生物學(xué)作用的可能性最大,為65.2%;其次是在線粒體中,為17.4%。綿羊RPS20 蛋白在多種物種中氨基酸序列高度相似。綿羊RPS20基因編碼產(chǎn)物的二級(jí)結(jié)構(gòu)由無規(guī)卷曲、α 螺旋和β 折疊三部分組成,三級(jí)結(jié)構(gòu)亦由此三部分盤曲折疊纏繞形成。