人線粒體轉(zhuǎn)錄終止因子1(hMTERF1)蛋白的生物信息學分析
熊偉1,2,楊勇琴1,張海洋1,徐彤1,左紹遠1,余敏3
(1. 大理學院基礎醫(yī)學院,云南 大理 671000;
2.云南省昆蟲生物醫(yī)藥研發(fā)重點實驗室,云南 大理 671000;
3.云南大學生命科學學院,昆明 650091)
摘要:為了預測和分析人線粒體轉(zhuǎn)錄終止因子1(human mitochondrial transcription termination factor 1, hMTERF1)蛋白的結構與功能。采用生物信息學的方法對hMTERF1進行系統(tǒng)的分析與研究,包括hMTERF1的理化性質(zhì)、跨膜區(qū)和信號肽、亞細胞定位、二級結構功能域、蛋白質(zhì)的功能分類預測、多重序列比對與系統(tǒng)發(fā)育樹構建、三級結構建模。結果表明:hMTERF1蛋白分子量為45.78 kD,等電點為9.49,不具有信號肽和跨膜區(qū)。該蛋白定位于細胞線粒體,N端1~57個氨基酸為前導肽序列。其二級結構主要為螺旋和無規(guī)則卷曲,包含6個MTERF基序, 三級結構顯示結果與二級結構預測結果相符。蛋白質(zhì)多重序列比對和聚類分析顯示,hMTERF1蛋白與黑猩猩、大鼠、小鼠等哺乳動物的MTERF1蛋白具有高度同源性,在系統(tǒng)發(fā)育樹上聚為一簇。hMTERF1的生物信息學分析為進一步探索hMTERF1蛋白的功能提供參考資料和理論依據(jù)。
關鍵詞:人類;線粒體轉(zhuǎn)錄終止因子1;蛋白質(zhì);結構;生物信息學
中圖分類號:Q518.2 ; Q811.4文獻標志碼:A
收稿日期:2014-10-28;修回日期:2014-11-17.
作者簡介:操利超,男,碩士研究生,研究方向:生物數(shù)據(jù)分析;E-mail:caolichao@genomics.cn.
doi:10.3969/j.issn.1672-5565.2015.01.06
Bioinformatic analysis of human mitochondrial transcription
termination factor 1 (hMTERF1)
XIONG Wei1,2, YANG Yongqin1, ZHANG Haiyang1, XU Tong1, ZUO Shaoyuan1, YU Min3
(1.SchoolofBasicMedicalSciences,DaliUniversity,DaliYunnan671000,China;
2.YunnanProvincialKeyLaboratoryofEntomologicalBiopharmaceuticalR&D,DaliYunnan671000,China;
3.SchoolofLifeSciences,YunnanUniversity,Kuming650091,China)
Abstract:To study the structure and biological function of the human mitochondrial transcription termination factor 1 (hMTERF1). Many bioinformatics methods were used to analysis physical and chemical properties, hydrophobicity, transmembrane region, signal peptide, secondary structure, functional domain and assortment, multiple alignment, phylogenetic tree and three-dimensional structures of hMTERF1. The results showed that hMTERF1 was hydrophilic protein and the calculated molecular mass was 45.78 kD and the theoretical isoelectric point was 9.49. No signal peptide and transmembrane regions were found in the protein. hMTERF1 was localized in human mitochodria, and the N-terminal 1~57 amino acids were transit peptide. Main composition of the protein secondary structure were -helix and random coil, and it contains 6 MTERF motif. The three-demensional structure prediction showed similar results with secondary structure prediction. The multiple alignment and clustering analysis showed that hMTERF1 is an orthologous protein belong to MTERF family, and has high similarity to Pongo pygmaeus, Rattus norvegicus, and Mus musculus MTERF1. The bioinformatic analysis will be helpful for the further study of the function of hMTERF1.
Keywords:Homo Sapiens; Mitochondrial transcription termination factor 1; Protein; Structure; Bioinformatics
人線粒體轉(zhuǎn)錄終止因子1(human mitochondrial transcription termination factor 1,hMTERF1)是MTERF蛋白家族中發(fā)現(xiàn)最早,研究最深入的一個蛋白質(zhì)。1989年Kruse等在人類細胞中分離純化到一個促進線粒體DNA轉(zhuǎn)錄終止的DNA結合蛋白,該蛋白質(zhì)與線粒體DNA上16S rRNA基因與RNALeu(UUR)基因分界處的一段28bp序列特異結合,從而提前終止線粒體重鏈基因的轉(zhuǎn)錄[1]。1993年Daga等人將這一蛋白命名為線粒體轉(zhuǎn)錄終止因子[2]。近年來由于人們陸續(xù)在人類和其它物種中又發(fā)現(xiàn)了其它新的高度同源的蛋白質(zhì),如MTERF2、MTERF3和MTERF4,因此現(xiàn)在普遍將該蛋白稱為MTERF1[3-5]。
MTERF蛋白家族共有4個成員,廣泛存在于后生動物和植物中,但目前還沒有在真菌中發(fā)現(xiàn)同源蛋白質(zhì)[6-7]。隨著人們對線粒體轉(zhuǎn)錄調(diào)控機制和人類線粒體遺傳病的深入研究,線粒體轉(zhuǎn)錄終止因子蛋白家族的研究越來越引起人們的重視。研究表明,MTERF1存在于人類、猩猩、大鼠和小鼠等哺乳動物中,參與細胞許多重要的生理過程,如線粒體基因復制和轉(zhuǎn)錄調(diào)控、氧化磷酸化活性調(diào)節(jié)、細胞周期調(diào)控、細胞增殖與凋亡等,并在其中發(fā)揮重要的作用[8-12]。
目前已經(jīng)確定hMTERF1基因位于人類第7號染色體7q21.2,含有5個外顯子和4個內(nèi)含子,全長cDNA序列為1 968 bp,編碼一個由399個氨基酸組成的蛋白質(zhì)[3-5]。在本研究中,我們利用生物信息學方法和工具對hMTERF1蛋白序列進行系統(tǒng)的預測和研究,通過美國國立生物技術信息中心(National Center of Biotechnology Information, NCBI)數(shù)據(jù)庫和全球蛋白資源數(shù)據(jù)庫(Unified Protein Database, Uniprot)蛋白數(shù)據(jù)庫中檢索到的人類和其它物種MTERF1蛋白數(shù)據(jù),分析hMTERF1蛋白的氨基酸組成、理化性質(zhì)、二級結構、功能結構域和三級結構等信息,同時對不同物種的MTERF1蛋白序列進行多重序列比對并構建分子進化樹,以期為今后進一步研究該蛋白的功能提供生物信息學參考和理論依據(jù)。
1材料與方法
1.1材料
數(shù)據(jù)資料來源于國際互聯(lián)網(wǎng)上NCBI和Uniprot蛋白質(zhì)數(shù)據(jù)庫中已經(jīng)注冊的不同物種MTERF1的核酸及其氨基酸序列(見表1)。
表1 系統(tǒng)發(fā)育分析所用的不同物種 MTERF1基因序列的登錄號
1.2方法
hMTERF1蛋白的理化性質(zhì)采用Protparam tool軟件預測;親水性/疏水性采用ProtScale tool軟件進行預測,氨基酸分值參數(shù)選用HpHob./Kyte and Doolittle;跨膜區(qū)域使用TMHMM Server 2.0軟件進行預測;信號肽采用SignalP 4.1 Server軟件預測;蛋白質(zhì)亞細胞定位采用TargetP軟件、WoLFPSORT軟件和PSORT WWW Server中的iPSORT prediction工具進行分析;蛋白質(zhì)功能分類采用ProtFun 2.2 Server軟件進行預測;二級結構分別采用SOPMA、GOR IV和PSIPRED軟件進行分析;結構功能域采用SMART軟件預測;三級結構預測采用SWISS-MODEL軟件進行同源建模;多重序列比對采用Vector NTI 11.0軟件進行;系統(tǒng)發(fā)育樹構建采用MEGA 5.0軟件進行。各在線分析軟件的網(wǎng)站見表2。
表2 生物信息學研究的數(shù)據(jù)庫和軟件網(wǎng)站
2結果與分析
2.1hMTERF1蛋白的理化性質(zhì)
在GenBank注冊的hMTERF1基因包括1 200 bp的開放閱讀框(Open reading frame, ORF),編碼1個由399個氨基酸組成的蛋白質(zhì)。采用Protparam tool軟件預測hMTERF1蛋白的理化性質(zhì),推測該蛋白的分子式為C2 047H3 295N563O588S18,等電點為9.49,相對分子量為45.78,不穩(wěn)點參數(shù)54.27,根據(jù)不穩(wěn)定參數(shù)的數(shù)值在40以下才是穩(wěn)定蛋白的標準,可推定hMTERF1為不穩(wěn)定蛋白[13]。軟件預測該蛋白在體外環(huán)境下的半衰期為30小時。通過分析該基因編碼的氨基酸發(fā)現(xiàn),hMTERF1蛋白由20種氨基酸組成,Leu、Ser和Asn的含量較多,其中Leu的含量高達13.30%。相對含量較少的氨基酸為His和Trp。帶正電荷的氨基酸殘基(Arg+Lys)總數(shù)為57個,帶負電荷的氨基酸殘基(Asp+Glu)為41個(見圖1)。疏水性平均系數(shù)(Grand average of hydropathicity, GRAVY)為-0.201,預測該蛋白為親水性蛋白。
圖1 hMTERF1蛋白的氨基酸組成分析
2.2hMTERF1蛋白的跨膜區(qū)域與信號肽分析
蛋白質(zhì)的跨膜區(qū)域主要是膜內(nèi)在蛋白和細胞膜的膜脂相結合的部位。利用TMHMM Server v2.0在線軟件對hMTERF1蛋白的跨膜區(qū)域分析,結果顯示,該蛋白質(zhì)的跨膜螺旋數(shù)量(Number of predicted TMHs)為0,這說明hMTERF1不是跨膜蛋白質(zhì),細胞質(zhì)合成后直接運輸?shù)骄€粒體內(nèi)發(fā)揮作用,與實驗報道的hMTERF1蛋白質(zhì)功能相吻合[3](見圖2)。
SignalP是一個信號肽及其剪切位點的預測工具,它采用一個神經(jīng)網(wǎng)絡來區(qū)分信號肽和費信號肽,另一個神經(jīng)網(wǎng)絡來識別剪切位點。C值是信號肽酶切位點分值,S值是信號肽分值,Y值是由C值和S值綜合得出的剪切位點分值,用于更精確地確定信號肽酶切位點[14]。使用SignalP 4.1 Server在線軟件預測mean S score值為0.162,依據(jù)mean S score>0.5才能判斷為分泌蛋白質(zhì)的標準,推測hMTERF1蛋白不具有信號肽,這同樣說明它是一種在細胞內(nèi)發(fā)揮生理作用的蛋白質(zhì)(見圖3)。
圖2 hMTERF1蛋白跨膜域分析
圖3 hMTERF1蛋白信號肽分析
2.3hMTERF1蛋白親水性/疏水性預測和分析
親水性/疏水性預測和分析對于進一步預測蛋白質(zhì)的二級結構和結構功能域具有重要的生物學意義,采用ProtScale tool軟件進行親水性/疏水性預測,結果表明,hMTERF1蛋白中親水性氨基酸占69.98%,而疏水性氨基酸占25.96%,蛋白質(zhì)第274位氨基酸最大分值為2.244,蛋白質(zhì)第387位氨基酸最小分值為-2.322(見圖4)。依據(jù)氨基酸分值越低,親水性越強的規(guī)律,可推測hMTERF1是親水性蛋白,從整體來看,親水性氨基酸數(shù)量多于疏水性氨基酸,且均勻分布在整個肽鏈中[15]。
圖4 hMTERF1蛋白親水性/疏水性預測結果
注:參數(shù)選用Hphob/Kyte & Doolittle。
Notes:parameter: Hphob/Kyte & Doolittle.
2.4hMTERF1蛋白二級結構預測與分析
蛋白質(zhì)二級結構主要指蛋白質(zhì)分子中主鏈骨架原子依賴氫鍵排列在一維方向上具有周期性的構象,對其進行預測與分析,將有助于認識蛋白質(zhì)的高級結構。分別采用SOPMA、GOR IV和PSIPRED軟件進行分析,預測的結果非常相似。GOR IV和SOPMA算法是目前常用的蛋白質(zhì)二級結構算法,具有較高的預測精度,2個不同方法預測hMTERF1蛋白二級結構的結果均表明,hMTERF1蛋白質(zhì)由42.61%的-螺旋(alpha helix)、14.29%的延伸鏈(extended strand)、43.11%的無規(guī)則卷曲(random coil)構成(見圖5)。圖中豎線由長至短依次表示-螺旋、延伸鏈和無規(guī)則卷曲,可見-螺旋和無規(guī)則卷曲是該蛋白質(zhì)二級結構的主要構成元件,延伸鏈出現(xiàn)在局部肽鏈,且沒有-轉(zhuǎn)角(beta-turn)出現(xiàn)。
圖5 hMTERF1蛋白二級結構柱狀圖
2.5hMTERF1蛋白結構功能域的預測
結構功能域是指生物大分子中具有特異結構與獨立功能的區(qū)域,特別是指蛋白質(zhì)中這樣的區(qū)域。用SMART在線軟件預測hMTERF1蛋白的結構功能域,結果表明,該蛋白質(zhì)位于171~179,337~348的區(qū)域為2個低復雜度區(qū)域(low complexity region),在位于122~152,157~189,194~224,235~266,311~341,342~372的區(qū)域分別存在6個MTERF基序,每個基序由大約30個左右的氨基酸殘基組成(見圖6)。
圖6 hMTERF1氨基酸序列結構功能域分析
2.6hMTERF1蛋白的亞細胞定位和功能分類
分別使用WoLFPSORT軟件和PSORT WWW Server中的iPSORT Prediction工具對hMTERF1蛋白質(zhì)進行細胞定位,兩個不同軟件的分析結果均表明hMTERF1蛋白定位于細胞線粒體中,蛋白質(zhì)N端的1~57個氨基酸是其進入線粒體的前導肽序列。另外,采用TargerP軟件預測hMTERF1蛋白亞細胞定位,結果同樣顯示該蛋白質(zhì)定位于線粒體。
采用ProtFun軟件對hMTERF1蛋白進行功能分類,基因功能分類(Functional category)顯示該蛋白可能是轉(zhuǎn)運和結合蛋白質(zhì)(Transport and binding), 基因本體分類(Gene Ontology category)進一步提示該蛋白是一種轉(zhuǎn)錄調(diào)控因子(Transcription factor),與實驗研究報道的hMTERF1蛋白的功能相符[3,8]。此外,預測結果還顯示hMTERF1蛋白不具有酶活性(見圖7)。
圖7 hMTERF1蛋白的功能分類
2.7多重序列比對與構建系統(tǒng)發(fā)育樹
選取人(Homo Sapiens)、猩猩(Pongoabelii)、大鼠(Rattusnorvegicus)、小鼠(Musmusculus)和金娃娃(Tetraodonnigroviridis)5個物種的直系同源MTERF1蛋白質(zhì)的氨基酸序列, 通過MEGA6.05軟件,分別使用鄰接法(Neighbor joining method)、最大似然法(Maximum likelihood method)和最大簡約法(Maximum parsimony method)構建系統(tǒng)發(fā)育樹,結果顯示3種方法構建的發(fā)育樹沒有大的差異,說明該蛋白質(zhì)在不同物種的系統(tǒng)發(fā)育樹構建正確(見圖8)。分析發(fā)現(xiàn)人類與猩猩的MTERF1為一個分支類群,大鼠和小鼠的MTERF1為一個分支類群,而金娃娃MTERF1則形成另外一個分支,這與物種之間的親緣關系和進化關系是一致的[16]。通過Vector NTI11.0軟件進行多重序列比對,結果表明這些氨基酸序列具有高度同源的特點,一致性達到76.41%,尤其表現(xiàn)在某些高度保守結構域的氨基酸序列完全一致(見圖9)。通過序列比對還發(fā)現(xiàn),hMTERF1與猩猩MTERF1蛋白之間一致性達到98.75%,說明二者的親緣關系最近。
圖8 MTERF1蛋白的系統(tǒng)發(fā)育樹
圖9 5個不同物種MTERF1直系同源蛋白的氨基酸序列多重比對
2.8hMTERF1蛋白三級結構預測與分析
采用SWISS-MODEL同源建模的方式得到hMTERF1蛋白的三維預測模型(見圖10),經(jīng)過RasMol軟件分析顯示該蛋白質(zhì)外形呈橢球狀,主要由-螺旋和無規(guī)則卷曲構成,與二級結構預測結果基本一致,說明同源建模的預測結果具有較高的精確度。
圖10 hMTERF1蛋白的三維結構
2討論
隨著計算機技術和生物技術的飛速發(fā)展,通過計算機模擬的方式對蛋白質(zhì)進行理化性質(zhì)、序列結構和功能等方面進行預測的確信度越來越高[17]。hMTERF1是人類MTERF蛋白家族的一個重要成員,通過生物信息學分析發(fā)現(xiàn)該蛋白由399個氨基酸殘基構成,是一個分子量為45.78 kD的親水性蛋白質(zhì),且不具有分泌信號肽。亞細胞定位軟件預測其定位于線粒體中,蛋白質(zhì)N端的1~57個氨基酸為前導肽序列,線粒體內(nèi)成熟的hMTERF1蛋白由342個氨基酸組成,預測結果與文獻報道的實驗研究結果完全一致[8,12]。通過預測蛋白質(zhì)的二級結構發(fā)現(xiàn)hMTERF1中56.90%的結構是由螺旋和-折疊構成,其余部分都是無規(guī)則卷曲。通過SMART在線軟件預測該蛋白含有6個MTERF基序,每個基序由大約30個氨基酸殘基構成。對其蛋白質(zhì)功能的預測顯示hMTERF1蛋白不具有酶活性,但在調(diào)控線粒體基因轉(zhuǎn)錄過程中發(fā)揮一定的生物學功能,同樣與文獻報道的實驗結果相符[3,8-9]。
通過hMTERF1與猩猩(Pongoabelii)、大鼠(Rattusnorvegicus)、小鼠(Musmusculus)和金娃娃(Tetraodonnigroviridis)4個不同物種MTERF1的系統(tǒng)發(fā)育樹聚類構建分析發(fā)現(xiàn),該蛋白質(zhì)屬于直系同源蛋白質(zhì)(orthologous protein),說明MTERF1蛋白在不同物種之間來源于共同祖先的蛋白,能夠很好的保留其主要序列以及結構,并且具有相似的生物學功能。由于MTERF1蛋白在不同物種中具有相似功能和共同起源,蛋白質(zhì)同源家族的分析對于確立物種之間的親緣關系和預測新蛋白質(zhì)序列的功能具有重要的意義[18]。本研究為今后進一步研究MTERF1蛋白家族的生物學功能及其它物種的直系同源MTERF蛋白之間的關系奠定了基礎。
參考文獻(References)
[1]KRUSE B, NARASIMHAN N, ATTARDI G. Termination of transcription in human mitochondria: Identification and purification of a DNA binding protein factor that promotes termination [J]. Cell, 1989, 58(2): 391-397.
[2]DAGA A, MICOL V, HESS D, et al. Molecular characteriation of the transcription termination factor from human mitochondria [J]. J Biol Chem, 1993, 268(11): 8123-8130.
[3]CHEN G, DAI J, TAN S, et al. MTERF1 regulates the oxidative phosphorylation activity and cell proliferation in HeLa cells [J]. Acta Biochim Biophys Sin, 2014, 46(6): 512-521.
[4]TERZIOGLU M, RUZZENENTE B, HARMEL J, et al. MTERF1 binds mtDNA to prevent transcriptional interference at the light-strand promoter but is dispensable for rRNA gene transcription regulation [J]. Cell Metab, 2013, 17(4):618-626.
[5]GUSTAFSSON C M, LARSSON N G. MTERF1 gives mtDNA an unusual twist [J]. Cell Metab, 2010, 12(1): 3-4.
[6]ROBERTI M, POLOSA P L, BRUNI F, et al. The MTERF family proteins: mitochondrial transcription regulators and beyond [J]. Biochim Biophys Acta, 2009, 1787(5): 303-311.
[7]ROBERTI M, POLOSA P L, BRUNI F, et al. MTERF factors: a multifunction protein family[J]. BioMol Concepts, 2010, 1(2): 215-224.
[8]HYVATINEN A K, KUMANTO M K, MARJAVAARA S K, et al. Effect on mitochondrial transcription of manipulating mTERF protein levels in cultured human HEK239 cells [J]. BMC Mol Biol, 2010, 11(9): 72-78.
[9]ASIN-CAYUELA J, SCHWEND T, FARGE G, et al. The human mitochondrial transcription termination factor (mTERF) is fully active in vitro in the non-phosphorylated form [J]. J Biol Chem, 2005, 280(27): 25499-25505.
[10]YAKUBOVSKAYA E, MEJIA E, BYRNES J, et al. Helix unwinding and base flipping enable human MTERF1 to terminate mitochondrial transcription [J]. Cell, 2010, 141(6): 982-983.
[11]RUBINSON E H, EICHMAN B F. Nucleic acid recognition by tandem helical repeats [J]. Curr Opin Stuct Biol, 2012, 22(1): 101-109.
[12]JIMENEZ-MENENDEZ N, FERNANDEZ-MILLAN P, RUBIO-COSIALS A, et al. Human mitochondrial mTERF wraps around DNA through a left-handed superhelical tandem repeat [J]. Nat Struct Mol Biol, 2010, 17 (7): 891-893.
[13]范晶,胥成浩,張西玉,等. 番茄LeNHX3基因的生物信息學分析[J]. 湖北農(nóng)業(yè)科學, 2009,48(12): 2917-2921.
FAN Jing, XU Chenghao, ZHANG Xiyu, et al. Bioinformatics analysis of LeNHX3 gene in tomato[J]. Hubei Agricultural Sciences, 2009,48(12): 2917-2921.
[14]陶雋,賈青,魏星燦,等. 豬ACACA基因及其編碼蛋白質(zhì)的生物信息學分析[J]. 江蘇農(nóng)業(yè)科學,2014, 42(5): 42-45.
TAO Juan, JIA Qing, WEI Xingcan, et al. Bioinformatics analysis of ACACA gene and protein in pig[J]. Jiangsu Agricultural Sciences, 2009,48(12): 2917-2921.
[15]錢葉雄,徐士杰,張亞男,等. 玉米精氨酸甲基轉(zhuǎn)移酶蛋白家族生物信息學分析[J]. 生物技術進展,2014, 4(1): 22-29.
QIAN Yexiong, XU Shijie, ZHANG Yanan, et al. Bioinformatics analysis of PRMT protein family in maize[J]. Current Biotechnology, 2014, 4(1): 22-29.
[16]袁保梅,昝玉璽,王天云,等.人14-3-3蛋白家族的生物信息學分析[J]. 生物技術通訊, 2007, 18(4): 587-589.
YUAN Baomei, ZAN Yuxi, WANG Tianyun, et al. Bioinformatics analysis of 14-3-3 protein family of humo sapiens[J]. Letters in Biothchnology, 2007, 18(4): 587-589.
[17]李顯航,劉紅美. 家蠅小熱休克蛋白(sHsp20.6)的生物信息學分析[J]. 生物信息學, 2013, 11(1): 65-71.
LI Xianhang, LIU Hongmei. Bioinformatics analysis of small heat shock protein(sHsp20.6) in musca domestica L[J]. Chinese Journal of Bioinformatics, 2013, 11(1): 65-71.
[18]JAYASHREE B, JONATHAN H C, PRESAD P, et al. A database of annotated tentative orthologs from eropabiotic stress transcripts[J]. Bioinformation, 2006,6(1): 225-227.
*通信作者:嚴志祥,男,高級工程師,博士,研究方向:生物數(shù)據(jù)分析;E-mail:yanzhixiang@genomics.cn.