楊 晴,馮承濤
(安徽理工大學化學工程學院,安徽淮南 233100)
肝臟因具有較多的代謝酶而附有解毒和代謝等功能,是脊椎動物的主要代謝器官,參與物質(zhì)代謝過程。細胞色素P450 酶(CYP450)存在于肝微粒體中,對體溫調(diào)節(jié)有重要影響,同時在藥物代謝的過程中起關(guān)鍵作用。CYP450亞家族種類繁多,CYP3A4
是亞家族種類之一。CYP3A4
是一種含有附帶一個鐵原子的亞鐵血紅素基團的蛋白,也是參與黃曲霉毒素代謝的主要I 相代謝酶,在人體肝臟中含量豐富,具有致癌活性的AFB18、9-環(huán)氧化合物就是在該酶的作用下由黃曲霉毒素B1(AFB1)活化而成的。Ng等測量了肝癌患者、其他慢性肝病患者和健康對照者的CYP3A4酶活性,以尿中的6β-羥基氫化可的松為研究指標,結(jié)果顯示:健康對照和其他慢性肝病患者尿中的6β-羥基氫化可的松水平明顯低于肝癌患者;肝癌的危險性與CYP3A4酶活性有一定的關(guān)系。楊立群等研究表明:相較于正常肝,肝炎后肝硬化患者CYP3A4
的P450 含量幾乎沒有變化,其微粒蛋白也無明顯改變;但其蛋白表達與活性明顯下降,基因表達也有所下降。生物信息學是一門集生命科學及相關(guān)學科交叉融合的前沿科學,可依托蛋白質(zhì)和基因組學序列信息分析序列的結(jié)構(gòu)功能。伴隨著計算機儲存的快速發(fā)展,大數(shù)據(jù)及相關(guān)軟件和生物信息學數(shù)據(jù)庫在生命科學研究中發(fā)揮越來越重要的作用。鑒于此,綜合利用生物信息學方法,選用DNASTAR、ProtParam、SignalP5.0、MEGA 等生物信息學平臺,進一步探究人源肝臟細胞色素代謝酶CYP3A4
基因的生物學特性,以期為肝癌、肝炎等疾病機制及其藥物研發(fā)提供參考。CYP3A4
基因的mRNA 序列(登錄號:NM_001202855.3)及其編碼的蛋白質(zhì)序列(登錄號:NP-001189784.1),備用。1.2.1 基因編碼區(qū)堿基序列組成和蛋白理化特性分析
用DNASTAR 系統(tǒng)的EditSeq 模塊,以及ExPASy 數(shù)據(jù)庫中的ProtParam(http://www.exPasy.org/tools/protparam)分別對人源CYP3A4
基因編碼區(qū)堿基序列組成和蛋白理化特性進行分析。1.2.2 蛋白結(jié)構(gòu)分析
用SOPMA 軟件分析人源CYP3A4 蛋白二級結(jié)構(gòu),用SWISS-MODEL(https://swissmodel.expasy.org/)軟件構(gòu)建蛋白三級結(jié)構(gòu)。
1.2.3 蛋白親/疏水性分析
用Protscale(https://web.expasy.org/protscale)軟件預測人源CYP3A4蛋白的親/疏水性。
1.2.4 蛋白信號肽及跨膜結(jié)構(gòu)分析
分別用SignalP5.0(http://www.cbs.dtu.dk/services/SignalP-5.0)和TMHMM 2.0(http://www.cbs.dtu.dk/services/TMHMM2.0)軟件對人源CYP3A4蛋白的信號肽和跨膜結(jié)構(gòu)進行分析。
1.2.5 蛋白N-糖基化位點和磷酸化位點分析
用NetNGlyc 1.0 (http://www.cbs.dtu.dk/services/ NetNGlyc 1.0)和NetPhos 3.1 (http://www.cbs.dtu.dk/services/NetPhos 3.1)分別預測人源CYP3A4蛋白的N-糖基化位點及其磷酸化位點。
1.2.6 B細胞抗原表位分析
用IEDB(http://www.iedb.org/)提供的蛋白質(zhì)抗原表位在線分析工具預測人源CYP3A4 蛋白的B 細胞抗原表位。
1.2.7 蛋白相互作用關(guān)系網(wǎng)絡(luò)的構(gòu)建及通路分析
主要通過String 數(shù)據(jù)庫完成有關(guān)CYP3A4 蛋白信號通路分析,以排列靠前10 位蛋白交互內(nèi)為檢索條件,構(gòu)建蛋白相互作用PPI 網(wǎng)絡(luò),進行GO 功能注釋和KEGG 通路富集分析。選擇homo sapiens,將閾值調(diào)至高置信度0.700。
1.2.8 蛋白氨基酸序列同源性分析及系統(tǒng)進化樹的構(gòu)建
選用MEGA5.0 軟件中的鄰接法(Neighbor-Joining)對CYP3A4
氨基酸序列進行同源性分析,構(gòu)建與之同源性相關(guān)聯(lián)的不同物種的CYP3A4
氨基酸序列的系統(tǒng)進化樹,其中自展值(Bootstrap)設(shè)為1 000 次。選用DNASTAR 軟件中的MegAlign 模塊(Jotun Hein 法,PAM 設(shè)為250)分析人源CYP3A4
氨基酸序列和其他相關(guān)物種與人源CYP3A4
氨基酸序列的同源性差異。CYP3A4
基因mRNA 序列的編碼區(qū)長為1 509(位于104~1 612 處),共編碼502 個氨基酸。人源CYP3A4
基因編碼區(qū)的A,G,T,C 體積分數(shù)分別為29.16%,21.80%,27.24%,21.80%,其中A+T 體積分數(shù)(56.40%)高于C+G體積分數(shù)(43.60%)。經(jīng)ProtParam軟件分析人源CYP3A4蛋白的理化性質(zhì),結(jié)果顯示CYP3A4 蛋白相對分子質(zhì)量為57 256.10,分子式為CHNOS,理論等電點為8.27,脂肪系數(shù)為95.86,平均親水系數(shù)為-0.038(親水),不穩(wěn)定系數(shù)為41.25,略高于閾值40,CYP3A4 蛋白在體外不穩(wěn)定。序列N-末端是甲硫氨酸,在酵母和大腸桿菌體內(nèi)表達半衰期分別為20,10 h,在哺乳動物網(wǎng)狀紅細胞體外表達的半衰期為30 h。CYP3A4蛋白氨基酸組成如表1。由表1可看出:CYP3A4蛋白氨基酸組成中,色氨酸(Trp)占比最低(占0.8%),亮氨酸(Leu)占比最高(占11.8%);帶正電荷的氨基酸(精氨酸(Arg)和賴氨酸(Lys))殘基數(shù)為60 個,帶負電荷的氨基酸(天冬氨酸(Asp)和谷氨酸(Glu))殘基數(shù)為57個。
表1 CYP3A4蛋白氨基酸組成Tab.1 Amino acid composition of CYP3A4 protein
預測結(jié)果顯示,人源CYP3A4 蛋白的二級結(jié)構(gòu)包 含223 個α 螺 旋(占44.42%)、27 個β 轉(zhuǎn) 角(占5.38%)、72 個延伸鏈(占14.34%)和180 個無規(guī)卷曲(占35.86%)。經(jīng)程序分析人源CYP3A4 蛋白的三級結(jié)構(gòu)與二級結(jié)構(gòu)分析結(jié)果完全一致。
人源CYP3A4 蛋白的親/疏水性結(jié)果如圖1。由圖1 可看出:人源CYP3A4 蛋白疏水性最強位于第18 位點處,得分為3.156;在第420,421 位點處親水性最強,得分為-2.744。通過比較疏水性和親水性區(qū)域可知,人源CYP3A4蛋白為一種親水性蛋白質(zhì)。
圖1 CYP3A4蛋白疏水性分析Fig.1 Hydrophobicity analysis of human CYP3A4 protein
人源CYP3A4信號肽的酶切位點是根據(jù)綜合剪切位點分值的最大值來判斷的,信號肽分值可用于辨別有無蛋白分泌。預測結(jié)果顯示:CYP3A4 蛋白信號肽的酶切位點位于第28~29 bp處;CYP3A4蛋白存在2個跨膜結(jié)構(gòu)。
人源CYP3A4 蛋白N-糖基化位點分析結(jié)果如圖2。由圖2 可得,人源CYP3A4 蛋白分別在第360 和461 處含有2 個N-糖基化位點。蛋白磷酸化位點結(jié)果顯示,人源CYP3A4 蛋白含47 個磷酸化位點,分別為19 個蘇氨酸位點(位于27,42,92,103,136,138,166,171,187,207,263,283,309,322,362,408,432,470和 498 處)、22 個絲氨酸位點(位于18,29,119,131,134,139,186,188,251,258,277,280,285,290,311,314,397,419,463,477,494和500處)和6 個酪氨酸位點(位于68,75,346,406,429和431處)。
圖2 CYP3A4蛋白N-糖基化位點分析Fig.2 N-glycosylation sites analysis of CYP3A4 protein
CYP3A4
基因的B 細胞抗原表位分析結(jié)果如圖3。由圖3 可看出,該基因B細胞抗原表位有20 處,分別位于37~45 位氨基酸(aa),75~84 aa,88~89 aa,106~109 aa,120~126 aa,137~140 aa,162~171 aa,195~205 aa,258~265 aa,278~287 aa,307~309 aa,323~331 aa,337~347 aa,400~402 aa,404~413 aa,418~429 aa,431~440 aa,467~471 aa,482~485 aa和487 aa處。圖3 CYP3A4蛋白B細胞抗原表位分析Fig.3 Epitopes analysis CYP3A4 protein B cell antigen
P
值分別為4.91和7.76E-06。圖4 CYP3A4相互關(guān)聯(lián)蛋白網(wǎng)絡(luò)Fig.4 CYP3A4 interrelated protein network map
對CYP3A4
生物學過程(biologiccal process,BP)、分子功能(molecular function,MF)、細胞組分(cellular component,CC)及KEGG 通路進行分析,結(jié)果見表2。由表2 可看出:CYP3A4 蛋白主要涉及聯(lián)苯分解、膽紅素結(jié)合、黃酮代謝、單帖代謝、葡萄糖醛酸基轉(zhuǎn)移酶活性的負調(diào)控等系列生物過程,據(jù)文獻[14-15]可知中藥黃酮類成分具有廣泛的藥理及生物活性,很多中藥黃酮提取物及黃酮單體化合物對CYP3A4 酶具有明顯的抑制作用或誘導作用;CYP3A4蛋白在咖啡因氧化酶活性、N,N-二甲基苯胺單氧酶活性、葡萄糖醛酸基轉(zhuǎn)移酶活性、類固醇羥化酶活性等方面發(fā)揮重要作用;細胞組分主要集中在膜、質(zhì)膜和細胞體中;蛋白網(wǎng)絡(luò)主要涉及的KEGG 信號通路包括抗壞血酸和阿爾尿酸代謝、藥物代謝-細胞色素P450、戊糖、葡萄糖醛酸轉(zhuǎn)換、視黃醇的新陳代謝和膽汁分泌等。該結(jié)果也在一定程度上印證了細胞色素P450體系是藥物氧化代謝的核心體系,其中含量最豐富的是CYP3A亞家族,該酶系能催化大多數(shù)的處方藥、環(huán)境致癌物、類固醇激素等的代謝。表2 CYP3A4及相關(guān)基因GO功能注釋和KEGG通路富集Tab.2 GO functional annotation and KEGG pathway enrichment of CYP3A4 and related genes
續(xù)表2
CYP3A4
氨基酸序列進化樹如圖5。由圖5可得,人源CYP3A4蛋白與同屬靈長類的Pan troglodytes(黑猩猩)處在同一個分支,其親緣關(guān)系最近,其次是Macaca mulatta (獼猴)、Macaca fascicularis (食蟹猴)、Papio anubis (東非狒狒),與Xenopus tropicalis (熱帶爪蟾)、Gallus gallus (雞)的親緣關(guān)系最遠,實驗結(jié)果可信度整體高。圖5 CYP3A4蛋白進化樹Fig.5 Phylogenetic tree of CYP3A4 protein
由DNASTAR 軟件中的MegAlign 模塊對選取的9個物種進行氨基酸序列對比分析,結(jié)果如圖6。
圖6 人和其他物種CYP3A4蛋白的氨基酸序列同源性分析Fig.6 Amino acid sequence homology of CYP3A4 protein of homology with other species
由圖6 可看出,人源CYP3A4 蛋白(NP_001189784.1) 與獼猴(NP_001035504.1)、食蟹猴(NP_001271463.1)、黑 猩 猩(NP_001116247.1)、東 非 狒 狒(XP_003895805.1)、牛(NP_024840513.1)、狗(XP_038524063.1)、雞(NP_001316437.1)、熱帶爪蟾(NP_001015786.1)的氨基酸序列同源性分別為93.4%,93.6%,98.6%,94.4%,76.9%,80.1%,60.0%和60.5%。由此可知:人源CYP3A4 蛋白在不同物種中同源性較高,在進化中則比較保守,該結(jié)果由CYP3A4蛋白氨基酸序列得到;人源CYP3A4蛋白氨基酸序列與熱帶爪蟾和雞的同源性最低,狗和牛次之,在黑猩猩、東非狒狒、食蟹猴、獼猴中同源性最高,與進化樹比對結(jié)果一致。
CYP3A4
基因的生物學特性,得到如下主要結(jié)論:1)人源CYP3A4
基因的編碼區(qū)長1 509 bp,編碼502個氨基酸,CYP3A4蛋白分子式為CHNOS,相對分子質(zhì)量為57 256.10,脂肪系數(shù)為95.86,CYP3A4 蛋白二級結(jié)構(gòu)主要由α 螺旋(44.42%)、β 轉(zhuǎn)角(5.38%)、延伸鏈(14.34%)和無規(guī)卷曲(35.86%)構(gòu)成,該蛋白存在2個跨膜結(jié)構(gòu),信號肽位于第28~29 bp處,是親水性蛋白,有2個N—糖基化位點和47個磷酸化位點,存在20個B細胞抗原表位。2)通過String數(shù)據(jù)庫得到人源CYP3A4蛋白相關(guān)功能和通路,CYP3A4蛋白在聯(lián)苯分解、黃酮代謝、葡萄糖醛酸基轉(zhuǎn)移酶活性的負調(diào)控、視黃醇的新陳代謝和膽汁分泌等系列信號通路中發(fā)揮重要作用,是藥物氧化代謝的核心體系。
3)經(jīng)同源性分析和進化樹顯示,黑猩猩、東非狒狒和獼猴與人源CYP3A4 蛋白相似性最高,親緣關(guān)系最近。