李平,武慧志,熊秋宏,王牛牛,肖涵,趙仲華,吳長(zhǎng)新
(1.山西大學(xué) 生物醫(yī)學(xué)研究院,山西 太原 030006;2.長(zhǎng)治醫(yī)學(xué)院 中心實(shí)驗(yàn)室,山西 長(zhǎng)治 046000)
代謝是由一系列將營(yíng)養(yǎng)物轉(zhuǎn)化為代謝物,從而為細(xì)胞存活和增殖提供能量的生化反應(yīng)途徑所組成。細(xì)胞代謝不僅包含小分子的降解,而且還包含蛋白質(zhì)、聚糖及脂質(zhì)的生物合成和分解代謝。內(nèi)質(zhì)網(wǎng)(ER)是負(fù)責(zé)蛋白質(zhì)生物合成最重要的細(xì)胞器之一,具有有效的質(zhì)量控制系統(tǒng),可以區(qū)分異常和正常蛋白質(zhì)[1-3]。這種系統(tǒng)被稱為內(nèi)質(zhì)網(wǎng)相關(guān)降解途徑(ERAD),其中蛋白酶體在蛋白質(zhì)降解途徑中起重要作用。
糖基化是蛋白質(zhì)和脂質(zhì)的關(guān)鍵翻譯后修飾之一,包含兩種主要類型:O-糖基化和N-糖基化。O-糖基化是在粗糙的內(nèi)質(zhì)網(wǎng)或順式高爾基體中進(jìn)行,而N-糖基化是內(nèi)質(zhì)網(wǎng)中一種共翻譯或翻譯后修飾方式,通過(guò)位于內(nèi)質(zhì)網(wǎng)和高爾基體的多個(gè)糖苷酶和糖基轉(zhuǎn)移酶進(jìn)行連續(xù)修飾[4-5]。 此外,糖基化在內(nèi)質(zhì)網(wǎng)質(zhì)量控制機(jī)制中發(fā)揮重要作用,確保錯(cuò)誤折疊的蛋白質(zhì)不會(huì)被運(yùn)輸?shù)礁郀柣w,N-聚糖酶在此過(guò)程中起最重要作用。
Ngly1(酵母/小鼠中的PNG1/Ngly1)是一種可以在內(nèi)質(zhì)網(wǎng)相關(guān)降解途徑中將N-聚糖從錯(cuò)誤折疊的糖蛋白上裂解,并在錯(cuò)誤折疊的糖蛋白的降解中起重要作用并且高度保守的N-聚糖酶[6-9]。Ngly1可以催化N-乙酰氨基葡萄糖(GlcNac)最內(nèi)層與N-糖蛋白上Asn殘基之間的酰胺鍵水解,從而產(chǎn)生脫N-糖基化蛋白,其中N-糖基化的Asn殘基被轉(zhuǎn)化為Asp和1-氨基 GlcNac結(jié)合的游離寡糖[9]。
Suzuki等在芽殖酵母中首次鑒定出了ngly1基因,后來(lái)在多種物種中均發(fā)現(xiàn)了Ngly1同源蛋白,包括釀酒酵母[6],盤狀線蟲(chóng)[10],秀麗隱桿線蟲(chóng)[11],裂殖酵母[12],Medaka魚(yú)[13],果蠅[14], 小鼠[15-16]和擬南芥[17]等。截至到目前,ngly1基因在斑馬魚(yú)中的作用尚未報(bào)道。研究表明,缺乏Ngly1的C57BL/6小鼠具有胚胎致死性,所以在成年動(dòng)物中研究分析Ngly1的功能比較困難。鑒于斑馬魚(yú)(Daniorerio)是在發(fā)育生物學(xué)和遺傳學(xué)分析中研究人類疾病強(qiáng)有優(yōu)勢(shì)的模式生物,因此探究斑馬魚(yú)ngly1基因的功能對(duì)于解析人類疾病(如先天性去糖基化障礙等[18])的病理原因具有重要意義。本研究利用生物信息學(xué)及分子生物學(xué)方法鑒定和表征斑馬魚(yú)ngly1基因的功能。
野生型斑馬魚(yú)在明暗周期為14 h和10 h,溫度為28℃的條件下進(jìn)行喂養(yǎng),每天喂食兩次。胚胎通過(guò)自然雜交獲得,受精卵在28.5℃下孵育,并根據(jù)Kimmel[19]等方法進(jìn)行分期。所有實(shí)驗(yàn)均根據(jù)當(dāng)?shù)貙?shí)驗(yàn)動(dòng)物保護(hù)倫理委員會(huì)批準(zhǔn)的指南進(jìn)行。
在斑馬魚(yú)基因組數(shù)據(jù)庫(kù)(http:∥www.ensembl.org/Danio-rerio/blastview)中找到斑馬魚(yú)ngly1基因的編碼序列,并利用PCR從斑馬魚(yú)胚胎cDNA中擴(kuò)增目的片段,構(gòu)建pCS2-ngly1表達(dá)載體:上游引物,5′-ATGCCTGGCTCTCAAGGAGTC-3′;下游引物, 5′-AGACTTTTCCATCTCAACCATCACT-3′,通過(guò)測(cè)序確定(中國(guó)上海生工有限公司)構(gòu)建成功。
HEK293T細(xì)胞培養(yǎng)在含有體積分?jǐn)?shù)10%胎牛血清,體積分?jǐn)?shù)1%青霉素和鏈霉素的DMEM培養(yǎng)基中,置于含體積分?jǐn)?shù)5% CO2的培養(yǎng)箱,37℃培養(yǎng)。使用PEI(Polyscience,Cat.No 23966-2)將質(zhì)粒DNA進(jìn)行細(xì)胞轉(zhuǎn)染,轉(zhuǎn)染后的細(xì)胞孵育培養(yǎng)24~48 h。
斑馬魚(yú)基因ngly1cDNA的核苷酸序列和氨基酸序列從Ensembl數(shù)據(jù)庫(kù)(http:∥asia.ensembl.org/index.html)中下載獲得。通過(guò)ExPaSy(http:∥www.expasy.org/tools/)獲得蛋白質(zhì)特征,并通過(guò)SMART數(shù)據(jù)庫(kù)(http:∥smart.embl-heidelberg.de/)對(duì)蛋白質(zhì)結(jié)構(gòu)域進(jìn)行拓?fù)浞治?。?jīng)過(guò)BLAST分析獲得24個(gè)物種的ngly1基因序列,對(duì)這些相似序列進(jìn)行多重比對(duì),然后使用MEGA7.0軟件[20]構(gòu)建最大似然樹(shù)(圖2)。鼠PNGase(Ngly1)的晶體結(jié)構(gòu)作為參考模型[21-23],用Swiss-Model(http:∥swiss model.expasy.org)對(duì)斑馬魚(yú)Ngly1蛋白進(jìn)行同源建模。
表1 內(nèi)參基因和引物序列
斑馬魚(yú)ngly1基因全長(zhǎng)為16 kb,由11個(gè)外顯子組成(圖1A),cDNA全長(zhǎng)為2 844 bp,包括207 bp的5′非翻譯區(qū)(UTR),1 935 bp的開(kāi)放閱讀框(ORF)和702 bp的3′非翻譯區(qū)(UTR),能夠編碼含645個(gè)氨基酸的蛋白質(zhì)。通過(guò)預(yù)測(cè)可知,Ngly1的分子量和理論等電點(diǎn)(pI)分別為72.44 kDa和6.00,且在斑馬魚(yú)ngly1基因中預(yù)測(cè)出兩個(gè)潛在的磷酸化位點(diǎn),一個(gè)泛素化位點(diǎn)和一個(gè)乙?;稽c(diǎn)。
為了分析斑馬魚(yú)Ngly1蛋白在進(jìn)化中的保守性,我們使用Mega 7.0軟件對(duì)人、小鼠和斑馬魚(yú)Ngly1氨基酸序列進(jìn)行多序列比對(duì)。結(jié)果表明人、小鼠和斑馬魚(yú)中的所有NGLY1/Ngly1蛋白均由三個(gè)同源結(jié)構(gòu)域組成,即 PUG,TGc和PAW,這些結(jié)構(gòu)域均高度保守(圖1B)。
為了預(yù)測(cè)斑馬魚(yú)Ngly1的三級(jí)結(jié)構(gòu),選擇包含PUB結(jié)構(gòu)域(2hpj.1.A)的N末端[22],包含TGc(2f4m-A)的核心結(jié)構(gòu)域[21]和包含PAW的C末端(2g9g.1.A)[23]的小鼠Ngly1作為模板進(jìn)行斑馬魚(yú)Ngly1的三級(jí)結(jié)構(gòu)同源性建模。結(jié)果表明,斑馬魚(yú)Ngly1的N末端區(qū)域(aa 3-99)主要由左手反平行的四個(gè)α螺旋組成,兩個(gè)α螺旋中間含有1個(gè)包含兩個(gè)短的α螺旋和一個(gè)β鏈的連結(jié),扭曲的反平行片由3個(gè)β鏈形成(圖1C)。斑馬魚(yú)Ngly1的核心區(qū)域(aa 154-438)包含轉(zhuǎn)谷氨酰胺酶樣折疊和鋅結(jié)合域(圖1D)。轉(zhuǎn)谷氨酰胺酶樣結(jié)構(gòu)域具有位于中央且強(qiáng)烈彎曲的六鏈反平行β折疊,這個(gè)β折疊被凹入側(cè)的8個(gè)α-螺旋和凸出側(cè)的3個(gè)α-螺旋所圍繞;鋅結(jié)合域包含一個(gè)三鏈β-折疊,如圖1D所示。斑馬魚(yú)Ngly1的C末端區(qū)域(aa 442-643)是1個(gè)稍微延長(zhǎng)的分子,展現(xiàn)出一個(gè)β三明治結(jié)構(gòu),該結(jié)構(gòu)包括兩層,由17條β-反平行鏈和2個(gè)短α螺旋組成(圖1E)。
使用MEGA 7.0構(gòu)建系統(tǒng)發(fā)育樹(shù),推斷魚(yú)類ngly1與其他動(dòng)物之間的進(jìn)化關(guān)系(圖2)。結(jié)果顯示,斑馬魚(yú)ngly1的進(jìn)化中是保守的,而且具有很高的支持度。通過(guò)系統(tǒng)發(fā)育樹(shù)揭示的親緣關(guān)系可知,斑馬魚(yú)ngly1基因是人類NGLY1和其他脊椎動(dòng)物的直系同源基因(圖2)。
根據(jù)蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè),斑馬魚(yú)Ngly1包含3個(gè)結(jié)構(gòu)域:PUG(aa 20-81),TGc(aa 286-341)和PAW(aa 477-569)(圖1B)。根據(jù)斑馬魚(yú)基因組數(shù)據(jù)庫(kù)的序列信息擴(kuò)增得到斑馬魚(yú)ngly1,并通過(guò)Sanger測(cè)序確定pCS2-Ngly1-GFP表達(dá)質(zhì)粒構(gòu)建成功。為了進(jìn)一步研究其蛋白表達(dá),分別將pCS2-GFP和pCS2-Ngly1-GFP質(zhì)粒轉(zhuǎn)染到HEK293細(xì)胞中,觀察到這些質(zhì)粒具有相似的轉(zhuǎn)染效率(圖3A,B)。蛋白質(zhì)印跡分析表明,單獨(dú)轉(zhuǎn)染了pCS2-GFP的HEK293T細(xì)胞在分子量約為27kD處有一條明顯的GFP蛋白條帶,如圖3B所示,而在pCS2-Ngly1-GFP轉(zhuǎn)染的細(xì)胞中,可觀察到一條斑馬魚(yú)Ngly1蛋白融合GFP的條帶,其分子量約為98 kD(圖3B)。
為了研究ngly1的組織分布,從健康斑馬魚(yú)的不同組織中提取總RNA,例如心臟、腮、肝臟、脾臟、腎臟、鰾、眼、腦、卵巢、睪丸、肌肉和腸等,并且通過(guò)qRT-PCR測(cè)定ngly1的轉(zhuǎn)錄水平,先前的研究提示我們應(yīng)謹(jǐn)慎選擇內(nèi)參基因[24]。為了找到適合斑馬魚(yú)組織分布的內(nèi)參基因,通過(guò)qRT-PCR在12種不同組織中驗(yàn)證了4個(gè)常用內(nèi)參基因(β-actin,18S rRNA,Rpl13α和GAPDH)的表達(dá)。圖4分析了從心臟、鰓、肝、脾、腎、游泳、眼、腦、卵巢、睪丸、肌肉和腸中分離到的總RNA。Rpl13α的表達(dá)可作為ngly1組織表達(dá)的內(nèi)參。結(jié)果顯示,與其他內(nèi)參基因相比,Rpl13α以最低的±SD值在不同組織中表現(xiàn)出最相似的表達(dá)水平,然而,GAPDH在不同組織中以最大的±SD值表現(xiàn)出最大的差異(圖4A)。因此,將Rpl13α的表達(dá)作為檢測(cè)ngly1表達(dá)的內(nèi)參基因。結(jié)果顯示,ngly1在卵巢和睪丸中表達(dá)水平最高,其次是腦,腮,眼,腸,脾,腎,肌肉,心臟和魚(yú)鰾。但肝臟中ngly1基因表達(dá)水平最低(如圖4B)。
圖1 不同物種Ngly1的生物信息學(xué)分析
為了檢測(cè)斑馬魚(yú)ngly1在不同胚胎發(fā)育階段的mRNA表達(dá),分別從2細(xì)胞期,24 h,36 h,48 h,72 h和5 d的魚(yú)中提取總RNA,并進(jìn)行qRT-PCR,同時(shí)還評(píng)價(jià)了候選參考基因(β-actin,18SrRNA,Rpl13α和GAPDH)在胚胎發(fā)育過(guò)程中的穩(wěn)定性表達(dá)。結(jié)果顯示,與其他內(nèi)參基因相比,不同發(fā)育階段的18S rRNA mRNA表達(dá)水平表現(xiàn)出最高的相似度和最低的±SD值。然而,在不同發(fā)育階段,β-actin,Rpl13α和GAPDH的表達(dá)顯示出相似的±SD值且遠(yuǎn)高于18S rRNA的表達(dá)(圖5A)。因此,使用18S rRNA的表達(dá)作為ngly1時(shí)空表達(dá)的內(nèi)參。結(jié)果顯示,斑馬魚(yú)ngly1在包括2細(xì)胞期,24 h,48 h和72 h在內(nèi)的所有發(fā)育階段均普遍表達(dá),但在5 d時(shí)表現(xiàn)出最高表達(dá)(圖5B)。
本研究通過(guò)生物信息學(xué)分析鑒定了斑馬魚(yú)ngly1基因與哺乳動(dòng)物的親緣關(guān)系,克隆了斑馬魚(yú)ngly1基因,并且確定了其時(shí)空表達(dá)模式。通過(guò)同源建模及結(jié)構(gòu)預(yù)測(cè)可知,Ngly1蛋白的654個(gè)氨基酸包含三個(gè)結(jié)構(gòu)域:PUG(aa 20-81),TGc(aa 286-341)和PAW(aa 477-569),斑馬魚(yú)Ngly1蛋白與其他已知脊椎動(dòng)物Ngly1具有高度相似的蛋白結(jié)構(gòu)(圖1)。
圖2 ngly1核酸序列的系統(tǒng)進(jìn)化樹(shù)分析,數(shù)字表示支持度,比例尺表示進(jìn)化距離
圖3 重組Ngly1的表達(dá)
圖4 ngly1的組織特異性表達(dá)
圖5 胚胎發(fā)育過(guò)程中ngly1基因的時(shí)空表達(dá)
在內(nèi)質(zhì)網(wǎng)相關(guān)降解期間,多功能AAA ATPase p97是蛋白質(zhì)降解復(fù)合物的一部分,p97與Ngly1的N末端PUG結(jié)構(gòu)域相關(guān)聯(lián)以募集哺乳動(dòng)物中泛素化的底物[22]。Ngly1從錯(cuò)誤折疊的糖蛋白中除去N-連接的寡糖,這是內(nèi)質(zhì)網(wǎng)相關(guān)降解途徑的一部分,涉及Ngly1核心結(jié)構(gòu)域與HR23蛋白緊密復(fù)合物的形成,而且該蛋白通過(guò)與泛素和26S蛋白酶體的組成成分相互作用而參與泛素蛋白酶體途徑[25-26]。除了Ngly1的N末端和核心結(jié)構(gòu)域外,C末端結(jié)構(gòu)域還通過(guò)與N-連接的寡糖鏈的甘露糖部分結(jié)合以增強(qiáng)小鼠Ngly1核心結(jié)構(gòu)域的活性,而在內(nèi)質(zhì)網(wǎng)相關(guān)降解途徑中發(fā)揮重要作用[23]。根據(jù)與小鼠Ngly1的三級(jí)結(jié)構(gòu)比對(duì),斑馬魚(yú)Ngly1可能參與p97,HR23或N-連接寡糖鏈的甘露糖部分相同的相互作用,從而在內(nèi)質(zhì)網(wǎng)降解途徑中起作用。此外,還進(jìn)行了親緣關(guān)系分析,以探索ngly1基因的進(jìn)化歷程,發(fā)現(xiàn)該基因在24種脊椎動(dòng)物中進(jìn)化上非常保守。
本文還克隆了全長(zhǎng)ngly1基因,并通過(guò)熒光顯微鏡觀察和蛋白質(zhì)印跡分析對(duì)其進(jìn)行了確認(rèn)。通過(guò)GFP單克隆抗體在轉(zhuǎn)染的HEK293T細(xì)胞裂解液中檢測(cè)到分子量大小約為98 kD的蛋白,可證明是與GFP融合的Ngly1蛋白(圖3A,B)。
繪制了斑馬魚(yú)ngly1的時(shí)空表達(dá)模式。為了研究ngly1的表達(dá),使用Rpl13α作為內(nèi)參,通過(guò)qRT-PCR檢測(cè)來(lái)自斑馬魚(yú)的各種組織中ngly1的表達(dá)。在成年魚(yú)中,與其他組織相比,ngly1基因主要在卵巢和睪丸中表達(dá),這一結(jié)果與先前的研究一致,即ngly1在小鼠睪丸中表達(dá)最高的結(jié)果一致[16]。然而,ngly1在斑馬魚(yú)肝臟中的表達(dá)最低,這與已報(bào)道的Ngly1在小鼠肝臟的表達(dá)并不一致,猜測(cè)這可能是由于使用了不同的內(nèi)參基因以及哺乳動(dòng)物肝臟和斑馬魚(yú)肝臟的結(jié)構(gòu)本身存在差異所導(dǎo)致。斑馬魚(yú)早期發(fā)育過(guò)程中,ngly1在胚胎發(fā)生過(guò)程中普遍表達(dá),并且第五天達(dá)到最高水平,但在小鼠胚胎發(fā)生中,Ngly1的時(shí)空表達(dá)尚不清楚。
缺失Ngly1的C57BL/6小鼠可導(dǎo)致胚胎致死,而另一種脫N-糖基化酶可以挽救部分Ngly1缺陷小鼠的致死性[27]。此外,Ngly1的缺失也會(huì)導(dǎo)致小鼠胚胎成纖維細(xì)胞(MEF)中內(nèi)質(zhì)網(wǎng)相關(guān)降解過(guò)程的失調(diào),但是通過(guò)額外敲除ENGase基因又可以減緩Ngly1-/-細(xì)胞的內(nèi)質(zhì)網(wǎng)相關(guān)降解途徑的失調(diào)[28]。這表明細(xì)胞質(zhì)ENGase可能是NGLY1缺乏癥的潛在治療靶標(biāo)之一[27]。