許勇,李靜,王紅萍,張忠東,王娟,胡倩,趙娜娜
安徽省醫(yī)學(xué)科學(xué)研究院,安徽 合肥 230061
從2019年12月至今,新型冠狀病毒病(Corona virus disease 2019,COVID-19)已在全球蔓延,感染人數(shù)超過(guò)400萬(wàn)人,逾28萬(wàn)人死亡,對(duì)全世界人民的健康生活造成了重大影響[1]。新型冠狀病毒屬于β屬冠狀病毒,有包膜,顆粒呈圓形或橢圓形,常為多形性[2]。2020年2月11日,因與SARS-CoV同屬于β冠狀病毒屬的Sarbecovirus亞屬,國(guó)際病毒命名委員會(huì)將其命名為嚴(yán)重急性呼吸系統(tǒng)綜合征冠狀病毒2型(severe acute respiratory syndrome coronavirus2,SARS-CoV-2),與SARS-CoV是姊妹病毒[3]。
和SARS-CoV等其他冠狀病毒類似,SARSCoV-2的遺傳物質(zhì)為RNA,基因組全長(zhǎng)約29 kb,共編碼9860個(gè)氨基酸殘基,其5'端約2/3的區(qū)域由2個(gè)大的開(kāi)放讀框ORFa和ORFb組成,編碼約16種非結(jié)構(gòu)蛋白(nonstructural protein,NSP),后1/3區(qū)域依次編碼刺突(spike,S)蛋白、小包膜(envelope,E)蛋白、膜(membrane,M)蛋白、核衣殼(nucleocapsid,N)蛋白和一些輔助蛋白[4-5]。在SARS-CoV中,非結(jié)構(gòu)蛋白NSP14全長(zhǎng)527殘基,包括3'-5'核酸外切酶和N7鳥(niǎo)甘甲基轉(zhuǎn)移酶(N7-MTase)2個(gè)功能結(jié)構(gòu)域,對(duì)病毒RNA的復(fù)制轉(zhuǎn)錄很重要,是抗冠狀病毒治療的潛在藥物靶點(diǎn)[6]。
由于SARS-CoV-2出現(xiàn)的時(shí)間較短,實(shí)驗(yàn)室研究尚需時(shí)間,運(yùn)用生物信息學(xué)方法對(duì)病毒的基因組、蛋白質(zhì)等性質(zhì)進(jìn)行分析預(yù)測(cè),了解病毒的感染機(jī)理,為疫苗、藥物開(kāi)放奠定理論基礎(chǔ)是一種重要的研究方法[4,7]。Chan等通過(guò)基因組序列的比對(duì)分析,對(duì)SARS-CoV-2基因組的構(gòu)成和編碼蛋白質(zhì)進(jìn)行初步預(yù)測(cè),發(fā)現(xiàn)SARS-CoV-2與蝙蝠中類似SARS的冠狀病毒密切,而它自身的一些獨(dú)特序列具有進(jìn)一步研究的價(jià)值[4]。Baruah等運(yùn)用生物信息學(xué)手段對(duì)SARS-CoV-2表面糖蛋白的B細(xì)胞和T細(xì)胞抗原表位進(jìn)行預(yù)測(cè),為疫苗的研發(fā)奠定理論基礎(chǔ)[8]。目前未見(jiàn)針對(duì)SARS-CoV-2中NSP14的生物信息學(xué)研究相關(guān)報(bào)道。
本研究基于NSP14的氨基酸序列,運(yùn)用生物信息學(xué)相關(guān)軟件分析和預(yù)測(cè)NSP14蛋白的性質(zhì)和結(jié)構(gòu),為新型冠狀病毒藥物篩選提供理論依據(jù)。
SARS-CoV-2中NSP14蛋白的氨基酸序列從NCBI官網(wǎng)下載(YP_009725309)。
采用NCBI中的Blastp工具比對(duì)SARS-CoV-2與SARS-CoV中NSP14蛋白序列的同源性;采用ProtParam分析理化性質(zhì)[9];采用PredictProtein[10]對(duì)NSP14蛋白的二級(jí)結(jié)構(gòu)、二硫鍵和功能基序進(jìn)行預(yù)測(cè);采用SWISS-MODEL[11-12]進(jìn)行同源建模;采用MolProbity軟件中的Ramachandran[13]對(duì)建模結(jié)果進(jìn)行評(píng)估;采用CastP[14]預(yù)測(cè)活性區(qū)域。
通過(guò)Blastp比對(duì)發(fā)現(xiàn),SARS-CoV-2與SARSCoV的NSP14氨基酸序列一致率達(dá)95%,陽(yáng)性率達(dá)98%(包括氨基酸種類不同但性質(zhì)相似的位點(diǎn)),說(shuō)明2種病毒的NSP14具有很高的同源性。如圖 1所示,第 31、128、176、220、228、259、260、307、319、374、396、437和 493位氨基酸殘基不同且性質(zhì)差異較大。
如表1,NSP14由527個(gè)氨基酸殘基組成,含量最高的殘基是纈氨酸(8.3%),最低的是色氨酸(1.9%)。NSP14的相對(duì)分子質(zhì)量為59 815.67,理論等電點(diǎn)為7.80,不穩(wěn)定系數(shù)為28.85,總平均親水系數(shù)為-0.134。綜上所述,NSP14是穩(wěn)定的親水性蛋白質(zhì)。
經(jīng)PredictProtein預(yù)測(cè),NSP14的二級(jí)結(jié)構(gòu)中含量最高的是無(wú)規(guī)卷曲(45.83%),其次為α螺旋(35.87%),延伸鏈的含量最低(18.30%),蛋白質(zhì)中不含二硫鍵。NSP14中包含N-糖基化位點(diǎn)、cAMP或cGMP依賴蛋白激酶磷酸化位點(diǎn)、蛋白激酶C磷酸化位點(diǎn)、酪蛋白激酶Ⅱ磷酸化位點(diǎn)和N-豆蔻?;稽c(diǎn)等5個(gè)保守基序(表2)。
圖1 SARS-CoV-2與SARS-CoV中NSP14的氨基酸序列比對(duì)
SWISS-MODEL建模是以5c8s.1的B鏈為模板,總體評(píng)價(jià)得分0.98,Qmean為-3.14,主要配體包括鳥(niǎo)苷-P3-腺苷-5',5'-3磷酸、S-腺苷-L-高半胱氨酸、Mg和Zn,功能預(yù)測(cè)為鳥(niǎo)嘌呤-N7-甲基轉(zhuǎn)移酶。Ramachandran評(píng)估結(jié)果表明同源建模顯示氨基酸位點(diǎn)都位于最佳區(qū)域內(nèi)的占94.8%(496/523),氨基酸位點(diǎn)位于允許區(qū)域內(nèi)的占99.2%(519/523),說(shuō)明該三級(jí)結(jié)構(gòu)模型準(zhǔn)確可靠。如圖2所示,蛋白質(zhì)中包含4個(gè)長(zhǎng)的α螺旋、2個(gè)短的α螺旋和比較明顯的5組β折疊。CastP預(yù)測(cè)發(fā)現(xiàn)NSP14有2個(gè)活性區(qū)域,分別由34個(gè)和41個(gè)氨基酸殘基構(gòu)成,總面積和體積分別為1469.712 ?2和1708.967 ?3(圖3)。
表1 SARS-CoV-2的NSP14氨基酸組成
圖2 SWISS-MODEL對(duì)NSP14三級(jí)結(jié)構(gòu)的預(yù)測(cè)
表2 SARS~CoV~2 NSP14的保守基序
大多數(shù)冠狀病毒基因組RNA的5'端具有甲基化的帽子結(jié)構(gòu),該結(jié)構(gòu)與真核細(xì)胞mRNA的帽子結(jié)構(gòu)相似,使病毒RNA能夠逃避宿主天然免疫系統(tǒng)的識(shí)別[15]。SARS-CoV的非結(jié)構(gòu)蛋白NSP14的1~287 aa為N端核糖核酸外切酶結(jié)構(gòu)域,288~527 aa為N7-甲基轉(zhuǎn)移酶結(jié)構(gòu)域,后者在其RNA加帽過(guò)程中發(fā)揮重要作用[6,16]。SARS-CoV-2的NSP14與SARS-CoV的NSP14氨基酸序列的一致率達(dá)到95%,CastP預(yù)測(cè)SARS-CoV-2的NSP14同樣包含2個(gè)活性區(qū)域,說(shuō)明SARS-CoV-2的NSP14具有與SARS-CoV的NSP14類似的功能。SARSCoV-2的NSP14的無(wú)規(guī)卷曲含量最高,為其2個(gè)活性區(qū)域提供了結(jié)構(gòu)基礎(chǔ),同時(shí)使得該蛋白質(zhì)的穩(wěn)定性可能較差[17]。
圖3 CastP對(duì)NSP14活性區(qū)域的預(yù)測(cè)
冠狀病毒NSP14的N端核糖核酸外切酶結(jié)構(gòu)域?qū)儆诤颂呛怂嵬馇忻窪EDD家族,可能與病毒基因組RNA的修復(fù)有關(guān),這可能使SARS-CoV-2的基因突變率較其他RNA病毒要低[6]。NSP14的N端核糖核酸外切酶活性使冠狀病毒能抵抗包括利巴韋林等在內(nèi)的許多核苷類似物的抑制作用,并能部分降低其對(duì)瑞德西韋的敏感性[18]。
SARS-CoV NSP14的 288~301 aa盤(pán)繞形成一條錯(cuò)綜復(fù)雜的環(huán)結(jié)構(gòu)[16],331~338 aa被認(rèn)為是底物結(jié)合的關(guān)鍵位點(diǎn)[6],破壞這些結(jié)構(gòu)會(huì)導(dǎo)致N7-甲基轉(zhuǎn)移酶活性的喪失。SARS-CoV-2的NSP14中288~301 aa與 SARS-CoV 的 NSP14高度一致,只有293、294位點(diǎn)替換成了性質(zhì)相似的氨基酸,而331~338 aa完全一致,說(shuō)明SARS-CoV-2的NSP14具有較好的N7-甲基轉(zhuǎn)移酶活性。
SARS-CoV-2的NSP14的176和374位點(diǎn)較SARS-CoV的NSP14有較大改變,導(dǎo)致其多了一個(gè)可能的N-糖基化位點(diǎn)和磷酸化位點(diǎn)。糖基化和磷酸化都是主要的翻譯后修飾方式,對(duì)蛋白質(zhì)功能有重要影響,這些位點(diǎn)的改變是否會(huì)對(duì)SARS-CoV-2的NSP14功能造成較大影響,需要進(jìn)一步研究。
綜上所述,SARS-CoV-2的NSP14對(duì)其抵抗利巴韋林等抗病毒藥物、逃避免疫系統(tǒng)識(shí)別起到重要作用,以NSP14酶活性為靶點(diǎn)進(jìn)行藥物篩選研究可能具有重要意義。