藍青萍,馮凱,王曉丹,潘玥,陳俊英,孫強明
中國醫(yī)學科學院北京協和醫(yī)學院醫(yī)學生物學研究所云南省重大傳染病疫苗研發(fā)重點實驗室,云南昆明650118
西尼羅河病毒(West Nile virus,WNV)是一種單鏈正義RNA 病毒,屬于黃病毒科黃病毒屬,于1937年首次從西尼羅河烏干達省一名發(fā)熱婦女的血液中分離出來,在隨后的幾十年里,WNV 席卷了亞洲、歐洲、非洲、北美等地區(qū)[1-3]。
WNV 是病毒性腦炎的主要病原體,在自然界中,以鳥-蚊-鳥的傳播周期維持循環(huán),主要通過蚊蟲尤其是庫蚊媒介進行傳播[4-5]。人類感染WNV 可引起西尼羅熱和WNV 性腦炎,臨床癥狀包括無癥狀感染或輕度急性發(fā)熱性疾病及神經系統疾病,包括腦膜炎、腦炎、急性弛緩性麻痹[6-7]。WNV 具有生物多樣性,基于遺傳差異,目前提出了9 個WNV譜系[3,8],見表 1。由于目前對 WNV 感染尚無明確的治療方法,因此開發(fā)安全有效的人用疫苗對預防WNV 感染至關重要[9-10]。不同地理位置的WNV 遺傳變異可能與病毒的毒力、擴增和遺傳等有關,研究發(fā)現,WNV 的 E 蛋白第 154 ~ 156 位點是糖基化位點,被認為是毒力因子,該位點的刪除可降低病毒的復制[11],因此推測該位點可作為WNV 疫苗研究的潛在靶點。
本研究分析了亞洲區(qū)來自中國、馬來西亞、印度、以色列、巴基斯坦、伊朗和土耳其等WNV 流行株的進化特征、流行趨勢及WNV 結構蛋白E 的核苷酸和氨基酸突變特征等,旨在為后續(xù)研究WNV的傳播和感染機制及疫苗的研發(fā)提供依據。
表1 WNV 譜系概述Tab.1 Overview of WNV lineages
1.1 亞洲區(qū)WNV 流行株核酸序列獲取 以“West Nile virus”為檢索詞在 NCBI-Pubmed 查詢 WNV 的流行情況,發(fā)現在亞洲地區(qū),WNV 于1951 在以色列首次暴發(fā),20 世紀70 年代土耳其和伊朗也有WNV的報告[1-3],20 世紀50 年代從印度西部和南部的蚊蟲中分離出WNV 毒株,2013 年中國新疆省首次確診WNV 的人類病例[4]。分別以“West Nile virus”、“West Nile virus China”、“West Nile virus India”、“West Nile virus Israel”、“West Nile virus Pakistan”、“West Nile virus Iran”、“West Nile virus Malaysia”、“West Nile virus Turkey”等為關鍵詞和主題詞,在NCBI 的Pubmed(https://www.ncbi.nlm.nih.gov /pubmed /)和 GenBank(https:/ / www.ncbi.nlm.nih.gov / nuccore /)上進行檢索,并獲取亞洲區(qū)WNV流行株核苷酸序列。
1.2 亞洲區(qū)WNV 流行株的序列進化分析 選取在GenBank 中登錄的 WNV 亞洲地區(qū)病毒株China(AY490240、JX442278、JX442279、JX442280、JX442-281、JX442282)、India(JQ303102、GQ851605、KU97-8770、GQ851604、KC601756、JX041632、EU249803)、Israel(HM152776、HM051416、AY688948、HM152775、HM152773、AF481864)、Pakistan(MH545365、MH54-5363、MH545364、JX070655)、Iran(MF462262、KJ48-6150)、Malaysia(MK327792、MK327802、MK327788、MK327789)、Turkey(JN828806、KJ433826、KJ958922、KP400657、KC290932、MK327808) 以及參考病毒株New York(AF196835)、Australia(D00246)、India(DQ-256376)、Uganda(AY532665)、Czech Republic(AY7-65264)、Russia(277251)、Austria(KJ831223)、Senegal(EU082200)、Senegal(KJ131502),應用 BIOEDIT 軟件對上述WNV 亞洲地區(qū)病毒株核酸序列進行多重比對。利用 MEGA 6.0 軟件構建病毒全長序列和部分E 蛋白序列的系統發(fā)育進化樹,進化樹構建參數為:最大似然法,Bootstrap 設為1 000。
1.3 E 蛋白突變分析 將亞洲地區(qū)病毒株的E 蛋白核苷酸序列進行譜系1 和譜系2 比對,分析核酸突變情況,再通過在線翻譯(http:/ / www.bio-soft.net /sms / index.html)將堿基序列翻譯成氨基酸序列,分析氨基酸突變替代情況。
2.1 亞洲區(qū)WNV 流行株核苷酸序列的獲取 經檢索,獲取亞洲區(qū)WNV 流行株核苷酸序列見表2。
2.2 亞洲區(qū)WNV 流行株的序列進化分析 通過GenBank 獲取亞洲區(qū)WNV 流行地區(qū)中國、馬來西亞、印度、以色列、巴基斯坦、伊朗和土耳其的WNV全基因組序列和部分E 蛋白基因組序列,將獲取的WNV 全基因組序列與不同譜系的代表株進行系統進化樹分析,見圖1,可以看出,WNV 以色列株(HM152773、AF481864)在親緣關系上與譜系 1a 株最為接近,而以色列株(AY688948)在親緣關系上與譜系2 株較為接近,印度株(KU978770)的親緣關系與譜系1c 接近,且分布在不同的小支上。將獲取的不同譜系代表株的E 蛋白序列進行系統進化分析,發(fā)現 WNV 中國株(JX442278,JX42280-JX44-2282)在親緣關系上與譜系1a 株最為接近,馬來西亞株在親緣關系上與伊朗株(KJ486150)接近,巴基斯坦株與印度株(JQ303102)接近,而馬來西亞株和巴基斯坦株與其他譜系的WNV 株親緣關系較遠,分布在不同的兩大分支上,見圖2。上述亞洲區(qū)WNV流行株的序列進化分析表明,亞洲區(qū)流行的WNV 可能來源于譜系1 株與譜系2 株,且病毒可能存在位點突變。
表2 亞洲區(qū)WNV 流行株核苷酸序列Tab.2 Nucleotide sequences of WNV endemic strains in Asia
圖1 根據WNV 全基因組序列構建的系統進化樹Fig.1 Phylogenetic tree constructed based on complete nucleotide sequence of WNV
圖2 根據WNV E 蛋白部分序列構建的系統進化樹Fig.2 Phylogenetic tree constructed based on partial sequence of WNV E protein
2.3 WNV E 蛋白突變分析 將中國、巴基斯坦、印度、以色列和土耳其共5 株WNV 的E 蛋白與譜系1 和譜系2 WNV 代表株的E 蛋白進行核酸序列和氨基酸序列比對,發(fā)現與譜系2 株相比,WNV E 蛋白堿基突變率和氨基酸突變率整體比譜系1 高。與譜系1 相比,除印度株(KU978770)外,所有其他株 E 蛋白的堿基突變率和氨基酸突變率與譜系1a 相比最低,表明WNV 譜系1a 在亞洲區(qū)較為流行;而印度株(KU978770)與譜系 1c 株相比,其 E 蛋白堿基突變率與氨基酸突變率最低,分別為0.8%和0.4%,這與前面進化分析的結果一致,即印度株(KU978770)與譜系1c 株在親緣關系上最為接近,見表3 和表4。將亞洲區(qū)流行的WNV 株E 蛋白與譜系1a 比對發(fā)現,印度株(GQ851605、JX041632、GQ851604 和 KU-978770)的第154 和156 位氨基酸分別由天冬酰胺突變?yōu)樘於彼岷徒z氨酸(N154D、N154S),絲氨酸突變?yōu)楦彼岷捅彼幔⊿156P、S156A),而中國株(AY490240)、巴基斯坦株(JX070655)及以色列株(HM051416)的第156 位氨基酸分別由絲氨酸突變?yōu)楦彼?、苯丙氨酸和脯氨酸(S156P、S156F、S156P),見表5,推測這些位點的改變可能與病毒的毒力、致病性、神經侵襲性、流行等有關。
表3 WNV E 蛋白堿基突變率(%)Tab.3 Base mutation rate of WNV E protein(%)
表4 WNV E 蛋白氨基酸突變率(%)Tab.4 Amino acid mutation rate of WNV E protein(%)
表5 WNV E 蛋白氨基酸突變位點分析Tab 5.Analysis of amino acid mutation sites of WNV E protein
E 蛋白是病毒包膜的主要成分,位于病毒顆粒的最外層,主要參與細胞表面受體識別與結合,與病毒進入細胞以及與宿主膜融合相關。E 蛋白是WNV的主要毒力因子,一些報道認為,E 蛋白糖基化位點的突變是影響WNV 毒力改變的重要因素[11-12]。本研究將亞洲地區(qū)不同國家不同WNV 株的E 蛋白氨基酸序列與譜系1 和譜系2 相比,發(fā)現與譜系2 相比,E蛋白的堿基和氨基酸的突變率較高,表明譜系1 的病毒株在亞洲區(qū)流行廣泛。E 蛋白的第154 ~156 位是WNV 譜系 1(1a 和 1b)和譜系 2 的糖基化位點,該位點被認為與病毒毒力相關,分析發(fā)現,E 蛋白的第154 和156 位氨基酸存在變異,推測可能與亞洲區(qū)流行株的毒力、致病性、神經侵襲性、流行等有關。
自1937 年在烏干達分離出WNV 以來,該病毒已在全球傳播,分別分布于非洲、亞洲、歐洲和澳大利亞[2]。自 1999 年以來,WNV 的流行出現在美洲,具有較高的發(fā)病率和死亡率。2014 年,美國疾病控制與預防中心(CDC)的監(jiān)測數據表明,WNV 是美國神經侵染性蟲媒病毒疾病的最常見病原[13]。有文獻表明,近幾年WNV 在世界范圍內不斷擴散傳播,并發(fā)現基因型為WNV02 的毒株在全球范圍內的擴散效率比NY99 毒株更高,表明病毒的傳播和暴發(fā)與其基因的進化顯著相關[14],因此,分析WNV 的系統發(fā)育和分子進化特征,對研究WNV 的傳播流行和感染機制具有重要意義。基于系統發(fā)生的分類,目前可將WNV 分為9 個譜系,能引起人類感染的WNV主要來自譜系 1 和譜系2[15-16],譜系 1 通常分布在非洲、歐洲、澳大利亞、亞洲、北美和中美洲及中東,譜系1a 在美國(NY99 毒株)、非洲、歐洲和中東地區(qū)分布最廣,可能是引起這些地區(qū)大暴發(fā)的原因[3];而譜系2 的WNV 早期主要在非洲大陸局部流行,后來傳到了俄羅斯、匈牙利、意大利和希臘[17]。本研究將亞洲區(qū)流行株與不同譜系的代表株進行系統進化分析,發(fā)現亞洲區(qū)流行的WNV 可能來源于譜系1株和譜系2 株,且病毒可能存在進化突變。
綜上所述,本研究通過對亞洲流行地區(qū)WNV的核苷酸序列和E 蛋白序列進行分析比對,構建分子進化樹,比較其親緣關系,并進一步闡述了這些病毒株間E 蛋白核苷酸和氨基酸突變情況,為后續(xù)研究WNV 的暴發(fā)流行機制提供了理論依據。