黃晶晶,肖 盟,徐英春
中國(guó)醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院 北京協(xié)和醫(yī)院檢驗(yàn)科, 北京 100730
隨著新技術(shù)的發(fā)展,病原微生物鑒定方法已從傳統(tǒng)的生化反應(yīng)過渡到使用基質(zhì)輔助激光解吸電離飛行時(shí)間質(zhì)譜(matrix-assisted laser desorption/ionization time-of-flight mass spectrometry,MALDI-TOF MS)鑒定輔以雙脫氧鏈終止法Sanger測(cè)序。Sanger測(cè)序是菌種鑒定“金標(biāo)準(zhǔn)”,深受臨床微生物工作者喜愛,但因其通量小,獲得的序列信息有限,無法滿足醫(yī)院感染性疾病暴發(fā)調(diào)查、未知病原體鑒定、毒力分析及耐藥性監(jiān)測(cè)等方面的需求。21世紀(jì)初人類基因組計(jì)劃完成,測(cè)序技術(shù)發(fā)展迅猛,高通量、低成本的二代測(cè)序技術(shù)(next-generation sequencing,NGS)應(yīng)運(yùn)而生。與Sanger測(cè)序相比,NGS不需要靶特異性引物,其優(yōu)勢(shì)在于單次運(yùn)行即可用于所有病原體的鑒定和分型。因此,該技術(shù)可在醫(yī)學(xué)微生物實(shí)驗(yàn)室和感染預(yù)防措施中發(fā)揮巨大作用[1]。
NGS即高通量測(cè)序技術(shù),應(yīng)用范圍包括全基因組測(cè)序 (whole-genome sequencing,WGS)、全外顯子組測(cè)序 (whole-exome sequencing,WES)、目標(biāo)區(qū)域測(cè)序 (targeted regions sequencing,TRS)和宏基因組測(cè)序。NGS可在一次測(cè)試中同時(shí)運(yùn)行多個(gè)病原體的WGS,病原體可以是來自不同患者的病原分離物,也可以是來自某一個(gè)體的多個(gè)菌種臨床樣本(宏基因組學(xué))。經(jīng)過10多年的發(fā)展,NGS測(cè)試成本明顯降低[2- 4]。該技術(shù)的核心思想是邊合成邊延伸邊測(cè)序,通過捕捉合成鏈末端的信號(hào)(熒光信號(hào)或氫離子釋放所致的pH值變化)來獲得DNA序列信息。其主要流程是將通用接頭連接到適當(dāng)長(zhǎng)度(一般100~1000 bp)片段化的基因組DNA上,然后運(yùn)用不同方法(油包水微球或固相表面連接等)形成千百萬的單分子多克隆聚合酶鏈反應(yīng)(polymerase chain reaction,PCR)陣列,繼而進(jìn)行大規(guī)模序列擴(kuò)增并實(shí)時(shí)檢測(cè)合成鏈末端的信號(hào),再通過生物信息學(xué)分析得到完整的基因組序列信息[5]。現(xiàn)階段發(fā)展成熟,應(yīng)用較為廣泛的技術(shù)平臺(tái)主要包括Roche/焦磷酸測(cè)序(也稱454測(cè)序)、Illumina/Solexa測(cè)序、Applied Biosystems/SOLID測(cè)序和Life Tech/Ion Torrent測(cè)序等。
NGS序列的信息獲取需要兩個(gè)重要環(huán)節(jié):(1)提取片段化的基因組DNA。因測(cè)序儀可測(cè)的序列長(zhǎng)度在100~1000 bp之間,故需在測(cè)序之前使用機(jī)械等方式將基因組DNA隨機(jī)片段化處理,并在兩端加上特定接頭[5- 6];因各測(cè)序平臺(tái)適用的片段DNA長(zhǎng)度不一,且DNA片段大小對(duì)數(shù)據(jù)分析產(chǎn)生影響,所以應(yīng)根據(jù)需要選擇片段大小進(jìn)行后續(xù)處理。(2)制備文庫(kù)。 DNA或RNA片段需與接頭和條形碼融合,以便在測(cè)序后區(qū)分待測(cè)的DNA片段,隨后進(jìn)行克隆擴(kuò)增,歸一化和測(cè)序。為此,制備一個(gè)健全的包含正在被研究的基因組DNA或RNA的文庫(kù)非常必要[7]。
測(cè)序獲得的大量序列信息需要通過生物信息學(xué)軟件或在線平臺(tái)進(jìn)行分析,以得到完整的基因組序列。首先,可以使用諸如FASTQC(Babraham Bioinformatics,英國(guó))等程序總結(jié)序列質(zhì)量信息,以確定數(shù)據(jù)質(zhì)量合格。由于NGS具有高度敏感性,即使存在非目標(biāo)生物體低水平污染也可能干擾下游分析,甚至導(dǎo)致不確定的分型結(jié)果。諸如checkM和Kraken等程序可用于快速篩選樣品中可能存在的污染[8- 9]。在某些情況下,生物信息學(xué)方法難以過濾污染物讀數(shù),樣本則需重新分離和測(cè)序。
序列信息質(zhì)量合格后,測(cè)序的片段(讀數(shù))可按需要進(jìn)行組裝(基因組裝配)。一般來說,碎片越大,基因組裝越容易和準(zhǔn)確。常用的基因組組裝軟件有CLC Genomics Workbench(Qiagen),Newbler和Velvet等。同時(shí),研究者可使用多位點(diǎn)序列分型(multilocus sequence typing,MLST),通過研究核心基因組多位點(diǎn)序列分型(core genome MLST,cgMLST)或全基因組多位點(diǎn)序列分型(whole genome MLST,wgMLST)研究分離株之間的遺傳關(guān)系。這種方法可以使用諸如SeqSphere(Ridom)和BioNumerics(Applied Maths,Biomérieux)等軟件或EnteroBase和BIGSdb(細(xì)菌隔離基因組序列數(shù)據(jù)庫(kù))等在線工具[10]。
基因組裝配后,基因組自動(dòng)注釋引擎可用于預(yù)測(cè)基因功能,從而提供生物體全面的功能圖。通常使用的微生物基因組自動(dòng)注釋服務(wù)包括美國(guó)國(guó)立生物技術(shù)信息中心原核基因組注釋傳遞途徑(http://www.ncbi.nlm.nih.gov/genome/annotation_prok/)和GeneMark(http://opal.biology.gatech.edu/)[11],在基因組流行病學(xué)中心網(wǎng)站上可分析NGS數(shù)據(jù)。為了檢測(cè)毒力和耐藥基因,可使用Virulence Finder和ResFinder,或通過綜合抗菌藥物耐藥基因數(shù)據(jù)庫(kù)和毒力因子數(shù)據(jù)庫(kù)獲得相應(yīng)數(shù)據(jù)。然而,通過這些網(wǎng)站獲得的結(jié)果需使用其他方法進(jìn)行確認(rèn)[12]。
使用Artemis Comparison Tool(ACT)、Artemis和來自Sanger Institute的DNA繪圖儀可進(jìn)行進(jìn)一步的比較基因組研究[13- 15]。
如今,國(guó)內(nèi)絕大部分臨床微生物實(shí)驗(yàn)室采用基于生化反應(yīng)的自動(dòng)或半自動(dòng)微生物鑒定系統(tǒng)進(jìn)行菌種鑒定,雖然MALDI-TOF MS技術(shù)早在20 世紀(jì)80 年代末即已問世并迅速發(fā)展,但由于其設(shè)備昂貴尚未在眾多基層醫(yī)院廣泛使用。中心實(shí)驗(yàn)室使用MALDI-TOF MS技術(shù)能夠準(zhǔn)確鑒定臨床分離的細(xì)菌和真菌[16],但對(duì)一些少見、罕見以及菌種復(fù)合體的鑒定結(jié)果并不十分可靠,如Ranque等[17]和Wieser等[18]報(bào)道的近平滑復(fù)合體、新型隱球菌復(fù)合體等。所以,臨床微生物實(shí)驗(yàn)室常以MALDI-TOF MS技術(shù)輔以Sanger測(cè)序進(jìn)行菌種鑒定。但Sanger測(cè)序獲得的菌株信息有限,且臨床對(duì)于微生物實(shí)驗(yàn)室的需求不僅僅局限于菌種鑒定和藥物敏感性檢測(cè),實(shí)驗(yàn)室常常需要協(xié)助感染控制部門進(jìn)行感染性疾病暴發(fā)的調(diào)查,在分子水平監(jiān)測(cè)耐藥性的傳播。因此,及時(shí)、有效開展NGS測(cè)序是臨床微生物工作必不可少的內(nèi)容。
據(jù)報(bào)道,NGS技術(shù)已應(yīng)用于一些臨床微生物實(shí)驗(yàn)室,其常用于醫(yī)院感染性疾病暴發(fā)的調(diào)查、未知病原體的鑒定、毒力分析、耐藥基因組的研究等方面[12,19]。
NGS序列信息可報(bào)告感染性疾病暴發(fā)的傳播鏈,并已被用于跟蹤由鮑曼不動(dòng)桿菌、耐甲氧西林金黃色葡萄球菌和肺炎克雷伯桿菌引起的醫(yī)院感染性疾病的傳播[20- 23]。在醫(yī)院感染性疾病暴發(fā)期間,當(dāng)流行病學(xué)證據(jù)支持時(shí),基因組序列可用于跟蹤患者之間或環(huán)境來源的傳播鏈。當(dāng)流行病學(xué)聯(lián)系缺失時(shí),基因組序列也可幫助作出醫(yī)院感染來源的假設(shè),并且確定哪些病例與醫(yī)院感染有關(guān)。當(dāng)NGS數(shù)據(jù)在醫(yī)院感染調(diào)查中整合時(shí),可指導(dǎo)、回應(yīng)干預(yù)措施,例如隔離病房或制定新的防控指南,以防止未來暴發(fā)。
使用基于WGS分型的優(yōu)點(diǎn)是可促進(jìn)流行病學(xué)研究和公共衛(wèi)生調(diào)查,其在暴發(fā)檢測(cè)和監(jiān)測(cè)多藥耐藥病原體的演變和動(dòng)力學(xué)中顯得尤為重要[12]。Wang等[24]將2013年暴發(fā)于中國(guó)云南西雙版納的登革病毒進(jìn)行WGS測(cè)序,經(jīng)分析發(fā)現(xiàn)其屬于DENV- 3基因型Ⅱ,和老撾2013年分離株、孟加拉國(guó)2002年分離株基因型最為相似。Zhou等[25]基于WGS描述了新出現(xiàn)的產(chǎn)CTX-M- 15肺炎克雷伯菌序列型1427(sequence type 1427,ST1427)。此外,通過基因組系統(tǒng)發(fā)育分析,追蹤在單中心治療患者和隨后轉(zhuǎn)診患者之間間歇性傳播的產(chǎn)CTX-M- 15肺炎克雷伯菌ST15。長(zhǎng)期循環(huán)調(diào)查該區(qū)域患者群體以早期發(fā)現(xiàn)肺炎克雷伯菌高危克隆[1]。
除了疫情追蹤和表征外,WGS還有助于控制措施的實(shí)施以避免耐藥病原體的擴(kuò)散。荷蘭曾發(fā)生機(jī)構(gòu)間傳播的碳青霉烯酶耐藥肺炎克雷伯菌的暴發(fā)流行,衛(wèi)生部門通過將所有檢測(cè)陽性的居民隔離至醫(yī)療機(jī)構(gòu)外單獨(dú)治療以避免更多人感染[26]。
快速鑒定新發(fā)突發(fā)感染性疾病病原體,在最短時(shí)間內(nèi)準(zhǔn)確獲取病原體的全面信息,對(duì)于能否有效控制感染性疾病疫情具有決定性意義。病毒性病原體的檢測(cè)主要包括病毒抗原檢測(cè)、核酸檢測(cè)以及病毒分離培養(yǎng)等。病毒分離培養(yǎng)及抗原檢測(cè)因方法學(xué)的固有缺陷,無法滿足臨床快速、準(zhǔn)確鑒定新發(fā)突發(fā)病毒性病原體的需求[27- 28]。雖然臨床微生物實(shí)驗(yàn)室可采用特異性強(qiáng)、敏感性高的熒光定量PCR對(duì)疑似病毒進(jìn)行篩查和確認(rèn),但其必須建立在已知病原體基因序列基礎(chǔ)上,無法對(duì)未知病毒病原體進(jìn)行檢測(cè)[28]。
沙特阿拉伯Saeb等[27]在傳統(tǒng)鑒定方法失敗后,通過NGS技術(shù)結(jié)合生物信息學(xué)、系統(tǒng)發(fā)育和病原學(xué)分析報(bào)道了首例人感染溶血梭菌(Clostridiumhaemolyticum)。研究發(fā)現(xiàn),該菌株是一種潛在的致病菌,具有抗生素抗性,且對(duì)人類宿主及其周圍環(huán)境耐受力強(qiáng),除質(zhì)粒的新型重組外,染色體中存在毒力因子,可能是人類感染發(fā)生的原因。這項(xiàng)工作表明NGS用于臨床微生物病原體鑒定,特別是對(duì)更多微生物樣本進(jìn)行NGS序列分析并在公共數(shù)據(jù)庫(kù)中共享的重要性。
了解病原體毒力概況對(duì)于預(yù)測(cè)疾病嚴(yán)重程度和轉(zhuǎn)歸,以及在疾病早期進(jìn)行風(fēng)險(xiǎn)評(píng)估至關(guān)重要。WGS有可能通過使用在線工具來確定毒力因子的存在,不僅限于特定基因[29- 30]。
WGS可用于表征高毒力細(xì)菌,如產(chǎn)志賀毒素的大腸埃希菌(Shiga toxin-producingEscherichiacoli, STEC)O104:H4型。STEC曾引發(fā)過大規(guī)模疫情,然而其已知的進(jìn)化歷史和基因組多樣性信息較少。使用WGS進(jìn)行暴發(fā)和非暴發(fā)菌株系統(tǒng)發(fā)育學(xué)分析,為其后續(xù)研究提供了進(jìn)化背景,并揭示譜系特異性標(biāo)記,指示了選擇性壓力和適應(yīng)性選擇[31]。此外,產(chǎn)志賀毒素的腸聚集性大腸埃希菌(enteroaggregativeEscherichiacoli, EAEC)Stx2a +O104:H4的核心基因組系統(tǒng)發(fā)育分析顯示,不同聚類、不同耐藥性、毒力模式取決于隔離時(shí)間[32]。
在大型隊(duì)列研究中,WGS可用于描述STEC的分子特征。所有關(guān)聯(lián)菌株的基因型、血清型、MLST、毒力、抗菌藥物耐藥譜和系統(tǒng)遺傳背景等信息均可從序列數(shù)據(jù)中獲取,以獲得全面、高分辨率的分子特征。NGS可在相對(duì)較短時(shí)間內(nèi)詳細(xì)描述和比較多種菌株。因此,WGS在改進(jìn)病原體分子流行病學(xué)監(jiān)測(cè)中的作用不可否認(rèn)。
除了鑒定病原體之外,還可使用宏基因組學(xué)方法來研究耐藥基因組。腸道細(xì)菌是抗菌藥物耐藥基因(antibiotic resistance gene,ARG)的已知儲(chǔ)存庫(kù),抗菌藥物治療對(duì)腸道細(xì)菌耐藥基因組產(chǎn)生影響,可導(dǎo)致水平基因轉(zhuǎn)移和耐藥菌的選擇。一項(xiàng)蒂賓根大學(xué)的研究調(diào)查了2例經(jīng)環(huán)丙沙星治療6 d的患者,通過宏基因組學(xué)分析顯示腸內(nèi)存在ARG,并提出分析抗菌藥物選擇壓力的新方法,可用于醫(yī)院比較治療方案及評(píng)估其對(duì)腸道細(xì)菌耐藥基因組的影響;臨床醫(yī)生需格外關(guān)注抗菌藥物的選擇,優(yōu)先使用對(duì)患者腸道菌群選擇性壓力較小的抗菌藥物,可能減少耐藥菌株的傳播[33]。
NGS數(shù)據(jù)庫(kù)中已有報(bào)道,在生命垂危和住院患者體內(nèi)發(fā)現(xiàn)了質(zhì)粒黏菌素耐藥基因mcr- 1。歐洲國(guó)家通過回顧性研究對(duì)NGS數(shù)據(jù)庫(kù)中的mcr- 1基因進(jìn)行調(diào)查,從而引發(fā)丹麥、德國(guó)和荷蘭的病例檢測(cè)[34- 36]。在荷蘭,2000多例當(dāng)?shù)鼗颊吣c桿菌科菌株在數(shù)小時(shí)內(nèi)被篩選,以揭示mcr- 1基因的存在[40]。因此,已經(jīng)存在的NGS數(shù)據(jù)可用于篩選新的抗菌藥物耐藥基因。
NGS技術(shù)的發(fā)展使得人類更深入地了解微生物的變遷和進(jìn)化,更全面、準(zhǔn)確地描述菌株基因型、毒力、抗菌藥物耐藥譜和系統(tǒng)遺傳背景等信息,通過使用獨(dú)特的標(biāo)志物進(jìn)行疫情追蹤,為醫(yī)院感染性疾病的暴發(fā)調(diào)查奠定理論基礎(chǔ)。此外,NGS在臨床微生物實(shí)驗(yàn)室中可標(biāo)準(zhǔn)化病原體的分型方法,用于分子診斷、感染預(yù)防、病原體鑒定和監(jiān)測(cè)以及新型抗菌藥物耐藥基因檢測(cè)。然而,隨著NGS在醫(yī)學(xué)中的廣泛應(yīng)用,其技術(shù)流程和數(shù)據(jù)分析對(duì)臨床微生物實(shí)驗(yàn)室提出了更高要求。研究者不僅需處理比傳統(tǒng)基因分型更多的數(shù)據(jù)量,還要結(jié)合應(yīng)用生物信息學(xué)和流行病學(xué)等內(nèi)容。此外,從國(guó)內(nèi)外研究來看,建立一個(gè)全球范圍內(nèi)共享的NGS數(shù)據(jù)庫(kù)非常有必要,其將有助于突發(fā)、新發(fā)感染性疾病的及時(shí)診斷,并有助于開發(fā)微生物基因組學(xué)應(yīng)用于感染性疾病監(jiān)測(cè)和疫情調(diào)查的全部潛力。
然而,NGS工作流程的改善,特別是縮短文庫(kù)制備時(shí)間和數(shù)據(jù)分析自動(dòng)化等方面尚需進(jìn)一步探索。此外,建立統(tǒng)一的病原體分型標(biāo)準(zhǔn),從而構(gòu)建全球共享的NGS參考數(shù)據(jù)庫(kù)以進(jìn)一步降低成本勢(shì)在必行。唯有如此,感染性病原體的監(jiān)測(cè)與管理,以及基于NGS數(shù)據(jù)的靶向抗生素治療才能實(shí)現(xiàn),從而推動(dòng)個(gè)性化微生物學(xué)的發(fā)展。
志謝:感謝中國(guó)醫(yī)學(xué)科學(xué)院阜外醫(yī)院周洲教授在NGS數(shù)據(jù)解讀方面給予的指導(dǎo);感謝北京協(xié)和醫(yī)院檢驗(yàn)科張棟在文章撰寫方面給予的幫助。