卞星晨, 劉笑芬, 馮美卿, 張 菁,*
基因組規(guī)模代謝模型( genome-scale metabolic model,GSMM) 是通過整合基因組學、轉(zhuǎn)錄組學、文獻組學、蛋白質(zhì)組學以及代謝組學等多組學數(shù)據(jù),建立基因-蛋白質(zhì)(酶)-生化反應(yīng)關(guān)聯(lián)組成的特定微生物代謝網(wǎng)絡(luò)[1]。GSMM將從基因組獲得的生化反應(yīng)信息與代謝表型進行橋接,為從系統(tǒng)上理解微生物生理代謝功能模型提供一個高效平臺[2]。GSMM最初主要應(yīng)用于工業(yè)微生物制造領(lǐng)域,具體包括①分析代謝網(wǎng)絡(luò)屬性;②預(yù)測和分析微生物生長表型;③基于模型的組學數(shù)據(jù)闡釋;④系統(tǒng)代謝工程[2]。近幾年,GSMM逐漸應(yīng)用于細菌感染治療領(lǐng)域,Oberhardt等[3-4]通過GSMM的建立,闡釋了病原菌的感染過程和致病機制,提出該建模方法不僅可創(chuàng)新性用于新靶標抗菌藥物的發(fā)現(xiàn),還有助于更好地理解疾病的發(fā)病機制,優(yōu)化治療策略。本文就基因組規(guī)模代謝網(wǎng)絡(luò)模型的構(gòu)建及其在抗感染治療領(lǐng)域的應(yīng)用進行綜述,以期為抗感染治療及新藥開發(fā)提供參考。
GSMM構(gòu)建通常包括以下4個部分[5]。
首先需通過基因組測序和數(shù)據(jù)庫比對,獲得所研究微生物的基因組注釋信息,結(jié)合生化反應(yīng)或代謝通路信息的數(shù)據(jù)庫,如KEGG (Kyoto Encyclopedia of Genes and Genomes, https://www.genome.jp/kegg/),MetaCyc (Metabolic Pathway Database, https://metacyc.org/),構(gòu)建初步的代謝網(wǎng)絡(luò)。應(yīng)予注意的是,僅僅依據(jù)基因組信息構(gòu)建的代謝網(wǎng)絡(luò)往往是不完整和不全面的,需要后續(xù)的手工修正以完善代謝網(wǎng)絡(luò)。
由于并非所有來源于數(shù)據(jù)庫的基因注釋可信度都很高,且用于獲得注釋信息的數(shù)據(jù)庫并不具有種屬特異性,基因組數(shù)據(jù)注釋過程中往往包含了許多非目標微生物的信息,而缺失了部分實際存在的代謝物及代謝反應(yīng),需根據(jù)文獻檢索結(jié)果對代謝網(wǎng)絡(luò)進行補充修正,該過程稱為模型的手工修正。手工修正對于后期模型的準確預(yù)測十分必要,經(jīng)完善的模型對于代謝物之間相互關(guān)系的描述更為準確和細致。
粗略的GSMM的重構(gòu)依賴于流平衡分析(flux balanced analysis, FBA)[6],F(xiàn)BA的目標就是獲得基于約束的最優(yōu)解空間。該分析借助Matlab軟件中的COBRA (constraint-based reconstruction and analysis)工具包[7],將代謝反應(yīng)用計量學矩陣表示,代謝流用向量表示,模型的約束條件通常是物質(zhì)守恒與能量守恒。為了解微生物在不同生理條件或外界因素干擾下(微生物生長的不同生命周期,生長所需營養(yǎng)物質(zhì)是否充足,疾病的不同階段,藥物對微生物的作用)的代謝調(diào)控,通?;谄湓诓煌瑮l件下的基因表達水平,定義代謝流的邊界,用以對模型進一步約束,從而縮小解空間,提高數(shù)學模型在真實情況下的預(yù)測能力 [8-9]。
整合基因表達數(shù)據(jù)的算法包括GIMME (gene inactivity moderated by metabolism and expression)、iMAT(integrative metabolic analysis tool)、MADE(metabolic adjustment by differential expression)、E-Flux、PROM(probabilistic regulation of metabolism)等[10],各有其優(yōu)缺點,比如GIMME算法只需要一個基因表達數(shù)據(jù)集,但需要用戶設(shè)定閾值,判斷基因表達變化,MADE算法無需設(shè)定閾值,但需要多重基因差異表達數(shù)據(jù)集,因基因表達水平是一個連續(xù)的變量,E-Flux算法避免將表達數(shù)據(jù)分類為表達或不表達這種二進制形式,更符合真實情況,可根據(jù)實際需求選用合適的算法[11]。
在模型評估過程中,通過重復(fù)1.2和1.3步驟,尋找重構(gòu)網(wǎng)絡(luò)中缺失的一些代謝反應(yīng),通過大量全面的文獻檢索補齊這些網(wǎng)絡(luò)漏洞。需要注意的是,在填補代謝漏洞的過程中,新添加到代謝網(wǎng)絡(luò)中的生化反應(yīng)可能會導(dǎo)致新漏洞出現(xiàn)。因此,當加入新的反應(yīng)時,應(yīng)確保所有代謝物能連接到已構(gòu)建好的代謝網(wǎng)絡(luò)。
除需要補齊網(wǎng)絡(luò)漏洞外,也應(yīng)對GSMM的實用性進行評估,比如是否在不同培養(yǎng)基中合成細菌生長所需的前體物質(zhì);典型培養(yǎng)基上能否生長;能否反映單一基因敲除的細菌生長表型;已知的與預(yù)測的生理特性的比較;合成目標代謝產(chǎn)物的能力及其合成速率[12]。
經(jīng)過模型的評估與修正,GSMM 構(gòu)建的最后一步則是將生化反應(yīng)可視化。可視化軟件包括Adobe Illustrator、Cell Designer (http://celldesigner.org/)等。
由于GSMM的構(gòu)建需要多達96個步驟,為加速新模型的建立,已開發(fā)出一些程序,使建模過程趨向于自動化,如基于網(wǎng)絡(luò)資源的模型SEED(http://www.theseed.org/)[13],該模型的核心為一個模型重構(gòu)管線,它整合了基因組注釋技術(shù)、基因-蛋白反應(yīng)(gene-protein-reaction, GPR)構(gòu)建、生物量產(chǎn)生反應(yīng)、反應(yīng)網(wǎng)絡(luò)集、反應(yīng)可逆性的熱力學分析以及模型的優(yōu)化[14-15]。其他自動化建模工具還包括有Path2Models (https://www.ebi.ac.uk/biomodels-main/path2models)[16]、CarveMe(https://pypi.org/project/carveme/)[17]等。
GSMM在工業(yè)微生物領(lǐng)域的應(yīng)用已較為廣泛,近年來才逐漸應(yīng)用于抗感染領(lǐng)域。Oberhardt等[3]在2008年建立了銅綠假單胞菌PAO1的代謝模型,從而對該病原菌的基因型和表型關(guān)系有了更深的理解。該課題組選取了囊性纖維化肺部感染患者,對銅綠假單胞菌在感染進程中的代謝網(wǎng)絡(luò)加以分析,揭示了在囊性纖維化肺中,銅綠假單胞菌如何通過代謝改變以適應(yīng)環(huán)境[4],探討銅綠假單胞菌的致病機制,即在宿主的定植與感染機制。在模型構(gòu)建完成后,模擬每個基因的敲除,鑒定出不同感染進程中顯著抑制細菌生長或致死的基因,由此可根據(jù)疾病進程,針對特異性基因靶點選擇更合適的治療方案。
由于細菌在體內(nèi)的生存、感染與定植主要與生長必需基因和毒力因子的產(chǎn)生相關(guān),多數(shù)抗菌藥物的作用靶點通常作用于細菌生長過程,但這種靶向作用易產(chǎn)生耐藥。Bartell等[18]提出毒力相關(guān)通路可能成為治療靶點,且不易產(chǎn)生適應(yīng)性耐藥。在預(yù)測的116個生長必需基因中,46個基因同時為毒力因子合成所必需,其中6個脂肪酸和磷脂代謝基因(aacA、aacB、aacC、aacD、fabD、fabG)對毒力因子的合成影響最為顯著。這種基于機制的模型定量分析揭示了基因?qū)毦L和毒力的影響,不僅僅減少了實驗成本和時間,也為開發(fā)新治療策略提供了思路和方向。
銅綠假單胞菌易在醫(yī)療植入物[19]以及囊性纖維化患者的肺部[20]形成生物膜,但其生物膜形成機制仍不清楚。Biggs等[21]借助GSMM,結(jié)合已有的基于Agent仿真建模(agent-based model, ABM)的生物膜形成模型,揭示銅綠假單胞菌生物膜形成活性是氧依賴性的,在氧缺乏時,添加硝酸鹽可緩解這種氧依賴機制,促進無氧呼吸進而增加生物膜的形成,與實際情況相符[22]。Vital-Lopez等[23]在PAO1的GSMM基礎(chǔ)上構(gòu)建動力學模型,結(jié)合基因表達譜,研究銅綠假單胞菌在形成生物膜狀態(tài)下的代謝,根據(jù)相關(guān)代謝物的濃度變化預(yù)測特異性的針對生物膜形成的目標反應(yīng),進而尋找特異性基 因。
在抗菌靶標尋找中,Sigurdsson等[24]首次運用系統(tǒng)生物學方法,通過模擬與生物膜形成相關(guān)的微環(huán)境,發(fā)掘清除銅綠假單胞菌生物膜的候選基因。由于病原菌可能在被清除之前就形成了生物膜,有必要對必需基因發(fā)生突變的菌株的生物膜形成能力進行評估。只有當必需基因的突變不誘導(dǎo)生物膜形成時方可將其作為藥物作用靶標,故Xu等[25]通過模型模擬對突變株生物膜形成進行定量預(yù)測。有趣的是,通過系統(tǒng)水平的建模,發(fā)現(xiàn)必需基因的突變相比于非必需基因更易誘導(dǎo)生物膜形成,最終確定lysC、cysH、adk、galU這4個基因可作為銅綠假單胞菌的治療靶標,實驗數(shù)據(jù)也證實這4個靶基因與銅綠假單胞菌的生存和毒力有 關(guān)[25]。
GSMM有助于從系統(tǒng)層面了解抗生素作用機制,反映在抗生素作用下,細菌的生化反應(yīng)發(fā)生哪些改變。以銅綠假單胞菌為例,多黏菌素類藥物發(fā)揮抗菌活性的機制與細菌應(yīng)答之間的關(guān)系仍然存在許多未知,需要借助系統(tǒng)藥理學的方法進行更全面的研究。Zhu等[26]在建立了銅綠假單胞菌PAO1的代謝模型iPAO1的基礎(chǔ)上,將多黏菌素B作用下細菌的轉(zhuǎn)錄組學數(shù)據(jù)作為模型的約束條件,建立了基于多黏菌素B作用機制的模型,不僅揭示銅綠假單胞菌在多黏菌素B作用下發(fā)生的一系列代謝改變,包括生物量合成減少、氨基酸分解代謝上調(diào)、三羧酸循環(huán)的代謝流上調(diào)與氧化還原反應(yīng)的增加,與組學數(shù)據(jù)互為印證,也能夠預(yù)測環(huán)境或基因擾動引起的代謝改變。模型模擬結(jié)果表明,脂質(zhì)A的修飾與多黏菌素B的耐藥相關(guān),這一修飾對細菌的生長影響不大,但顯著改變了外膜的生化特征,包括因4-氨基-4-脫氧-L-阿拉伯糖(4-amino-4-deoxy-L-arabinose, L-Ara4N)修飾導(dǎo)致的表面負電荷的中和,乙?;腿ヒ阴;^程帶來的極性和疏水作用改變,這些代謝改變都將影響多黏菌素類藥物與細菌的相互作用。
Presta等[27]基于多黏菌素E處理后的細菌轉(zhuǎn)錄組學數(shù)據(jù),建立了鮑曼不動桿菌標準菌株ATCC 19606在多黏菌素E處理前后的GSMM。將未經(jīng)藥物處理和經(jīng)多黏菌素E 2 mg/L處理15 min和60 min的基因表達數(shù)據(jù)整合入鮑曼不動桿菌ATCC 19606的GSMM中,結(jié)果表明在多黏菌素E的選擇性壓力下,細菌的必需基因發(fā)生改變。78個必需基因中,經(jīng)多黏菌素E處理15 min和60 min后66個基因仍被預(yù)測為生長必需基因,由此提出在多黏菌素類藥物作用下具有特異性的藥物作用靶標基因,作用于這些靶標基因的藥物可能與多黏菌素E產(chǎn)生協(xié)同作用。而事實上,除轉(zhuǎn)錄調(diào)控以外,代謝調(diào)控也將共同影響細菌的代謝網(wǎng)絡(luò)。Zhu等[28]進一步將轉(zhuǎn)錄組學和代謝組學數(shù)據(jù)整合到鮑曼不動桿菌ATCC 19606的GSMM中,探究鮑曼不動桿菌在多黏菌素E處理后發(fā)生的代謝改變,其中糖異生、磷酸戊糖途徑、氨基酸和核苷酸的生物合成上調(diào),三羧酸循環(huán)、肽聚糖和脂多糖的生物合成下調(diào),呼吸鏈代謝流也發(fā)生改變,與代謝組學實驗數(shù)據(jù)相一致,這些結(jié)果使我們產(chǎn)生思考:多黏菌素E聯(lián)合一些非抗生素如核苷酸抑制劑是否能產(chǎn)生協(xié)同作用。這種多黏菌素E處理下的代謝改變,從機制上為優(yōu)化多黏菌素類藥物聯(lián)合用藥方案的制定提供參考依據(jù)。
無論是對病原菌致病機制或是對藥物抗菌機制的揭示,其價值均在于發(fā)現(xiàn)特異性治療靶標,從機制上為新藥開發(fā)和治療策略的制定提供依據(jù)。必需基因的預(yù)測是發(fā)現(xiàn)潛在靶標最常用的方法,編碼必需基因的酶通常被假定為藥物靶標。若該必需基因或基因產(chǎn)物會影響某一個代謝反應(yīng),基因敲除就可能導(dǎo)致代謝流的重新分布[29]。在不同的疾病階段,病原菌的生長環(huán)境有所差異,其必需基因也會受到環(huán)境的影響,因此在不同生長條件下建立的模型適用于不同疾病階段藥物靶標的發(fā)現(xiàn)[30]。除必需基因外,評估酶的穩(wěn)健性也能夠發(fā)掘代謝網(wǎng)絡(luò)中易受影響部分,將其作為潛在藥物靶標。模擬反應(yīng)流部分抑制到完全抑制對目標流如生物量產(chǎn)生的影響,揭示在酶催化反應(yīng)抑制的條件下代謝網(wǎng)絡(luò)的穩(wěn)健性[31]。若酶的失活引起某些毒性中間體累積,毒性中間體對病原菌有致死作用,那么這些酶也將會成為更具潛力的藥物靶標[32]。由于一些藥物與天然代謝物高度相似,這些藥物可競爭或抑制酶的活性[33],因此預(yù)測必需代謝物也有助于發(fā)現(xiàn)藥物新靶標。與必需基因的預(yù)測方法類似,對鮑曼不動桿菌而言,預(yù)測出9個必需代謝物[34],這些必需代謝物合成或消耗所需的催化酶將成為可能的靶標。
許多抗感染藥物是多靶點的,多靶點作用不易產(chǎn)生耐藥[35],運用FBA能夠快速預(yù)測多個基因或代謝反應(yīng)擾動的影響[36]。聯(lián)合用藥也相當于是一種多靶點策略,為篩選得到具有協(xié)同作用的聯(lián)合用藥方案,選取已知或可能的藥物靶標,逐漸限制其代謝流,觀察相應(yīng)的發(fā)生流增加的代謝反應(yīng),在這些通路中尋找有協(xié)同作用的藥物新靶標[32]。或者在GSMM的基礎(chǔ)上,整合藥物處理后病原菌的基因表達信息,建立特定條件下的代謝模型,據(jù)此預(yù)測的靶標可能與該藥物產(chǎn)生協(xié)同作 用[27]。
綜上所述,GSMM的構(gòu)建有助于理解病原菌的致病機制、藥物的作用機制以及耐藥產(chǎn)生,在新藥研發(fā)中,將模型預(yù)測整合到新藥研發(fā)管線中,基于預(yù)測進行實驗驗證,將大大加快抗感染治療藥物的研發(fā)和治療策略的制定。