徐軼舟, 王 卓
(上海交通大學Bio-X研究院 遺傳發(fā)育與精神神經疾病教育部重點實驗室,上海 200030)
肝細胞肝癌(Hepatocellular carcinoma, HCC)是原發(fā)性肝癌中最常見的一種,據統(tǒng)計,它已成為癌癥中名列前三的致死原因[1]。隨著瓦伯格效應被揭示,人們意識到腫瘤細胞會改變自身的代謝途徑以滿足不同尋常的增殖、遷移及避免凋亡的需求[2],因此,癌癥可以被認為是一種復雜的代謝疾病。分析其與正常細胞內顯著不同的生化通路,找出可能的代謝重編程位點,對于癌癥機制的研究有著非常重要的作用。
細胞的代謝網絡囊括了所有生化和相關的調控反應。通過網絡架構,將這些反應作為一個整體,避免了單個模塊的局限性,是代謝網絡模型的優(yōu)勢所在。隨著高通量測序技術的飛速發(fā)展,基因組規(guī)模代謝網絡的重建從酵母、大腸桿菌等模式生物,到復雜的真核生物,甚至到人都有了廣泛的應用[3]。在此基礎上,通過結合不同的轉錄組/蛋白質組數據,細胞系/組織特異性的模型也陸續(xù)被推出[4]。
有了人類全基因組規(guī)模的代謝網絡模型作為基礎,很多實驗室將其應用到預測各種疾病標志物和治療靶點的工作中,其中就包括癌癥。Mardinoglu等[5]用微陣列數據挖掘出了非小細胞肺癌的關鍵基因。Uhlen等[6]運用TCGA數據庫(The Cancer Genome Atlas, https://portal.gdc.cancer.gov/)中的轉錄組數據和tINIT(Task-driven Integrative Network Inference for Tissues)算法為多種癌癥構建了總計6 753個病人個體化代謝模型,為精準分型提供基礎。數個基于此設計的抗癌藥物也已被FDA批準并投入臨床,如針對EGFR突變導致的非小細胞肺癌的安維汀、治療HER2陽性乳腺癌的帕妥珠單抗。這些結果都證明了代謝模型在癌癥研究中的可靠性,因此將代謝模型的模擬預測與傳統(tǒng)實驗相結合,可以更高效地探索癌癥發(fā)病機制,為后續(xù)研究提供可靠的理論依據。
在本文的研究中,我們對正常肝臟模型和HCC肝癌模型進行代謝分析,通過比較兩個模型結果各異的基因,嘗試找出HCC肝癌細胞生長的代謝重編程位點,并據此探索腫瘤細胞生長的特殊機制,為臨床藥物靶點的篩選提供依據。
采用代謝模型領域權威數據庫(Human Metabolic Atlas, https://metabolicatlas.org)中的正常肝細胞[7]和HCC肝癌細胞模型[8]來進行代謝分析。比較在敲除后對兩模型特異/共同有影響的代謝基因,探索HCC肝癌細胞生長的潛在重編程機制。兩個代謝模型都是以HMR2(Human Metabolic Reaction 2.0)[9]為基礎,通過INIT[4](Integrative Network Inference for Tissues)算法整合HPA(Human Proteome Atlas, http://www.proteinatlas.org/)數據庫各細胞系和組織的蛋白表達譜數據,將biomass作為衡量細胞生長情況的指標。兩個模型的組分構成如表1所示,它們共有的基因為1 458個。
表1 代謝模型組分構成
代謝網絡的研究方法可以分為靜態(tài)和動態(tài)兩種,然而由于缺少動力學參數的先驗知識,目前的算法強度也無法支撐在大范圍生物系統(tǒng)中如此大量數據的處理,因此動態(tài)法的應用十分受限,靜態(tài)法仍是目前的主流。在靜態(tài)算法中,流平衡分析法[10](Flux balance analysis, FBA)利用了基于約束的思想:假設代謝網絡處于穩(wěn)定態(tài),即任何一個物質的產出等于消耗。在給定閾值的凸空間內(限制某些反應的流值上下限,如限制營養(yǎng)攝取反應的流值)通過線性規(guī)劃尋找目標函數最優(yōu)解,并以此計算此時整個代謝網絡的流值分布。因為FBA的穩(wěn)態(tài)假設與生物體內情況相符,且線性規(guī)劃的解空間穩(wěn)定性較高,因此在代謝網絡研究領域中應用時間最長,范圍也最廣。
本文主要用到了依附于MATLAB平臺的工具包COBRA[11]和RAVEN[12],它們都是基于約束的代謝模型進行重構和分析的工具包。將細胞生長設為目標函數進行求解,即可得到在當前條件下細胞生長最優(yōu)時其他反應及其酶的狀態(tài)。
通過RAVEN工具包讀入模型,完成相應的格式轉變,并將生成biomss的反應設置為目標函數;之后將COBRA工具包的數學計算器改為性能更優(yōu)的Gurobi(https://www.gurobi.com/),并運行singleGeneDeletion函數和doubleGeneDeletion函數對兩個模型共有的1 458個基因進行單/雙基因敲除模擬,參數選擇默認的線性規(guī)劃(LP)進行求解。這兩個函數的原理是分別將待敲除基因催化的反應流值置為0,并在滿足FBA約束條件下,依據各反應間的承接關系重新計算目標函數的值。
選取biomass的合成反應作為目標函數,以此衡量細胞生長,并對敲除后會使biomass合成量降為0(即導致細胞死亡)的基因和基因對進行分析。
通過模擬單獨敲除每個基因對模型的影響,并找出敲除后會使細胞生長降為0的基因,稱為致死基因,見表2和圖1所示。
表2 致死基因
圖1 致死基因結果韋恩圖
兩個模型共有的致死基因為8個,根據Reactome數據庫(https://reactome.org/),它們都位于甘油磷脂代謝通路,參與了維持細胞膜結構的心磷脂的合成和構象轉化。其中有5個基因[PGS1(phosphatidylglycerophosphate synthase 1)、CRLS1(cardiolipin synthase 1)、CDS2(CDP-diacylglycerol synthase 2)、CDIPT(CDP-diacylglycerol——inositol 3-phosphatidyltransferase)和CMPK2(cytidine/uridine monophosphate kinase 2)]已在IMPC(International Mouse Phenotyping Consortium, https://www.mousephenotype.org/)數據庫中有小鼠的功能實驗結果驗證,且都為敲除后致死基因,與我們的模擬一致。
HCC肝癌細胞模型特異的結果有12個,基于Reactome數據庫的分析結果表明其富集于線粒體的脂肪酸β氧化通路,對腫瘤細胞獲取增殖所需的大量能量有至關重要的作用,如圖2紅色框所示。不僅如此,HADHA(hydroxyacyl-CoA dehydrogenase trifunctional multienzyme complex subunit alpha)、SPTLC1(serine palmitoyltransferase long chain base subunit 1)、ACADM(acyl-CoA dehydrogenase medium chain)、ECHS1(enoyl-CoA hydratase short chain 1)、CEPT1(choline/ethanolamine phosphotransferase 1)、PTDSS1(phosphatidylserine synthase 1)、ACADSB(acyl-CoA dehydrogenase short/branched chain)和PCYT1A(phosphate cytidylyltransferase 1, choline, alpha)都已被作為藥物靶點,在DrugBank(https://www.drugbank.ca/)數據庫中有記錄,未被收錄的基因如AGK(acylglycerol kinase)已在前列腺腫瘤中被證明能通過活化EGFR及下游的MAPK信號通路來促進細胞增殖[13],值得深入探索。
圖2 線粒體內脂肪酸β氧化通路
正常肝細胞模型特異結果有8個,其中TECR(trans-2,3-enoyl-CoA reductase)和SGPL1(sphingosine-1-phosphate lyase 1)在IMPC數據庫中存在小鼠實驗結果,且為敲除致死基因。由于TECR參與了脂肪酸合成,對細胞生長過程有比較重要的作用,因此進一步查看了模型TECR涉及的具體反應發(fā)現(xiàn),在正常肝細胞模型中共有28個僅能被TECR催化的反應,其中有26個同樣存在于HCC肝癌細胞模型中,但這26個反應的酶編碼基因并不是TECR,而是多個其他基因,說明在HCC肝癌細胞中的確存在代謝重編程以保證脂肪酸代謝通路的穩(wěn)定,從而在各種條件下都能為腫瘤細胞增殖提供充足的營養(yǎng)物質。除此之外,GUK1(guanylate kinase 1)是將治療癌癥的前體藥物轉化為有藥理活性代謝物的關鍵基因[14],因此敲除它也只會使正常肝細胞死亡,而不會對HCC肝癌細胞有影響。
利用雙基因敲除,嘗試找出單獨失活對細胞生長無影響、但組合敲除卻會使細胞生長降為0的基因對,稱為組合致死基因對,如表3所示。
表3 組合致死基因對
兩個模型共有的結果為15對,其中有12個基因對都有1個相同的基因NPC1L1(NPC1 like intracellular cholesterol transporter 1),它編碼的蛋白質負責將外部膽固醇運入胞質以滿足生化需求,而與其組合致死的基因則都屬于膽固醇合成通路??疾靸蓚€模型的特異結果,發(fā)現(xiàn)也各自有3個基因對含有NPC1L1,且與其組合致死的基因同樣屬于膽固醇合成通路。因此推斷組合致死的原因是細胞無法從外部攝取膽固醇,同時內部合成途徑被阻礙,造成膽固醇不足,無法維持正常生化過程。
除此之外,HCC肝癌細胞模型還有7對特異組合致死基因;正常肝細胞模型有9對,其中4對結果比較特別:PTDSS1和PCYT1A,在HCC模型中單敲就會致死,而在正常肝細胞模型中,它們與PTDSS2(phosphatidylserine synthase 2)或PCYT2(phosphate cytidylyltransferase 2, ethanolamine)組合敲除才會對細胞有致命影響。探究其生化功能發(fā)現(xiàn):作為磷脂酰物質循環(huán)的重要基因,PTDSS1與PCYT1A位于膽堿(choline, Cho)通路上,而PTDSS2和PCYT2負責催化乙醇胺(ethanolamine, ETA)通路上的反應,如圖3所示。不僅如此,膽堿通路負責催化甘油二酯生成磷脂酰膽堿的CEPT1基因也出現(xiàn)在HCC細胞特異性單敲致死的結果中(表2),而乙醇胺通路上的EPT1和PEMT基因在HCC模型中先天性缺失。因此推測:在正常肝細胞中,磷脂酰物質循環(huán)可以靈活地由膽堿或者乙醇胺兩條途徑完成;而在HCC細胞中發(fā)生了代謝重編程,使乙醇胺途徑變得可有可無,在這種情況下,膽堿通路對于HCC肝癌細胞的重要性急劇增加,導致單獨敲除其通路的任一關鍵基因就會使腫瘤細胞死亡,與先前Glunde等[15]和Ikawa等[16]在小鼠中得到的實驗結果一致。
紅色為乙醇胺代謝通路;藍色為膽堿代謝通路
2.2.1 膽固醇合成通路揭示HCC肝癌細胞生長的關鍵基因
如表3所示,對于膽固醇合成通路的特異性組合致死基因對,IDI1(isopentenyl-diphosphate delta isomerase 1)、DHCR24(24-dehydrocholesterol reductase)和CYP51A1(cytochrome P450 family 51 subfamily A member 1)僅會使正常肝細胞生長率降為0;MSMO1(methylsterol monooxygenase 1)、HMGCS1(3-hydroxy-3-methylglutaryl-CoA synthase 1)和FDPS(farnesyl diphosphate synthase)僅會使HCC肝細胞生長率降為0。
比對兩個模型的基因,發(fā)現(xiàn)在HCC肝癌細胞中同時存在IDI1以及IDI2基因,且這兩個基因可以催化相同的反應,因此敲除其中一個并不會對細胞產生致命影響。與此相反的是,HCC肝癌細胞缺少了HMGCS2基因,其對HMGCS1的依賴性大大增強。Wang等[17]的實驗結果證明HMGCS2低表達能抑制半胱氨酸蛋白酶介導的凋亡途徑,同時增強c-Myc/cyclinD1和EMT信號通路,從而促進細胞增殖、遷移能力,因此HCC細胞很可能采取這種代謝重編程來加速腫瘤發(fā)生過程。
對于DHCR24,在正常肝細胞模型中查看了它單獨催化的反應,共有5個,流值均不為0;然而其中僅有1個反應在HCC肝癌細胞模型中的流值不為0,且負責催化的基因為DHCR24、HADHA、EHHADH或ECHS1(HADHA和ECHS1是HCC細胞的單敲致死基因),這說明DHCR24對于HCC細胞來說并不是優(yōu)勢基因,同時從側面證明了HADHA與ECHS1對HCC細胞的重要性。Wu等[18]的實驗結果表明:DHCR24會與腫瘤抑制子p53結合并取代其N端的裂解酶Mdm2,造成p53在細胞內的累積,導致腫瘤細胞死亡,因此DHCR24的缺失反而可以提高腫瘤細胞生存率,與我們的模擬結果一致。
2.2.2 L-氯化棕櫚酰肉堿缺失誘發(fā)腫瘤細胞凋亡
組合敲除CPT1A(carnitine palmitoyl transferase 1A)和CPT1B(carnitine palmitoyl transferase 1B)基因會使HCC細胞生長率變?yōu)?,但只會使正常肝細胞生長率下降10.19%,說明其是HCC細胞生長的關鍵基因。
CPT1A和CPT1B都屬于CPT1基因家族,在HCC模型中催化了64個位于肉堿代謝通路上的反應。這條通路負責運輸長鏈脂肪酸進入線粒體基質,以進行細胞內80%[19]的β氧化,釋放生化需求的絕大部分能量。動物試驗證實CPT1A的缺失會導致脂肪酸代謝通路異變,從而提高細胞對營養(yǎng)物質匱乏的不耐受性[20]。
更進一步解讀,發(fā)現(xiàn)CPT1A和CPT1B作用于運輸棕櫚酰輔酶A(Palmitoyl-CoA, PALM-CoA)進入線粒體內膜,并與肉堿(Carnitine, CAR)生成L-氯化棕櫚酰肉堿(L-palmitoyl carnitine, LPCARN)的反應。如果將它們組合敲除,會導致線粒體內LPCARN含量的驟減。先前有試驗證明LPCARN等?;鈮A的過量累積會引發(fā)各種代謝疾病[21],并能通過調控IL6R表達來促進炎癥反應通路,加速腫瘤發(fā)生[22],甚至高濃度LPCARN會導致各種癌癥,包括HCC肝癌[23]。因此,組合敲除CPT1A和CPT1B對HCC肝癌細胞生長產生的影響遠比對正常肝細胞的大,這也與模擬結果一致。
本文選取了基于相同初始模型構建的HCC肝癌細胞模型和正常肝細胞模型進行代謝分析,運用單基因和雙基因敲除,探索在HCC肝癌發(fā)生過程中潛在的代謝重編程位點和生化機制,并結合IMPC以及DrugBank數據庫對部分結果進行了驗證。
在單基因敲除致死的結果中,兩個模型共有的8個致死基因已有5個被IMPC數據庫中的小鼠實驗證實。HCC模型的特異性結果大多已被DrugBank收錄,剩余基因如AGK也在前列腺癌中被證明與細胞增殖相關,有望成為新的藥物靶點;與此同時,TECR和GUK1僅在正常肝細胞模型中有重要影響,暗示它們可能是潛在的抗腫瘤靶點。
在雙基因敲除的結果中,缺失負責攝入外部膽固醇的NPC1L1基因后,膽固醇合成通路變成了細胞獲取膽固醇的唯一途徑,所以敲除其上的關鍵基因會使腫瘤/正常細胞都凋亡。不同的是,HMGCS2在HCC肝癌細胞中的缺失使其對HMGCS1的依賴性大大提高;而IDI2在HCC肝癌細胞中的存在使其對IDI1的依賴性大大降低。不僅如此,敲除膽固醇合成通路最后一步的必需基因DHCR24僅會導致正常肝細胞死亡,暗示在腫瘤細胞的膽固醇合成過程中,反應極有可能在生成鏈甾醇后就終止了。先前有試驗證明鏈甾醇可以取代膽固醇維持部分調控、代謝等生化功能[24],但由于化學性質差異,例如在肝臟中,某些?;D移酶與鏈甾醇的酯化度只有膽固醇的40%,所以若用鏈甾醇取代膽固醇會導致各類疾病,也包括癌癥[25]。因此IDI2可能是潛在的HCC肝癌基因,而HMGCS2和DHCR24極有可能是HCC腫瘤發(fā)生過程的潛在抗腫瘤靶點,值得進一步試驗研究。
另外,肝癌細胞乙醇胺通路關鍵基因的先天缺失,以及其對膽堿代謝通路關鍵基因缺失的不耐受暗示了在HCC腫瘤細胞中,膽堿代謝通路占據了磷脂酰物質循環(huán)的主導作用,是值得深入研究的代謝重編程位點。
本文運用代謝分析模擬得到的結果具有高解釋性且與先前的試驗結果一致,說明了研究方法可靠。癌癥代謝重編程是腫瘤細胞為了滿足增殖、避免凋亡而采取的普遍手段,通過模擬結合試驗的方法,可以更高效地篩選潛在靶點,為臨床治療提供理論基礎。