盧偉,付濤
武漢大學(xué)人民醫(yī)院胃腸外Ⅱ科,湖北 武漢 430060
胃癌是常見(jiàn)的消化系統(tǒng)惡性腫瘤之一,據(jù)統(tǒng)計(jì),2018年全球范圍內(nèi)新發(fā)病例超過(guò)100萬(wàn),同時(shí)有超過(guò)80萬(wàn)病例死亡[1]。由于胃癌早期癥狀不典型、篩查體系不完善,在中國(guó)約70%的胃癌病人在確診時(shí)已經(jīng)處于進(jìn)展期[2]。腫瘤微環(huán)境(tumor microenvironment,TME),包含惡性細(xì)胞、腫瘤相關(guān)成纖維細(xì)胞、基質(zhì)細(xì)胞和免疫細(xì)胞等,與腫瘤發(fā)生發(fā)展、病人預(yù)后以及新的治療方案相關(guān)[3]。
目前越來(lái)越多的證據(jù)表明表觀遺傳學(xué)的改變包括DNA甲基化,基因組印跡以及其他改變,這些改變可能會(huì)導(dǎo)致包括胃癌在內(nèi)的惡性腫瘤進(jìn)展[4]。本文旨在探討DNA甲基化對(duì)TME的潛在影響,同時(shí)建立基于DNA甲基化預(yù)后相關(guān)差異位點(diǎn)的胃癌分子亞型以及Cox風(fēng)險(xiǎn)預(yù)測(cè)模型,為胃癌的診療提供一定理論依據(jù)[5]。
癌癥基因組圖譜(TCGA)數(shù)據(jù)庫(kù)中胃腺癌(stomach adenocarcinoma,STAD)病人RNA轉(zhuǎn)錄組數(shù)據(jù)可從基因組數(shù)據(jù)共享(Genomic Data Commons,GDC,https://portal.gdc.cancer.gov/)中下載。所有TCGA-STAD DNA甲基化數(shù)據(jù)均直接從加利福尼亞大學(xué)圣克魯斯分校(UCSC,http://xena.ucsc.edu/public/)下載,其中包括Methylation 27k TCGA-STAD數(shù)據(jù)集和Methylation 450k TCGA-STAD數(shù)據(jù)集,并不受倫理審核。
下載的TCGA-STAD臨床數(shù)據(jù)集包括病人的生存時(shí)間、生存狀態(tài)、性別、T分期、N分期、M分期、病理分期等,通過(guò)樣本ID合并病人生存時(shí)間、生存狀態(tài)及DNA甲基化位點(diǎn)(排除一些標(biāo)記為“未知”的數(shù)據(jù))。對(duì)Methylation 450k TCGA-STAD數(shù)據(jù)集使用“survival” R包進(jìn)行了Cox回歸分析,得到單因素和多因素獨(dú)立預(yù)后甲基化位點(diǎn)。
運(yùn)行一致性聚類對(duì)TCGA-STAD數(shù)據(jù)和多個(gè)獨(dú)立預(yù)后的甲基化位點(diǎn)進(jìn)行分析,然后將TCGA中胃癌樣本分為不同的DNA甲基化亞型(使用“ConsensusClusterPlus”R包無(wú)監(jiān)督運(yùn)行1 000次)。同時(shí)可以獲得不同的胃癌DNA甲基化亞型病人的預(yù)后。通過(guò)TCGA-STAD病人樣本ID將分型后的DNA甲基化亞型中的胃癌病人與其臨床特征結(jié)合,探索不同DNA甲基化亞型與臨床特征的關(guān)系。
選擇DNA甲基化水平差異最大的2個(gè)亞型,將亞型對(duì)應(yīng)的TCGA-STAD樣本上傳至CIBERSORT(https://cibersort.stanford.edu/)來(lái)推斷2個(gè)亞型的免疫細(xì)胞組成(循環(huán)計(jì)算1 000次),由此可以推算DNA甲基化對(duì)TME的影響。
選擇預(yù)后最好同時(shí)包含差異位點(diǎn)最多的亞型,取該亞型DNA甲基化差異位點(diǎn)及多因素獨(dú)立預(yù)后DNA甲基化位點(diǎn)的交集位點(diǎn),計(jì)算風(fēng)險(xiǎn)評(píng)分(Risk Score),計(jì)算公式如下:
其中“1”到“n”為所有DNA甲基化差異位點(diǎn)。將450k甲基化芯片中病人標(biāo)記為“訓(xùn)練組”(“training group”),將27k甲基化芯片中病人標(biāo)記為“對(duì)照組”(“test group”)。對(duì)訓(xùn)練組及對(duì)照組中的病人進(jìn)行風(fēng)險(xiǎn)評(píng)分,高于訓(xùn)練組風(fēng)險(xiǎn)評(píng)分中位值的病人為高風(fēng)險(xiǎn)組病人,低于訓(xùn)練組風(fēng)險(xiǎn)評(píng)分中位值的病人為低風(fēng)險(xiǎn)組病人。
首先本研究采用了R studio軟件(R 3.6.1 version,https://www.r-project.org/)及Perl進(jìn)行數(shù)據(jù)分析及作圖。通過(guò)TCGA RNA轉(zhuǎn)錄組數(shù)據(jù)對(duì)P值進(jìn)行校正得到偽發(fā)現(xiàn)率(FDR),篩選臨界值為FDR<0.05和logFC絕對(duì)值>2.000。通過(guò)訓(xùn)練組病人的受試者工作特征(ROC)曲線判斷該模型是否有效[6-8]。
通過(guò)TCGA樣本ID將Methylation 450k TCGA-STAD數(shù)據(jù)集與樣本對(duì)應(yīng)的生存時(shí)間及生存狀態(tài)合并,使用Cox回歸分析,得到148個(gè)單因素獨(dú)立預(yù)后相關(guān)DNA甲基化位點(diǎn)(P<0.05)和137個(gè)多因素獨(dú)立預(yù)后相關(guān)DNA甲基化位點(diǎn)(P<0.05)。根據(jù)樣本生存時(shí)間、生存狀態(tài)和多因素獨(dú)立預(yù)后相關(guān)DNA甲基化位點(diǎn)將TCGA-STAD分為7個(gè)DNA甲基化亞型,同時(shí)可以獲得DNA甲基化亞型的Kaplan-Meier曲線(P=0.003,圖1A、B)。
合并TCGA-STAD臨床數(shù)據(jù)和DNA甲基化亞型,分析不同甲基化亞型與病理分期、分級(jí)(grade)、性別、年齡、TNM分期的關(guān)系[9]。結(jié)合圖1B及圖2A可認(rèn)為DNA甲基化水平最高的亞型3病人較DNA甲基化水平最低的亞型7病人預(yù)后更好(P<0.05)。由圖2 B~H可知亞型7中≤65歲、G2、M1期、N2期和Ⅳ期病人數(shù)量多于亞型3中病人數(shù)量。
CIBERSORT結(jié)果提示生存差異最大的亞型3及亞型7的免疫細(xì)胞組成中幼稚B細(xì)胞(B cells naive)、記憶B細(xì)胞(B cells memory)及激活的T細(xì)胞CD4+記憶細(xì)胞(T cells CD4 memory activated)存在明顯差異(P<0.05,圖3)。
圖1 確定DNA甲基化亞型 A.按DNA甲基化水平差異將TCGA-STAD劃分為7個(gè)DNA甲基化亞型;B.不同DNA甲基化亞型的生存率差異(P<0.05)
圖2 不同臨床特征中不同DNA甲基化亞型病人所占比例 A.DNA甲基化與臨床特征關(guān)系的熱圖;B.不同DNA甲基化亞型病人年齡占比;C.不同DNA甲基化亞型病人性別占比;D.不同DNA甲基化亞型病人病理分級(jí)占比;E.不同DNA甲基化亞型病人病理分期占比;F.不同DNA甲基化亞型病人T分期占比;G.不同DNA甲基化亞型病人N分期占比;H.不同DNA甲基化亞型病人M分期占比
圖3 亞型3病人和亞型7病人免疫細(xì)胞浸潤(rùn)差異
通過(guò)DNA甲基化分型與預(yù)后結(jié)果可見(jiàn)亞型3預(yù)后最好,取該亞型DNA甲基化差異位點(diǎn)及多因素獨(dú)立預(yù)后DNA甲基化位點(diǎn)的交集位點(diǎn)計(jì)算風(fēng)險(xiǎn)評(píng)分,在本文中風(fēng)險(xiǎn)評(píng)分=(-1.242×cg12645220表達(dá)量)+(-1.432×cg20727114表達(dá)量)+(-1.744×cg26535072表達(dá)量),見(jiàn)表1。
表1 DNA甲基化差異位點(diǎn)表達(dá)與該位點(diǎn)系數(shù)
基于風(fēng)險(xiǎn)評(píng)分建立Cox風(fēng)險(xiǎn)預(yù)測(cè)模型,將TCGA-STAD病人分為高風(fēng)險(xiǎn)組病人和低風(fēng)險(xiǎn)組病人(臨床信息見(jiàn)表2)。ROC曲線下面積(AUC)為0.677,可以認(rèn)為基于風(fēng)險(xiǎn)評(píng)分構(gòu)建的DNA甲基化Cox風(fēng)險(xiǎn)預(yù)測(cè)模型能夠有效預(yù)測(cè)胃癌病人預(yù)后(圖4)。訓(xùn)練組病人及對(duì)照組病人的Kaplan-Meier曲線均證明高風(fēng)險(xiǎn)組病人較低風(fēng)險(xiǎn)組病人預(yù)后更差(P<0.05),見(jiàn)圖5A、B。
圖4 DNA甲基化風(fēng)險(xiǎn)預(yù)測(cè)模型繪制的受試者工作特征(ROC)曲線
表2 TCGA-STAD病人臨床信息(例)
圖5 訓(xùn)練組和對(duì)照組不同風(fēng)險(xiǎn)組病人的預(yù)后 A.在訓(xùn)練組中,高風(fēng)險(xiǎn)組病人較低風(fēng)險(xiǎn)組病人預(yù)后更差(P<0.05);B.在對(duì)照組中,高風(fēng)險(xiǎn)組病人較低風(fēng)險(xiǎn)組病人預(yù)后更差(P<0.05)
在以往的研究中,為了預(yù)測(cè)胃癌病人的預(yù)后,通常將胃癌分為4種分子亞型:EB病毒相關(guān)型胃癌,微衛(wèi)星不穩(wěn)定型胃癌,染色體不穩(wěn)定型胃癌以及基因組穩(wěn)定型胃癌[10]。本研究基于DNA甲基化水平差異將TCGA胃癌病人分為7個(gè)DNA甲基化亞型。
由于腫瘤生物學(xué)行為和免疫反應(yīng)的異質(zhì)性和復(fù)雜性,應(yīng)用單一的生物標(biāo)志物來(lái)全面說(shuō)明和預(yù)測(cè)腫瘤預(yù)后和其對(duì)治療的反應(yīng)是不可靠的。因此,基于多生物標(biāo)志物的預(yù)測(cè)模型可能是一種更有效、更準(zhǔn)確的工具。本研究依據(jù)DNA甲基化預(yù)后相關(guān)差異位點(diǎn)cg12645220、cg20727114、cg26535072建立了Cox風(fēng)險(xiǎn)預(yù)測(cè)模型。cg12645220、cg20727114、cg26535072表達(dá)的基因分別是PAK7、APBA1、CPT1C。p21活化激酶7(PAK7)屬于PAK族蛋白,參與調(diào)節(jié)細(xì)胞增殖、凋亡、侵襲/遷移和化學(xué)抗性,其過(guò)度表達(dá)或激活可能導(dǎo)致癌癥[11-12]。APBA1與 Munc18-1結(jié)合,在突觸小泡的胞吐作用中發(fā)揮推定功能,突觸小泡的胞吐作用是突觸小泡胞吐機(jī)制的重要組成部分[13]。CPT1C具有該基因的重要旁系同源物是CPT1A在脂質(zhì)代謝過(guò)程中類似的作用,能夠影響CD8+T記憶細(xì)胞的生長(zhǎng)[14]。CPTI激活脂肪酸氧化,通過(guò)產(chǎn)生ATP和NADPH促進(jìn)癌癥生長(zhǎng),這是癌癥代謝的重要組成部分[15]。所以,CPT1C可能成為癌癥的新治療靶點(diǎn)[16]。
遺傳基因的表觀學(xué)改變,尤其是DNA甲基化,已被確定為腫瘤免疫細(xì)胞浸潤(rùn)改變的重要因素[17-18]。本研究證明了DNA甲基化水平高的病人預(yù)后好,DNA甲基化水平不同的病人間存在包括幼稚B細(xì)胞、記憶B細(xì)胞及激活的T細(xì)胞CD4+記憶細(xì)胞等免疫細(xì)胞比例的差異?,F(xiàn)在針對(duì)胃癌免疫治療,如程序性死亡蛋白-1(PD-1)等,都是針對(duì)T細(xì)胞的治療方法[19-20]。B 細(xì)胞被認(rèn)為是體液免疫的主要效應(yīng)細(xì)胞,可以通過(guò)分泌免疫球蛋白、促進(jìn)T細(xì)胞反應(yīng)和直接殺死癌細(xì)胞來(lái)抑制腫瘤進(jìn)展[21]。盡管免疫檢查點(diǎn)抑制劑的引入使T細(xì)胞相關(guān)免疫反應(yīng)成為治療靶點(diǎn),但并非所有病人都能從這些治療中受益[22-24]。細(xì)胞毒性免疫依賴于特殊效應(yīng)T細(xì)胞,即細(xì)胞毒性T細(xì)胞,它們具有特定的溶細(xì)胞機(jī)制,使它們能夠誘導(dǎo)目標(biāo)死亡,確定靶細(xì)胞后,細(xì)胞毒性T細(xì)胞形成裂解免疫突觸,通過(guò)將微管組織中心對(duì)接在突觸膜上,制備致死酶溶解裂解顆粒[25-26]。美國(guó)食品藥品監(jiān)督管理局批準(zhǔn)了幾種檢查點(diǎn)抑制劑藥物,如抗PD-1派姆單抗等,但并未廣泛應(yīng)用于臨床胃癌病人[27-28]。針對(duì)DNA甲基化位點(diǎn)的免疫治療可能會(huì)成為未來(lái)胃癌治療方法之一[29-31]。
本研究也具有一定的局限性:首先對(duì)TCGA數(shù)據(jù)庫(kù)進(jìn)行了條件篩選,結(jié)果可能出現(xiàn)選擇偏倚。其次,TCGA數(shù)據(jù)庫(kù)中病例為美國(guó)公民,因?yàn)橹忻里嬍硹l件、早期篩查體系的不同,所以結(jié)果對(duì)亞太人群的預(yù)測(cè)效果可能并不理想。并且由于TCGA數(shù)據(jù)庫(kù)中樣本量的限制,同樣會(huì)對(duì)研究結(jié)果造成影響,在后期仍需要大量獨(dú)立樣本進(jìn)行驗(yàn)證。
利益沖突所有作者均聲明不存在利益沖突