包逸雯 朱偉良
膠質(zhì)瘤是顱內(nèi)最常見的原發(fā)性惡性腫瘤[1],預(yù)后較差,占所有膠質(zhì)瘤一半以上的膠質(zhì)母細(xì)胞瘤(glioblastoma multiforme,GBM)的5、10 年生存率僅在5%、0.71%左右[2,3]。低級(jí)別膠質(zhì)瘤(low-grade gliomas,LGGs)的預(yù)后常優(yōu)于GBM,有些LGGs 亞型的5年生存率在41%~88%[4]。研究表明,異檸檬酸脫氫酶(isocitrate dehydrogenase,IDH)突變型膠質(zhì)瘤病人生存預(yù)后相對(duì)IDH 野生型膠質(zhì)瘤病人要好[5]。因此,分析IDH 突變導(dǎo)致的基因表達(dá)差異具有重要的臨床意義。近年來,成纖維細(xì)胞在膠質(zhì)瘤中的多能性備受關(guān)注,包括與其他類型細(xì)胞的交聯(lián)、細(xì)胞外基質(zhì)(extracellular matrix,ECM)的構(gòu)建以及免疫調(diào)節(jié)等作用[6~8]。本文擬采用生物信息學(xué)方法探討膠質(zhì)瘤IDH突變是否通過調(diào)控成纖維細(xì)胞基因表達(dá)抑制膠質(zhì)瘤惡性生物學(xué)行為,從而改善病人預(yù)后。
1.1 數(shù)據(jù)收集計(jì)算機(jī)檢索TCGA 數(shù)據(jù)庫(https://por?tal.gdc.cancer.),通過UCSC Xena 下載GDC-TCGAGBM 和GDC-TCGA-LGG 相關(guān)RNA-seq。648 例膠質(zhì)瘤(234 例GBM和414例LGG)的RNA-seq數(shù)據(jù)來自CGGA數(shù)據(jù)庫[9]。此外,從GEO數(shù)據(jù)庫下載單細(xì)胞RNA-seq 數(shù)據(jù)集GSE131928(包含28 例IDH 野生型GBM)[10]。
1.2 差異表達(dá)基因(differentially expressed genes,DEGs)的識(shí)別CGGA 數(shù)據(jù)庫膠質(zhì)瘤RNA-seq 數(shù)據(jù)分 析DEGs 時(shí),P<0.05 和FC>1.5 的 基 因 被 認(rèn) 為DEGs。TCGA 數(shù)據(jù)庫膠質(zhì)瘤RNA-seq 數(shù)據(jù)分析DEGs時(shí),P<0.05和FC>2被認(rèn)為DEGs。
1.3 基因富集分析通過R 統(tǒng)計(jì)軟件包c(diǎn)lusterProfil?er、KEGG.db、clusterProfiler進(jìn)行GO富集分析、KEGG分析和GESA 相關(guān)分析。Entrez 基因id 是從“c2.cp.kegg.v7.4.entrez.gmt”文件中檢索到的。
1.4 生存分析首先利用GEPIA(http://gepia.cancerpku.cn/)中的“Expression on Box Plots”模塊對(duì)腫瘤組織和正常組織的靶基因進(jìn)行單因素生存分析,Cox比例風(fēng)險(xiǎn)分析和預(yù)后模型通過R 統(tǒng)計(jì)軟件包survmin?er、survival、rms、pROC和RColorBrewer進(jìn)行分析。
1.5 腫瘤純度、免疫細(xì)胞浸潤和免疫微環(huán)境的評(píng)估通過R軟件包ESTIMATE、MCPcounter評(píng)估膠質(zhì)瘤樣本的腫瘤純度和腫瘤微環(huán)境中基質(zhì)細(xì)胞等比例。
1.6 單細(xì)胞聚類分析單細(xì)胞RNA-seq 數(shù)據(jù)集(GSE131928)的細(xì)胞聚類由R 軟件包Seurat 進(jìn)行分析。首先,采用“LogNormalize”縮放歸一化方法,去除具有超過2 500或<200、>5%線粒體計(jì)數(shù)的獨(dú)特特征細(xì)胞。在數(shù)據(jù)歸一化后,使用帶有默認(rèn)參數(shù)的UMAP執(zhí)行單元格的非線性降維。最后,通過t-SNE方法和UMAP 方法劃分生物標(biāo)志物簇。此外,通過DEGs的富集分析,再次鑒定出免疫細(xì)胞亞群和成纖維細(xì)胞亞群。
1.7 數(shù)據(jù)可視化生信分析結(jié)果通過多種R 軟件包可視化,包括GOplot、enrichplot、ggplot2、Complex?Heatmap、forestplot和ggforestplot等,以及應(yīng)用Graph?Pad Prism 9和Adobe Photoshop 2020等專業(yè)軟件。
2.1 IDH突變顯著下調(diào)LGGs細(xì)胞活性以及與細(xì)胞外因子的結(jié)合能力GO富集分析顯示IDH突變顯著下調(diào)的DEGs主要參與細(xì)胞活力的調(diào)節(jié),包括細(xì)胞因子受體復(fù)合物、免疫復(fù)合物等。此外,IDH突變顯著抑制LGGs腫瘤細(xì)胞與細(xì)胞外因子的結(jié)合能力,包括細(xì)胞因子、趨化因子、ECM成分等。KEGG分析結(jié)果再次驗(yàn)證IDH 突變下調(diào)ECM 構(gòu)建相關(guān)的通路。信號(hào)通路圖譜提示這些DEGs 幾乎覆蓋了ECM 構(gòu)建通路。IDH突變上調(diào)的DEGs也被富集,但并未顯著參與ECM 的構(gòu)建。這提示IDH 突變會(huì)削弱腫瘤細(xì)胞活力和抑制胞外結(jié)構(gòu)構(gòu)建,降低腫瘤細(xì)胞的侵襲性。
2.2 篩選同時(shí)影響LGGs和GBM 生存預(yù)后的DEGs GEPIA 數(shù)據(jù)庫的“Survival Plots”模塊對(duì)IDH 突變產(chǎn)生的DEGs 進(jìn)行單基因生存分析,成功篩選出超過50 個(gè)顯著改變LGGs 病人總體生存期的DEGs,12個(gè)顯著影響LGGs 和GBM 生存預(yù)后的靶基因,包括BMP2、COL27A1、SERPINA5 和VEGFA 等(圖1A)。多變量coxph 分析發(fā)現(xiàn),TCGA-LGG、CGGA-LGG、TCGA-GBM 和CGGA-GBM 中BMP2、SERPINA5 和COL27A1 表達(dá)水平與病人生存預(yù)后相關(guān)(圖1B、1C)。Cox 回歸分析顯示BMP2 和SERPINA5 的組合比單獨(dú)BMP2 或SERPINA5 具有更高的預(yù)測(cè)價(jià)值。這提示BMP2、COL27A1和SERPINA5可能是影響膠質(zhì)瘤病人生存預(yù)后的關(guān)鍵基因。
圖1 BMP2、COL27A1和SERPINA5的表達(dá)水平顯著影響膠質(zhì)瘤病人的生存預(yù)后
2.3 膠質(zhì)瘤IDH突變與BMP2、SERPINA5、COL27A1基因表達(dá)水平的相關(guān)性CGGA 數(shù)據(jù)庫樣本分析結(jié)果顯示,IDH突變顯著下調(diào)BMP2在LGGs和GBM中的表達(dá),而顯著上調(diào)COL27A1 和SERPINA5 的表達(dá)(圖2A、2B)。這提示IDH突變是改變?nèi)齻€(gè)靶基因表達(dá)水平的共性條件。相關(guān)性分析顯示,無論是GBM還是LGGs,BMP2 與COL27A1 和SERPINA5 呈中等強(qiáng)度負(fù)相關(guān)(圖2C、2D),而SERPINA5 與COL27A1呈中等強(qiáng)度正相關(guān)(圖2C、2D)。
圖2 膠質(zhì)瘤IDH突變與BMP2、SERPINA5、COL27A1基因表達(dá)水平的相關(guān)性分析
2.4 基質(zhì)評(píng)分和成纖維細(xì)胞豐度與膠質(zhì)瘤預(yù)后不良呈正相關(guān)免疫估算結(jié)果顯示COL27A1 和SERPI?NA5高表達(dá)、BMP2低表達(dá)的數(shù)據(jù)集基質(zhì)評(píng)分明顯增高,IDH 突變顯著下調(diào)四個(gè)數(shù)據(jù)集的基質(zhì)評(píng)分。MCPcounter 評(píng)估結(jié)果顯示IDH 突變和BMP2 高表達(dá)顯著降低LGGs成纖維細(xì)胞的絕對(duì)豐度,而COL27A1和SERPINA5高表達(dá)顯著增加成纖維細(xì)胞的絕對(duì)豐度(圖3)。GBM 成纖維細(xì)胞的絕對(duì)豐度顯著高于LGGs。這提示IDH突變也許通過上調(diào)BMP2以及下調(diào)COL27A1 和SERPINA5 表達(dá),抑制膠質(zhì)瘤ECM 的構(gòu)建和成纖維細(xì)胞豐度,最終影響病人的預(yù)后。
圖3 膠質(zhì)瘤IDH 基因型以及BMP2、COL27A1、SERPI?NA5表達(dá)水平與成纖維細(xì)胞豐度的關(guān)系
2.5 IDH野生型GBM 中成纖維細(xì)胞的多能性 包含28 例IDH 野生型GBM 的單細(xì)胞數(shù)據(jù)集(GSE131928)被聚類分析[13],最后篩選出成纖維細(xì)胞亞集。GSM3828672 第8 亞組的富集分析顯示成纖維細(xì)胞增強(qiáng)內(nèi)皮細(xì)胞、平滑肌細(xì)胞等多種細(xì)胞的趨化性,并促進(jìn)微血管的形成;成纖維細(xì)胞也可以正向調(diào)節(jié)上皮細(xì)胞向間充質(zhì)細(xì)胞轉(zhuǎn)化并促進(jìn)間充質(zhì)細(xì)胞增殖和分化。KEGG 分析顯示PI3K/Akt、MAPK 和Ras 等信號(hào)通路在成纖維細(xì)胞中被激活。GSM3828673第11亞組富集分析顯示成纖維細(xì)胞激活包括脂肪酸代謝、丙酮酸代謝、類固醇代謝等多個(gè)能量代謝通路。因此,我們推測(cè)成纖維細(xì)胞不僅促進(jìn)ECM的框架構(gòu)建,還賦予血管內(nèi)皮細(xì)胞和膠質(zhì)瘤細(xì)胞合適的生存環(huán)境。這些過程可能是成纖維細(xì)胞導(dǎo)致惡性程度最高的IDH 野生型GBM 治療預(yù)后差的因素之一。
即使采用手術(shù)聯(lián)合術(shù)后放化療等綜合治療,幾乎所有GBM 仍會(huì)復(fù)發(fā),中位生存期僅12~15 個(gè)月[11]。而IDH野生型LGGs 通常比IDH突變型更早、更快地復(fù)發(fā)[12]。盡管IDH突變作為保護(hù)性因素在膠質(zhì)瘤治療中已形成廣泛共識(shí),但I(xiàn)DH 的保護(hù)性機(jī)制仍未完全被認(rèn)知。為了探討其潛在機(jī)制,我們從CGGA 數(shù)據(jù)庫和TCGA 數(shù)據(jù)庫獲取包括LGGs 和GBM 在內(nèi)的四個(gè)數(shù)據(jù)集,采用多維度多樣本的分析,以IDH 突變?yōu)榍腥朦c(diǎn),結(jié)果顯示BMP2、SERPINA5和COL27A1三個(gè)基因的表達(dá)水平的變化會(huì)影響LGGs 和GBM 的生存預(yù)后,并與IDH 突變高度相關(guān)。這與既往報(bào)道較為一致[13~15]。
那么,IDH 突變是如何調(diào)控BMP2、COL27A1 和SERPINA5 的表達(dá)水平來影響膠質(zhì)瘤的侵襲性?基于CGGA 數(shù)據(jù)庫相關(guān)差異分析的結(jié)果表明,IDH 突變下調(diào)BMP2的表達(dá),并上調(diào)COL27A1和SERPINA5的表達(dá)。這提示IDH突變是改變?nèi)齻€(gè)靶基因表達(dá)水平的共性條件。那么,明確BMP2、COL27A1 和SERPINA5之間是否存在從屬關(guān)系尤為重要。為此,我們進(jìn)行相關(guān)性分析,結(jié)果顯示無論GBM 還是LGGs,BMP2 與COL27A1 和SERPINA5 呈中等程度負(fù)相關(guān),而COL27A1 和SERPINA5 呈中等強(qiáng)度正相關(guān)。此外,熱圖聚類分析結(jié)果與相關(guān)性分析結(jié)果一致,即三種基因之間找不到絕對(duì)從屬關(guān)系。因此,這三種基因?qū)δz質(zhì)瘤的影響可能以多元化途徑調(diào)控腫瘤微環(huán)境的變化,例如對(duì)免疫微環(huán)境的調(diào)控,而非直接通過胞內(nèi)信號(hào)通路作用徹底改變腫瘤細(xì)胞活力。
BMP2、SERPINA5 和COL27A1 三者之間沒有絕對(duì)的從屬關(guān)系,可能更多受IDH突變的影響,并可能以多信號(hào)通路的形式調(diào)控腫瘤細(xì)胞侵襲性?;贗DH突變的富集分析顯示細(xì)胞外基質(zhì)構(gòu)建是IDH突變影響最為廣泛的信號(hào)通路,而基質(zhì)構(gòu)建是影響膠質(zhì)瘤治療預(yù)后的關(guān)鍵因素之一。我們嘗試通過PPI網(wǎng)絡(luò)來挖掘BMP2、SERPINA5、COL27A1 之間的相關(guān)作用以及對(duì)上下游關(guān)鍵蛋白節(jié)點(diǎn)的調(diào)控機(jī)制,但是未能有效挖掘。因?yàn)镻PI 蛋白互動(dòng)分析是依賴于前人的研究結(jié)果,但目前SERPINA5、COL27A1 對(duì)腫瘤細(xì)胞的影響機(jī)制的相關(guān)研究仍較少。
總之,我們的結(jié)果提示在基因表達(dá)水平層面,IDH突變誘導(dǎo)BMP2上調(diào)、SERPINA5和COL27A1下調(diào),通過調(diào)控腫瘤免疫微環(huán)境和成纖維細(xì)胞功能活性,降低膠質(zhì)瘤細(xì)胞惡性度。當(dāng)然,我們基于生物信息學(xué)分析得出的相關(guān)結(jié)論仍需要更多相關(guān)領(lǐng)域的研究結(jié)果加以論證。