馬夢璇,張燕飛,祁玉娟
胃癌是一種侵襲性疾病,其預后較差,并且通常沒有利于早期診斷的特定癥狀。2018 年,全球有超過 100 萬人被診斷出患有胃癌,其中783 000人因胃癌死亡[1]。目前已經(jīng)開發(fā)了多種針對胃癌的治療方法,但對許多進展期胃癌患者療效不佳。因此,迫切需要探索新的診斷標志物和腫瘤進展的分子機制,達到胃癌早期診斷與早期治療的目的[2]。染色質(zhì)可及性作為與特定位點腫瘤功能相關(guān)的基因組特征之一,可通過與轉(zhuǎn)錄因子結(jié)合調(diào)節(jié)與癌癥進展和侵襲相關(guān)的多個基因。最近,研究者開始探索染色質(zhì)狀態(tài)變化對癌癥發(fā)展的影響。染色質(zhì)可及性失調(diào)可能會改變下游癌基因或抑癌基因的轉(zhuǎn)錄活性,從而影響惡性腫瘤的進展。染色質(zhì)重塑是基因調(diào)控的關(guān)鍵機制[3]。染色質(zhì)重塑是所有DNA相關(guān)核心細胞過程的經(jīng)典步驟,一些染色質(zhì)重塑決定了細胞的存亡,包括與癌癥發(fā)病和發(fā)展有關(guān)的細胞過程。過去10年中,染色質(zhì)重塑在細胞轉(zhuǎn)化和癌癥發(fā)展中的作用越來越受到關(guān)注[4],大規(guī)模表觀基因組學和轉(zhuǎn)錄組學研究結(jié)果強調(diào)了癌癥中染色質(zhì)重塑因子的頻繁突變或失調(diào),表明異常的染色質(zhì)重塑在癌癥發(fā)展中起著重要作用[5-6]。
本研究通過生物信息學分析,研究胃癌中染色質(zhì)調(diào)節(jié)因子(Chromatin regulator,CR)的表達譜和預后價值,構(gòu)建基于CR基因的預測模型,探索對治療胃癌有益的小分子藥物。
1.1 GEO的數(shù)據(jù)采集 在GEO (Gene Expression Omnibus)數(shù)據(jù)庫中搜索“Gastric cancer”相關(guān)數(shù)據(jù)表達譜,獲得2個微陣列數(shù)據(jù)研究集(GSE26942和GSE79973)。GSE26942源自 GPL6947平臺,GSE79973 源自 GPL570 平臺。GSE26942 數(shù)據(jù)集由 218 個樣本組成,包括對照組胃黏膜組織12例,胃腺癌203例,胃間質(zhì)瘤3例。GSE79973 數(shù)據(jù)集由 20個樣本組成,包括對照組胃黏膜組織10例,胃癌組織10例。見表1。
表1 GEO數(shù)據(jù)庫胃癌基因表達譜數(shù)據(jù)集(例)
1.2 差異表達基因DEG的篩選 采用GEO數(shù)據(jù)庫中的在線分析工具GEO2R篩選差異基因。R軟件limma 包用于篩選DEG。篩選標準為|logFC|>0.2,P值(adj.Pvalue)<0.05,并與染色質(zhì)調(diào)節(jié)因子相關(guān)基因取交集獲取染色質(zhì)調(diào)節(jié)因子差異表達基因。為了直觀反映基因表達情況,采用R軟件中的pheatmap、VennDiagram、ggplot2 R包將染色質(zhì)調(diào)節(jié)因子差異表達基因繪制熱圖火山圖。
1.3 DEG的功能富集分析 使用 DAVID生物信息數(shù)據(jù)庫對上述染色質(zhì)調(diào)節(jié)因子差異表達基因進行 GO 功能注釋和 KEGG 通路分析[7-8]。調(diào)整后P<0.05用于閾值篩選,使用R軟件中的cluster Profiler、pathview R包將GO和KEGG結(jié)果可視化。
1.4 PPI網(wǎng)絡(luò)構(gòu)建 將DEGs導入String數(shù)據(jù)庫,置信度>0.9[9],選擇智人進行物種選擇,形成蛋白質(zhì)互作網(wǎng)絡(luò),使用Cytoscape篩選出PPI網(wǎng)絡(luò)中的hub基因。本研究以Degree值排序前10位的基因作為蛋白質(zhì)互作 (PPI)網(wǎng)絡(luò)中的hub基因。
1.5 構(gòu)建hub基因預測模型及潛在治療藥物篩選 采用“1.4”中篩選出的hub基因構(gòu)建胃癌的預測模型,使用ROCR包繪制列線圖、Calibration 圖及ROC 曲線,并通過Enrichr平臺 (https://maayanlab.cloud/Enrichr/)用DSigDB 數(shù)據(jù)庫進行 hub基因和共表達基因的藥物篩選。根據(jù)P值和調(diào)整后的P值選擇與差異表達RNA(DEmRNA)相關(guān)的前 5種候選藥物。表2顯示了 DSigDB數(shù)據(jù)庫中排名前 5 位的候選藥物[10]。
表2 DSigDB數(shù)據(jù)庫中hub基因的潛在藥物
2.1 差異基因的獲取 基于GSE26942和GSE79973基因集,使用svaR包消除了樣本間的批量效應(yīng)后,獲得了差異基因與染色質(zhì)調(diào)節(jié)因子取集合,共獲得染色質(zhì)調(diào)節(jié)因子差異基因137個,其中上調(diào)基因93個,下調(diào)基因44個,并繪制出熱圖(圖1A)與火山圖(圖1B),紅色代表上調(diào),綠色代表下調(diào)。
2.2 差異基因的功能富集分析 為了探索染色質(zhì)調(diào)節(jié)因子差異基因?qū)C體細胞組成及代謝活動的影響,本研究對137個差異基因進行了GO和KEGG功能富集分析。結(jié)果表明,胃癌上調(diào)基因主要包括“堿基切除修復、同源重組、細胞周期、S-腺苷蛋氨酸依賴型甲基轉(zhuǎn)移酶活性、組蛋白甲基轉(zhuǎn)移酶活性、組蛋白結(jié)合、核染色質(zhì)、染色體區(qū)域、染色體端粒區(qū)域、調(diào)節(jié)DNA 代謝過程、染色質(zhì)共價修飾、組蛋白修飾”等,上調(diào)的主要KEGG通路為“堿基切除修復、同源重組、細胞周期”(圖2A)。下調(diào)基因主要包括“修飾依賴蛋白結(jié)合、轉(zhuǎn)錄輔助因子活性、組蛋白結(jié)合、核常染色質(zhì)、組蛋白甲基轉(zhuǎn)移酶復合體、核染色質(zhì)、DNA甲基化、組蛋白修飾、染色質(zhì)共價修飾”等,下調(diào)的KEGG代謝通路主要為“胰島素抵抗”(圖2B)。
2.3 PPI網(wǎng)絡(luò)構(gòu)建和模塊分析 采用String工具構(gòu)建差異基因的PPI網(wǎng)絡(luò),選擇物種為homo sapiens,將所得結(jié)果導入Cytoscape軟件,對PPI網(wǎng)絡(luò)進行可視化(圖3A),置信度>0.9,并采用cyto-Hubba插件篩選出PPI網(wǎng)絡(luò)中的hub基因。得到前10名hub基因為BRCA2、BARD1、RAD51、NBN、PCNA、TP53BP1、E2F6、RUVBL1、RUVBL2、WDR5(圖3B)。
圖1 篩選差異基因
圖2 DEGs富集分析
2.4 構(gòu)建hub基因預測模型及潛在治療藥物篩選 采用“2.3”中篩選出的hub基因構(gòu)建胃癌的預測模型,繪制列線圖、Calibration 圖及ROC 曲線(圖4A-C),由DSigDB數(shù)據(jù)庫可見hub的胃癌預測模型中ROC值為0.953,預測效果良好,其中RUVBL1基因的預測性最佳。并根據(jù)hub預測相關(guān)潛在治療藥物有氟達拉濱、硝酸鉀等。見圖4D、表2。
圖3 DEGs的蛋白互作網(wǎng)絡(luò)
圖4 ROC曲線與藥物預測
近年來,大量研究發(fā)現(xiàn)了一些分子標志物與胃癌發(fā)生發(fā)展的相關(guān)性[11-12]。Wu等[13]研究表明,TRERNA1敲低顯著降低胃癌細胞遷移、侵襲和轉(zhuǎn)移。TRERNA1消耗減少了體內(nèi)胃癌的細胞轉(zhuǎn)移,在轉(zhuǎn)錄水平調(diào)節(jié)CDH1作為胃癌進展的關(guān)鍵效應(yīng)物,提示TRERNA1/CDH1是胃癌治療的新的潛在靶點[13]。Huang等[14]研究表明,LINC00673可以作為LSD1和EZH2的支架并抑制兩者表達,發(fā)揮致癌作用,促進胃癌發(fā)展進程。Qi等[15]研究顯示,AGAP2-AS1過表達促進細胞生長和侵襲。其通過與LSD1和EZH2相互作用并抑制CDKN1A(P21)和E-cadherin轉(zhuǎn)錄發(fā)揮致癌作用,表明AGAP2-AS1是胃癌患者的潛在診斷標志物和治療靶點。然而,由于癌癥的高度異質(zhì)性、差異表達基因數(shù)量龐大,且染色質(zhì)調(diào)節(jié)因子在癌癥的發(fā)生發(fā)展中具有重要作用[16-18],因此,本研究探究了染色質(zhì)調(diào)節(jié)因子在胃癌中的作用。
生物信息學分析顯示,癌癥組織樣本較正常組織樣本,上調(diào)的染色質(zhì)調(diào)節(jié)因子基因主要包括:堿基切除修復、同源重組、細胞周期、S-腺苷蛋氨酸依賴型甲基轉(zhuǎn)移酶活性、組蛋白甲基轉(zhuǎn)移酶活性、組蛋白結(jié)合、核染色質(zhì)、染色體區(qū)域、染色體端粒區(qū)域、調(diào)節(jié)DNA代謝過程、染色質(zhì)共價修飾、組蛋白修飾等。上調(diào)的KEGG通路:細胞周期、同源重組、堿基切除修復。下調(diào)的染色質(zhì)調(diào)節(jié)因子基因主要包括:修飾依賴蛋白結(jié)合、轉(zhuǎn)錄輔助因子活性、組蛋白結(jié)合、核常染色質(zhì)、組蛋白甲基轉(zhuǎn)移酶復合體、核染色質(zhì)、DNA甲基化、組蛋白修飾、染色質(zhì)共價修飾等。下調(diào)的KEGG代謝通路主要為胰島素抵抗。
采用cytoHubba插件獲得hub基因:BRCA2、BARD1、RAD51、NBN、PCNA、TP53BP1、E2F6、RUVBL1、RUVBL2、WDR5,在胃癌的預測模型中,RUVBL1基因的預測性最佳。RUVBL1具有較弱的ATPase活性[19-20],是TIP60復合物的重要組成部分[21],其伴隨和調(diào)節(jié)轉(zhuǎn)錄因子,包括MYC、E2F1和β-連環(huán)蛋白(β-catenin),并參與導致致癌的染色質(zhì)重塑[22]。RUVBL1和β-catenin上調(diào)和核定位與癌癥進展高度相關(guān),其增強TCF/β-catenin介導的Wnt靶基因轉(zhuǎn)錄,因此可能促進癌變[23]。生存結(jié)果較差的非小細胞肺癌(NSCLC)患者中也具有較高的RUVBL1和RUVBL2表達[24]。此外,Sun等[25]研究表明,RUVBL1可替代AR信號轉(zhuǎn)導,以促進癌細胞存活和腫瘤耐藥性發(fā)展。Lone等[26]發(fā)現(xiàn),RUVBL1免疫陽性與腫瘤患者預后不良和復發(fā)率較高有關(guān)。Zeng等[27]研究表明,敲低RUVBL1可以通過抑制β-連環(huán)蛋白信號轉(zhuǎn)導,從而降低癌癥細胞增殖和轉(zhuǎn)移,并表明RUVBL1可作為口腔鱗狀細胞癌的診斷和預后生物標志物以及治療靶點。另外,在胃癌的預測模型中,BRCA2與其他基因顯示出相反的作用。證據(jù)表明,BRCA2基因突變可致胃癌風險增加[28],并且具有BRCA2高表達的胃癌與更好的預后相關(guān)[29]。這可能對胃癌具有重要的預后和治療意義。結(jié)果表明,染色質(zhì)調(diào)節(jié)因子在胃癌的發(fā)生發(fā)展中具有重要作用。此外,本研究通過Enrichr平臺,采用DSigDB 數(shù)據(jù)庫進行hub基因和共表達基因的藥物篩選,其中氟達拉濱、硝酸鉀最佳。然而,由于本研究是基于軟件統(tǒng)計處理和數(shù)據(jù)庫分析獲得的關(guān)鍵基因和藥物,其是否能在胃癌中發(fā)揮作用仍需進一步的分子生物學實驗來驗證。
綜上所述,染色質(zhì)調(diào)節(jié)因子在胃癌的發(fā)生發(fā)展中具有重要作用,采用染色質(zhì)調(diào)節(jié)相關(guān)因子構(gòu)建預后模型效果良好,其中RUVBL1效果最佳,并通過hub基因篩選出了潛在治療藥物,為胃癌的臨床治療提供了輔助指導,但需要更多的臨床隊列和實驗來進一步驗證結(jié)論。