王 倩, 袁莉莉, 范文濤
(陜西中醫(yī)藥大學(xué), 咸陽(yáng) 712046)
結(jié)直腸癌是發(fā)生于結(jié)腸或直腸粘膜上皮的惡性腫瘤,發(fā)病率占胃腸道腫瘤的第3位。據(jù)流行病學(xué)資料表明,該病的發(fā)病率呈現(xiàn)上升趨勢(shì),且發(fā)病年齡可見(jiàn)于任何年齡,以40~50歲年齡組發(fā)病率最高,目前已成為嚴(yán)重威脅人類(lèi)健康的常見(jiàn)疾病。只有做到早發(fā)現(xiàn)、早治療才能有效降低死亡率。本文通過(guò)GEO數(shù)據(jù)庫(kù)和TCGA數(shù)據(jù)庫(kù)聯(lián)合分析,篩選結(jié)直腸癌差異基因,分析生存曲線,為早期診斷結(jié)直腸癌提供新的標(biāo)志物及其治療提供理論依據(jù)。
本研究通過(guò)檢索NCBI(https://www.ncbi.nlm.nih.gov/),選擇GEO Datasets,檢索Colorectal cancer,選擇Homo sapiens ,共檢索出27723芯片。選擇GSE21510,包含104例樣本;GSE25071,包含50例樣本;GSE32323,包含10例樣本。3組共納入164例樣本。
進(jìn)入芯片數(shù)據(jù)庫(kù),選擇GEO數(shù)據(jù)庫(kù)自帶分析工具Analyze with GEO2R,點(diǎn)擊Define groups進(jìn)行分組,分為癌組織組和癌旁組織組,點(diǎn)擊TOP250進(jìn)行分析,保存分析數(shù)據(jù)。進(jìn)一步根據(jù)P值<0.01,logFC>2或者<-2進(jìn)行差異基因篩選。
將檢索出的差異基因采用文恩圖制作軟件(venny2.1)繪制文恩圖,查找三組共有基因。
打開(kāi)TCGA數(shù)據(jù)庫(kù)(https://cancergenome.nih.gov/),用差異基因查找在結(jié)直腸癌中的表達(dá)。
打開(kāi)TCGA數(shù)據(jù)庫(kù)(https://cancergenome.nih.gov/),分析差異基因?qū)Y(jié)直癌生存曲線的影響。
將篩選出的差異基因,在GEO 數(shù)據(jù)庫(kù)GSE24514芯片集中進(jìn)行驗(yàn)證。
進(jìn)入芯片數(shù)據(jù)庫(kù),使用GEO數(shù)據(jù)庫(kù)自帶分析工具Analyze with GEO2R,點(diǎn)擊Define groups進(jìn)行分組,分為癌組織組和癌旁組織組,點(diǎn)擊TOP250進(jìn)行分析,保存分析數(shù)據(jù)。進(jìn)一步根據(jù)P值<0.01,logFC>2或者<-2進(jìn)行差異基因篩選。共篩選出251個(gè)差異基因,其中上調(diào)基因146個(gè),下調(diào)基因105個(gè)。繪制差異基因火山圖(圖1)。
進(jìn)入芯片數(shù)據(jù)庫(kù),使用GEO數(shù)據(jù)庫(kù)自帶分析工具Analyze with GEO2R,點(diǎn)擊Define groups進(jìn)行分組,分為癌組織組和癌旁組織組,點(diǎn)擊TOP250進(jìn)行分析,保存分析數(shù)據(jù)。進(jìn)一步根據(jù)P值<0.01,logFC>2或者<-2進(jìn)行差異基因篩選。共篩選出669個(gè)差異基因,其中上調(diào)基因312個(gè),下調(diào)基因357個(gè)。繪制差異基因火山圖(圖2)。
Fig.1Analysis of GSE21510 gene chip differential genes
Fig.2Analysis of GSE25071 gene chip differential genes
進(jìn)入芯片數(shù)據(jù)庫(kù),使用GEO數(shù)據(jù)庫(kù)自帶分析工具Analyze with GEO2R,點(diǎn)擊Define groups進(jìn)行分組,分為癌組織組和癌旁組織組,點(diǎn)擊TOP250進(jìn)行分析,保存分析數(shù)據(jù)。進(jìn)一步根據(jù)P值<0.01,logFC>2或者<-2進(jìn)行差異基因篩選。共篩選出353個(gè)差異基因,其中上調(diào)基因115個(gè),下調(diào)基因238個(gè)。繪制差異基因火山圖(圖3)。
Fig.3Analysis of GSE32323 gene chip differential genes
經(jīng)篩選GSE21510基因芯片差異基因251個(gè),其中上調(diào)基146個(gè),下調(diào)基因105個(gè)。GSE25071基因芯片差異基因669個(gè),其中上調(diào)基因312個(gè),下調(diào)基因357個(gè)。GSE32323基因芯片差異基因353個(gè),其中上調(diào)基因115個(gè),下調(diào)基因238個(gè)。經(jīng)文恩圖分析,3個(gè)基因集交集共有15個(gè)基因,其中上調(diào)基因3個(gè),下調(diào)基因12個(gè)(圖4)。在結(jié)腸癌組織中上調(diào)基因?yàn)榇侔┗?,下調(diào)基因?yàn)橐职┗?。通過(guò)基因的差異表達(dá)和生存曲線分析,分別在已篩選的促癌基因和抑癌基因種尋找結(jié)直腸癌診斷標(biāo)志物。
Fig.4Analysis of genetic differences Venn diagram
Tab. 1 Three lists of differential genes
打開(kāi)TCGA數(shù)據(jù)庫(kù),用差異基因查找在結(jié)直腸癌中的表達(dá)。上調(diào)基因3個(gè),下調(diào)基因12個(gè)。
2.5.1 上調(diào)基因 在TCGA數(shù)據(jù)庫(kù)分析包含327例結(jié)直腸癌標(biāo)本的數(shù)據(jù)集,分析差異基因表達(dá)。286例患者INHBA、NFE2L3、HOMER1基因表達(dá)明顯上調(diào),41例正常。表明上調(diào)基因?qū)Y(jié)直腸的產(chǎn)生具有促進(jìn)作用(圖5)。
Fig.5Upregulated gene expressions in TCGA database
2.5.2 下調(diào)基因 在TCGA數(shù)據(jù)庫(kù)分析包含327例結(jié)直腸癌標(biāo)本的數(shù)據(jù)集,分析差異基因表達(dá)。286例患者CA4、CLCA4、BEST4、CA1、CPM、ENTPD5、PDE9A、SLC4A4、SPIB、VSIG2、ZG16、ADH1B基因表達(dá)明顯下調(diào),41例正常。表明下調(diào)基因?qū)Y(jié)直腸的產(chǎn)生具有促進(jìn)作用(圖6)。
在TCGA數(shù)據(jù)庫(kù)分析包含279例結(jié)直腸癌標(biāo)本的數(shù)據(jù)集,對(duì)差異基因進(jìn)行生存分析。發(fā)現(xiàn)70例INHBA基因升高患者的生存時(shí)間明顯低于209例INHBA基因減低患者,說(shuō)明INHBA基因升高對(duì)結(jié)直腸癌具有促進(jìn)作用。71例CLCA4、CA4基因升高患者的生存時(shí)間明顯高于208例CLCA4、CA4基因降低患者,說(shuō)明CLCA4、CA4基因升高對(duì)結(jié)直腸癌具有抑制作用(圖7)。
Fig.6The expressions of down-regulated genes in TCGA database
Fig.7Differential gene survival curves
在GEO數(shù)據(jù)庫(kù)中查找結(jié)直腸癌相關(guān)GSE24514芯片集,共包含49例標(biāo)本,使用工具Analyze with GEO2R進(jìn)行在線分析,查找差異基因ID。通過(guò)ID號(hào)查找到差異基因在組織中的表達(dá)量,驗(yàn)證促癌基因INHBA,抑癌基因CLCA4、CA4在芯片集中的表達(dá)量。
2.7.1 促癌基因 促癌基因INHBA在GEO數(shù)據(jù)庫(kù)GSE24514結(jié)直腸癌芯片集49例樣本中(圖8), 34例腫瘤樣本成高表達(dá),明顯高于15例正常組織樣本。表明基因INHBA在結(jié)直腸癌形成過(guò)程中起到促進(jìn)作用。
Fig.8Differential expression of INHBA gene in GSE24514 dataset
2.7.2 抑癌基因 抑癌基因CLCA4、CA4在GEO數(shù)據(jù)庫(kù)GSE24514結(jié)直腸癌芯片集49例樣本中(圖9、10), 34例腫瘤樣本成低表達(dá),明顯低于15例正常組織樣本。表明基因CLCA4、CA4在結(jié)直腸癌形成過(guò)程中起到抑制作用。
Fig.9Differential expression of CLCA4 and CA4 genes in GSE24514 dataset
Fig.10Differential expression of CLCA4 and CA4 genes in GSE24514 dataset
結(jié)直腸癌是一種常見(jiàn)的惡性腫瘤,主要發(fā)生在人體消化系統(tǒng)直腸和乙狀結(jié)腸,是由直腸和乙狀結(jié)腸發(fā)生癌變導(dǎo)致的,發(fā)病率較高,主要發(fā)生群體是40~50的年齡人群,男性大于女性。結(jié)腸癌初期癥狀不明顯,容易被人忽略,一般發(fā)現(xiàn)在中后期,有消化不良、排便不暢、貧血、消瘦等癥狀,嚴(yán)重者會(huì)出現(xiàn)便血、粘液膿性血便中毒。因不能早期發(fā)現(xiàn),導(dǎo)致死亡率較高。因此,篩選結(jié)直腸癌促癌、抑制基因,有利于早期診斷治療。
本研究通過(guò)篩選GSE21510基因芯片得到差異基因251個(gè),其中上調(diào)基因146個(gè),下調(diào)基因105個(gè)。GSE25071基因芯片差異基因669個(gè),其中上調(diào)基因312個(gè),下調(diào)基因357個(gè)。GSE32323基因芯片差異基因353個(gè),其中上調(diào)基因115個(gè),下調(diào)基因238個(gè)。經(jīng)文恩圖分析,3個(gè)基因集交集共有15個(gè)基因,其中上調(diào)基因3個(gè),下調(diào)基因12個(gè)。在TCGA數(shù)據(jù)庫(kù)中查找差異基因的表達(dá)量和生存曲線。根據(jù)基因表達(dá)量及生存曲線,篩選出上調(diào)基因INHBA為促癌基因,下調(diào)基因CLCA4、CA4為抑癌基因。為進(jìn)一步驗(yàn)證3個(gè)基因在結(jié)直腸癌中的表達(dá)。本文再選取GEO數(shù)據(jù)庫(kù)GSE24514芯片驗(yàn)證差異基因在結(jié)直腸癌中的表達(dá)。促癌基因INHBA在GSE24514芯片癌組織中呈現(xiàn)高表達(dá),表明INHBA基因具有促進(jìn)結(jié)直腸癌變的作用。抑癌基因CLCA4、CA4在GSE24514芯片癌組織中呈現(xiàn)低表達(dá),表明CLCA4、CA4基因?qū)Y(jié)直腸癌有抑制作用。
有報(bào)道在食管腺癌中,INHBAmRNA 水平顯著高于Barrett 食管及食管上皮異性增生[1]。在胃癌中,腫瘤組織中 INHBAmRNA 水平亦顯著高于癌旁正常組織[2]。Wang 等[2]的研究認(rèn)為,胃癌中INHBA mRNA 高表達(dá)與瘤體較大及瘤體浸潤(rùn)較深相關(guān),同時(shí) INHBA 高表達(dá)患者的無(wú)瘤生存期及總體生存期均顯著低于低表達(dá)者。在頭頸部鱗狀細(xì)胞癌中,INHBA 過(guò)表達(dá)與淋巴結(jié)轉(zhuǎn)移相關(guān),且高表達(dá)者無(wú)病生存期顯著低于低表達(dá)者[1]。研究顯示,在食管腺癌中INHBA基因啟動(dòng)子去甲基化導(dǎo)致其表達(dá)上調(diào),并進(jìn)一步促進(jìn)食管癌細(xì)胞的增殖[3]。INHBA 基因在肺腺癌[4]、胃癌[5]、結(jié)直腸癌[6]等惡性腫瘤中也存在顯著表達(dá)上調(diào),并且其高表達(dá)與患者的不良預(yù)后密切相關(guān)。實(shí)驗(yàn)研究顯示TGF-β、NF-κB 等信號(hào)通路相關(guān)基因在右半結(jié)腸癌組織中顯著富集,TGF-β通路中的差異表達(dá)基因INHBA 在右半結(jié)腸癌組織中的mRNA 及蛋白表達(dá)水平顯著高于左半結(jié)腸癌,并且INHBA 高表達(dá)與脈管浸潤(rùn)、血管壁浸潤(rùn)、遠(yuǎn)處轉(zhuǎn)移及不良預(yù)后呈正相關(guān),提示INHBA 基因可能在右半結(jié)腸癌的發(fā)生和演進(jìn)過(guò)程中發(fā)揮著重要作用,有望為右半結(jié)腸癌患者的臨床治療提供新的分子靶點(diǎn)[7]。
CLCA4 在 CRC 細(xì)胞質(zhì)和細(xì)胞膜的表達(dá)水平顯著低于正常對(duì)照組織,在疾病不同階段的患者還表現(xiàn)出極大的差異,并和患者的生存期顯著關(guān)聯(lián)。這表明 CLCA4 表達(dá)降低可能是惡性腫瘤的生物標(biāo)志物并參與癌癥的復(fù)發(fā)和轉(zhuǎn)移,如果早期檢測(cè)該標(biāo)志物,可以預(yù)測(cè)患者預(yù)后并作為治療干預(yù)的判斷依據(jù)。CLCA4 和CLCA1 的表達(dá)缺失可以降低對(duì)腫瘤細(xì)胞的抑制[8]。研究發(fā)現(xiàn)CLCA4 的表達(dá)與腫瘤的高風(fēng)險(xiǎn)因素緊密相關(guān),如原發(fā)腫瘤的浸潤(rùn)程度、淋巴結(jié)轉(zhuǎn)移、Dukes 分期和組織學(xué)分級(jí),并且表達(dá)水平隨腫瘤的分化程度逐步變化,這可能表示在早期 CRC 患者中檢測(cè)該指標(biāo)可直接預(yù)知該患者的預(yù)后情況是否良好。另外,檢測(cè) CLCA4的表達(dá)也可能有助于識(shí)別患者預(yù)后較差的風(fēng)險(xiǎn)因素,以此來(lái)評(píng)估 CLCA4 水平有助于準(zhǔn)確的預(yù)測(cè)患者的預(yù)后、復(fù)發(fā)和潛在的二次性手術(shù)的幾率,這樣可以個(gè)體化的治療每個(gè)病人,達(dá)到優(yōu)化治療的效果[9]。
本研究發(fā)現(xiàn)在結(jié)直腸癌標(biāo)本中基因INHBA(促癌基因)明顯升高,基因 CA4、CLCA4(抑癌基因)明顯降低。 生存曲線證實(shí)INHBA基因升高患者的生存時(shí)間明顯低于INHBA基因減低患者,說(shuō)明INHBA基因升高對(duì)結(jié)直腸癌具有促進(jìn)作用。CLCA4、CA4基因升高患者的生存時(shí)間明顯高于208例CLCA4、CA4基因降低患者,說(shuō)明CLCA4、CA4基因升高對(duì)結(jié)直腸癌具有抑制作用。通過(guò)GEO數(shù)據(jù)庫(kù)與TCGA數(shù)據(jù)庫(kù)聯(lián)合分析,發(fā)現(xiàn)結(jié)直腸癌促癌基因INHBA,抑癌基因CLCA4、CA4。基因INHBA、CLCA4、CA4在結(jié)直腸癌組織中的表達(dá)揭示了其在結(jié)直腸癌發(fā)生、發(fā)展中的作用。有望成為檢測(cè)結(jié)直腸癌侵襲、轉(zhuǎn)移及預(yù)后的重要手段。