余春波,李大玉,范 芳,李長福
(遵義醫(yī)科大學 生物化學教研室,貴州 遵義 563099)
肝細胞癌(Hepatocellular carcinoma,HCC)是消化系統(tǒng)最常見的惡性腫瘤之一[1],其發(fā)病率和死亡率占全球癌癥的第6位和第4位[2],病毒感染、酒精、肥胖等都可能引發(fā)HCC的發(fā)生,盡管在手術治療、化療方面取得一些進展,但肝癌發(fā)生的分子機制仍然難以捉摸[3]。由于缺乏有效的治療靶點,一直以來都是臨床治療階段的一個難關,隨著癌癥的基因突變和全基因組研究的開展,許多基因在腫瘤的致癌過程中起作用,這可能對開發(fā)有效的肝癌預防和治療方案有用,因此,篩選及鑒定肝癌發(fā)生發(fā)展過程中的關鍵基因和通路,將有助于認識肝癌潛在的發(fā)病機制,以期為臨床尋找更多的診斷方法、治療靶點和預后提供一定的參考。
目前,癌癥研究已進入基因組學數(shù)據(jù)測序時代,將更好地了解癌癥基因變化,確定潛在的基因突變,進一步發(fā)現(xiàn)新的治療靶點[4],單張數(shù)據(jù)芯片分析的結果,假陽性率相對較高。本研究從GEO數(shù)據(jù)庫中篩選下載五個數(shù)據(jù)集,通過對正常肝組織和HCC組織基因芯片中的差異基因進行分析,篩選得到關鍵基因和信號通路;進一步驗證關鍵基因在表達水平、病理分期關系、患者生存分析和免疫組化分析,這樣篩選出來的基因可能更具有臨床意義,或將為HCC的診斷和治療提供新的思路。
1.1 芯片來源 在GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/)中搜索關鍵詞“Hepatocellular carcinoma”,選擇“Homo sapiens、tissue、Expession profiling by array”,在數(shù)據(jù)集中挑選正常肝組織為對照組,人HCC組織為實驗組。3張基因芯片,GSE14520,GSE84598,GSE84402分別有正常肝組織樣本19、22、14例,人HCC組織樣本有22、22、14例,平臺分別為GPL3921、GPL10558、GPL570;2張miRNA數(shù)據(jù)芯片,GSE98269、GSE57555分別有正常肝組織樣本3、5例,人HCC組織樣本3、5例,平臺分別為GPL20712、GPL18044。
1.2 篩選差異表達基因 利用GEO2R在線分析工具對實驗組和對照組數(shù)據(jù)進行分析,其中以|log2FC(fold change)|≥1.5和P<0.05作為截取標準用于DEGs的篩選,Venn在線制圖工具對3組差異表達基因取交集基因,獲得3組差異表達基因共同上調、下調的DEGs。
1.3 DEGs的PPI網(wǎng)絡構建及關鍵基因的篩選 將所獲得的3組差異表達基因共同上調、下調的DEGs輸入STRING數(shù)據(jù)庫(https://string-db.org)構建PPI網(wǎng)絡圖,隨后導入Cytoscape3.7.1軟件,利用軟件自帶MCODE插件進行模塊分析,模板篩選標準[5]:自由度截止值=10,Haircut on,Node Score Cutoff =0.2,K-Core=2,及Max.Depth=100,進而用Cytohubba插件對差異基因用常規(guī)3種算法(Degree、Closeness、Betweeness)進行篩選,每一種算法所得的前10個基因為關鍵基因。
1.4 關鍵基因GO分析及KEGG pathway分析 利用在線DAVID網(wǎng)站(https://david.ncifcrf.gov)對Cytohubba插件篩選出來的關鍵基因進行GO和KEGG pathway分析。
1.5 關鍵基因的驗證與預后 用GEPIA數(shù)據(jù)庫(http://gepia.cancer-pku.cn)進行在線分析,以|log2FC|>1、P<0.05為標準對篩選得到的關鍵基因進行表達水平、病理分期關系、患者生存分析等,并用人類蛋白質圖譜(http://www.proteinatlas.org)分析關鍵基因的在HCC組織和正常組織中的免疫組化結果,下載具有代表性的免疫染色圖片。
1.6 關鍵基因的腫瘤免疫細胞浸潤分析 利用TIMER在線網(wǎng)站(https://cistrome.shinyapps.io/timer/)檢測關鍵基因在HCC組織中免疫細胞的浸潤情況。
1.7 關鍵基因的miRNA驗證 將關鍵基因輸入動物microRNA靶標預測和功能注釋數(shù)據(jù)庫(http://mirdb.org/)預測其miRNA,并與2張miRNA數(shù)據(jù)芯片取DEMs,驗證關鍵基因的miRNA,構建Hub Gene—miRNA網(wǎng)絡。
2.1 HCC差異基因及miRNA的篩選 3張基因芯片GSE14520、GSE84598、GSE84402分別篩選出DEGs559個(163個上調基因,396個下調基因)、1 021個(450個上調基因,571個下調基因)、857個(403個上調基因,454個下調基因),將這3個芯片數(shù)據(jù)集取交集,共同表達上調的DEGs為37個(見圖1A),共同表達下調的DEGs為127個(見圖1B)。
2.2 HCC差異基因的PPI網(wǎng)絡構建及關鍵基因的篩選 將篩選的164個DEGs導入String數(shù)據(jù)庫構建PPI網(wǎng)絡(見圖2A),再用Cytoscape3.7.1軟件的MCODE插件獲得2個重要模板(見圖2B、C);Hubba插件篩選得到19個Hub基因(見圖3)。
A:上調基因;B:下調基因。圖1 HCC組織芯片差異表達基因篩選
圖2 DEGs之間的PPI網(wǎng)絡和顯著模板分析
A:Degree; B:Closeness; D:Betweennes。圖3 3種算法結果排名前10的基因在網(wǎng)絡中的相互關系
2.3 HCC關鍵基因的GO分析和KEGG通路富集結果 通過把19個Hub基因上傳到DAVID數(shù)據(jù)庫進行GO分析和KEGG通路富集,差異基因生物學過程集中在細胞周期、有絲分裂過程、視黃酸受體信號通路的調控、對類固醇激素及內源性刺激的反應等(見圖4A);分子功能有酶結合功能和蛋白去乙?;附Y合功能,細胞組成分布在微管、中心體、紡錘體等,信號通路有p53信號通路、卵母細胞減數(shù)分裂和細胞周期等(見圖4B)。
圖4 HCC組織關鍵基因GO分析和KEGG通路富集
2.4 HCC組織和正常肝組織關鍵基因表達的驗證 通過GEPIA驗證Hub基因在HCC組織和正常肝組織的表達結果顯示:與正常肝組織比較,有3個Hub基因在HCC組織中低表達,7個Hub基因在HCC組織中高表達(P<0.05,見圖5A),且與HPA數(shù)據(jù)庫中免疫組織化學結果相一致,而NDC80和TAT未被HPA數(shù)據(jù)庫收錄(見圖5B);同時驗證Hub基因與HCC患者OS和DFS的關系,結果表明,7個Hub基因高表達組患者的OS情況差于低表達組患者,CYP3A4、ESR1和TAT低表達組患者的OS情況差于高表達組患者(P<0.05,見圖6A);7個Hub基因的高表達組患者的DFS情況差低于表達組患者,CYP3A4、ESR1和TAT高表達組患者的DFS情況高于低表達組患者(P<0.05,見圖6B);除此之外,這10個Hub基因的表達與HCC臨床分期差異顯著(P<0.05,見圖6C)。
A:AURKA;B:BIRC5;C:CCNB1;D:CDK1;E:CYP3A4;F:ESR1;G:KPNA2;H:NDC80;I:TAT;J:TOP2A。圖5 關鍵基因在HCC組織與正常肝組織中的表達
A:AURKA;B:BIRC5;C:CCNB1;D:CDK1;E:CYP3A4;F:ESR1;G:KPNA2;H:NDC80;I:TAT;J:TOP2A。圖6 關鍵基因在HCC組織中表達與患者預后分析
2.5 關鍵基因的腫瘤免疫細胞浸潤分析 通過TIMER數(shù)據(jù)庫對差異表達Hub基因進行檢測發(fā)現(xiàn),AURKA、KPNA2、CYP3A4和TAT mRNA在肝癌免疫微環(huán)境中與B細胞、中性粒細胞、CD8+T細胞、CD4+T細胞、樹突狀細胞和巨噬細胞在肝癌組織的免疫微環(huán)境中的表達明顯相關(P<0.05);而與腫瘤純度在肝癌組織免疫環(huán)境中的表達無確切關系(P>0.05);AURKA、KPNA2 mRNA表達水平與免疫細胞呈正相關,表達量增加;而CYP3A4、TAT mRNA表達水平與免疫細胞呈負相關,表達量下降(見圖7)。
BIRC5、CCNB1、CDK1、NDC80和TOP2A mRNA在肝癌免疫微環(huán)境中與腫瘤純度、B細胞、中性粒細胞、CD8+T細胞、CD4+T細胞、樹突狀細胞和巨噬細胞在肝癌組織的免疫微環(huán)境中的表達明顯相關(P<0.05);且都與免疫細胞呈正相關,表達量增加(見圖7)。
ESR1 mRNA在肝癌免疫微環(huán)境中與腫瘤純度、B細胞和巨噬細胞在肝癌組織的免疫微環(huán)境中的表達明顯相關(P<0.05);而與中性粒細胞、CD8+T細胞、CD4+T細胞和樹突狀細胞在肝癌組織免疫環(huán)境中的表達無相關性(P>0.05);且都與免疫細胞呈負相關,表達量減少(見圖7)。
圖7 關鍵基因與腫瘤免疫細胞間的相關性
2.6 關鍵基因預測miRNA 將關鍵基因CDK1、CCNB1、NDC80、TOP2A、KPNA2、BIRC5、AURKA、CYP3A4、TAT、ESR1用miRDB數(shù)據(jù)庫進行在線預測miRNA,發(fā)現(xiàn)132個miRNA,與2個miRNA芯片GSE98269、GSE57555取交集,得到共有的hsa-miR-224-5p、hsa-miR-144-3p、hsa-miR-148a-3p、hsa-miR-130a-3p、hsa-miR-22-3p這5個miRNA,并構建 Hub Gene—miRNA網(wǎng)絡(見圖8)。
圖8 Hub Gene—miRNA網(wǎng)絡
肝癌是全球常見癌癥之一,其發(fā)生發(fā)展與轉移被認為是一個非常復雜的過程,且HCC的5年生存率僅為18%[6-8],為深入了解其中的分子機制,尋找與HCC密切相關的基因,筆者在GEO數(shù)據(jù)庫檢索篩選得到3張基因表達芯片數(shù)據(jù)集GSE14520、GSE84598和GSE84402,篩選得到164個DEGs并構建PPI網(wǎng)絡,Cytoscape3.7.1軟件篩選排名前十的Hub基因,并進行GO功能和KEGG通路分析,驗證發(fā)現(xiàn)7個上調Hub基因在HCC組織中的表達水平明顯高與正常肝組織,有3個下調Hub基因在HCC組織中的表達水平低于正常肝組織,與免疫組化結果相一致,進而分析Hub基因與HCC患者OS的和DFS相關,且這10個Hub基因的表達與HCC臨床分期相關,提示這些Hub基因具有HCC病理診斷的臨床價值,有助于HCC患者的預后評估。進一步探討Hub基因與腫瘤微環(huán)境免疫細胞浸潤之間的關系,發(fā)現(xiàn)Hub基因在HCC組織的免疫微環(huán)境中的表達明顯相關;與免疫細胞呈現(xiàn)出正相關或負相關,表達量有增加或減少,提示這些Hub基因與HCC腫瘤組織中的免疫細胞的浸潤存在相關性。隨后將10個Hub基因導入miRDB數(shù)據(jù)庫預測得到miRNA并于2張miRNA數(shù)據(jù)芯片GSE98269、GSE57555取交集,得到5個miRNA。
由此筆者推測,這10個關鍵基因CDK1、CCNB1、NDC80、TOP2A、KPNA2、BIRC5、AURKA、CYP3A4、TAT和ESR1可能是肝癌潛在治療的靶點及預后標志物。目前已證實AURKA是肝癌的一個有效藥物靶點,且取得了初步成功,其發(fā)揮的原癌基因作用已探究明確[9-10],抑制AURKA可促進黑色素瘤免疫的積累[11],激活p53協(xié)同AURKA拮抗可促進免疫介導的腫瘤清除[5]。TOP2A在肝癌中參與p53途徑、癌癥途徑和細胞凋亡信號傳導途徑等幾種與癌癥相關的關鍵途徑,發(fā)揮原癌基因作用,是肝癌靶向治療中的一個重要靶點[12],且介導的DNA分裂與腫瘤炎癥微環(huán)境相關,TOP2A是HCC發(fā)生發(fā)展中重要的基因[13]。CDK1與HCC中的免疫細胞浸潤有關[14],抑制CDK1可防止免疫介導的遠端腫瘤破壞[15]。而KEGG分析發(fā)現(xiàn)Hub基因富集在p53信號通路,p53信號通路異常能促進肝癌惡性增殖,并參與HCC的發(fā)生,p53信號通路關鍵基因p53在正常細胞和癌細胞的代謝中起到重要作用[16],并與腫瘤免疫、炎癥微環(huán)境相關,由此筆者推測AURKA、TOP2A和CDK1和p53信號通路可能與肝細胞再生及腫瘤免疫、炎癥微環(huán)境相關。
NDC80是染色體正常分離所必需的基因,有絲分裂過程中有重要的作用,異常表達會造成染色體的異常分離,致使染色體不穩(wěn)定,最終導致腫瘤的發(fā)生[17]。ESR1是HCC的關鍵基因、診斷和治療的標志物[18]。CCNB1與HCC免疫細胞侵潤相關[14]。KPNA2基因可能是通過影響G2/M期、p53信號通路進而發(fā)揮抑制腫瘤細胞增殖、誘導細胞凋亡的作用[19]。KPNA2參與機體免疫應答,在多種腫瘤的發(fā)生、發(fā)展和預后中發(fā)揮重要作用,其高表達能夠顯著性增加腫瘤的惡性增殖,與腫瘤的惡性程度密切相關[20-22]。BIRC5是肝癌免疫相關的預后基因[23]。CYP450是體內藥物轉化關鍵的代謝酶[24]。TAT表達異常讓酪氨酸不能有效降解,致使血液及尿液中酪氨酸及其代謝產(chǎn)物明顯增加,這種疾病是酪氨酸血癥Ⅱ型常染色體隱性遺傳病。以上均反映了這個10個關鍵基因作為肝癌診斷、治療靶點的潛在可能性。
通過2張miRNA數(shù)據(jù)芯片GSE98269、GSE 57555篩選得到的差異miRNA,與10個Hub基因導入miRDB數(shù)據(jù)庫預測得到miRNA取交集,得到hsa-miR-224-5p、hsa-miR-144-3p、hsa-miR-148a-3p、hsa-miR-130a-3p、hsa-miR-22-3p這5個miRNA,有研究發(fā)現(xiàn),hsa-miR-224-5p被認為是肝細胞癌的最佳生物標志物[25],在對乙酰氨基酚誘導的人肝毒性中起到自我保護的作用[26]。hsa-miR-144-3p在肝細胞癌患者血清中細胞外囊泡明顯升高[27]。酒精性肝炎疾病中hsa-miR-148a-3p介導CYP2B6下調[28],hsa-miR-148a-3p通過AGO1依賴性方式在對照和乙醇暴露的肝細胞中促進ADH4表達[29]。miR-130a-3p控制多種癌細胞中的細胞生長,遷移和侵襲[30],miR-130a-3p通過抑制吉西他濱代謝肝癌細胞中的Smad4調節(jié)細胞遷移和侵襲[30]。小檗堿抑制HepG2細胞生長并上調miR-22-3p表達[31]。梓醇通過調節(jié)miR-22-3p/MTA3信號抑制HCC的細胞增殖、侵襲和遷移[32]。以上均反映了這個5個miRNA在肝癌的診斷、治療靶點的潛在可能性。
綜上所述,對GEO數(shù)據(jù)庫中篩選的3個基因芯片和2個miRNA數(shù)據(jù)芯片進行生物信息學分析發(fā)現(xiàn),HCC發(fā)生的關鍵基因可能是CCNB1、NDC80、CDK1、TOP2A、KPNA2、BIRC5、AURKA、CYP3A4、TAT和ESR1,重要的信號通路可能是卵母細胞減數(shù)分裂和p53信號通路,hsa-miR-224-5p、hsa-miR-144-3p、hsa-miR-148a-3p、hsa-miR-130a-3p、hsa-miR-22-3p這5個miRNA可能是HCC關鍵的miRNA,為HCC的分子機制研究和預后判斷提供新靶點,對肝癌的早期診斷和個體化治療,為后續(xù)的實驗研究提供指導。