施金虎,吳 波,藍(lán)曉紅,王玥坤,楊 陽,易劍峰,魏 瑋,高 茗#
(1.中國人民解放軍東部戰(zhàn)區(qū)總醫(yī)院藥劑科,南京 210002; 2.江西中醫(yī)藥大學(xué)中醫(yī)基礎(chǔ)理論分化發(fā)展研究中心,南昌 330004)
原發(fā)性肝癌的發(fā)病率在我國常見惡性腫瘤疾病中居第4位,其病死率在惡性腫瘤中居第2位,嚴(yán)重威脅我國人民的生命和健康[1]。原發(fā)性肝癌主要分為肝細(xì)胞癌(HCC)、肝內(nèi)膽管癌(ICC)和混合型肝細(xì)胞癌-膽管癌(Chcc-CCA)3種不同病理學(xué)類型,三者發(fā)病機(jī)制、病理組織學(xué)、治療方法、生物學(xué)行為以及預(yù)后等方面差異較大,既往研究主要在HCC或膽管癌(CC)方面,而2種疾病的共同基礎(chǔ)分子機(jī)制鮮有報(bào)道。因此,研究兩者間的聯(lián)系,有助于肝膽癌早期篩查、診斷、系統(tǒng)治療及隨訪監(jiān)測(cè)等。隨著高通量測(cè)序技術(shù)的不斷發(fā)展與完善,基于多組學(xué)數(shù)據(jù)研究被用于挖掘調(diào)控疾病潛在細(xì)胞因子、基因表達(dá)異常及信號(hào)通路等復(fù)雜調(diào)控機(jī)制。微RNA(miRNA)是一類內(nèi)源性的具有調(diào)控功能的非編碼RNA分子,廣泛分布于真核生物中,其大小長20~25個(gè)核苷酸。近年來,大量研究發(fā)現(xiàn)miRNA及其靶基因的表達(dá)失調(diào),影響多種腫瘤細(xì)胞增殖、侵襲及凋亡,已成為當(dāng)今研究的熱點(diǎn)。隨著轉(zhuǎn)錄組學(xué)的高速發(fā)展,使得研究人員對(duì)特定癌種中表達(dá)失衡miRNA及其調(diào)控靶點(diǎn)挖掘變?yōu)榭赡?。本研究通過挖掘HCC和CC中共同差異表達(dá)miRNAs(DEMs),預(yù)測(cè)其上游調(diào)控基因和下游調(diào)控靶點(diǎn),借助Cytoscape 3.9.1軟件篩選關(guān)鍵靶點(diǎn),構(gòu)建miRNA-關(guān)鍵靶點(diǎn)調(diào)控網(wǎng)絡(luò),并對(duì)關(guān)鍵靶基因進(jìn)行驗(yàn)證和中藥預(yù)測(cè)分析,以期為肝膽癌的診斷和治療提供新的線索或依據(jù)。
本研究所需芯片數(shù)據(jù)集源于GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/),該數(shù)據(jù)庫儲(chǔ)存了大量轉(zhuǎn)錄組基因表達(dá)數(shù)據(jù)集和測(cè)序序列。在GEO DataSets搜索欄添加“hepatocellular carcinoma and cholangiocarcinoma and miRNA or microRNA”進(jìn)行檢索,獲得與研究內(nèi)容相關(guān)的芯片數(shù)據(jù)集。
HCC和CC基因表達(dá)原始數(shù)據(jù)均來自GSE209875數(shù)據(jù)集,該數(shù)據(jù)來自日本東麗工業(yè)株式會(huì)社,包含了10對(duì)HCC患者(6對(duì)CC患者)腫瘤組織和癌旁組織(基因芯片平臺(tái):GPL21185和GPL21263)。利用在線分析工具GEO2R對(duì)數(shù)據(jù)集進(jìn)行分組,以閾值為|log2FC|>1和P<0.05[2]篩選DEMs,通過FunRich數(shù)據(jù)庫(http://www.funrich.org/)預(yù)測(cè)上游轉(zhuǎn)錄因子[3],通過miRNet數(shù)據(jù)庫(https://www.mirnet.ca/)預(yù)測(cè)下游靶基因。
將“1.2”中預(yù)測(cè)的下游靶基因上傳至STRING數(shù)據(jù)庫(https://cn.string-db.org/),閾值“minimum required interaction score=0.4”“hide protein names”,獲得PPI網(wǎng)絡(luò)。隨后,用Cytoscape 3.9.1軟件行可視化處理,并用“cytohubba”插件行MCC算法分析,得到該網(wǎng)絡(luò)關(guān)鍵靶基因,按打分值排序,選取前30位靶基因與DEMs構(gòu)建miRNA調(diào)控網(wǎng)絡(luò)。
將“1.2”中預(yù)測(cè)下游靶基因上傳至DAVID數(shù)據(jù)庫(https://david.ncifcrf.gov/),獲得靶基因參與生物過程(BP)、細(xì)胞組成(CC)和分子功能(MF)及KEGG通路。
UALCAN數(shù)據(jù)庫(http://ualcan.path.uab.edu/)是綜合交互式的網(wǎng)絡(luò)數(shù)據(jù)庫,可用于識(shí)別生物標(biāo)志物或潛在基因,便于研究人員收集有價(jià)值基因信息和數(shù)據(jù)。將關(guān)鍵基因上傳至UALCAN數(shù)據(jù)庫,選擇“TCGA”功能模塊,獲取靶基因在正常人與HCC(或CC)患者中的表達(dá)差異,P<0.05為差異有統(tǒng)計(jì)學(xué)意義[4]。Kaplan Meier-plotter軟件(https://kmplot.com/analysis/)能夠評(píng)估所有基因表達(dá)與21種腫瘤類型的樣本存活率之間的相關(guān)性,該軟件用于惡性腫瘤相關(guān)生物標(biāo)志物研究。將關(guān)鍵基因上傳至該軟件,選擇“l(fā)iver cancer”進(jìn)行分析,獲得靶基因整體生存率。
與靶點(diǎn)相關(guān)的中藥預(yù)測(cè)用到的數(shù)據(jù)庫為Coremine Medical(https://www.coremine.com/),該數(shù)據(jù)由多國科研機(jī)構(gòu)共同研制,吸納中西醫(yī)相關(guān)領(lǐng)域的醫(yī)學(xué)信息檢索平臺(tái),支持在線檢索與靶點(diǎn)相關(guān)的信息,如中藥、疾病、藥物、食物、基因、蛋白、化合物及細(xì)胞成分等。將關(guān)鍵基因映射到Coremine Medical數(shù)據(jù)庫中獲取相關(guān)中藥,P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
基于GSE209875基因片段原始數(shù)據(jù),對(duì)其進(jìn)行分組:HCC組包括10個(gè)惡性腫瘤組織和10癌旁組織,年齡為62~75歲,平均68歲,樣本的miRNA來源于total RNA;CC組包括6個(gè)惡性腫瘤組織和6個(gè)癌旁組織,年齡為63~76歲,平均71歲,樣本的miRNA來源于total RNA。
通過在線分析工具GEO2R對(duì)兩組進(jìn)行差異分析,分別得到14個(gè)DEMs(HCC組)和104個(gè)DEMs(CC組),其中miR-199a-5p為兩組共同DEMs,見圖1(A)—圖1(B)。利用FunRich軟件對(duì)miR-199a-5p進(jìn)行轉(zhuǎn)錄因子預(yù)測(cè),得到28個(gè)轉(zhuǎn)錄因子,差異最大的前6個(gè)分別為EGR1、ELF1、MEF2A、POU2F1、SP1和RXRA,見圖1(C);通過miRNet數(shù)據(jù)庫預(yù)測(cè)出166個(gè)下游靶基因,見圖1(D)。
A.HCC組與CC組DEMs交集;B.CC組和HCC組miR-199a-5p熱圖;C.miR-199a-5p上游轉(zhuǎn)錄因子;D.miR-199a-5p下游調(diào)控靶點(diǎn)。
將166個(gè)下游靶基因映射到STRING數(shù)據(jù)庫中,構(gòu)建PPI網(wǎng)絡(luò),該網(wǎng)絡(luò)中有166個(gè)節(jié)點(diǎn),449條邊,平均度值為5.41,PPI enrichment(P<1×10-16),見圖2(A)。利用Cytoscape 3.9.1軟件中“cytohubba”插件分析該網(wǎng)絡(luò)關(guān)鍵靶點(diǎn),選取分值排序前30位進(jìn)行可視化處理,見圖2(B)、表1。將關(guān)鍵基因映射至下游靶基因網(wǎng)絡(luò),見圖2(C)。
表1 MCC算法關(guān)鍵基因打分排序(前10位)
BP富集到270個(gè)條目,68個(gè)有效條目,主要涉及基因表達(dá)的正向調(diào)控、凋亡過程的負(fù)調(diào)控、細(xì)胞增殖的正向調(diào)節(jié)、蛋白質(zhì)磷酸化、對(duì)缺氧的反應(yīng)、上皮細(xì)胞向間質(zhì)細(xì)胞轉(zhuǎn)變和細(xì)胞遷移的正向調(diào)節(jié)等;CC富集到41個(gè)條目,11個(gè)有效條目,主要涉及基底外側(cè)質(zhì)膜、細(xì)胞質(zhì)、轉(zhuǎn)錄因子復(fù)合物、細(xì)胞表面和核內(nèi)膜等;MF富集到49個(gè)條目,28個(gè)有效條目,主要涉及蛋白激酶結(jié)合、酶結(jié)合、生長因子結(jié)合、蛋白激酶活性、受體結(jié)合、細(xì)胞因子活性和膠原蛋白綁定等,見圖3(A)。KEGG通路主要富集到癌癥通路、胃癌、胰腺癌、FoxO信號(hào)通路、HCC、絲裂原激活的蛋白激酶(MAPK)信號(hào)通路以及磷脂酰肌醇3激酶-蛋白激酶B(PI3K-Akt)信號(hào)通路等,見圖3(B)。
A.PPI網(wǎng)絡(luò);B.MCC算法分析關(guān)鍵基因間相關(guān)性;C.miRNA與關(guān)鍵基因調(diào)控網(wǎng)絡(luò),綠色倒三角示下調(diào)miR-199a-5p,紅色菱形示打分值排序居前10位的上調(diào)關(guān)鍵基因,紅色圓形為打分較低關(guān)鍵基因。
A.下游靶基因主要參與生物過程、組成成分及分子功能;B.下游靶基因富集到的主要信號(hào)通路。
本課題組研究了TCGA數(shù)據(jù)集中關(guān)鍵基因在正常人與惡性腫瘤患者中的表達(dá)水平,發(fā)現(xiàn)HCC及CC的VEGFA、CDH1、CD44、SMAD4、SMAD3、CDH2、SOX9、JAG1和KRAS等9個(gè)關(guān)鍵基因mRNA表達(dá)與正常人比較有顯著性差異,見圖4(A)—圖4(T)。進(jìn)一步比較其差異的變化趨勢(shì),發(fā)現(xiàn)VEGFA、CD44、SMAD4、SMAD3、SOX9、JAG1和KRAS等7個(gè)關(guān)鍵基因在HCC和CC中的表達(dá)較正常組織顯著升高,與上述預(yù)測(cè)結(jié)果一致。CDH1基因在HCC中表達(dá)較正常組織顯著升高,在CC中表達(dá)較正常組織顯著降低,說明該基因在不同癌種間發(fā)揮著不同生物學(xué)作用。
通過對(duì)關(guān)鍵基因(排序居前10位)進(jìn)行HCC患者整體生存率的分析,發(fā)現(xiàn)VEGFA、CDH1、SOX9和JAG1的異常表達(dá)與HCC患者整體生存率有關(guān),見圖5。
A—J.不同表達(dá)的關(guān)鍵基因?qū)Ω伟┗颊哒w生存率的影響(logrank P<0.05為差異有統(tǒng)計(jì)學(xué)意義)。
A.預(yù)測(cè)中藥性味分類;B.預(yù)測(cè)中藥歸經(jīng)。
將關(guān)鍵基因(排序居前10位)映射至Coremine Medical數(shù)據(jù)庫,篩選治療HCC或CC的潛在中藥,共篩選出中藥25味(P<0.05),結(jié)果見表2。對(duì)預(yù)測(cè)的中藥進(jìn)行性味、歸經(jīng)分析,多數(shù)中藥以微寒為主,主要?dú)w于肝經(jīng)、脾經(jīng),見圖6。
表2 與關(guān)鍵基因作用的潛在中藥
目前,甲胎蛋白被廣泛作為HCC診斷的生物標(biāo)志物,但由于HCC發(fā)生、發(fā)展的生物學(xué)過程十分復(fù)雜,且易受外界因素的影響(如病毒性肝炎、乙醇),因而,尋找新的HCC預(yù)后相關(guān)分子標(biāo)志物對(duì)HCC的診斷、治療及預(yù)后意義重大[5]。CC是常見的肝臟惡性腫瘤,具有惡性程度高、擴(kuò)散轉(zhuǎn)移時(shí)間短、治療效果差和生存期短等特點(diǎn)。上述2種疾病雖病理機(jī)制不同,但仍有交集,若能探明其內(nèi)在聯(lián)系,有利于疾病診療。隨著生物數(shù)據(jù)量劇增和生物信息學(xué)快速發(fā)展,與腫瘤相關(guān)的二級(jí)數(shù)據(jù)庫逐漸趨于完善,研究人員可對(duì)特定癌種中表達(dá)異常基因進(jìn)行系統(tǒng)研究[6-8]。
本研究從GEO數(shù)據(jù)庫中獲取HCC和CC芯片數(shù)據(jù)集,利用在線分析工具GEO2R對(duì)兩組數(shù)據(jù)集進(jìn)行差異表達(dá)分析,HCC數(shù)據(jù)集共篩選出14個(gè)miRNA,CC數(shù)據(jù)集共篩選出104個(gè)miRNA,兩者共同DEMs為miR-199a-5p。為進(jìn)一步深入研究其調(diào)控機(jī)制,進(jìn)而預(yù)測(cè)分析共同DEMs的上游轉(zhuǎn)錄基因,得到EGR1、ELF1、MEF2A、POU2F1、SP1和RXRA等6個(gè)上游轉(zhuǎn)錄基因;下游靶標(biāo)預(yù)測(cè)出166個(gè)靶基因。隨后進(jìn)行生物學(xué)過程和通路富集,靶基因主要參與增加基因表達(dá)調(diào)節(jié)、抑制凋亡過程、促進(jìn)細(xì)胞增殖、上皮細(xì)胞向間質(zhì)細(xì)胞轉(zhuǎn)變和促進(jìn)細(xì)胞遷移等生物過程;主要涉及癌癥通路、FoxO信號(hào)通路、MAPK信號(hào)通路以及PI3K-Akt信號(hào)通路;富集到主要疾病包括胃癌、胰腺癌和HCC。PPI網(wǎng)絡(luò)篩選出VEGFA、CDH1、CD44和SMAD4等10個(gè)關(guān)鍵基因。VEGFA是血小板衍生生長因子/血管內(nèi)皮生長因子家族的成員,可介導(dǎo)并增加血管通透性,誘導(dǎo)血管生成,血管發(fā)生和內(nèi)皮細(xì)胞生長,促進(jìn)細(xì)胞遷移和抑制細(xì)胞凋亡[9-11]。CDH1為鈣依賴性細(xì)胞黏附蛋白,屬于鈣黏蛋白家族成員,CDH1基因參與細(xì)胞黏附、遷移和上皮細(xì)胞增殖,與腫瘤發(fā)生、發(fā)展密切相關(guān)[12]。CD44基因編碼細(xì)胞表面糖蛋白,參與細(xì)胞間相互作用、細(xì)胞黏附和遷移,現(xiàn)已證實(shí)該蛋白質(zhì)在腫瘤細(xì)胞侵襲、轉(zhuǎn)移中起促進(jìn)作用。SMAD4屬于Smad家族成員,可充當(dāng)腫瘤抑制因子并抑制上皮細(xì)胞增殖,還可通過減少血管生成和增加血管通透性而對(duì)腫瘤產(chǎn)生抑制[13]。SNAI1是蛋白質(zhì)編碼基因,主要參與上皮間質(zhì)轉(zhuǎn)化的誘導(dǎo)以及胚胎中胚層的形成和維持、生長停滯、存活和細(xì)胞遷移[14]。研究結(jié)果顯示,上述基因可能參與HCC/CC相關(guān)的腫瘤發(fā)生、發(fā)展不同階段,有相應(yīng)文獻(xiàn)為支撐。因而,本預(yù)測(cè)具有一定的參考意義。
為驗(yàn)證研究結(jié)果的可行性,本課題組比較了核心基因在正常人與HCC(或CC)患者中的表達(dá)差異及影響肝癌預(yù)后分析。發(fā)現(xiàn)VEGFA、CD44、SMAD4、SMAD3、SOX9、JAG1和KRAS等7個(gè)關(guān)鍵基因在HCC和CC中的表達(dá)較正常組織顯著升高,與上述預(yù)測(cè)結(jié)果一致。且VEGFA、CDH1、SOX9和JAG1的異常表達(dá)與肝癌患者整體生存率顯著相關(guān)。本研究發(fā)現(xiàn),miR-199a-5p表達(dá)相比癌旁組織顯著下調(diào),而miR-199a-5p的低表達(dá)可以通過增加VEGFA、CDH1、SOX9和JAG1等基因表達(dá)來促進(jìn)肝膽腫瘤細(xì)胞增殖、侵襲能力,后續(xù)可進(jìn)行相關(guān)實(shí)驗(yàn)驗(yàn)證。此外,本課題組通過COREMINE數(shù)據(jù)庫對(duì)干預(yù)關(guān)鍵靶點(diǎn)進(jìn)行相關(guān)中藥預(yù)測(cè),結(jié)果提示丹參、當(dāng)歸和人參出現(xiàn)頻次較多,藥物歸經(jīng)以肝、脾兩經(jīng)為主,且多為微寒類。中醫(yī)學(xué)無“HCC”病名,臨床表現(xiàn)多以肋間痛、腹水、黃疸及腹內(nèi)包塊,中醫(yī)學(xué)將其歸屬于“肝積”“脾積”和“癖黃”等范疇[15-16]。中醫(yī)學(xué)中,CC可歸于“肋痛”“黃疸”范疇,與氣血凝結(jié)、七情內(nèi)傷、腑臟虧損和飲食勞傷等密切相關(guān)[17],可見2種疾病間交集存在。文獻(xiàn)報(bào)道,丹參可抑制肝癌細(xì)胞生長、誘導(dǎo)惡性腫瘤細(xì)胞分化,減輕患者癥狀,縮小癌腫,增強(qiáng)抗腫瘤藥物療效,并降低門靜脈高壓等[18-21]。張誼等[22]研究發(fā)現(xiàn),丹參酮ⅡA能夠劑量依賴性地抑制肝癌細(xì)胞HepG2增殖,誘導(dǎo)細(xì)胞凋亡、ATP生成減少、耗氧量降低以及線粒體膜電位的下降。羅藝[23]發(fā)現(xiàn),丹參中的隱丹參酮通過調(diào)控PI3K-AKT-雷帕霉素靶蛋白信號(hào)通路誘導(dǎo)肝癌細(xì)胞凋亡和自噬,體內(nèi)實(shí)驗(yàn)表明隱丹參酮能夠抑制肝癌細(xì)胞Huh7裸鼠皮下移植瘤的生長。
本研究的局限之處在于數(shù)據(jù)來源依賴于GEO數(shù)據(jù)庫中記載的芯片數(shù)據(jù)集,然而單一來源芯片數(shù)量過少,可能對(duì)研究結(jié)果造成偏倚。因而,本課題組采用多個(gè)數(shù)據(jù)庫結(jié)合文獻(xiàn)報(bào)道驗(yàn)證結(jié)果的準(zhǔn)確性,為后續(xù)實(shí)驗(yàn)研究進(jìn)行鋪墊??傊?本研究構(gòu)建了miRNA與關(guān)鍵基因調(diào)控網(wǎng)絡(luò),分析關(guān)鍵基因在2種惡性腫瘤中的差異表達(dá)及預(yù)后不利因素,上述結(jié)果有望為肝膽癌發(fā)病機(jī)制和臨床治療提供新的線索。
中國醫(yī)院用藥評(píng)價(jià)與分析2024年2期