趙棟燕, 尹騰飛, 姚樹(shù)坤
1.中國(guó)醫(yī)學(xué)科學(xué)院 北京協(xié)和醫(yī)學(xué)院,北京 100029;2.中日友好醫(yī)院消化內(nèi)科;3.北京大學(xué)醫(yī)學(xué)部
結(jié)直腸癌是全球最常見(jiàn)的惡性腫瘤之一,占每年全球新發(fā)癌癥及癌癥相關(guān)死亡人數(shù)的10%。近年來(lái)結(jié)直腸癌的經(jīng)濟(jì)負(fù)擔(dān)在發(fā)展中國(guó)家逐漸增加,預(yù)計(jì)到2030年新病例的數(shù)目將超過(guò)220萬(wàn),死亡人數(shù)將達(dá)到110萬(wàn)[1]。結(jié)直腸癌最常見(jiàn)的病理類(lèi)型是腺癌,占所有類(lèi)型的70%~90%,甚至更高[2]。盡管目前化療、手術(shù)、靶向治療、放療等多種治療方法在一定程度上提高結(jié)直腸癌患者的生存率并減少其復(fù)發(fā),但晚期結(jié)直腸癌患者的5年生存率仍然很低[1]。近年來(lái)結(jié)直腸癌的發(fā)病機(jī)制和分子機(jī)制等相關(guān)研究取得了巨大進(jìn)展,但依然無(wú)有效的方法來(lái)預(yù)測(cè)患者的生存情況,因此,亟待可靠的分子模型來(lái)預(yù)測(cè)患者的預(yù)后,并指導(dǎo)治療。
miRNA是非編碼RNA家族的重要成員之一,由18~25個(gè)核糖核苷酸組成,通過(guò)與靶mRNA的3’端非編碼區(qū)或5’端非編碼區(qū)互補(bǔ)結(jié)合,抑制翻譯或者使靶mRNA降解或沉默。據(jù)了解,miRNA調(diào)控著60%的人類(lèi)蛋白編碼基因組的表達(dá),參與包括癌癥在內(nèi)的多種生物和病理過(guò)程,在細(xì)胞增殖、遷移、侵襲和轉(zhuǎn)移中具有重要作用[3]。已經(jīng)證實(shí),miRNA在每一種人類(lèi)腫瘤組織中均顯示出異常表達(dá)模式,包括結(jié)直腸癌。而特定的miRNA具有抑癌或促癌作用,這意味著miRNA是腫瘤形成的關(guān)鍵因素[4]。在人類(lèi)腫瘤的發(fā)生發(fā)展中發(fā)揮著重要作用。隨著基因測(cè)序技術(shù)的不斷進(jìn)步,大量的miRNA不斷被發(fā)現(xiàn)。越來(lái)越多的證據(jù)顯示,miRNA對(duì)結(jié)直腸癌的生長(zhǎng)、增殖和轉(zhuǎn)移至關(guān)重要。比如,miR-496作用于靶基因RASSF6,參與調(diào)控WNT通路,誘導(dǎo)上皮間充質(zhì)轉(zhuǎn)化,促進(jìn)結(jié)直腸腫瘤轉(zhuǎn)移[5]。miR-506促進(jìn)靶基因NR4A1的降解,從而抑制結(jié)直腸腫瘤細(xì)胞的生長(zhǎng)、增殖與遷移[6]。有研究證實(shí)單個(gè)或多個(gè)miRNA可以作為腫瘤的預(yù)后因素。生物信息學(xué)是分子生物學(xué)和信息技術(shù)的結(jié)合體,它通過(guò)收集和篩選基因組序列信息,對(duì)其進(jìn)行分析和解釋?zhuān)罱K獲得生物系統(tǒng)的規(guī)律。因此,本研究目的在于依據(jù)生物信息學(xué)技術(shù)應(yīng)用癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)建立能夠有效預(yù)測(cè)結(jié)直腸腺癌患者預(yù)后的miRNA風(fēng)險(xiǎn)模型。
1.1 資料獲取通過(guò)TCGA數(shù)據(jù)庫(kù)下載結(jié)直腸腺癌患者與正常對(duì)照組的miRNA表達(dá)數(shù)據(jù)、mRNA表達(dá)數(shù)據(jù)及相關(guān)的臨床數(shù)據(jù)(https://portal.gdc.cancer.gov/repository)。TCGA數(shù)據(jù)庫(kù)向公眾免費(fèi)開(kāi)放,因此,本研究不需要額外的倫理證明。
1.2 差異mRNA與差異miRNA的篩選應(yīng)用R語(yǔ)言的“edgeR”包對(duì)miRNA和mRNA的表達(dá)譜進(jìn)行歸一化處理,比較腫瘤組與正常組的miRNA和mRNA表達(dá)情況,并篩選出差異的mRNA與miRNA,篩選標(biāo)準(zhǔn)為校正P值(FDR)<0.05和|log2FC|>1。
1.3 預(yù)后模型的構(gòu)建與驗(yàn)證根據(jù)數(shù)據(jù)分析的要求,無(wú)完整臨床特征信息(包括性別、年齡、生存時(shí)間、生存狀態(tài))及生存時(shí)間<30 d(表明可能由其他疾病引起的死亡)將排除在本模型構(gòu)建之外。應(yīng)用R語(yǔ)言的“caret”包將具有完整生存信息和差異表達(dá)miRNA表達(dá)譜的樣本按照50%的比例隨機(jī)分為訓(xùn)練集和測(cè)試集,“caret”包中的“createDataPartition”函數(shù)能夠快速實(shí)現(xiàn)數(shù)據(jù)的分割。利用χ2檢驗(yàn)檢測(cè)訓(xùn)練集、測(cè)試集與合并數(shù)據(jù)集之間的臨床病理信息有無(wú)差異。隨后,對(duì)訓(xùn)練集的miRNA進(jìn)行單變量Cox回歸分析,篩選預(yù)后相關(guān)的miRNA。對(duì)于P<0.05的miRNA進(jìn)行多變量Cox回歸分析,構(gòu)建了預(yù)測(cè)風(fēng)險(xiǎn)的模型:risk score=∑βi×expmiRNAi,其中expmiRNA是miRNA的表達(dá)水平,β是對(duì)應(yīng)miRNA的回歸系數(shù)。根據(jù)風(fēng)險(xiǎn)值的中位數(shù)進(jìn)行分組,將所有腫瘤患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組。采用Kaplan-Meier法及Log-rank檢驗(yàn)繪制生存曲線,繪制受試者工作特征曲線(receiver operating characteristic,ROC)計(jì)算對(duì)5年生存期預(yù)測(cè)的曲線下面積(area under the curve,AUC)來(lái)評(píng)估m(xù)iRNA模型的效能,同時(shí)我們也計(jì)算了腫瘤TNM分期的預(yù)測(cè)生存預(yù)后的效能。通過(guò)多因素Cox比例風(fēng)險(xiǎn)模型分析判斷miRNA預(yù)后模型是否為結(jié)直腸腺癌的獨(dú)立風(fēng)險(xiǎn)因素。
1.4 miRNA靶基因的預(yù)測(cè)目前公認(rèn)的miRNA靶基因預(yù)測(cè)網(wǎng)站有3個(gè),包括miRTarBase (http://mirtarbase.mbc.nctu.edu.tw/),targetScan(http://www.targetscan.org)與miRDB(http://www.mirdb.org/)。首先,從這三個(gè)網(wǎng)站下載了miRNA預(yù)測(cè)數(shù)據(jù)庫(kù),并使用Perl語(yǔ)言預(yù)測(cè)各個(gè)miRNA的靶基因,我們把同時(shí)存在于兩個(gè)及兩個(gè)以上數(shù)據(jù)庫(kù)中的基因定義為miRNA的靶基因。為了明確這些靶基因是否參與結(jié)直腸腺癌的發(fā)病機(jī)制,將靶基因與結(jié)直腸腺癌中差異表達(dá)基因取交集,同時(shí)應(yīng)用cytoscape軟件(3.80版本)描繪miRNA與交集基因之間的關(guān)系。應(yīng)用R語(yǔ)言的“clusterProfiler”與“org.Hs.eg.db”包對(duì)交集基因進(jìn)行KEGG與GO富集分析。當(dāng)P<0.05時(shí),則認(rèn)為富集的基因集有統(tǒng)計(jì)學(xué)意義。
1.5 篩選核心靶基因與生存相關(guān)的靶基因String數(shù)據(jù)庫(kù)(https://string-db.org/)是一個(gè)搜尋蛋白質(zhì)之間相互作用的數(shù)據(jù)庫(kù)。應(yīng)用該網(wǎng)站明確靶基因之間的互作關(guān)系,設(shè)置置信度參數(shù)為0.004,并下載蛋白互作關(guān)系的相關(guān)文件。應(yīng)用cytoscape軟件的插件cytoHubba明確前10個(gè)核心基因,并繪制網(wǎng)絡(luò)關(guān)系圖。最后,應(yīng)用Kaplan-Meier法及Log-rank檢驗(yàn)篩選出生存相關(guān)的靶基因。
2.1 篩選差異mRNA與miRNA我們對(duì)531個(gè)腫瘤樣品與11個(gè)正常樣品進(jìn)行了miRNA差異表達(dá)分析,篩選出520個(gè)差異表達(dá)的miRNA,其中上調(diào)的有328個(gè),下調(diào)的有192個(gè)。隨后,我們對(duì)554個(gè)腫瘤樣品與48個(gè)正常樣品進(jìn)行了mRNA差異表達(dá)分析,篩選出7 677個(gè)差異表達(dá)基因,其中上調(diào)的有4 321個(gè),下調(diào)的有3 356個(gè)。
2.2 預(yù)后模型的構(gòu)建將所有具有完整臨床病理信息的結(jié)直腸腺癌患者(n=484)隨機(jī)分為訓(xùn)練集(n=244)與測(cè)試集(n=240)。兩組患者在年齡、性別、TNM分期、隨訪時(shí)間、隨訪結(jié)局方面比較,差異均無(wú)統(tǒng)計(jì)學(xué)意義(見(jiàn)表1)。單因素Cox回歸分析發(fā)現(xiàn),在訓(xùn)練集中,共有13個(gè)miRNA與患者的總生存期密切相關(guān)(P<0.05)。通過(guò)單因素和多因素Cox回歸分析,最終從13個(gè)候選基因中挑選出來(lái)7個(gè)miRNA用于構(gòu)建風(fēng)險(xiǎn)模型(見(jiàn)表2)。Kaplan-Meier曲線顯示這7個(gè)miRNA均與患者的總生存期密切相關(guān)(P<0.05)(見(jiàn)圖1)。風(fēng)險(xiǎn)評(píng)分計(jì)算如下:風(fēng)險(xiǎn)評(píng)分=hsa-miR-891a-5p的表達(dá)值×0.201+hsa-miR-664b-3p的表達(dá)值×0.564+hsa-miR-485-5p的表達(dá)值×0.386-hsa-miR-486-5p的表達(dá)值×0.298-hsa-miR-3615的表達(dá)值×0.277-hsa-miR-21-3p的表達(dá)值×0.394-hsa-miR-3677-3p的表達(dá)值×0.372。
表1 484例結(jié)直腸腺癌患者的臨床病理特征
表2 差異miRNA的單因素與多因素Cox回歸分析
圖1 Kaplan-Meier曲線與Log-rank檢驗(yàn)提示7個(gè)miRNA均與結(jié)直腸腺癌患者的總生存期顯著相關(guān)
2.3 預(yù)后模型的驗(yàn)證在訓(xùn)練集中,根據(jù)miRNA風(fēng)險(xiǎn)模型計(jì)算了每一例結(jié)直腸腺癌患者的風(fēng)險(xiǎn)評(píng)分。以中位風(fēng)險(xiǎn)評(píng)分為截止點(diǎn),將患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,進(jìn)行Kaplan-Meier分析,結(jié)果提示高風(fēng)險(xiǎn)組患者的總生存時(shí)間明顯短于低風(fēng)險(xiǎn)組患者(P<0.001)。把風(fēng)險(xiǎn)公式應(yīng)用于測(cè)試集與合并數(shù)據(jù)集之后,我們發(fā)現(xiàn)了類(lèi)似具有顯著性差異的結(jié)果(P<0.001)。根據(jù)患者的生存狀態(tài)分布圖,說(shuō)明了測(cè)試集、訓(xùn)練集和合并數(shù)據(jù)集中低風(fēng)險(xiǎn)的患者生存時(shí)間長(zhǎng),預(yù)后佳(見(jiàn)圖2)。另外,我們應(yīng)用了ROC曲線對(duì)5年生存期進(jìn)行了預(yù)測(cè)。如圖2所示,在訓(xùn)練集中,miRNA預(yù)后模型對(duì)5年生存期的預(yù)測(cè)AUC為0.722;在測(cè)試集中,對(duì)5年生存期的預(yù)測(cè)AUC為0.747;在合并數(shù)據(jù)集中,對(duì)5年生存期的預(yù)測(cè)AUC為0.735,高于腫瘤TNM分期對(duì)5年生存期的預(yù)測(cè)AUC值(0.726)。
圖2 訓(xùn)練集、測(cè)試集和合并數(shù)據(jù)集的Kaplan-Meier生存曲線、ROC曲線及生存狀態(tài)分布圖
為了明確miRNA風(fēng)險(xiǎn)模型是否為結(jié)直腸腺癌的獨(dú)立預(yù)后風(fēng)險(xiǎn)因素,多因素Cox比例風(fēng)險(xiǎn)模型分析了miRNA模型與其他臨床病理因素的相關(guān)性。在合并數(shù)據(jù)集中,我們發(fā)現(xiàn)miRNA模型是結(jié)直腸腺癌的獨(dú)立風(fēng)險(xiǎn)因素,不受包括年齡、性別、TNM分期在內(nèi)的臨床病理參數(shù)的影響(HR=1.106,95%CI:1.033~1.185,P=0.004)(見(jiàn)圖3)。
圖3 miRNA預(yù)后風(fēng)險(xiǎn)模型的單因素Cox回歸分析(A)與多因素Cox回歸分析(B)
2.4 miRNA靶基因的預(yù)測(cè)通過(guò)3個(gè)靶基因數(shù)據(jù)庫(kù),我們預(yù)測(cè)了構(gòu)建模型的7個(gè)miRNA所調(diào)控的靶基因。為了提供生物信息分析的準(zhǔn)確性,對(duì)重疊的靶基因進(jìn)行了鑒定。維恩圖提示hsa-miR-891a-5p、hsa-miR-664b-3p、hsa-miR-485-5p、hsa-miR-486-5p、hsa-miR-3615、hsa-miR-21-3p和hsa-miR-3677-3p的靶基因數(shù)目分別是52個(gè)、49個(gè)、1 281個(gè)、344個(gè)、75個(gè)、631個(gè)、38個(gè)。接著,將所有的靶基因與7 677個(gè)差異表達(dá)基因進(jìn)行交集,得到了277個(gè)交集基因。其中,112個(gè)基因在結(jié)直腸腺癌中表達(dá)下調(diào),165個(gè)基因表達(dá)上調(diào)。圖4展示了用于構(gòu)建模型的7個(gè)miRNA與靶基因之間的網(wǎng)絡(luò)關(guān)系。
注:長(zhǎng)方形代表miRNA,圓形代表mRNA;紅色代表表達(dá)上調(diào),綠色代表表達(dá)下調(diào)。
2.5 腫瘤相關(guān)靶基因的功能富集分析GO注釋提示共有583個(gè)通路與腫瘤相關(guān)靶基因密切相關(guān)。GO結(jié)果中主要包括生物學(xué)過(guò)程(BP)、細(xì)胞組分(CC)和分子功能(MF)三個(gè)部分,每個(gè)部分前30個(gè)通路在圖5中進(jìn)行了展示。BP分析提示,靶基因與細(xì)胞生長(zhǎng)、成骨作用、發(fā)展細(xì)胞生長(zhǎng)等密切相關(guān)(見(jiàn)圖5A);CC分析提示,靶基因富集在軸突生長(zhǎng)錐、頂端質(zhì)膜及含膠原的細(xì)胞外基質(zhì)(見(jiàn)圖5B);MF分析提示靶基因調(diào)控受體配體活性、信號(hào)受體激活因子活性、軸突導(dǎo)向因子結(jié)合、細(xì)胞因子活性等(見(jiàn)圖5C)。KEGG分析提示共有18個(gè)通路與靶基因密切相關(guān),比如Hippo信號(hào)通路、cGMP-PKG信號(hào)通路、軸突導(dǎo)向、長(zhǎng)程增強(qiáng)效應(yīng)及細(xì)胞因子受體相關(guān)作用等(見(jiàn)圖5D)。
2.6 生存相關(guān)的靶基因Kaplan-Meier曲線提示277個(gè)腫瘤相關(guān)的靶基因中,其中有9個(gè)靶基因(DNA2、F2、F2RL2、HERC3、LITAF、SEMA6A、SEMA6D、XPNPEP3、ZNF831)與患者的生存預(yù)后呈正相關(guān),有14個(gè)靶基因(C2orf48、FSTL3、LDLRAD3、MAB21L1、NPR3、ONECUT2、PLXNA3、RGS2、RNF150、SNAI1、SP5、SPIN3、STC2、TTYH3)與患者的生存預(yù)后呈負(fù)相關(guān)(見(jiàn)圖6)。接著,將277個(gè)腫瘤相關(guān)的靶基因輸入到String數(shù)據(jù)庫(kù)中,描繪基因間的互作網(wǎng)絡(luò),并應(yīng)用cytoscape軟件篩選出10個(gè)核心基因(CD44、ESPL1、BUB1B、BIRC5、F2、SNAI1、WT1、DYNC1I1、GNAQ、IL17A)(見(jiàn)圖7)。
注:A:BP分析;B:CC分析;C:MF分析;D:KEGG分析。
圖6 Kaplan-Meier曲線與Log-rank檢驗(yàn)提示23個(gè)靶基因與結(jié)直腸腺癌患者的總生存期顯著相關(guān)
注:模塊顏色越深,關(guān)聯(lián)系數(shù)越高。
結(jié)直腸癌是一種高度惡性腫瘤,特別容易發(fā)生肝、肺轉(zhuǎn)移,嚴(yán)重影響患者的生存預(yù)后??紤]到結(jié)直腸癌具有較高的腫瘤異質(zhì)性,基于常規(guī)分期比如TNM分期無(wú)法準(zhǔn)確預(yù)測(cè)疾病的轉(zhuǎn)移、進(jìn)展和臨床結(jié)局。盡管腫瘤患者可能處于同一TNM期,但其臨床結(jié)局可能存在較大差異。因此,尋找一種準(zhǔn)確的預(yù)后生物標(biāo)志物對(duì)了解結(jié)直腸癌的發(fā)病機(jī)制、預(yù)測(cè)臨床結(jié)果和個(gè)體化治療非常重要。因此,尋找一種高特異性和靈敏性的預(yù)后標(biāo)志物對(duì)患者至關(guān)重要。由于miRNA在人體中廣泛分布并能夠穩(wěn)定存在,miRNA被認(rèn)為是一種的新型生物學(xué)標(biāo)志物。越來(lái)越多的研究表明,miRNA參與調(diào)控結(jié)直腸癌的血管生長(zhǎng)、上皮間充質(zhì)轉(zhuǎn)化、過(guò)度增殖、凋亡缺失、干細(xì)胞穩(wěn)態(tài)等多個(gè)病理生理機(jī)制,是結(jié)直腸癌的治療靶點(diǎn)和預(yù)后指標(biāo)[7]。因此,基于TCGA數(shù)據(jù)庫(kù),我們建立了由7個(gè)miRNA組成的能夠預(yù)測(cè)結(jié)直腸腺癌患者預(yù)后的風(fēng)險(xiǎn)模型。
首先,我們從TCGA數(shù)據(jù)庫(kù)下載了結(jié)直腸腺癌患者的成熟miRNA表達(dá)譜、轉(zhuǎn)錄組表達(dá)譜及相應(yīng)的臨床資料。通過(guò)差異表達(dá)分析,獲得了520個(gè)差異miRNA和7 677個(gè)差異mRNA。所有的患者被隨機(jī)分配為訓(xùn)練集和測(cè)試集,在訓(xùn)練集中通過(guò)單因素、多因素Cox分析建立了由7個(gè)miRNA(hsa-miR-891a-5p、hsa-miR-664b-3p、hsa-miR-485-5p、hsa-miR-486-5p、hsa-miR-3615、hsa-miR-21-3p與hsa-miR-3677-3p)組成的預(yù)后模型。同時(shí),我們?cè)谟?xùn)練集、測(cè)試集和合并數(shù)據(jù)集中驗(yàn)證了該miRNA模型的預(yù)后效能。Kaplan-Meier曲線提示,在三個(gè)數(shù)據(jù)集中均呈現(xiàn)出高風(fēng)險(xiǎn)組患者的生存率顯著低于低風(fēng)險(xiǎn)組的趨勢(shì)。ROC曲線提示模型預(yù)測(cè)5年生存率的AUC均>0.7,并且高于腫瘤TNM分期的AUC值,表明該模型具有較好的效能。此外,多因素Cox比例風(fēng)險(xiǎn)模型分析提示miRNA模型是結(jié)直腸腺癌的獨(dú)立風(fēng)險(xiǎn)因素,不受其他臨床病理因素如年齡、性別、TNM分期等的影響。
既往研究[8-17]表明,用于構(gòu)建模型的miRNA均參與調(diào)控腫瘤的生長(zhǎng)、發(fā)育、侵襲與轉(zhuǎn)移等功能。比如,hsa-miR-891a-5p是激素受體陽(yáng)性乳腺癌與非小細(xì)胞肺癌的新型生物學(xué)標(biāo)志物,能夠調(diào)控腫瘤的生物學(xué)功能[8-9]。一個(gè)小樣本研究表示hsa-miR-664b-3p的升高常伴隨著胰腺神經(jīng)內(nèi)分泌腫瘤遠(yuǎn)處轉(zhuǎn)移的出現(xiàn),可以作為預(yù)測(cè)胰腺內(nèi)分泌腫瘤轉(zhuǎn)移與否的一種潛在的生物標(biāo)志物[10]。hsa-miR-485-5p作為一種抑癌基因抑制多種腫瘤細(xì)胞的生長(zhǎng)與侵襲,并能增加化療藥物的敏感性,比如乳腺癌[11]、卵巢癌[12]、食管癌[13]。與既往研究相反的是,本研究中hsa-miR-485-5p的表達(dá)水平與患者的生存時(shí)間呈負(fù)相關(guān),提示hsa-miR-485-5p在結(jié)直腸腺癌中能夠促進(jìn)腫瘤生長(zhǎng)。有研究表明,hsa-miR-486-5p作用于靶基因PIK3R1抑制結(jié)直腸癌細(xì)胞的遷移與侵襲,可以作為結(jié)直腸癌的治療靶點(diǎn)[14]。一項(xiàng)基于生物信息學(xué)的研究提出hsa-miR-3615與肝癌患者的總生存時(shí)間呈負(fù)相關(guān),與TNM高分期、血清AFP與Ki67水平呈正相關(guān)[15]。而在本研究中,hsa-miR-3615與結(jié)直腸腺癌患者的總生存時(shí)間呈正相關(guān),提示其在不同腫瘤中可能發(fā)揮著不同的作用。一項(xiàng)基礎(chǔ)研究提出miR-21-3p可能通過(guò)靶向NAV3基因在卵巢腫瘤中誘導(dǎo)順鉑耐藥[16]。發(fā)表在2020年的一項(xiàng)研究提示缺氧誘導(dǎo)的miR-3677-3p能夠通過(guò)抑制SIRT5促進(jìn)肝細(xì)胞癌細(xì)胞的增殖、遷移和侵襲[17]。然而,這些miRNAs在結(jié)直腸腺癌中到底發(fā)揮什么樣的作用,未來(lái)還需要大量的臨床與基礎(chǔ)研究來(lái)進(jìn)行探索。
為了進(jìn)一步了解用于構(gòu)建模型的miRNA在結(jié)直腸腺癌中的作用機(jī)制,我們首先對(duì)miRNA的靶基因進(jìn)行了預(yù)測(cè),隨后將靶基因與差異的mRNA取交集,對(duì)交集基因進(jìn)行了功能富集分析。GO結(jié)果提示交集基因主要與細(xì)胞生長(zhǎng)、成骨作用、發(fā)展細(xì)胞生長(zhǎng)、軸突生長(zhǎng)錐、頂端質(zhì)膜、含膠原的細(xì)胞外基質(zhì)、信號(hào)受體激活因子活性、軸突導(dǎo)向因子結(jié)合及細(xì)胞因子活性等有關(guān)。KEGG結(jié)果提示交集基因參與調(diào)控Hippo信號(hào)通路與cGMP-PKG信號(hào)通路。大量研究表明這兩條通路參與調(diào)控人類(lèi)腫瘤的生物學(xué)功能[18-20]。以上結(jié)果提示,我們用來(lái)構(gòu)建預(yù)后模型的miRNA參與調(diào)控腫瘤相關(guān)的信號(hào)通路,為預(yù)后模型的臨床應(yīng)用提供了生物學(xué)的證據(jù)。
為了明確miRNA預(yù)后模型調(diào)控結(jié)直腸腺癌的關(guān)鍵機(jī)制,我們用cytoscape軟件的插件cytoHubba篩選出10個(gè)核心基因,包括CD44、ESPL1、BUB1B、BIRC5、F2、SNAI1、WT1、DYNC1I1、GNAQ與IL17A。與此同時(shí),我們應(yīng)用Kaplan-Meier法繪制了所有靶基因的生存曲線,結(jié)果提示共有23個(gè)靶基因與結(jié)直腸腺癌患者的總生存期顯著相關(guān)。值得注意的是,靶基因F2不僅是蛋白互作網(wǎng)絡(luò)的核心基因之一,也與患者的預(yù)后生存顯著相關(guān)。這些結(jié)果提示本研究中用于構(gòu)建模型的miRNA可能通過(guò)調(diào)控靶基因F2來(lái)影響腫瘤患者的預(yù)后生存。F2基因編碼凝血酶原蛋白,又稱(chēng)為凝血因子Ⅱ。凝血因子Ⅱ是一種多結(jié)構(gòu)域糖蛋白,對(duì)生命至關(guān)重要,是抗凝治療的關(guān)鍵靶點(diǎn)[21]。在癌癥患者中,高凝狀態(tài)是一個(gè)常見(jiàn)的現(xiàn)象。它不僅與靜脈血栓栓塞的風(fēng)險(xiǎn)增加有關(guān),也與腫瘤增殖和進(jìn)展有關(guān)[22]。然而,目前無(wú)研究證實(shí)F2參與調(diào)控結(jié)直腸癌的發(fā)生發(fā)展。未來(lái)需要進(jìn)一步的試驗(yàn)去探索模型相關(guān)的miRNA與靶基因在結(jié)直腸癌中的功能。
本研究存在一些不足之處。我們的研究?jī)H僅納入了TCGA這一個(gè)數(shù)據(jù)庫(kù),未用外部數(shù)據(jù)庫(kù)比如GEO數(shù)據(jù)庫(kù)(Gene Expression Omnibus database)或其他大樣本的臨床隊(duì)列進(jìn)行驗(yàn)證。另外,我們應(yīng)用三個(gè)靶基因數(shù)據(jù)庫(kù)預(yù)測(cè)了miRNA的靶基因,并未進(jìn)行基礎(chǔ)實(shí)驗(yàn)在細(xì)胞和分子水平進(jìn)一步的驗(yàn)證。
基于生物信息分析,我們成功地構(gòu)建了一個(gè)能夠有效預(yù)測(cè)結(jié)直腸腺癌患者預(yù)后的miRNA模型,并證實(shí)該模型優(yōu)于常規(guī)腫瘤分期。更重要的一點(diǎn)是,該模型不僅與患者的總生存期顯著相關(guān),而且是結(jié)直腸腺癌的獨(dú)立風(fēng)險(xiǎn)因素。另外,我們通過(guò)對(duì)構(gòu)建模型的miRNA靶基因進(jìn)行預(yù)測(cè),推斷了miRNA的潛在生物學(xué)功能具有調(diào)控結(jié)直腸腺癌的發(fā)生、發(fā)展、增殖及轉(zhuǎn)移的潛力,尋找了該模型調(diào)控的關(guān)鍵基因,為結(jié)直腸腺癌的病理生理機(jī)制研究提供了一個(gè)新的方向。