汪虎,李靖,謝波,張晨嵩,潘成武,張新鑫,王輝,賈建光
在全球范圍內(nèi),胃癌(gastric cancer, GC)是第四大常見癌癥,也是導(dǎo)致癌癥相關(guān)死亡的第二大主要原因[1- 2]。盡管胃癌的發(fā)病機(jī)理和分子生物學(xué)機(jī)制處于不斷研究中,但是外科手術(shù)治療仍然是目前胃癌的唯一根除療法,大部分的胃癌患者因在確診時(shí)即為進(jìn)展期,且腫瘤較早發(fā)生轉(zhuǎn)移,而喪失最佳治療時(shí)期。盡管晚期胃癌的化療方案取得了進(jìn)展,如5-FU方案和鉑方案,但總生存期(OS)仍不理想。近年來,各種靶向藥物被開發(fā)出來,然而,總體結(jié)果仍然令人失望。生物信息學(xué)為胃癌的治療帶來了希望。有必要利用生物信息學(xué)方法開發(fā)有價(jià)值的生物標(biāo)志物,并預(yù)測靶向治療的效果。因此,為早期篩查和診斷選擇新的生物標(biāo)志物一直是胃癌一級預(yù)防和治療的緊迫策略。
圖1 ADAMTS7在多種類型組織中的mRNA表達(dá)(TCGA數(shù)據(jù)集)
含Ⅰ型血小板結(jié)合蛋白基序的解聚蛋白樣金屬蛋白酶7(ADAMTS7)是具有血小板反應(yīng)蛋白基序的解聚蛋白樣金屬蛋白酶(ADAMTS)家族的成員。近年來,隨著研究的發(fā)展,許多報(bào)告已經(jīng)確定了ADAMTS7蛋白在各種發(fā)育組織(包括癌癥)中的功能[3-5]。但是ADAMTS7與胃癌相關(guān)性聯(lián)系鮮有報(bào)道,本研究中,使用綜合生物信息學(xué)分析TCGA數(shù)據(jù)庫數(shù)據(jù)來確定ADAMTS7在胃癌中具有預(yù)后價(jià)值。
1.1 ADAMTS7基因在泛癌組織中的表達(dá) 應(yīng)用R 語言分析軟件ggplot2包,將ADAMTS7在各種腫瘤組織中的表達(dá)水平進(jìn)行綜合比較[6]。
1.2 ADAMTS7基因在胃癌中表達(dá) 應(yīng)用R軟件BiocManager及l(fā)imma包提取目的基因表達(dá)數(shù)據(jù),并利用Perl軟件提取目的基因在胃癌組織及其對應(yīng)正常胃組織中的表達(dá)數(shù)據(jù)。然后,應(yīng)用R軟件對目的基因表達(dá)數(shù)據(jù)及配對數(shù)據(jù)進(jìn)行可視化[7-8]。其中在非配對樣本中,癌組織375例,正常組織32例。在配對樣本中,癌組織27例,癌旁組織27例。
1.3 預(yù)測ADAMTS7對胃癌的診斷價(jià)值 應(yīng)用R軟件pROC及ggplot2包以ADAMTS7的表達(dá)量作為診斷胃癌的指標(biāo)繪制ROC。
1.4 臨床病理特征的獨(dú)立預(yù)后分析 利用Perl軟件將臨床病理特征與目的基因表達(dá)進(jìn)行整合后獲得獨(dú)立預(yù)后分析輸入文件,利用R軟件survival及survminer包)對輸入文件進(jìn)行單因素及多因素Cox回歸分析,同時(shí)利用R軟件對相關(guān)數(shù)據(jù)進(jìn)行生存分析。使用N分期、年齡、腫瘤殘留和ADAMTS7水平利用R軟件rms及survival繪制列線圖、ROC曲線、生存率校準(zhǔn)曲線[9]。
1.5 目的基因富集分析 利用R軟件clusterProfiler包及GSEA方法來識(shí)別2組給定樣本間差異富集的基因和途徑。首先根據(jù)基因與ADAMTS7表達(dá)的相關(guān)性生成一個(gè)基因列表,并根據(jù)樣本隊(duì)列中ADAMTS7的中值水平將患者數(shù)據(jù)集分為ADAMTS7高表達(dá)組和低表達(dá)組。每次分析總共進(jìn)行1 000個(gè)基因集排列。根據(jù)標(biāo)稱P值和標(biāo)準(zhǔn)化富集分?jǐn)?shù)(NES)確定富集途徑并進(jìn)行分類[10]。
2.1 ADAMTS7在多種類型組織中的mRNA表達(dá) TCGA數(shù)據(jù)庫分析結(jié)果顯示,在33種腫瘤組織中,15種類型腫瘤中ADAMTS7表達(dá)水平高于正常組織(P<0.05),其余18種類型腫瘤中ADAMTS7表達(dá)水平與正常組織的表達(dá)比較差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。見圖1。
2.2 ADAMTS7在胃癌中的表達(dá)狀況 TCGA數(shù)據(jù)庫顯示,在胃癌非配對樣本中,ADAMTS7基因在癌組織中表達(dá)水平高于正常組織,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見圖 2A;在胃癌配對樣本中,ADAMTS7癌組織中表達(dá)水平高于癌旁組織,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見圖 2B。
2A 非配對癌組織表達(dá)情況 2B 配對癌組織表達(dá)情況圖2 ADAMTS7在胃癌中的表達(dá)狀況
2.3 預(yù)測ADAMTS7對胃癌的診斷價(jià)值 為了預(yù)測ADAMTS7對胃癌的診斷價(jià)值,本課題組以ADAMTS7的表達(dá)量作為診斷胃癌的指標(biāo)繪制ROC曲線,曲線下面積(AUC)0.858(95%CI: 0.799~0.918)。ADAMTS7作為診斷胃癌的指標(biāo)具有一定的準(zhǔn)確性,可能作為預(yù)測胃癌的潛在標(biāo)志物。見圖3。
2.4 ADAMTS7的表達(dá)與胃癌患者預(yù)后的關(guān)系 在 TCGA數(shù)據(jù)庫中,生存分析表明,ADAMTS7高表達(dá)患者具有較差的總生存率OS(P=0.007)以及較差的疾病特異生存率DSS(P=0.038)。見圖4A和4B。對數(shù)據(jù)庫中缺失數(shù)據(jù)刪減后行單因素Cox回歸分析顯示ADAMTS7高表達(dá)、T3期、T4期、N1期、N3期、M1期、病理分期Ⅱ~Ⅳ期、年齡大于65歲及殘余腫瘤是胃癌生存較差的預(yù)后因素,而多因素Cox回歸分析顯示ADAMTS7高表達(dá)、N3期、年齡大于65歲及殘余腫瘤是胃癌生存較差的預(yù)后因素。見表1。
圖3 預(yù)測ADAMTS7對胃癌的診斷價(jià)值
4A ADAMTS7表達(dá)的OS生存曲線 4B ADAMTS7表達(dá)的DSS生存曲線圖4 ADAMTS7表達(dá)的OS和DSS生存曲線
表1 ADAMTS7單因素和多因素分析
2.5 基于ADAMTS7表達(dá)構(gòu)建列線圖及驗(yàn)證預(yù)后影響 使用N分期、年齡、腫瘤殘留和ADAMTS7水平作為預(yù)測胃癌患者1、3、5年OS的指標(biāo)構(gòu)建列線圖(圖5A)。ROC曲線評估列線圖的判別度,1、3、5年AUC分別是0.512、0.605和0.657(圖5B)。校準(zhǔn)曲線呈現(xiàn)了1、3、5年臨床結(jié)果列線圖的理想預(yù)測(圖5C)。綜合上述數(shù)據(jù)表明,ADAMTS7可作為預(yù)測胃癌患者OS的有用生物標(biāo)志物。
2.6 基因集富集分析 通過GSEA確定 ADAMTS7在胃癌中作用的推定細(xì)胞機(jī)制,結(jié)果表明MAPK信號通路和 Hedgehog信號通路是ADAMTS7 高表達(dá)表型中差異豐富的途徑。見圖6A、圖6B。
5A 列線圖 5B ROC曲線 5C 校準(zhǔn)曲線圖5 基于ADAMTS7表達(dá)構(gòu)建列線圖及驗(yàn)證預(yù)后影響
圖6 基于GSEA的ADAMTS7相關(guān)信號通路GSEA富集分析
胃癌是常見的消化系統(tǒng)腫瘤之一,也是全球致命的一種腫瘤。目前,手術(shù)切除是早期胃癌患者的主要治療方法,而化療是晚期胃癌患者的首選治療方法[11-12]。然而,鑒于癥狀是非特異性的,大多數(shù)胃癌患者被診斷為晚期。因此,確定一種敏感且特異的生物標(biāo)志物來預(yù)測胃癌的預(yù)后并作為胃癌治療的靶點(diǎn)至關(guān)重要。研究[13-14]表明,隨著多種分子生物學(xué)和基因技術(shù)的進(jìn)步,如高通量測序,為研究胃癌的分子機(jī)制提供了新的選擇,并且發(fā)現(xiàn)了各種新的靶點(diǎn)[15-17]。
表觀遺傳學(xué)(epigenetics)是研究基因的核苷酸序列不發(fā)生改變的情況下,基因表達(dá)可遺傳變化的一門遺傳學(xué)分支學(xué)科。表觀遺傳學(xué)包含DNA甲基化、染色質(zhì)可及性與染色質(zhì)構(gòu)象和非編碼RNA的轉(zhuǎn)錄后修飾與組蛋白翻譯后修飾等。近年來,在各個(gè)疾病領(lǐng)域,表觀遺傳學(xué)的研究越來越多,結(jié)合生物信息學(xué)技術(shù)以及多組學(xué)技術(shù),可用來捕獲不同生物過程的基因表達(dá)與表觀遺傳改變的相關(guān)性。以上這些技術(shù)的應(yīng)用也正迅速成為細(xì)胞可塑性和多樣性研究的有力工具,可著眼于癌癥、干細(xì)胞等早期的表觀遺傳學(xué)變化,對于理解病因、早期診斷及晚期控制等方面具有極高的價(jià)值,為基因調(diào)控和疾病預(yù)后提供了有價(jià)值的見解。
ADAMTS7是ADAMTS家族的蛋白水解成員,該家族包括一個(gè)信號肽、一個(gè)前域、一個(gè)金屬蛋白酶結(jié)構(gòu)域、一個(gè)類分離素結(jié)構(gòu)域和幾個(gè)血栓反應(yīng)蛋白I型重復(fù)序列(TSP1),由間隔域分隔[18]。用轉(zhuǎn)化酶(furin或類似furin的酶)裂解ADAMTS前肽是酶活化的典型要求。例如,與PACE4、PC6B和PC7轉(zhuǎn)化酶相比,furin是ADAMTS7成熟所需的主要轉(zhuǎn)化酶。α2-巨球蛋白(α2M)與ADAMTS7結(jié)合,是ADAMTS7的新底物,而ADAMTS7的金屬蛋白酶結(jié)構(gòu)域是α2M裂解所必需的。已知ADAMTS家族由19種蛋白酶組成,這些酶在發(fā)育、血管生成和凝血中起重要作用,其失調(diào)和突變與許多疾病過程有關(guān),如炎癥、癌癥、關(guān)節(jié)炎和動(dòng)脈粥樣硬化[19]。如ADAMTS7形成了自己的亞群具有獨(dú)特的特性。有證據(jù)[20-21]表明,ADAMTS-7可能在骨關(guān)節(jié)炎的發(fā)病機(jī)制中發(fā)揮關(guān)鍵作用。一項(xiàng)研究[22]發(fā)現(xiàn),ADAMTS7在關(guān)節(jié)炎軟骨和滑膜中顯著上調(diào),雖然在類風(fēng)濕性關(guān)節(jié)炎患者的軟骨中ADAMTS7均顯著上調(diào),但在骨關(guān)節(jié)炎患者中卻沒有顯著差異??梢?,ADAMTS7在其他疾病中表達(dá)存在差異,這些都為我們研究ADAMTS7在胃癌中的作用提供了理論基礎(chǔ)。
然而,ADAMTS7在先前的癌癥研究中鮮有報(bào)道,本課題組發(fā)現(xiàn)ADAMTS7在胃癌中起作用。本研究通過分析TCGA數(shù)據(jù)庫胃癌的基因表達(dá)數(shù)據(jù)及臨床數(shù)據(jù),結(jié)果顯示ADAMTS7不論是在非配對樣本中還是在配對樣本中,其在癌組織中的表達(dá)均明顯上升。以ADAMTS7的表達(dá)量作為診斷胃癌的指標(biāo)繪制ROC,AUC為0.858,其具有一定的準(zhǔn)確性。生存分析表明,高ADAMTS7表達(dá)具有較差的OS以及較差的DSS。單因素COX回歸分析顯示ADAMTS7高表達(dá)、T3期、T4期、N1期、N3期、M期、年齡大于65歲及殘余腫瘤是胃癌生存較差的預(yù)后因素,而多因素COX回歸分析顯示ADAMTS7高表達(dá)、N3期、年齡大于65歲及殘余腫瘤是胃癌生存較差的預(yù)后因素。為了進(jìn)一步預(yù)測ADAMTS7在胃癌中的作用機(jī)制,利用GSEA富集分析進(jìn)行預(yù)測,結(jié)果表明MAPK信號通路和 Hedgehog信號通路是 ADAMTS7 高表達(dá)表型中差異豐富的途徑。這些結(jié)果表明ADAMTS7在胃癌中高表達(dá),可能通過MAPK信號通路和Hedgehog信號通路影響胃癌的預(yù)后,其可能是胃癌的新的診斷指標(biāo)。
綜上所述,本研究通過生物信息學(xué)方法和大數(shù)據(jù)分析從不同層面詮釋了ADAMTS7在胃癌中的表達(dá)及其臨床意義。即ADAMTS7的高表達(dá)水平在胃癌發(fā)生發(fā)展過程中可能起著重要作用,有望成為胃癌診治和預(yù)后判斷的重要指標(biāo)和新的靶點(diǎn)。但生物信息學(xué)方法同樣存在著局限性,仍然需要更多的相關(guān)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行證實(shí)。