王雨娜,吳冬桂,趙 貝
(1.大理大學(xué)基礎(chǔ)醫(yī)學(xué)院,云南 大理 671000;2.珠海市人民醫(yī)院外科,廣東 珠海 519000)
胰腺癌(pancreatic adenocarcinoma,PAAD)[1]是全球癌癥死亡的主要原因,患者生存率不到7%。在歐美等發(fā)達(dá)國(guó)家,胰腺癌的發(fā)病率和死亡率最高。胰腺癌可能由遺傳性生殖系或癌癥相關(guān)基因的體細(xì)胞獲得性突變引起,突變也會(huì)導(dǎo)致癌癥進(jìn)展和轉(zhuǎn)移,對(duì)基因腫瘤水平的研究分析尋找胰腺癌的潛在治療靶點(diǎn)為治療預(yù)防胰腺癌的發(fā)生發(fā)展提供了有力的發(fā)展方向。前梯度蛋白2(recombinant anterior gradient 2,AGR2)是一種原癌基因[2],最近的研究表明[3-5],AGR2 的高表達(dá)與各種人類(lèi)癌細(xì)胞系的細(xì)胞增殖、轉(zhuǎn)移和耐藥性有關(guān)。此外,AGR2 的高表達(dá)也被證明是胰腺癌存活率低的預(yù)測(cè)因素。為此,本研究基于生物信息學(xué)分析,重點(diǎn)探究AGR2 與胰腺癌的密切關(guān)系,以期為未來(lái)的醫(yī)學(xué)發(fā)展提供指導(dǎo)方向。
1.1 利用GEO 數(shù)據(jù)庫(kù)挖掘AGR2 基因 GEO 是一個(gè)基因表達(dá)數(shù)據(jù)倉(cāng)庫(kù)和在線資源,用于從任何物種或人造的來(lái)源檢索基因表達(dá)數(shù)據(jù),本研究原始數(shù)據(jù)均從GEO 數(shù)據(jù)庫(kù)下載并通過(guò)R 3.2.2 集成。
1.2 利用Oncomine 數(shù)據(jù)庫(kù)分析AGR2 在胰腺癌與非瘤組織的相關(guān)性 在Oncomine 數(shù)據(jù)庫(kù)中設(shè)定篩選和挖掘數(shù)據(jù)的條件:①Gene:AGR2;②Analysis Type:Cancer vs.Normal;③Cancer Type:Pancreatic Carcinoma;④Data Type:mRNA;⑤Sample Type:Clinical Specimen;⑥臨界值設(shè)定條件(Pvalue<1E-4,fold change 2,gene rank=top 10%,data type=all)。
1.3 在GEPIA2 數(shù)據(jù)庫(kù)分析AGR2 基因在各腫瘤組織中的表達(dá) GEPIA2(http://gepia2.cancer-pku.cn/)是一個(gè)常用的交互式網(wǎng)站,用于繪制給定基因的表達(dá)譜。GEPIA 包含來(lái)自TCGA 和GTEx 數(shù)據(jù)庫(kù)的9736 個(gè)腫瘤和8587 個(gè)正常組織,根據(jù)基因表達(dá)水平進(jìn)行生存分析,本研究通過(guò)GEPIA2 獲取AGR2在各種腫瘤中的表達(dá)情況。
1.4 通過(guò)GEPIA2 分析胰腺癌中AGR2 與相似基因的相關(guān)度 據(jù)報(bào)道與胰腺癌相關(guān)的基因有S100P、C-K-RAS、CDC25B、HER,在數(shù)據(jù)庫(kù)GEPIA2 對(duì)這些基因與AGR2 基因的相關(guān)性進(jìn)行統(tǒng)計(jì)學(xué)分析。
1.5 AGR2 在胰腺癌患者中的生存曲線 通過(guò)GEPIA2采用Kaplan-Meier 法構(gòu)建AGR2 在胰腺癌中的生存曲線,探究AGR2 的mRNA 表達(dá)量與胰腺癌患者預(yù)后的關(guān)系。
1.6 AGR2 mRNA 表達(dá)水平與胰腺癌患者病理分期的關(guān)系 在GEPIA 數(shù)據(jù)庫(kù)(http://gepia.cancer-pku.cn/)中設(shè)定篩選和挖掘數(shù)據(jù)的條件為:①選擇Stage plot;②Gene:AGR2;③Cancer name:PAAD(pancreatic adenocarcinoma)。
1.7 通過(guò)The Human Protein Atlas 數(shù)據(jù)庫(kù)獲取AGR2在正常胰腺與胰腺癌的免疫組化 利用The Human Protein Atlas 數(shù)據(jù)庫(kù)獲得AGR2 基因在人正常胰腺組織的表達(dá)情況與在異常胰腺癌組織中的表達(dá)情況。
1.8 利用String 數(shù)據(jù)庫(kù)分析與AGR2 相互作用的蛋白網(wǎng)絡(luò) 通過(guò)String 數(shù)據(jù)庫(kù)獲取AGR2 的蛋白互作網(wǎng)絡(luò),分析AGR2 與其他蛋白之間的關(guān)系;設(shè)定條件為:AGR2 選擇克隆號(hào)為No:HPA007912 的抗體對(duì)1 例正常胰腺組織和11 例胰腺癌組織的AGR2 蛋白表達(dá)程度進(jìn)行分析。
1.9 GeneMANIA 分析AGR2 在胰腺癌的蛋白表達(dá)分析圖譜 執(zhí)行GeneMANIA 以構(gòu)建最重要的激酶靶標(biāo)AGR2 的蛋白質(zhì)-蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò)。
1.10 UALCAN 分析 根據(jù)患者的腫瘤分期和淋巴結(jié)轉(zhuǎn)移狀態(tài)分析正常組織和癌組織中AGR2 的表達(dá)情況。
1.11 統(tǒng)計(jì)學(xué)分析 采用t檢驗(yàn)分析正常組織與胰腺癌組織中的表達(dá)差異,采用Kaplan-Meier 模型和Logrank 法檢驗(yàn)進(jìn)行生存分析,采用Pearson 法進(jìn)行基因表達(dá)的相關(guān)性分析。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義,P<0.01 為統(tǒng)計(jì)學(xué)意義顯著。
2.1 AGR2 基因結(jié)構(gòu)及數(shù)據(jù)集表達(dá)情況 GEO 數(shù)據(jù)庫(kù)是一個(gè)儲(chǔ)存芯片、二代測(cè)序以及其他高通量測(cè)序數(shù)據(jù)的數(shù)據(jù)庫(kù),利用該數(shù)據(jù)庫(kù),可知AGR2 位于7號(hào)染色體;HGNC 數(shù)據(jù)庫(kù)顯示,該基因編碼內(nèi)質(zhì)網(wǎng)(ER)蛋白的二硫鍵異構(gòu)酶(PDI)家族成員,該蛋白催化蛋白質(zhì)折疊和硫醇-二硫鍵交換反應(yīng)。AGR2 編碼的蛋白質(zhì)具有N 端ER 信號(hào)序列、催化活性硫氧還蛋白結(jié)構(gòu)域和C 端ER 保留序列。這種蛋白質(zhì)在細(xì)胞遷移、轉(zhuǎn)化和轉(zhuǎn)移中發(fā)揮作用,是一種p53 抑制劑。作為ER 定位的分子伴侶,它在富含半胱氨酸的跨膜受體和富含半胱氨酸的腸糖蛋白粘蛋白的折疊、運(yùn)輸和組裝中發(fā)揮作用;該基因與炎癥性腸病和癌癥進(jìn)展有關(guān),見(jiàn)圖1。
圖1 AGR2 染色體定位及基因數(shù)據(jù)圖譜
2.2 AGR2 在胰腺癌中的表達(dá)情況 通過(guò)Oncomine數(shù)據(jù)庫(kù)分析可知,AGR2 基因在胰腺癌中呈現(xiàn)高表達(dá)狀態(tài);AGR2 mRNA 在胰腺癌研究芯片中的表達(dá)情況顯示,AGR2 均在胰腺癌中現(xiàn)高表達(dá)狀態(tài),差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見(jiàn)圖2。
圖2 AGR2 mRNA 在胰腺癌中的表達(dá)情況
2.3 AGR2 在各種癌癥中的表達(dá)情況 通過(guò)GEPIA2數(shù)據(jù)庫(kù)分析AGR2 基因在各腫瘤組織中的表達(dá)如下:從高到低的表達(dá)情況依次為胃腺癌(STAD)、結(jié)腸癌(COAD)、直腸腺癌(READ)、胰腺癌(PAAD)、肺腺癌(LUAD)、乳腺癌(BRCA)、前列腺癌(PRAD)、食管癌(ESCA)等,見(jiàn)圖3。
圖3 AGR2 在各種癌癥中的表達(dá)情況
2.4 在胰腺癌中與AGR2 的相關(guān)基因分析 通過(guò)GEPIA2 分析報(bào)道過(guò)的相關(guān)基因,得出與AGR2 基因表達(dá)相關(guān)性最高的4 個(gè)基因,分別為S100P、CDC25B、C-K-Ras、HER3,以上4 個(gè)基因均與AGR2 基因的表達(dá)呈正相關(guān),即AGR2 基因的表達(dá)量越高,相關(guān)基因的表達(dá)量也隨之升高,見(jiàn)圖4。
圖4 AGR2 mRNA 與其相關(guān)基因在胰腺癌組織中表達(dá)情況
2.5 AGR2 與胰腺癌患者預(yù)后的相關(guān)性 AGR2 mRNA的表達(dá)與胰腺癌患者的總生存率(overall survival,OS)和無(wú)病生存率(disease free survival,DFS)無(wú)相關(guān)性,見(jiàn)圖5。
圖5 AGR2 與胰腺癌患者預(yù)后的相關(guān)性
2.6 AGR2 在不同分期胰腺癌中的表達(dá) GEPIA2 結(jié)果顯示,不同病理分期的胰腺癌AGR2 mRNA 表達(dá)水平比較,差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見(jiàn)圖6。
圖6 AGR2 mRNA 在不同分期胰腺癌中表達(dá)情況
2.7 AGR2 在正常胰腺組織與胰腺癌組織的免疫組化 分析AGR2 蛋白在1 例正常胰腺組織和11 例典型胰腺癌組織中的表達(dá)情況,結(jié)果顯示6 例胰腺癌組織中AGR2 蛋白表達(dá)及抗體染色程度為“高度”水平;3 例為“中度”水平;2 例為“低度”水平,見(jiàn)圖7。
圖7 AGR2 在正常胰腺組織和胰腺癌組織中的免疫組化
2.8 與AGR2 相互作用的蛋白網(wǎng)絡(luò) 通過(guò)String 數(shù)據(jù)庫(kù)分析得到AGR2 基因相互作用的蛋白分別有TFF1、SPDEF、AGR3、TFF3、FOXA1、P4HB、RUB VBL、HSPA5、LYPD3、RUVBL2,節(jié)點(diǎn)數(shù):11,邊數(shù):25,平均節(jié)點(diǎn)度:4.55,局部聚類(lèi)系數(shù):0.752,預(yù)期邊緣數(shù):11,PPI 富集P值:0.000 286,此網(wǎng)絡(luò)具有比預(yù)期更多的交互性,見(jiàn)圖8。
圖8 與AGR2 相互作用的蛋白網(wǎng)絡(luò)
2.9 基于GeneMANIA 構(gòu)建AGR2 蛋白的PPI 網(wǎng)絡(luò)PPI 網(wǎng)絡(luò)和功能分析表明,AGE2 富集的基因組主要負(fù)責(zé)蛋白泛素化的正向調(diào)控、Wnt 通路的調(diào)控以及共表達(dá)蛋白組靶向,見(jiàn)圖9。
圖9 AGR2 蛋白的PPI 網(wǎng)絡(luò)
2.10 AGR2 甲基化分析 根據(jù)AGR2 在胰腺癌中不同樣本,胰腺癌的不同癌癥分期階段,患者種族差異、患者年齡、飲酒史以及淋巴結(jié)轉(zhuǎn)移情況綜合分析出以下數(shù)據(jù),其中Beta(β)值表示從未甲基化(0)到完全甲基化(1)的DNA 甲基化水平,不同的β 值截止值已被認(rèn)為表明高甲基化(β 值:0.5~0.7)或低甲基化(β值:0.25~0.3),見(jiàn)圖10。
圖10 AGR2 甲基化分析
圖10 AGR2 甲基化分析(續(xù))
目前,胰腺癌是全球癌癥死亡的主要原因,其全球負(fù)擔(dān)在過(guò)去的25 年中增加了1 倍以上,盡管這一增長(zhǎng)在很大程度上是由于全球人口老齡化引起的,但胰腺癌存在一些可改變的關(guān)鍵風(fēng)險(xiǎn)因素,例如吸煙、肥胖、糖尿病和酒精攝入[6-9]。這些風(fēng)險(xiǎn)因素的患病率在全球許多地區(qū)正在增加,因此也導(dǎo)致胰腺癌的發(fā)病率增加,但由于潛在患病率和預(yù)防策略的差異,這些風(fēng)險(xiǎn)因素的相對(duì)貢獻(xiàn)在全球范圍內(nèi)有所不同。遺傳因素雖然不能直接改變,但卻是胰腺癌風(fēng)險(xiǎn)的重要組成部分,包括遺傳性癌癥基因的致病變異、與遺傳性胰腺炎相關(guān)的基因,以及在全基因組關(guān)聯(lián)研究中發(fā)現(xiàn)的常見(jiàn)變異。鑒定胰腺癌的遺傳變化不僅可以深入了解該病的病因,還可以為指導(dǎo)早期檢測(cè)提供參考[10-12]。因此,探究胰腺癌發(fā)生發(fā)展的分子機(jī)制并確定其早期診斷的分子標(biāo)志物至關(guān)重要。
AGR 家族由3 個(gè)成員組成,即TXNDC12(AGR1)、AGR2 和AGR3。AGR2 蛋白是AGR 家族中研究最多的蛋白質(zhì)。此外,AGR2 廣泛涉及人類(lèi)疾病,特別是癌癥[13,14]。在人類(lèi)癌癥模型中,AGR2 在多種癌癥類(lèi)型中高度表達(dá),其表達(dá)升高與癌細(xì)胞適應(yīng)性增加有關(guān)[15,16]。如AGR2 過(guò)表達(dá)可促進(jìn)癌細(xì)胞增殖和轉(zhuǎn)移以及促進(jìn)細(xì)胞存活,在許多癌癥類(lèi)型中ER 應(yīng)激可導(dǎo)致AGR2 的表達(dá)增加。
Oncomine 是基于網(wǎng)絡(luò)的數(shù)據(jù)庫(kù)和數(shù)據(jù)挖掘平臺(tái),是系統(tǒng)地管理、分析和提供所有公共癌癥微陣列數(shù)據(jù)的數(shù)據(jù)庫(kù),其差異表達(dá)分析將大多數(shù)主要類(lèi)型的癌癥與各自的正常組織以及各種癌癥亞型進(jìn)行比較,基于臨床和病理學(xué)的分析可供探索選定基因或多個(gè)基因的查詢和數(shù)據(jù)可視化[17,18]。GEPIA2具有198 619 種isoforms(功能上相似的蛋白質(zhì),具有相似但不完全相同的氨基酸序列,由不同基因編碼,或由去除不同外顯子的相同基因的RNA 轉(zhuǎn)錄本編碼)和84 種癌癥亞型,可將基因表達(dá)量化從基因水平擴(kuò)展到轉(zhuǎn)錄水平,并支持特定癌癥亞型的分析和亞型之間的比較[19]。此外,GEPIA2 還采用了受單細(xì)胞測(cè)序研究啟發(fā)的基因特征量化分析技術(shù),并提供定制分析,用戶可以上傳自己的RNA-seq 數(shù)據(jù)并將其與TCGA 和GTEx 樣本進(jìn)行比較[23]。人類(lèi)蛋白質(zhì)圖譜已對(duì)59 種組織中的超過(guò)15 313 種蛋白質(zhì)進(jìn)行了基于免疫組織化學(xué)的蛋白質(zhì)組學(xué)可視化。在每個(gè)組織中,病理學(xué)家已經(jīng)對(duì)許多不同細(xì)胞類(lèi)型的染色模式進(jìn)行了評(píng)分。因此,有大量的可視化蛋白質(zhì)組學(xué)數(shù)據(jù)可用于將基因或蛋白質(zhì)列表分類(lèi)為特定的細(xì)胞類(lèi)型。STRING 數(shù)據(jù)庫(kù)[20]是專(zhuān)用于全生物體蛋白質(zhì)關(guān)聯(lián)網(wǎng)絡(luò)的幾個(gè)在線資源之一,STRING 數(shù)據(jù)庫(kù)旨在將重點(diǎn)放在覆蓋范圍(適用于數(shù)千個(gè)基因組測(cè)序生物)、證據(jù)來(lái)源的完整性(例如包括自動(dòng)文本挖掘)和可用性功能(例如定制、富集檢測(cè)和程序訪問(wèn))[21]。本研究主要利用上述數(shù)據(jù)庫(kù)挖掘AGR2 在胰腺癌中的表達(dá)情況及其與患者預(yù)后的相關(guān)性。本研究結(jié)果顯示,AGR2 基因在胰腺癌癌組織中的表達(dá)水平高于正常組織(P<0.05),AGR2 基因高表達(dá)與患者的病理分期有關(guān)(P<0.05);AGR2 共表達(dá)基因分析顯示,S100P、CDC25B、C-KRAS、HER3 等基因與AGR2 基因表達(dá)呈正相關(guān)。這些均提示AGR2 基因在胰腺癌發(fā)生發(fā)展過(guò)程中可作為促癌因子發(fā)揮作用,同時(shí)亦可作為胰腺癌的預(yù)后指標(biāo)。本研究還顯示,AGR2 基因主要負(fù)責(zé)蛋白質(zhì)泛素化的正向調(diào)控、Wnt 通路的調(diào)控以及與共表達(dá)蛋白組靶向有關(guān),推測(cè)AGR2 可能通過(guò)調(diào)控以上途徑來(lái)調(diào)節(jié)細(xì)胞周期,從而促進(jìn)腫瘤細(xì)胞增殖。此外,本研究還發(fā)現(xiàn)與AGR2 正相關(guān)的共表達(dá)基因,這些基因可為后續(xù)研究提供參考。
綜上所述,AGR2 基因在胰腺癌中呈高表達(dá),與胰腺癌的發(fā)生發(fā)展及預(yù)后存在一定關(guān)系,有望成為胰腺癌預(yù)后評(píng)估和治療的潛在靶點(diǎn)。