鐘慧敏 莫華倩 姜燕慧 沈婷 劉宜敏
胰腺癌(pancreatic adenocarcinoma,PAAD)是常見的惡性程度較高的消化系統(tǒng)腫瘤,發(fā)病率、死亡率分別位于惡性腫瘤中前10 位、第4 位[1]。手術(shù)治療和化療是其主要治療手段,然而目前二者對PAAD 患者的總體生存率影響有限[2]。盡管CA19?9、CA125、CEA 等可作為PAAD 診斷和預(yù)后的臨床標(biāo)志物,但其預(yù)測準(zhǔn)確性還有待提高[3]。因此,需要找到新的生物標(biāo)志物以實現(xiàn)胰腺癌的早期診斷,把握胰腺癌的關(guān)鍵治療時機。
C19orf33 基因是由4 個跨越約1 kbp 的外顯子組成,位于HAI?2 基因下游的11 kbp 處[4]。研究表明,C19orf33 在多種腫瘤如卵巢癌中表達(dá)異常且與預(yù)后緊密相關(guān)[5]。但其在胰腺癌中的作用還尚未研究透徹。因此,本研究旨在通過生物信息學(xué)分析TCGA(The Cancer Genome Atlas)數(shù)據(jù)庫中C19orf33 和臨床相關(guān)信息,評估C19orf33 基因表達(dá)在胰腺癌中的診斷和預(yù)后價值,并對其潛在的作用機制進行探索。
1.1 一般資料我們從TCGA 數(shù)據(jù)庫和基因型組織表達(dá)數(shù)據(jù)庫(Genotype?Tissue Expression,GTEx,V8 版本)中下載最新的RNA 測序數(shù)據(jù)和相應(yīng)的臨床病理信息(截止至2021 年1 月2 日)。患者均簽署知情同意書并通過醫(yī)院倫理委員會批準(zhǔn)(2021?KY015)。病例排除標(biāo)準(zhǔn):(1)“0”基因表達(dá)值;(2)臨床資料不完整;(3)組織病理類型不為PAAD 的患者;(4)生存時間<1個月的患者;共納入178例符合標(biāo)準(zhǔn)的PAAD 樣本和336 例正常胰腺組織樣本。為了提高篩選結(jié)果的可靠證據(jù),我們另外從GEO(Gene Expression Omnibus)數(shù)據(jù)庫下載GSE71729數(shù)據(jù)集的RNA 芯片表達(dá)和相關(guān)臨床數(shù)據(jù),包括145例腫瘤組織和46例胰腺正常組織[6]。
1.2 差異表達(dá)基因篩選R 軟件deseq2 包、GEO2R 分別用于篩選TCGA?PAAD、GTEx 和GSE71729 數(shù)據(jù)集中胰腺癌和正常胰腺組織的差異表達(dá)的基因(differentially expressed genes,DEGs)及與C19orf33 相關(guān)的DEGs[7];R 軟件ggplot2 包繪制差異表達(dá)火山圖和上調(diào)及下調(diào)DEGs 的韋恩圖(Venn),確定可信的DEGs。差異表達(dá)的篩選閾值為:|log2(FC)|>2&p.adjust<0.05。
1.3 生存分析采用基因表達(dá)中位數(shù)作為分組依據(jù),Kaplan?Meier 法分析不同組的OS 和PFI 的預(yù)后差異,預(yù)后數(shù)據(jù)來自《Cell》的一篇文章[8]。
1.4 差異表達(dá)及ROC分析Mann?Whitney U 檢驗探索TCGA?PAAD、GTEx 數(shù)據(jù)集胰腺癌與正常胰腺組織及腫瘤不同T 分期亞組之間的C19orf33 表達(dá)差異,R 軟件包ggplot2 繪制箱式圖。受試者工作特征曲線(receiver operating characteristic curve,ROC)曲線下面積(area under the curve,AUC)預(yù)測C19orf33 表達(dá)對患者是否罹患胰腺癌和腫瘤T 分期的診斷價值。
1.5 REACTOME 和KEGG GSEA 分析參考基因集合為MSigDB(v7.4)[9]中的c2.cp.v7.2.symbols.gmt[Curated],每次分析重復(fù)1000 次,用Benjamini?Hochberg 方法進行P 值矯正,以標(biāo)準(zhǔn)化富集分?jǐn)?shù)(normalized enrichment score,NES)>1.5,錯誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)<0.25 且p.adjust<0.05作為顯著富集標(biāo)準(zhǔn)。
1.6 統(tǒng)計學(xué)分析所有統(tǒng)計學(xué)分析和可視化均使用R 軟件(v.3.6.3)進行。Excel 軟件(v2020)進行統(tǒng)計描述;χ2檢驗和Fisher 精確檢驗進行統(tǒng)計檢驗。Kaplan?Meier 法計算生存率;使用單因素和多因素Cox 比例風(fēng)險模型進行生存分析。具有統(tǒng)計學(xué)意義的檢驗水準(zhǔn)為P<0.05。
2.1 差異表達(dá)基因篩選及C19orf33 的生存分析和差異表達(dá)結(jié)果見圖1。
圖1 差異表達(dá)基因篩選及C19orf33 的生存分析和差異表達(dá)結(jié)果
2.2 C19orf33 是胰腺癌OS 相關(guān)的獨立預(yù)后危險因素見表1。
表1 胰腺癌患者C19orf33 相關(guān)的基線資料表
2.3 胰腺癌患者中基于C19orf33 表達(dá)水平的REACTOME 和KEGG 功能富集分析見圖2。
圖2 REACTOME 和KEGG GSEA 分析胰腺癌中C19orf33 高、低表達(dá)組DEGs 富集的功能和通路
胰腺癌是常見的消化系統(tǒng)惡性腫瘤,易發(fā)生轉(zhuǎn)移,預(yù)后極差,且當(dāng)前治療手段對PAAD 患者的總體生存率影響有限。研究表明C19orf33 高表達(dá)與多種腫瘤的預(yù)后較差緊密相關(guān)。然而,C19orf33在PAAD 中的臨床意義、作用和分子機制仍不明確,因此C19orf33 在胰腺癌腫瘤發(fā)生發(fā)展中的確切作用值得進一步研究。
在這項研究中,我們篩選發(fā)現(xiàn)C19orf33 在PAAD 中具有差異表達(dá),進一步地,我們發(fā)現(xiàn)C19orf33 表達(dá)水平與PAAD 患者的總生存率及無進展間期呈負(fù)相關(guān)(P均<0.05),同時,ROC 曲線分析也證實C19orf33 表達(dá)可作為胰腺癌理想的診斷生物標(biāo)志物。與我們研究結(jié)果相似,研究發(fā)現(xiàn)在乳頭腎細(xì)胞癌、結(jié)直腸癌[10]中,C19orf33 高表達(dá),且與其預(yù)后差相關(guān)。這表明C19orf33 可作為惡性腫瘤患者的預(yù)后預(yù)測標(biāo)志物。然而其具體相關(guān)作用機制尚不明確。
有研究表明C19orf33 可分別通過調(diào)節(jié)上皮?間充質(zhì)轉(zhuǎn)化或與Hippo 通路YAP1 協(xié)調(diào)作用進而抑制乳腺癌細(xì)胞系或甲狀腺乳頭狀癌細(xì)胞的進展[11]。本研究中,我們也發(fā)現(xiàn)C19orf33 在神經(jīng)活性配體和受體間相互作用、趨化因子信號通路等多個信號通路上聚集,由此可見,C19orf33 在免疫相關(guān)的生物學(xué)過程中發(fā)揮著一定作用。但是C19orf33 與這些通路之間的確切相互作用關(guān)系還有待進一步的實驗驗證。
綜合上述分析,C19orf33 不僅對胰腺癌患者的疾病狀態(tài)具有診斷價值,而且是胰腺癌的獨立預(yù)后危險因素,但尚需開展更多的實驗來進一步驗證。