王秋 李曉峰 夏勇 熊丹
宮頸癌是全球范圍內(nèi)最常見的女性惡性腫瘤之一,死亡率在女性惡性腫瘤中居第二位[1-2]。85%的宮頸癌死亡發(fā)生在中低等收入人群國家[3]。目前,宮頸癌的篩查、手術(shù)、放化療等治療方法已經(jīng)取得一定的成效,但是對晚期和復發(fā)性宮頸癌的臨床治療效果還遠遠不夠,患者的預后較差[4]。因此,迫切需要更好的宮頸癌治療靶點和檢測標志物來提高患者的生存期。
當前,在預防癌癥方面有許多公共數(shù)據(jù)庫可供研究。重新分析與宮頸癌相關(guān)的基因表達譜對于其發(fā)病機制和分子機理非常重要。許多研究已探討了宮頸癌的致病基因及預后[5],如研究發(fā)現(xiàn)INHBA(TGF-β 超家族的成員之一)在宮頸癌中高度表達,并與宮頸癌的不良預后相關(guān)。同時,INHBA 也與免疫細胞浸潤相關(guān)[6]。Xue 等[7]研究發(fā)現(xiàn)MCM2可能與宮頸癌的發(fā)生和發(fā)展有關(guān),并進一步驗證了MCM2的敲除可以抑制宮頸癌細胞的增殖。然而,基因之間以各種方式相互作用,腫瘤基因組復雜多變,現(xiàn)行的研究結(jié)果遠不足以揭示宮頸癌的發(fā)病機制及預后預測。因此,需要從不同角度進行研究和分析,本研究擬使用生物信息學方法通過多組學分析尋找宮頸癌的新型預后生物標志物。
本研究確定了GSE9750、GSE46857和GSE52903數(shù)據(jù)庫中的差異表達基因(Differentially Expressed Genes,DEGs),對這些差異表達基因進行了GO、KEGG 和蛋白互作網(wǎng)絡等多種方法分析并得出樞紐基因。進一步對樞紐基因的臨床意義(包括表達和生存分析)進行分析,為進一步了解這些樞紐基因在宮頸癌的發(fā)展和轉(zhuǎn)移中的作用提供新的方向,同時加深對宮頸癌發(fā)生發(fā)展的分子機制的認識,為宮頸癌的治療提供新的潛在靶點。
GEO 1據(jù)庫(https://www.ncbi.nlm.nih.gov/gds)用于下載微陣列數(shù)據(jù)集。分別下載GSE9750、GSE46857 和GSE52903 數(shù)據(jù)集進行分析。研究過程見圖1。AURKA基因免疫組化用的抗體來源于Abcam(貨號:ab52973)。
圖1 研究路線圖Figure 1 The study procedure
使用在線程序仙桃學術(shù)(https://www.xiantao.love/)對基因功能進行注釋(GO 分析)和KEGG 通路進行富集分析。
使 用GEO2R 工 具(http://www.ncbi.nlm.nih.gov/geo/geo2r/)得到DEGs,并設置|log2fold change|≥1 和P<0.05 為臨界值。
篩選得到上調(diào)和下調(diào)的DEGs,使用String 數(shù)據(jù)庫(http://string-db.org)進行分析,設置臨界值大于0.4。使用Cytoscape v3.9.0 插件從P<0.01 中選擇PPI 網(wǎng)絡(https://cytoscape.org/)的顯著模塊,并由MCODE 插件進一步分析。
通過使用Kaplan-Meier plotter(KM plotter,http://www.kmplot.com)對樞紐基因進行總生存期和無復發(fā)生存期分析。
GEPIA 數(shù)據(jù)庫是基于TCGA 創(chuàng)建的數(shù)據(jù)庫,在該數(shù)據(jù)庫上進行樞紐基因mRNA 表達驗證。樞紐基因基因的蛋白表達在人類蛋白圖譜(http://www.proteinatlas.org/)中進行驗證。
標本經(jīng)10% 中性福爾馬林固定、常規(guī)脫水、浸蠟、石蠟包埋,4 μm 厚連續(xù)切片,免疫組織化學染色使用羅氏Bench-Mark ULTRA 全自動免疫組織化學染色機進行染色,一抗AURKA 試劑購自Abcam 公司(ab52973)。
采用R 4.2.2 版本軟件(美國Math-Soft 公司)進行統(tǒng)計和繪圖。研究連續(xù)變量通過t檢驗進行分析比較。生存分析采用Kaplan-Meier 統(tǒng)計學方法進行分析。以P<0.05 為差異有統(tǒng)計學意義。
使用火山圖顯示DEGs,紅色點代表上調(diào)的DEGs,藍色點代表下調(diào)的DEGs。見圖2A~2C。在GSE9750、GSE46857 和GSE52903 中分別鑒定出上調(diào)基因610,747,355 個,下調(diào)基因1 572,700,502 個。利用維恩圖共鑒定出30 個共同上調(diào)的DEGs 和49 個共同下調(diào)的DEGs。見圖2D~2E。
圖2 不同數(shù)據(jù)集中的差異表達基因Figure 2 Differentially expressed genes in the different datasets
對圖2 鑒定出來的30 個上調(diào)的DEGs 和49 個下調(diào)的DEGs 進行GO 和KEGG 富集分析。GO 分析:“生物過程”前三位為“細胞器裂變”、“細胞器組織的負調(diào)控”、“再生”;“細胞組分”前三位為“含膠原蛋白的細胞外基質(zhì)”、“核染色體”、“細胞周期蛋白依賴性蛋白激酶全酶復合物”;“分子功能”前三位為“蛋白質(zhì)C 端結(jié)合”、“整合素結(jié)合”、“細胞外基質(zhì)結(jié)合”。KEGG 分析DEGs 富集的通路主要為“細胞周期”、“孕酮介導的卵細胞成熟”和“鉑耐藥性”。GO 分析和KEGG 分析結(jié)果顯示采用氣泡圖。見圖3A。或采用網(wǎng)絡圖。見圖3B。
圖3 差異表達基因的GO 和KEGG 分析的結(jié)果Figure 3 Results of the GO and KEGG analyses of the differentially expressed genes
構(gòu)建蛋白質(zhì)相互作用網(wǎng)絡。見圖4A。從PPI網(wǎng)絡中識別出得分最高的前15 個基因。見圖4B。通過KM plotter 分析出15 個樞紐基因在宮頸癌總生存期(OS)和無復發(fā)生存期(RFS)中的作用,在OS 分析中包含了304 例宮頸癌患者,發(fā)現(xiàn)AURKA基因的高表達與宮頸癌患者總生存期較短顯著相關(guān)。見圖5A。RFS 分析中包含了174 例宮頸癌患者,發(fā)現(xiàn)AURKA基因的高表達與宮頸癌患者無復發(fā)生存期較短顯著相關(guān)。見圖5B。
圖4 差異表達基因的PPI 網(wǎng)絡和模塊分析Figure 4 PPI network and module analysis of DEGs
圖5 樞紐基因的OS 及RFS 的相關(guān)性分析Figure 5 The correlation analysis between hub genes and OS or RFS of cervical carcinoma patients
AURKA基因在宮頸癌組織中上調(diào)。見圖6A。在不同種族人群中的表達差異無統(tǒng)計學意義(P>0.05)。見圖6B。但在人類蛋白圖譜中,AURKA基因在宮頸癌組織的蛋白表達水平顯著高于正常宮頸組織圖。見圖6C。采用受試者工作特征(ROC)曲線來評估AURKA基因表達水平對區(qū)分宮頸癌組織和正常宮頸組織的預測價值。見圖6D。ROC 曲線下面積(AUC)為0.999。收集10 對臨床樣本進行AURKA基因在宮頸癌及癌旁組織中表達的免疫組化驗證,結(jié)果顯示,AURKA基因在宮頸癌組織中表達增高。見圖7A~7B。差異有統(tǒng)計學意義(P<0.05)。見圖7C。不同分化程度癌組織表達差異無統(tǒng)計學意義(P>0.05)。見圖7D-7F。
圖6 AURKA 基因在宮頸癌中表達的驗證Figure 6 Validation of the expression of the AURKA genes in cervical carcinoma
圖7 AURKA 基因在宮頸癌組織中的表達Figure 7 The expression of the AURKA genes in cervical carcinoma tissues
宮頸癌是起源于子宮頸的惡性腫瘤,是女性生殖系統(tǒng)中最廣泛的惡性腫瘤[8-9]。宮頸癌的發(fā)生發(fā)展過程與多種遺傳和環(huán)境因素相關(guān)[10]。為了識別潛在的生物標志物,仍需要進行大量詳細的研究,包括治療方案、途徑、機制和預后。本研究中,分析了來自三個GEO 數(shù)據(jù)集(GSE9750、GSE46857 和GSE52903)的差異表達基因,得到30 個基因表達上調(diào),49 個基因表達下調(diào),對差異基因進行GO 和KEGG 通路研究發(fā)現(xiàn)差異表達基因主要與“細胞周期”、“孕酮介導的卵細胞成熟”和“鉑耐藥性”信號通路有關(guān)。此外,通過分子相互作用的分析,進一步篩選出前15 個樞紐基因并進行了預后生存分析,發(fā)現(xiàn)了AURKA基因的高表達與宮頸癌患者總生存期較短顯著相關(guān)。同樣,RFS 分析發(fā)現(xiàn)AURKA基因的高表達與宮頸癌患者無復發(fā)生存期較短相關(guān)。對AURKA基因的表達進行驗證發(fā)現(xiàn)其在宮頸癌組織中mRNA 和蛋白的表達均上調(diào),但無種族人群差異。最后,通過ROC 曲線分析進一步表明AURKA基因在宮頸癌中具有較好的預測價值。
AURKA是一種絲氨酸/蘇氨酸激酶,在細胞有絲分裂中起著重要的調(diào)節(jié)作用[11]。AURKA在許多惡性腫瘤中高表達,是中心體復制、成熟和分離的關(guān)鍵[12]。這與本研究GO 和KEGG 分析得到的結(jié)果吻合。研究表明,AURKA在大多數(shù)人類癌癥中升高與肺癌、肝癌和結(jié)直腸癌患者的不良預后密切相關(guān)[13-15]。AURKA作為一種致癌基因,影響許多腫瘤的生物學過程,如增殖、基因組的不穩(wěn)定性、侵襲和轉(zhuǎn)移[16]。Liu 等[17]研究發(fā)現(xiàn),AURKA抑制劑可通過與AURKA結(jié)合誘導G2/M 期阻滯和線粒體誘導結(jié)腸癌細胞內(nèi)源性凋亡。Shao 等[18]報道了子宮頸癌患者組織中AURKA的表達明顯增加。進一步研究表明,hsa_circ_0075341 通過隔離miR-149-5p 和上調(diào)AURKA的表達來增強宮頸癌細胞的增殖和侵襲能力。Van Horn 等[19]研究發(fā)現(xiàn),CDK1 的激活啟動了AURKA所參與的有絲分裂的激活[19]。此外,被激活的AURKA和PLK1 進一步在作用于CDK1,促進有絲分裂,并參與有絲分裂中的紡錘體形成和中心粒分裂。近期,Wang 等[20]綜合多個GEO 數(shù)據(jù)集分析發(fā)現(xiàn)CDK1 和PRC1 與良好的生存期相關(guān),而AURKA與較差的生存期相關(guān)。本研究綜合GSE9750、GSE46857 和GSE52903數(shù)據(jù)集分析,發(fā)現(xiàn)AURKA在宮頸癌中表達顯著增高,進一步研究發(fā)現(xiàn)AURKA與宮頸癌的總生存期及無復發(fā)生存期密切相關(guān),TCGA 數(shù)據(jù)庫和臨床樣本進一步驗證了AURKA在宮頸癌的高表達,且無種族人群差異。重要的是ROC 曲線分析亦顯示AURKA在宮頸癌中具有較好的預測價值。
綜上所述,AURKA可能作為宮頸癌檢測和靶向治療的一個新靶點。