毛建英, 袁海涵
(1.內蒙古自治區(qū)人民醫(yī)院婦產科,內蒙古呼和浩特010017; 2.北京市大興區(qū)人民醫(yī)院)
作為中國女性第二常見的癌癥類型,近年來宮頸癌的發(fā)病率有上升趨勢,15~44歲女性癌癥病人中,宮頸癌發(fā)病率居第二位,而死亡率居第三位[1],提升宮頸癌的診斷、篩查可有效得防治宮頸癌。
本研究從美國國立生物技術信息中心(national center for biotechnology information,NCBI)下載了宮頸癌進展相關數(shù)據集,利用生物信息學分析進一步挖掘了宮頸癌進展過程中的基因表達圖譜及信號通路等,以期為臨床宮頸癌的快速診斷和精準治療提供潛在生物標記物。
本研究收集的宮頸癌進展芯片數(shù)據來源于NCBI數(shù)據庫中的GEO數(shù)據庫,該套芯片數(shù)據是由Espinosa AM提交的GSE39001芯片數(shù)據,該套芯片數(shù)據研究所采用的實驗平臺是Affymetrix公司的HT HG-U133+ PM Array Plate,它共含有43例宮頸癌組織樣本及12例對應的癌旁組織樣本[2]。
1.2.1宮頸癌組織芯片數(shù)據處理 利用GEO數(shù)據庫中自帶的GEO2R(https:∥www.ncbi.nlm.nih.gov/geo/GEO2R/)對GSE103512芯片數(shù)據進行標準化處理,深度挖掘差異表達基因(different expression genes,DEGs)。
根據組織芯片中不同組織的來源,將芯片中的組織分為宮頸癌旁組織(adjacent tissues,A)及宮頸癌組織(cancer tissues,C),進一步進行數(shù)據分組,采用T檢驗對兩組數(shù)據進行比較,篩選該套組織芯片的差異表達基因,篩選條件是P<0.01,|Fold change|≥1.0。
1.2.2宮頸癌進展差異表達基因GO分析及信號通路分析 將宮頸癌進展相關差異表達基因上傳至DAVID數(shù)據庫中,進行基因名稱轉換。選擇該數(shù)據庫中的基因功能注釋模塊(functional annotation),分別對納入的差異表達基因進行生物學過程(biological process)、分子功能(molecular function)、細胞組成(cellular compotent)及生物學信號通路(kyoto encyclopedia of genes and genomes,KEGG)的GO分析,篩選宮頸癌進展過程中差異表達基因富集的生物學過程、分子功能、細胞組成(篩選標準均為P<0.05);并進一步對差異基因富集的相關信號通路進行篩選、校正(P<0.05)[3,4]。
1.2.3宮頸癌進展的蛋白質相互作用網絡 將宮頸癌進展的相關差異表達基因進一步導入STRING數(shù)據庫中,分析蛋白質之間的相關性,進一步利用數(shù)據庫繪制、分析蛋白質相互作用網絡(protein protein interaction network,PPI),在此基礎上,進一步根據生物信息學學的標準流程,通過Cytoscape軟件(https:∥cytoscape.org/)分析、篩選與宮頸癌進展相關的核心基因(hub genes,篩選標準:滿足Degree≥10)[5,6]。
1.2.4宮頸癌進展過程中核心基因表達水平分析 利用GEPIA數(shù)據庫中的Gene correction模塊(基因相關性),在宮頸癌(cervical invasive carcinoma)模型下,分析、比對上述核心基因在宮頸癌組織及正常宮頸組織中的表達水平[7]。
1.2.5數(shù)據分析 在本部分研究中,采用SPSS19.0軟件包進行實驗數(shù)據的處理分析,數(shù)值用平均值±方差的方式進行表示,采用單因素方差LSD檢驗比對、分析組間數(shù)據;P<0.05表示差異具有統(tǒng)計學意義。
從GSE39001數(shù)據集中鑒定出共112個DEG,與正常宮頸組織相比,宮頸癌進展過程中存在42個上調基因(如APOBEC3B,AURKA,BUB1B)和70個下調基因(如ABCA8,ACTG1P4,ADRA2A)。
宮頸癌進展的GO分析結果,生物過程組中,DEG主要富集于細胞增殖過程的正向調控、細胞凋亡過程的負向調控及細胞分離等過程(見表1);分子功能組中,主要富含肝素結合等;在細胞成分中,主要富集于蛋白質類細胞外基質。KEGG信號通路富集結果顯示,主要富集于調控細胞周期的調控及P53信號通路(見表2)。
宮頸癌進展過程中的核心基因分別為RFC4、TOP2A、PCNA、BUB1、TPX2和KIF20A,上述核心基因編碼蛋白PPI結果示(見圖1)。
宮頸癌及其對應宮頸正常組織中核心基因的表達水平結果示,在宮頸癌組織中,RFC4、BUB1、TOP2A、PCNA、TPX2和KIF20A基因的表達水平均顯著高于對應的正常宮頸組織。
宮頸癌的體內發(fā)展過程比較復雜,然而由于目前大多數(shù)的研究均來源于單個隊列研究,對病人的預后并不理想,為了進一步挖掘宮頸癌進展過程,本論文通過生物信息學的方法,篩選出了6個核心基因RFC4、TOP2A、PCNA、BUB1、TPX2及KIF20A。GO結果表明宮頸癌進展過程中的DEGs主要參與調控細胞分裂、DNA復制、細胞周期和轉錄等調控過程。
作為RFC家族成員之一,RFC4密切參與調控真核細胞DNA復制以及DNA損傷修復等過程,而且該基因的活性與如細胞周期中S期檢查點的調節(jié)及姐妹染色單體凝聚和基因組維護密切相關,其表達水平的異常與癌癥進展密切相關,而且目前已有研究報道指出對于早期宮頸癌病人,RFC4表達水平與宮頸癌進展密切相關[8]。
作為DNA合成轉錄、染色體分離等過程的關鍵調控基因,TOP2A,常用作化療藥物療效評估預測因子,其腫瘤組織中的表達水平可顯著調控腫瘤細胞對蒽環(huán)類腫瘤靶向藥物的反應性[9],PCNA,即增殖細胞核抗原(proliferating cell nuclear antigen),是哺乳動物細胞有絲分裂過程的關鍵調控蛋白,該蛋白僅在增殖的細胞中表達,其表達水平的異常增加可以顯著性地促進體內腫瘤細胞的失控增殖,進一步促進癌癥進展。
表1 宮頸癌進展過程GO分析結果
表2 宮頸癌進展過程KEGG信號通路分析
BUB1,位于人染色體2q14,該基因由25個外顯子構成,其編碼的BUB1蛋白則由1085個氨基酸殘基構成;該蛋白結構域中包括一個保守的、可以與動粒結合的N-末端結構域,中間為BUB3結合所必需的非保守結構域,而其C-末端結構域具有絲氨酸/蘇氨酸激酶活性[10,11]。BUB1蛋白的活性與紡錘體檢查點活性密切相關,其表達水平的異常會導致細胞內染色體不穩(wěn)定性的產生,進一步促進腫瘤的發(fā)生、發(fā)展、轉移,與癌癥病人的預后情況密切相關[12~15]。
TPX2基因,又稱Repp86,定位于人類染色體20q11.2,,作為受細胞周期嚴格調控的核增殖相關蛋白及微管相關蛋白,TPX2蛋白主要功能為在維持紡錘體穩(wěn)定性并調控細胞周期及有絲分裂過程,并與腫瘤的分化、侵潤和復發(fā)關系密切相關。
綜上所述,本部分研究利用生物信息學的方法,結合組織芯片數(shù)據,利用一系列網絡數(shù)據庫分析了宮頸癌進展相關的差異表達基因圖譜,并深入地分析了差異表達基于富集的癌癥進展調控過程及其關鍵信號通路,并在此基礎上,利用癌癥進展相關數(shù)據庫驗證了宮頸癌進展過程相關核心基因表達水平與宮頸癌進展過程的相關性,為下一步臨床、細胞模型探索宮頸癌進展的相關性指明了研究方向。