李錦忠, 諶寧, 王丹, 龔曉兵
(暨南大學(xué) 附屬第一醫(yī)院 消化科, 廣東 廣州 510632)
原發(fā)性肝癌是男性癌癥相關(guān)死亡的第2大原因,是女性癌癥相關(guān)死亡的第6大原因,也是全球最常被診斷出的癌癥[1],此外,肝癌(hepatocellular carcinoma,HCC)是最致命的原發(fā)癌之一,5年生存率為10%或更低[2].HCC的主要危險(xiǎn)因素具有明顯的地域性:在亞洲和非洲的大多數(shù)高流行率國家,慢性乙型肝炎病毒(hepatitis B virus, HBV)感染和黃曲霉毒素B1(aflatoxin B1,AFB1)暴露是主要的危險(xiǎn)因素,但隨著AFB1暴露減少,乙型肝炎疫苗接種率增加以及新一代抗病毒藥物(如恩替卡韋和替諾福韋)對(duì)乙型肝炎病毒抑制的累積影響,HCC發(fā)生率將呈現(xiàn)下降趨勢.相反,丙型肝炎病毒(hepatitis C virus, HCV)感染,過量飲酒和糖尿病/肥胖/代謝綜合征在低流行率地區(qū)發(fā)揮更重要的作用,特別是西方人群,所以HCC患病率將繼續(xù)增加[3-4].手術(shù)的綜合治療在HCC的治療中起主導(dǎo)作用,然而,70%~80%的HCC患者在臨床確診時(shí)已為晚期,不適合進(jìn)行手術(shù)切除和肝移植等潛在治愈性治療,只有15%的患者可以從手術(shù)切除中獲益[5],且腫瘤通常對(duì)化療或放療有抵抗力[6].為HCC引入的最有效的靶向藥物是索拉非尼,作為一種酪氨酸激酶抑制劑(tyrosine kinase inhibitor,TKI),索拉非尼仍然是唯一一種在晚期HCC使用的全身性靶向腫瘤治療藥物,但其療效非常有限[7],這可能進(jìn)一步反映了晚期HCC缺乏有效的替代方案.目前關(guān)于HCC 發(fā)病機(jī)制還未得到清晰的闡明,可能與多種基因突變和表觀遺傳畸變相關(guān).盡管基因突變不易于治療,但HCC中常出現(xiàn)的表觀遺傳畸變可能成為新靶點(diǎn)[8].
由著絲粒DNA和相關(guān)蛋白組成的動(dòng)粒在染色體分離和細(xì)胞分裂中起關(guān)鍵作用[9].著絲粒蛋白(centromeric protein,CENP)是高度保守的基因,已被廣泛研究并顯示對(duì)著絲粒和相關(guān)動(dòng)粒形成起著關(guān)鍵作用,其中CENP-A可將著絲粒變成DNA和蛋白的復(fù)合物,而且確保著絲粒在細(xì)胞分裂中完好無損[10].在大多數(shù)真核生物中,著絲粒的遺傳需要借助CENP-A核小體的運(yùn)輸作用來保留在每個(gè)姐妹染色單體上的表觀遺傳標(biāo)記,從而確保了人體有幾乎完全相同的染色體組[11].因此,CENP-A作為著絲點(diǎn)的標(biāo)志性蛋白因子,在染色體精確分離過程中發(fā)揮著關(guān)鍵作用.據(jù)報(bào)道,CENP-A在包括結(jié)直腸癌、肺腺癌、原發(fā)性骨肉瘤、卵巢癌等在內(nèi)的各種癌中過表達(dá)[12-15].Tomonaga等[12]為結(jié)直腸癌中CENP-A過表達(dá)與非整倍性之間的聯(lián)系提供了證據(jù).研究顯示:沉默CENP-A減少了HCC細(xì)胞增殖,阻斷了G1期的細(xì)胞周期,并增加了細(xì)胞凋亡;相反,CENP-A過表達(dá)促進(jìn)HCC細(xì)胞生長并減少細(xì)胞凋亡[16].雖然CENP-A在HCC生長或存活中具有特異性作用,但其作為HCC生物標(biāo)志物的臨床意義及作用機(jī)制尚未確定.
為了研究CENP-A在HCC中的表達(dá)模式和臨床作用,使用UCSC Xena瀏覽器(https://xenabrowser.net/)獲得TCGA-LIHC原發(fā)性肝細(xì)胞癌(liver hepatocellular carcinoma, LIHC)患者的3級(jí)數(shù)據(jù)[17],為424例原發(fā)性HCC患者提供了基因表達(dá)數(shù)據(jù)和臨床隨訪信息,并通過UCSC Xena瀏覽器在線分析原發(fā)性LIHC患者CENP-A的mRNA表達(dá),外顯子表達(dá)和DNA甲基化.通過GraphPad Prism v7.0產(chǎn)生初始治療后的OS和RFS的Kaplan-Meier曲線.為了使結(jié)果更可靠,通過使用FireBrowse(http://firebrowse.org/)對(duì)TCGA生成的數(shù)據(jù)進(jìn)行分析,比較一些實(shí)體腫瘤和相應(yīng)正常組織中的CENP-A表達(dá).
在Oncomine數(shù)據(jù)庫檢索界面輸入與本研究相關(guān)的篩選條件:①cancer type: liver cancer; ②gene: CENP-A; ③analysis type: cancervsnormal analysis,對(duì)已發(fā)表的CENP-A表達(dá)數(shù)據(jù)進(jìn)行了meta分析.
統(tǒng)計(jì)分析使用R語言(3.4.1)進(jìn)行.分析CENP-A的RNA表達(dá)及基因改變和臨床學(xué)意義、預(yù)后價(jià)值的相關(guān)性.構(gòu)建了用于死亡和復(fù)發(fā)檢測的受試者工作特征曲線(receiver operating characteristic,ROC)曲線,并基于Youden指數(shù)確定CENP-A表達(dá)的最佳截?cái)嘀?采用Log-rank檢驗(yàn)來評(píng)估生存曲線之間的差異.用單變量和多變量Cox回歸模型分析預(yù)后價(jià)值.
采用R-DESeq軟件篩選肝細(xì)胞癌RNAseq數(shù)據(jù)的差異表達(dá)基因,設(shè)定差異基因的篩選閾值:p-adj<0.000 1和log2fold-chang>2;同時(shí)采用heatmap包對(duì)差異基因進(jìn)行聚類分析.應(yīng)用DAVID(https://david.ncifcrf.gov/)在線工具對(duì)差異表達(dá)基因進(jìn)行GO功能注釋分析.通過使用用于癌癥基因組學(xué)的cBioPortal的數(shù)據(jù)挖掘,本實(shí)驗(yàn)鑒定了在肝癌(liver hepatocellular carcinoma,LIHC)(|Pearson r|≥0.5和|Spearman’s r|≥0.5)中與CENP-A共表達(dá)的基因.應(yīng)用Cytoscape(3.6.1)的ClueGO對(duì)差異表達(dá)基因進(jìn)行KEGG信號(hào)通路分析,初步篩選及鑒定出CENP-A在肝細(xì)胞癌中的功能及信號(hào)通路.運(yùn)用STRING(https://string-db.org/)數(shù)據(jù)庫和Cytoscape(3.6.1)軟件對(duì)差異基因編碼的蛋白質(zhì)進(jìn)行蛋白互作網(wǎng)絡(luò)分析,并且顯示出包含CENP-A的最小相互作用且信心評(píng)分>0.7的結(jié)果.
與CENP-A遺傳改變相關(guān)的潛在機(jī)制仍然未知,因此,實(shí)驗(yàn)分析了CENP-A的甲基化和拷貝數(shù)變異(copy number variation,CNV)狀態(tài).通過使用cBioPortal數(shù)據(jù)庫,獲得了HCC中CENP-A的表達(dá)譜和基因改變(包括甲基化,擴(kuò)增和拷貝數(shù))之間的關(guān)系,并進(jìn)一步分析CENP-A遺傳改變對(duì)生存的影響.
通過使用FireBrowse的數(shù)據(jù)挖掘,本實(shí)驗(yàn)表征了幾種類型的實(shí)體瘤(包括LIHC)中CENP-A的mRNA表達(dá).結(jié)果顯示,CENP-A在多種實(shí)體腫瘤(包括消化道腫瘤、肺癌、乳腺癌、宮頸癌等)均高表達(dá),其中在LIHC組織中的CENP-A表達(dá)量為正常肝組織的2.97倍(圖1A).為了進(jìn)一步比較LIHC中的CENP-A表達(dá),提取TCGA-LIHC中的CENP-AmRNA RNAseq和外顯子RNAseq數(shù)據(jù)用于分析. LIHC中CENP-A的mRNA和exon表達(dá)顯著高于正常組織(P<0.000 1),且CENP-A對(duì)LIHC診斷的敏感性和準(zhǔn)確性較高(AUC=0.956,P<0.000 1,圖1B、圖1C).為了進(jìn)一步論證該結(jié)論,利用 Oncomine 數(shù)據(jù)庫提取信息,分析發(fā)現(xiàn),2007年起共有7 項(xiàng)研究涉及CENP-A在HCC和正常組織中的表達(dá),共包括1 127例樣本,meta分析結(jié)果顯示:與對(duì)照組相比,CENP-A在HCC中高表達(dá)(P=0.003,圖2).
圖1A CENP-A的 mRNA在不同類型實(shí)體瘤和相應(yīng)正常組織中的表達(dá)
Fig.1A Expression of CENP-A mRNA in different types of solid tumors and corresponding normal tissues
數(shù)據(jù)來自TCGA-LIHC
圖1C 原發(fā)性LIHC患者CENP-A的 mRNA表達(dá)及診斷
1~7 分別表示7項(xiàng)研究結(jié)果,藍(lán)色代表低表達(dá),紅色代表高表達(dá),顏色由淺變深(即從正中間% 往兩邊各自的箭頭方向) 代表表達(dá)差異越大,紅色越深表示CENP-A基因在該芯片中表達(dá)越高.
1~7 represent the results of 7 studies respectively, blue represents low expression, red represents high expression.The change in color from light to dark (from % in the middle to the direction of the arrows on each side), indicates a greater difference in expression.
圖2 CENP-A的meta分析
Fig.2 Meta analysis of CENP-A
CENP-A表達(dá)和原發(fā)性LIHC患者人口統(tǒng)計(jì)和臨床病理參數(shù)之間的關(guān)聯(lián)總結(jié)(表1).在LIHC患者中,高CENP-A表達(dá)組肝癌組織的分化程度更低(P<0.000 1),處于T3- 4期(32/91,41.9%vs.55/252,21.8%,P=0.012)和臨床Ⅲ/Ⅳ期(44/105,35.2%vs.43/238,18.1%,P=2.92E-06)的患者多于CENP-A低表達(dá)組.此外,高CENP-A表達(dá)組與低CENP-A表達(dá)組相比有顯著較高的死亡率(59/112,52.7%vs.71/255,27.8%,P=4.63E-06)和較高的復(fù)發(fā)率(52/95,54.7%vs.89/225,39.6%,P=0.012),但CENP-A的表達(dá)量與臨床階段沒有明顯的相關(guān)性(圖3).在LIHC中,高CENP-A表達(dá)與LIHC患者顯著較差的OS(P=2.66E-07)和RFS(P=5.5E-05)相關(guān)(圖4).通過進(jìn)行單因素分析,可發(fā)現(xiàn)LIHC患者原發(fā)腫瘤的大小及向周圍的進(jìn)展(T3- 4)、中晚期(Ⅲ/Ⅳ)和高CENP-A表達(dá)與顯著較短的OS和RFS有關(guān);多變量分析證實(shí),高CENP-A表達(dá)是LIHC患者OS(HR:2.266,95%CI:1.542-3.330,P=3.14E-05)和RFS(HR:1.605,95%CI:1.118-2.305,P=0.010)差的獨(dú)立預(yù)后因素(表2).
圖3 CENP-A表達(dá)與臨床分期的關(guān)系
Fig.3 Relationship between CENP-A expression and clinical stage
圖4 CENP-A表達(dá)與LIHC患者OS或RFS的關(guān)系
Table 1 Relationship between cenp-a expression and demographic and clinicopathological parameters in TCGA primary LIHC patients
參數(shù)nCENP-A表達(dá)高(n=112)低(n=255)2P值年齡/歲58±12.7361.41±13.540.11性別119女40790.800.37248男72176組織學(xué)分級(jí)231G1-25217917.52<0.0001131G3-45774纖維化評(píng)分1060-224820.0140.99363-58286961653T2731-26620722.3<0.0001913-44645N249082167-141-313M264089175-0.553103臨床分期256Ⅰ/Ⅱ6119521.872.92E-0687Ⅲ/Ⅳ4443生存狀態(tài)237存活5318420.984.63E-06130死亡5971復(fù)發(fā)情況179無431366.250.012141有5289
從TCGA下載的374例HCC癌組織樣本和30例癌旁正常組織樣本的RNAseq數(shù)據(jù),篩選出在HCC中差異表達(dá)的基因數(shù)目有2 790個(gè),其中表達(dá)上調(diào)的基因有2 494個(gè),表達(dá)下調(diào)的基因有296個(gè),這些基因在HCC癌組織和例癌旁正常組織的表達(dá)有明顯區(qū)別,并進(jìn)一步對(duì)差異基因進(jìn)行聚類分析,得到差異基因的聚類熱圖和火山圖(圖5、圖6).為了進(jìn)一步研究CENP-A涉及的可能的信號(hào)傳導(dǎo)途徑,將上述差異表達(dá)基因分別進(jìn)行GO(gene ontology)功能富集,在LIHC中,GO功能富集分析顯示:CENP-A主要在細(xì)胞核染色體的著絲粒區(qū)域干擾細(xì)胞的有絲分裂,在分子水平體現(xiàn)為影響同種或不同蛋白間的異源二聚化,進(jìn)而干擾影響蛋白功能的發(fā)揮(表3).
表2 原發(fā)性LIHC患者OS/RFS的單因素和多因素分析Table 2 Univariate and multivariate analyses of OS/RFS in patients with primary LIHC
左側(cè)縱軸代表基因名,右側(cè)縱軸代表基因的聚類信息;上橫軸代表樣本的聚類信息,下橫軸代表癌癥和正常的樣本代碼,其顏色表示該基因表達(dá)量大小,表達(dá)量越大顏色越深,其中紅色為上調(diào),綠色為下調(diào),黑色代表基因表達(dá)無顯著變化.
The left vertical axis represents the gene name and the right vertical axis represents the clustering information of genes. The upper horizontal axis represents clustering information of samples, and the lower horizontal axis represents cancer and normal sample code.The color indicated the gene expression level, and the higher the expression level, the darker the color was. Among them, red, green and black respectively represent that gene expression is up-regulated, down-regulated and has no significant change.
圖5 原發(fā)性肝癌腫瘤組織與癌旁正常組織間差異基因的層次聚類熱圖
Fig.5 Hierarchical clustering heat map of differentially expressed genes between primary hepatocellular carcinoma tumor tissues and paracancer normal tissues
lnFC代表取ln后差異表達(dá)基因調(diào)整倍數(shù)(4.0倍),-ln10(FDR)代表校正后的P值(0.000 1),圖中的紅點(diǎn)表示上調(diào)的差異表達(dá)基因,綠點(diǎn)代表下調(diào)的差異表達(dá)基因,黑點(diǎn)代表差異改變不明顯的基因.
lnFC represents regulation multiple of gene (4.0 times), -ln10(FDR) represents the correctedPvalue of 0.000 1, and the red point, green point and black point in the figure respectively represent the genes that are up-regulated, down-regulated and have no obvious difference.
圖6 原發(fā)性肝癌腫瘤組織與癌旁正常組織間差異基因的火山圖
Fig.6 Volcanic map of differentially expressed genes between primary hepatocellular carcinoma tumor tissue and adjacent normal tissue
本實(shí)驗(yàn)通過cBioPortal鑒定了在LIHC中有285個(gè)基因與CENP-A共表達(dá).KEGG(kyoto encyclopedia of genes and genomes)通路結(jié)果提示這些基因富集在細(xì)胞周期、DNA復(fù)制、卵母細(xì)胞減數(shù)分裂、孕酮介導(dǎo)的卵母細(xì)胞成熟、Fanconi貧血途徑、同源重組、錯(cuò)配修復(fù)、p53信號(hào)通路、HTLV-I感染、嘧啶代謝、基礎(chǔ)切除修復(fù)、核苷酸切除修復(fù)及細(xì)胞衰老等通路上(圖7和S1).
表3 CENP-A在LIHC的GO功能富集分析Table 3 GO functional enrichment analysis of CENP-A in LIHC
圖7 CENP-A共表達(dá)基因在LIHC中的KEGG通路富集分析
STRING數(shù)據(jù)庫用于鞏固已知和預(yù)測的蛋白質(zhì)與CENP-A的關(guān)聯(lián),以最高可信度(high confidence:0.9)為條件篩選與CENP-A相關(guān)的HCC差異表達(dá)基因,共有42個(gè)與CENP-A相互作用的基因(圖8).前7位預(yù)測功能伙伴如下:BUB1(得分=0.854),AURKA(得分=0.85),AURKB(得分=0.844),KIF2C(得分=0.84),CDK1(得分=0.838),TOP2A(得分=0.83),HJURP(得分=0.712).該網(wǎng)絡(luò)中基因本體的功能富集分析表明,蛋白網(wǎng)絡(luò)功能富集在染色體的著絲粒上,通過影響動(dòng)粒對(duì)染色體移動(dòng)及調(diào)節(jié)進(jìn)而干擾有絲分裂的細(xì)胞周期(S2).
圖8 CENP-A與LIHC差異基因的蛋白互作網(wǎng)絡(luò)分析
LIHC中CENP-A表達(dá)失調(diào)的潛在機(jī)制.約9%的LIHC病例中觀察到CENP-A基因改變,其中擴(kuò)增和mRNA表達(dá)上調(diào)是改變的主要類型(圖9).進(jìn)一步分析基因改變的特點(diǎn),發(fā)現(xiàn)CENP-A的mRNA表達(dá)量隨著拷貝數(shù)的增加而增加,相反,隨著DNA甲基化增加而降低(圖10).進(jìn)一步研究HCC患者中CENP-A基因改變與生存之間的關(guān)系.存活曲線表明CENP-A改變的LIHC患者的OS(P<0.000 1)明顯更差,但對(duì)RFS影響不大(P=0.201,圖11).
圖9 LIHC中CENP-A基因改變情況
圖10 CENP-A的表達(dá)量與DNA甲基化和拷貝數(shù)改變(CNA)的關(guān)系
圖11 CENP-A基因改變與LIHC患者生存的關(guān)系
CENP-A位于動(dòng)粒內(nèi)層,為組蛋白H3在著絲粒區(qū)的變體,當(dāng)其出現(xiàn)磷酸化異常,裝配錯(cuò)誤,則會(huì)導(dǎo)致動(dòng)粒異常,進(jìn)而引發(fā)染色體錯(cuò)分,導(dǎo)致癌癥發(fā)生[18].研究發(fā)現(xiàn):與正常組織相比,它通常在多種癌組織中上調(diào)(包括肝癌)[12-16],從TCGA納入的424例大樣本分析同樣顯示CENP-A在肝癌組織中的表達(dá)明顯升高.基因組不穩(wěn)定性和非整倍性被認(rèn)為是癌癥的特征[19],而動(dòng)粒的功能障礙是染色體不穩(wěn)定和非整倍性的一個(gè)可能原因,這是由于定向正確的染色體分離缺陷引起的[20].本研究發(fā)現(xiàn)在LIHC中CENP-A改變主要體現(xiàn)在基因擴(kuò)增和mRNA上調(diào),且mRNA表達(dá)量與DNA拷貝數(shù)呈正相關(guān),而與DNA甲基化呈負(fù)相關(guān),且CENP-A改變的LIHC患者的總體生存率(P<0.000 1)明顯更差.癌癥組織通常具有總體低甲基化的特征,相比之下,腫瘤抑制基因的啟動(dòng)子是高甲基化[21],說明CENP-A基因改變是肝細(xì)胞增殖失調(diào)和癌變的原因之一.
作為致癌基因,CENP-A上調(diào)在某些癌癥中也具有預(yù)后價(jià)值.已發(fā)現(xiàn)CENP-A過表達(dá)的肺腺癌患者具有顯著更短的OS和RFS,也是肺腺癌和骨肉瘤手術(shù)切除患者OS和RFS的獨(dú)立陰性預(yù)后因素[13-14].此外,升高的CENP-A表達(dá)與卵巢癌進(jìn)展顯著相關(guān),并且在預(yù)測患者的OS和RFS方面具有獨(dú)立的預(yù)后價(jià)值[15].在本研究中,CENP-A表達(dá)影響患者的腫瘤復(fù)發(fā),但與轉(zhuǎn)移無明顯相關(guān)性,通過產(chǎn)生Kaplan-Meier曲線,進(jìn)一步證實(shí)LIHC患者中,高CENP-A表達(dá)與較差的OS和RFS有關(guān).另外,單因素和多因素分析顯示,高CENP-A表達(dá)是LIHC患者OS(HR:2.266,95%CI:1.542-3.330,P=3.14E-05)和RFS(HR:1.605,95%CI:1.118-2.305,P=0.010)差的獨(dú)立預(yù)后因素.
正常情況下,在M期早期,細(xì)胞周期相關(guān)蛋白復(fù)合物周期素依賴性蛋白激酶1/細(xì)胞周期蛋白B(CDK1/Cyclin B)可以催化CENP-A的Ser68發(fā)生磷酸化,從而不能被著絲粒特異性染色質(zhì)裝配因子(holliday junction recognition protein, HJURP)識(shí)別,避免了CENP-A過早地裝配對(duì)細(xì)胞造成的損害.待有絲分裂進(jìn)入M期末期,姐妹染色單體已經(jīng)成功分離,此時(shí)CDK1/Cyclin B活性降到最低,蛋白磷酸酶PP1α催化CENP-ASer68發(fā)生去磷酸化,然后HJURP識(shí)別 CENP-A 并將其裝配到著絲粒區(qū)域,將CENP-A核小體濃度回補(bǔ)到一個(gè)較高的水平[22].研究發(fā)現(xiàn)RNAi介導(dǎo)的CENP-A消耗在體外和體內(nèi)抑制HCC細(xì)胞生長,阻斷G1期的細(xì)胞周期進(jìn)展,并促進(jìn)細(xì)胞凋亡;消耗CENP-A的抗癌作用可能通過調(diào)節(jié)參與細(xì)胞周期控制和凋亡的大量基因來介導(dǎo),包括CHK2、P21waf1、P27Kip1、SKP2、MDM2、Bcl-2和Bax[16].研究也表明:通過與BUB1、AURKA、AURKB、KIF2C、CDK1、TOP2A、HJURP等多種基因聯(lián)合作用,CENP-A在DNA復(fù)制、錯(cuò)配修復(fù)、同源重組、基礎(chǔ)切除修復(fù)和細(xì)胞周期等通路上影響動(dòng)粒對(duì)染色體移動(dòng)及調(diào)節(jié)進(jìn)而干擾有絲分裂的細(xì)胞周期.目前已有研究顯示:組蛋白去乙酰化酶抑制劑、白屈菜堿可通過作用于CDK1,Cyclin B 和Aurora B間接抑制CENP-A的磷酸化,從而抑制腫瘤的增殖[23-24].所以CENP-A在癌細(xì)胞生物學(xué)中的實(shí)質(zhì)作用激發(fā)其作為HCC治療的分子靶標(biāo)治療的潛在應(yīng)用.