李開國 王茹月 楊曉慧 曲頌
乳腺癌是起源于乳腺上皮組織的惡性腫瘤,在世界范圍內(nèi)居女性癌癥發(fā)病率的首位,是女性癌癥死亡的主要原因[1]。2017年腫瘤登記中心數(shù)據(jù)顯示,乳腺癌位居我國女性癌癥發(fā)病率首位,惡性腫瘤死因第5位[2]。因此,深入研究乳腺癌的發(fā)病機制,尋找潛在的治療靶點和預(yù)后評估生物標志物成為該領(lǐng)域的研究熱點。Pygopus2(PYGO2)是經(jīng)典 Wnt/β-catenin 信號通路的重要組成部分,在正常組織和惡性組織中調(diào)節(jié)細胞生長和分化[3-4]。既往研究表明,在MCF-7乳腺癌細胞中,人PYGO2啟動子通過ETS(E-twentysix)家族成員ELF-1(E74-like factor 1)激活原癌基因的表達[5]。有學者通過shRNA(small hairpin RNA)抑制PYGO2表達,結(jié)果發(fā)現(xiàn)人膠質(zhì)瘤細胞系U251細胞的增殖數(shù)量減少,侵襲能力降低[6]。據(jù)此推測PYGO2與腫瘤的發(fā)生發(fā)展密切相關(guān)。盡管PYGO2表達異常在前列腺癌[7]、肝癌[8]、食管鱗狀細胞癌[9]、中樞神經(jīng)系統(tǒng)腫瘤[10]等多種腫瘤中已有報道,但在乳腺癌中卻鮮有研究,且由于研究方法、樣本量和人群的差異,其結(jié)論可靠性較低。
Oncomine是全球最大的癌癥基因芯片數(shù)據(jù)庫和整合數(shù)據(jù)挖掘平臺,目前已經(jīng)收錄了715個基因表達數(shù)據(jù)集、86 733個癌癥組織和正常組織的樣本數(shù)據(jù),該平臺整合的文獻及芯片數(shù)據(jù)因高質(zhì)量而得到科研人員的高度認可。而Kaplan-Meier Plotter數(shù)據(jù)庫是目前分析預(yù)后應(yīng)用較廣泛的在線數(shù)據(jù)庫,涵蓋了5 143例乳腺癌樣本,可對54 675個基因進行相關(guān)預(yù)后分析,并得出較客觀的結(jié)果。本研究采用Oncomine數(shù)據(jù)庫和Kaplan-Meier Plotter數(shù)據(jù)庫分析PYGO2在乳腺癌中的表達及其與預(yù)后的關(guān)系,為進一步研究乳腺癌的發(fā)生發(fā)展機制提供線索。
在 Oncomine數(shù)據(jù)庫(https://www.oncomine.org/resource/login.html)中根據(jù)本研究的需求設(shè)定篩選和挖掘數(shù)據(jù)條件:⑴“Cancer Type:Breast cancer”;⑵“Gene:PYGO2”;⑶“Data Type:All”;⑷“Analysis Type:CancervsNormal Analysis”;⑸臨界值設(shè)定條件(P value<0.05,fold change>2,gene rank=All)。
利用 Kaplan-Meier Plotter數(shù)據(jù)庫(http://kmplot.com/analysis/)中的 Breast cancer(mRNA)數(shù)據(jù)集進行生存分析。篩選條件:⑴“Cancer:Breast Cancer”;⑵“Gene symbol:PYGO2”;⑶“Split patients by:Auto select best cutoff”;⑷“Survival:OS/RFS/DMFS”;⑸“Follow up threshold:All”。本研究預(yù)后評價指標包括總生存期(overall survival,OS)、無復(fù)發(fā)生存期(relapse-freesurvival,RFS)和無遠處轉(zhuǎn)移生存期(distant metastasis-free survival,DMFS)。OS定義為癌癥診斷之日起至因任何原因引起死亡的時間。RFS定義為從癌癥初次治療至最早出現(xiàn)局部復(fù)發(fā)、遠處轉(zhuǎn)移或死亡的時間。DMFS定義為從癌癥初次治療至最早出現(xiàn)遠處轉(zhuǎn)移或死亡的時間。
本研究采用Kaplan-Meier Plotter數(shù)據(jù)庫和SPSS 16.0進行數(shù)據(jù)分析。采用均數(shù)±標準差(±s)描述PYGO2基因的表達量,其在正常組織與乳腺癌組織的差異分析采用獨立樣本t檢驗。采用Kaplan-Meier法分析PYGO2表達與乳腺癌預(yù)后的關(guān)系,組間比較用Log-rank檢驗。以雙側(cè)P<0.05為差異有統(tǒng)計學意義。
Oncomine數(shù)據(jù)庫中共收集了307項關(guān)于PYGO2在不同類型腫瘤組織與正常組織比較的研究結(jié)果,其中208項研究PYGO2表達差異有統(tǒng)計學意義(P<0.05),PYGO2表達增高的研究164項、表達降低的研究44項,在乳腺癌中高表達的研究32項,低表達的研究0項,見圖1。
2004年至今,Oncomine數(shù)據(jù)庫共有45項研究涉及PYGO2在乳腺癌組織和正常組織中的差異表達分析,共有3730個樣本,見圖2。研究成果分別發(fā)表于MolBiol Cell[11]、Proc Natl Acad Sci USA[12]、Nature[13-14]、Breast Cancer Res[15]、BMC Cancer[16]、Cancer Cell[17]、Breast Cancer Res Treat[18]和Nat Med[19]等雜志。在Oncomine數(shù)據(jù)庫中薈萃分析45項研究結(jié)果發(fā)現(xiàn),與正常組織相比,PYGO2基因在所有差異表達基因中其中位數(shù)值排名為1 214,并在乳腺癌組織中呈高表達(P=7.32×10-9)。
圖1 Oncomine數(shù)據(jù)庫中所有腫瘤相關(guān)研究PYGO2的表達
Oncomine數(shù)據(jù)庫中PYGO2在不同乳腺癌研究芯片數(shù)據(jù)集中的表達結(jié)果顯示,PYGO2在乳腺癌組織中的表達量顯著高于正常組織(P<0.05,F(xiàn)old change>2),見圖 3、表 1。
采用Kaplan-Meier Plotter數(shù)據(jù)庫[20]分析PYGO2表達水平與乳腺癌患者預(yù)后的關(guān)系,結(jié)果顯示PYGO2高表達組乳腺癌患者 OS(HR=0.69,95%CI:0.51~0.95,P=0.021)、RFS(HR=0.60,95%CI:0.51~0.70,P<0.001)以及 DMFS(HR=0.61,95%CI:0.43~0.87,P=0.005)均優(yōu)于低表達組,見圖4。
圖2 Oncomine數(shù)據(jù)庫中乳腺癌PYGO2基因的表達
圖3 Oncomine數(shù)據(jù)庫中不同乳腺癌研究芯片數(shù)據(jù)集PYGO2的表達
表1 PYGO2基因在不同乳腺癌研究芯片數(shù)據(jù)集中的表達情況
圖4 PYGO2基因表達與乳腺癌患者預(yù)后的關(guān)系
美國癌癥學會最新統(tǒng)計數(shù)據(jù)[21]顯示,2004~2013年女性乳腺癌發(fā)病率呈緩慢上升趨勢,從1989年到2015年,美國乳腺癌死亡率約下降了39%。有研究報道這可能得益于人類表皮生長因子受體2、血管內(nèi)皮生長因子、上皮生長因子受體等治療靶點的發(fā)現(xiàn)及靶向藥物在乳腺癌治療中的應(yīng)用[22]。然而這些靶點僅存在于部分乳腺癌患者,因此尋找乳腺癌發(fā)生發(fā)展的關(guān)鍵分子或靶點,對開發(fā)新的治療乳腺癌的靶向藥物具有重要意義。
PYGO2基因定位于1q21.3,是經(jīng)典Wnt/β-catenin信號通路的重要組成部分,可能編碼染色質(zhì)重塑蛋白,通過組蛋白甲基化發(fā)揮組蛋白密碼子的翻譯作用,促進機體正常發(fā)育[23]和激活腫瘤發(fā)生[24]的關(guān)鍵基因。PYGO2基因在多種腫瘤中的研究越來越多,但在乳腺癌中的研究相對較少。盡管有研究發(fā)現(xiàn)PYGO2基因在乳腺癌中高表達[11],但由于樣本量小,可信度較差。Oncomine數(shù)據(jù)庫是目前全球最大的基因芯片數(shù)據(jù)庫和整合數(shù)據(jù)挖掘平臺,本研究利用Oncomine數(shù)據(jù)庫分析共發(fā)現(xiàn)45項研究(包括3 730個樣本)涉及乳腺癌組織和正常組織中PYGO2表達的比較(高表達研究32項,低表達研究0項),其中3項研究結(jié)果顯示PYGO2在乳腺癌組織中的表達量高于正常組織,再次驗證了PYGO2基因在乳腺癌組織中呈高表達這一結(jié)論。進一步通過Kaplan-Meier Plotter數(shù)據(jù)庫分析發(fā)現(xiàn)PYGO2表達與乳腺癌患者的預(yù)后有關(guān),即PYGO2高表達患者的OS、RFS以及DMFS均優(yōu)于低表達者,分析原因可能為PYGO2基因是一種乳腺癌保護基因,當機體發(fā)生乳腺癌病變后其表達量升高,從而抑制腫瘤增殖、遷移或侵襲等,有利于患者的預(yù)后[25],但其具體機制仍有待進一步闡明。
綜上所述,PYGO2基因在乳腺癌組織中高表達,且與乳腺癌患者預(yù)后密切相關(guān),有望成為協(xié)助診斷乳腺癌和評估患者預(yù)后的生物標志物。本研究采用數(shù)據(jù)庫進行大樣本分析,避免樣本量過小產(chǎn)生的誤差,分析結(jié)果具有更高的可信度,但是這些數(shù)據(jù)均來自芯片檢測結(jié)果,相關(guān)結(jié)論還有待進一步驗證。