李瑋瑋,朱 瑩
(1.惠州衛(wèi)生職業(yè)技術學院醫(yī)學技術系,廣東惠州 516025;2.南方醫(yī)科大學附屬東莞人民醫(yī)院病理科,廣東 東莞 523059)
乳腺癌是女性常見惡性腫瘤之一,占女性新發(fā)腫瘤的30%[1]。早期診斷和精準治療策略雖然極大的改善了乳腺癌患者的整體預后,但在女性腫瘤患者中,乳腺癌死亡率仍排名第二[1]。乳腺癌具有獨特的分子病理學特征,其中雌激素受體(estrogen receptor,ER)、孕激素受體(progesterone receptor,PR)、人類表皮生長因子受體2(human epidermal growth factor receptor-2,HER-2)、Ki67 已為乳腺癌亞分類、患者精準診療和預后評估提供了重要的信息,大大降低了患者的死亡率[2]。然而,鑒于腫瘤復發(fā)、轉(zhuǎn)移的出現(xiàn)以及精準治療的迫切性,探尋新的生物標志物成為當前乳腺癌研究的主要方向之一。
MYB 家族包括MYB(C-Myb)、MYBL1(A-Myb)和MYBL2(B-Myb),每個家族成員識別共同的DNA 基序激活下游基因表達,發(fā)揮重要的轉(zhuǎn)錄調(diào)控功能,但它們參與的調(diào)控機制和生物學功能卻有所區(qū)分[3-5]。創(chuàng)始者成員MYB是一種參與細胞增殖、分化的重要轉(zhuǎn)錄因子,它通過基因擴增、染色體易位、轉(zhuǎn)錄活性增加等方式異常表達,調(diào)控細胞增殖、分化、凋亡、DNA損傷等生物學功能,發(fā)揮致癌作用[4,6-8],促進乳腺癌[6]、結直腸癌[9]、白血病[10]等惡性腫瘤發(fā)生發(fā)展。MYBL1通過基因重排形成融合基因(如MYBL1-NFIB)[7]或通過基因負調(diào)控片段(C-端結構域)缺失的方式異常表達[11],促進乳腺腺樣囊性癌[7]、兒童彌漫性低級別膠質(zhì)瘤[11]和淋巴細胞白血病[12]的發(fā)生和發(fā)展。MYBL2 是腫瘤細胞周期進展、細胞存活和上皮細胞-間充質(zhì)轉(zhuǎn)化(epithelial-mesenchymal transition,EMT)的中心調(diào)控因子,影響細胞增殖、耐藥性以及腫瘤轉(zhuǎn)移等生物功能[5],其過表達常常與乳腺癌[5,13]、肺癌[14]、肝癌[15]等腫瘤不良預后相關。
近年來,基于大型數(shù)據(jù)庫分析生物標志物已被腫瘤研究領域廣泛接受。盡管MYB家族在腫瘤發(fā)生發(fā)展過程中發(fā)揮重要作用,但每個家族成員在乳腺癌中的臨床價值仍未得到充分闡明。因此,本研究通過多個數(shù)據(jù)平臺綜合分析MYB家族在乳腺癌中的表達及預后價值,探究其對乳腺癌轉(zhuǎn)移復發(fā)的臨床意義。
Oncomine包含多種大型腫瘤基因芯片數(shù)據(jù)庫,用于分析多種腫瘤中基因轉(zhuǎn)錄水平變化(http://www.oncomine.org)[16]。本研究利用該數(shù)據(jù)庫對MYB 家族成員在乳腺癌和正常乳腺中的表達進行比較。以改變倍數(shù)閾值>1.5,P<0.05被認為差異具有統(tǒng)計學意義。
基因表達譜數(shù)據(jù)動態(tài)分析(gene expression profiling interactive analysis 2,GEPIA2)數(shù)據(jù)庫由北京大學研發(fā),用于分析腫瘤基因組圖譜(The Cancer Genome Atlas,TCGA)和基因型-組織表達(genotypetissues expression,GTEx)數(shù)據(jù)庫中不同腫瘤和正常組織樣本中的基因mRNA 表達(http://gepia2.cancer-pku.cn)[17]。本研究用于分析MYB家族基因在浸潤性乳腺癌(breast invasive carcinoma,BRCA)和正常乳腺組織中的表達。
TCGA 數(shù)據(jù)庫(https://cancergenome.nih.gov/)從分子水平上描述了2萬多例原發(fā)性腫瘤,并匹配了33種腫瘤對應的正常樣本,包含測序數(shù)據(jù)和臨床樣本數(shù)據(jù)[18]。cBioPortal(https://www.cbioportal.org/)通過多功能可視化分析腫瘤樣本研究基因組數(shù)據(jù),實現(xiàn)復雜的腫瘤基因組和臨床特征的整合分析[19]。本研究利用該平臺BRCA數(shù)據(jù)庫(TCGA,F(xiàn)irehose Legacy)中1 108例患者的基因表達信息,其中含有突變、拷貝數(shù)變異和mRNA 表達數(shù)據(jù)的樣本量960 例,用于進一步分析MYB 家族基因變異情況和篩選MYB 家族的共表達基因(co-expression genes)。設置Spearman 相關系數(shù)|R|≥0.6為共表達基因的篩選條件。
乳腺癌基因表達數(shù)據(jù)挖掘工具(Breast Cancer Gene-Expression Miner v4.4,bc-GenExMiner v4.4,http://bcgenex.centregauducheau.fr/BC-GEM)是一種乳腺癌基因表達數(shù)據(jù)挖掘工具,于2019 年12 月進行數(shù)據(jù)更新[20-21]。它被用于分析MYB 家族基因的mRNA 表達水平與多項臨床病理參數(shù)之間的關系、Cox 分析和無轉(zhuǎn)移復發(fā)生存(metastatic relapse-free survival,MRFS)的預后評估。
用Kaplan-Meier Plotter(https://kmplot.com/analysis/)[22]在線分析3 951名乳腺癌患者中MYB家族基因表達的無復發(fā)生存(relapse-free survival,RFS)和進展后生存(post progression survival,PPS)的預后價值。分別根據(jù)MYB家族基因中位表達水平將乳腺癌患者分為高表達和低表達兩組,選擇Jet Set 最佳探針集[23],Kaplan-Meier曲線評價RFS和PPS預后。
DAVID[24](https://david.ncifcrf.gov/)是一個整合生物信息數(shù)據(jù)庫,可提供大規(guī)?;蚧虻鞍琢斜硐到y(tǒng)綜合的生物功能注釋信息。采用DAVID 進行MYBL2共表達基因GO(gene ontology)功能分析和KEGG(Kyoto Encyclopedia of Gene and Genomes)信號通路的富集分析。
Oncomine 分析P值和兩組計量數(shù)據(jù)比較采用Student'st檢驗。利用GraphPad Prism 8 軟件繪圖。bc-GenExMiner v4.4 分析數(shù)據(jù)采用Welch 檢驗、事后Dunnett-Tukey-Kramer 檢驗、單因素和多因素Cox 分析。以P<0.05表示差異有統(tǒng)計學意義。
Oncomine 分析結果顯示,在乳腺癌、結直腸癌、胃癌等多個數(shù)據(jù)集中,其腫瘤組織的MYB家族基因表達高于相應正常組織,見圖1。其中,MYB、MYBL1和MYBL2分別在17個、14個和15個數(shù)據(jù)集的乳腺癌組織中表達高于正常乳腺組織,差異具有統(tǒng)計學意義(P<0.05,圖1)。同時,MYB 家族基因在不同乳腺癌類型中呈現(xiàn)出高表達,如浸潤性導管癌、浸潤性小葉癌和乳腺小管癌等,見表1。此外,利用GEPIA2分析結果顯示,1 085 例浸潤性乳腺癌組織中MYB 和MYBL2 mRNA表達高于291例正常乳腺組織,差異具有統(tǒng)計學意義(P<0.01,圖2A和2C),而MYBL1 mRNA表達的差異不明顯(圖2B)。
基于cBioPortal 分析乳腺癌數(shù)據(jù)集(TCGA,F(xiàn)irehose Legacy),結果顯示,其中960 例乳腺癌患者(microarray數(shù)據(jù))中MYB家族基因發(fā)生變異率為24.79%(238/960,圖3A)。MYB基因表達變異率為7.92%,其中mRNA 低表達占4.17%(40 例);MYBL1基因表達變異率為16.04%,主要表現(xiàn)為基因擴增(占7.29%,70例)和mRNA 高表達(占6.35%,61 例);MYBL2基因表達變異率為7.08%,主要表現(xiàn)為mRNA 高表達(占3.85%,37 例)(圖3A,表2)。MYB、MYBL1和MYBL2基因在乳腺癌組織中突變率低,分別為1.15%、0.31%和0.42%(表2)。進一步分析基因拷貝數(shù)變異(copynumber variation,CNV)與mRNA表達的關系,結果顯示隨著MYB家族基因CNV不斷增加(二倍體<輕度增加<擴增),MYB mRNA 水平并未逐漸升高(圖3B),而MYBL1 和MYBL2 mRNA 表達不斷升高,差異具有統(tǒng)計學意義(P<0.01,圖3C和3D)。
圖1 MYB家族基因在多種腫瘤中的表達水平(Oncomine數(shù)據(jù)庫)
使用bcGenExMiner v4.4 在線分析MYB 家族基因mRNA 表達與乳腺癌患者不同臨床病理特征的相關性(表3)。結果表明,高齡患者組(>51 歲)MYB mRNA 表達升高,而MYBL1和MYBL2的表達降低(P<0.01)。淋巴結轉(zhuǎn)移陽性患者組中的MYBL2 表達升高(P=0.002),但MYB 和MYBL1 的表達無明顯差異。ER+、PR+患者組中,MYB 表達升高(P<0.01),而HER-2+、三陰性乳腺癌(triple negative breast cancer,TNBC)、基底細胞樣乳腺癌(basal-like breast carcinoma,BLBC)和P53 突變?nèi)橄侔┗颊咧?,MYB 表達降低(P<0.01)。MYBL1 在ER+、PR+、HER-2+乳腺癌患者組中表達降低,但其在TNBC、BLBC 和P53 突變?nèi)橄侔┗颊呓M中表達升高(P<0.01)。與MYB結果完全相反,MYBL2在ER+、PR+患者組中表達下降,而在HER-2+、TNBC、BLBC 和P53 突變?nèi)橄侔┗颊呓M中表達升高(P<0.001)。此外,Scarff-Bloom-Richardson(SBR)分級越高,乳腺癌患者MYB 表達水平越低(P<0.01,圖4A),而MYBL1 和MYBL2 表達逐漸升高(P<0.01,圖4B 和4C)。
表1 Oncomine數(shù)據(jù)庫分析MYB家族在不同乳腺癌類型中表達的差異
圖2 MYB家族在BRCA和正常乳腺組織中的mRNA表達差異(GEPIA2)
表2 浸潤性乳腺癌中MYB家族基因變異類型分析
Kaplan-Meier Plotter 在線分析結果顯示,MYB 家族成員mRNA表達與乳腺癌患者的無復發(fā)生存(RFS)相關(P<0.01)。其中,MYB高表達乳腺癌患者的RFS 比其低表達患者的RFS 更長(圖5A)。而MYBL1和MYBL2高表達的乳腺癌患者RFS 顯著縮短(圖5B 和5C)。進一步分析MYB 家族基因表達與乳腺癌患者進展后生存(PPS)的相關性,結果顯示:MYB低表達和MYBL2高表達乳腺癌患者PPS 顯著縮短(圖5D 和5F),而MYBL1 表達與乳腺癌患者PPS 無明顯相關關系(圖5E)。此外,利用bc-GenExMiner v4.4 進行單因素Cox分析在轉(zhuǎn)移復發(fā)乳腺癌患者中,不同淋巴結狀態(tài)(N,nodal status)和ER 狀態(tài)下,MYB 家族基因表達與預后的關系見表4。結果顯示,在混合表達狀態(tài)Nm/ERm或N+/ERm(mixed expression status,m)的轉(zhuǎn)移復發(fā)乳腺癌患者中,MYB高表達患者預后好(P<0.01);在Nm/ER+或N-/ER+的轉(zhuǎn)移復發(fā)乳腺癌患者中,MYBL1高表達患者預后差(P<0.05);而在不同淋巴結狀態(tài)下,ERm或ER+的轉(zhuǎn)移復發(fā)乳腺癌患者中,MYBL2高表達患者預后 差(P<0.01)。同 時,MYB表 達 降 低、MYBL1和MYBL2表達升高的乳腺癌患者均具有較短的無轉(zhuǎn)移復發(fā)生存(MRFS)(P<0.01,圖6)。但與乳腺癌經(jīng)典預后指標諾丁漢預后指數(shù)(Nottingham prognostic index,NPI)和增殖評分進行Cox多因素分析發(fā)現(xiàn),僅MYBL2能作為乳腺癌轉(zhuǎn)移復發(fā)的獨立預后因子(P<0.05,表5)。
圖3 浸潤性乳腺癌中MYB家族基因變異分析(cBioPortal)
表3 bc-GenExMiner DNA 微陣列數(shù)據(jù)庫分析MYB家族表達與乳腺癌患者臨床病理特征的關系
使用cBioPortal 在線分析BRCA 數(shù)據(jù)集(TCGA,F(xiàn)irehose Legacy)中MYB 家族共表達基因,獲得MYB共表達基因21 個,MYBL1共表達基因6 個,MYBL2共表達基因251個。隨后利用DAVID對MYBL2共表達基因進行GO 功能注釋和KEGG 通路富集分析。GO 結果顯示,MYBL2共表達基因主要參與細胞分裂、有絲分裂核分裂、細胞核質(zhì)成分、蛋白結合、DNA復制等生物功能(圖7A)。KEGG 結果顯示,MYBL2共表達基因主要影響細胞周期信號通路(圖7B)。
圖4 MYB家族mRNA表達水平與乳腺癌患者SBR分級的關系(bc-GenExMiner v4.4 database)
圖5 MYB家族基因表達與乳腺癌患者無復發(fā)生存期(RFS)和進展后生存期(PPS)的關系(Kaplan Meier-plotter數(shù)據(jù)庫)
圖6 MYB家族基因表達與乳腺癌患者無轉(zhuǎn)移復發(fā)生存(MRFS)的關系(bc-GenExMiner v4.4數(shù)據(jù)庫)
MYB家族是介導多種腫瘤發(fā)生發(fā)展的重要轉(zhuǎn)錄調(diào)控因子家族,它們通過調(diào)控腫瘤細胞增殖、凋亡、遷移和侵襲等生物學過程,促進腫瘤惡性轉(zhuǎn)化,具有典型的癌基因特征[4-5,7,11]。隨著MYB家族在腫瘤研究中的不斷深入,MYB家族及其相互作用蛋白、下游靶基因被認為是潛在的治療靶點[4-5,28]。因此,在本研究中我們首次利用生物信息學方法,對MYB家族成員在乳腺癌中的表達和預后價值進行全面的分析,以期為乳腺癌發(fā)病機制和精準診療提供有價值的信息。
表4 bc-GenExMiner DNA 微陣列數(shù)據(jù)庫中轉(zhuǎn)移復發(fā)性乳腺癌的MYB家族單因素Cox分析
表5 MYB家族表達與NPI和增殖指數(shù)Cox分析
圖7 乳腺癌中MYBL2共表達基因GO和KEGG富集分析(DAVID)
本研究結果顯示MYB家族成員在乳腺癌組織中表達高于正常乳腺組織。MYB 家族主要通過基因擴增(MYBL1)、mRNA 轉(zhuǎn)錄增強(MYBL1、MYBL2)或減弱(MYB)方式,導致家族成員在乳腺癌中的異常表達。同時,MYB家族與乳腺癌分子分型相關。其中,MYB在ER+乳腺癌患者中表達升高,而在TNBC、BLBC 和P53突變?nèi)橄侔┗颊咧斜磉_降低,提示MYB高表達的乳腺癌患者腫瘤惡性程度較低。研究表明,MYB表達與ER+密切相關[29]。在ER+乳腺癌細胞中,ER 與雌激素結合, 募集正性轉(zhuǎn)錄延長因子b(positive transcription elongation factor b,PTEFB),磷酸化RNA聚合酶II,促進MYB的轉(zhuǎn)錄活化[28-29]。因此,MYB 是雌激素/ER信號傳導的效應因子,也是ER+細胞增殖和乳腺癌形成的必要因子[30]。與MYB結果相反,MYBL1和MYBL2在惡性程度較高的TNBC、BLBC和P53突變的乳腺癌中表達升高,并且MYBL2表達與淋巴結轉(zhuǎn)移相關,進一步提示MYBL2 高表達的乳腺癌更具侵襲性。MYBL2 作為乳腺癌21 基因復發(fā)評分(21-gene recurrence score,RS)的細胞增殖指標之一,主要反映腫瘤細胞的生物學特性[31]。此外,MYBL2在TP53突變腫瘤中表達異常升高[32]。TP53 的突變造成p53-p21-DREAM復合物(Dimerization partner,RB-like proteins,E2Fs and MuvB core)對MYBL2轉(zhuǎn)錄抑制作用減弱,MYBL2 表達增強,克服了由于DNA 損傷等細胞應激條件下的細胞周期檢驗點阻滯,促進腫瘤細胞周期進展和細胞存活[33-34]。同時,MYBL2 通過干擾DREAM復合物的裝配,并與MuvB (multi-vulva class B proteins)核心復合物相互作用形成更多的MMB(Myb-MuvB)復合物,促進有絲分裂基因轉(zhuǎn)錄,導致腫瘤細胞周期基因表達程序失調(diào)[33]。
雖然乳腺癌診斷和治療水平不斷提高,但患者轉(zhuǎn)移復發(fā)的風險依然很高,且大多數(shù)乳腺癌患者的死亡歸因于腫瘤轉(zhuǎn)移[35]。本研究分析結果顯示MYB低表達、MYBL1和MYBL2高表達乳腺癌患者RFS 縮短,患者轉(zhuǎn)移復發(fā)風險增加。MYB 低表達和MYBL2 高表達乳腺癌患者PPS 縮短,預后較差。通過進一步單因素和多因素校正分析,我們發(fā)現(xiàn)MYBL2能作為乳腺癌患者MRFS 的獨立預后因子。Dedi?等[13]通過免疫組化分析證實MYBL2表達水平對乳腺癌患者總生存(OS)和無病生存(DFS)預后有顯著影響,可作為獨立預后因素。此外,MYBL2 在乳腺癌細胞中通過SNAIL 介導EMT 轉(zhuǎn)化和細胞侵襲,加速乳腺癌細胞轉(zhuǎn)移[36]。MYBL1在乳腺癌中尚缺乏系統(tǒng)研究,但在乳腺腺樣囊性癌中,MYB和MYBL1通過基因重排,形成MYBNFIB、MYBL1-NFIB融合基因,成為這種特殊類型乳腺癌的致癌驅(qū)動因子和診斷指標[7-8]。
研究表明,MYBL2主要在G1晚期和S期表達,是參與細胞周期進展的重要調(diào)控因子[33]。在乳腺癌細胞中,由于基因擴增或轉(zhuǎn)錄調(diào)控異常導致MYBL2 高表達,形成的MMB 復合物直接轉(zhuǎn)錄調(diào)控中心紡錘體蛋白和有絲分裂驅(qū)動蛋白基因,促進腫瘤細胞增殖和細胞存活[37]。同時,我們分析乳腺癌中MYBL2共表達基因,這些基因主要富集于細胞核質(zhì)和染色體著絲粒細胞成分,發(fā)揮蛋白結合分子功能,影響DNA復制、細胞周期G1/S轉(zhuǎn)化、有絲分裂等生物過程和細胞周期相關信號通路。
綜上所述,通過多平臺數(shù)據(jù)整合分析MYB家族成員在乳腺癌中的表達和預后價值,我們認為乳腺癌具有典型的“MYB家族依賴型腫瘤”特征。MYB家族成員在乳腺癌中異常表達,與乳腺癌分子分型相關。MYB低表達、MYBL1和MYBL2高表達患者乳腺癌復發(fā)、轉(zhuǎn)移風險增加,預后差。這些結果揭示了MYB家族在乳腺癌惡性轉(zhuǎn)化中起著重要的作用。MYBL2主要通過調(diào)控細胞周期促進乳腺癌細胞增殖,可作為乳腺癌潛在有效的診斷、預后預測的生物標志物。這些認識和發(fā)現(xiàn)將為臨床乳腺癌患者的管理提供參考,也為后續(xù)深入開展分子機制研究和藥物開發(fā)提供依據(jù)和方向。