劉穎方子晗張雅琴王可,3
1 廣州市第一人民醫(yī)院(廣州 510180) 2 湖北文理學(xué)院基礎(chǔ)醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室(襄陽441053) 3 湖北文理學(xué)院附屬襄陽市中心醫(yī)院,臨床循證與轉(zhuǎn)化醫(yī)學(xué)中心(襄陽441053)
肺癌是世界上最常見的癌癥,也是癌癥死亡的最常見原因[1]。作為肺癌的主要類型之一,非小細(xì)胞肺癌約占肺癌病例的85%,非小細(xì)胞肺癌以肺腺癌居多[2]。目前因早期診斷工具及常見的腫瘤標(biāo)志物對(duì)非小細(xì)胞肺癌不敏感,導(dǎo)致肺腺癌預(yù)后相對(duì)較差,5年生存率不足15%[3-4]。因此,為提升肺腺癌病人的預(yù)后生活質(zhì)量,探索與肺腺癌有關(guān)的生物標(biāo)志物尤為重要。
表觀遺傳學(xué)改變與肺癌發(fā)病、病程加快相關(guān),DNA甲基化(DNA methylation)是導(dǎo)致表觀遺傳學(xué)改變的關(guān)鍵因素,在細(xì)胞功能調(diào)控和癌變過程中占據(jù)重要作用[5-7]。研究表明,DNA甲基化通過調(diào)控lncRNA的表達(dá)從而影響肺癌的預(yù)后[8]。腫瘤基因組圖譜(the cancer genome atlas,TCGA)含有大量腫瘤信息,為研究不同腫瘤共性、突變性、差異性情況提供機(jī)會(huì)[9]。本文從TCGA中選取肺腺癌甲基化數(shù)據(jù),篩選與其預(yù)后相關(guān)甲基化位點(diǎn),并評(píng)估肺腺癌病人預(yù)后情況,初步探索DNA甲基化在肺腺癌發(fā)生發(fā)展中的作用。
本研究使用TCGA數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)對(duì)數(shù)據(jù)進(jìn)行篩選,包括肺腺癌mRNA表達(dá)數(shù)據(jù)、甲基化數(shù)據(jù)和臨床預(yù)后數(shù)據(jù)。2019年10月本研究在TCGA數(shù)據(jù)庫下載肺腺癌mRNA表達(dá)數(shù)據(jù)和甲基化數(shù)據(jù),其中具有癌組織和癌旁組織甲基化信息數(shù)據(jù)的合計(jì)26例,具有癌組織和癌旁組織mRNA表達(dá)數(shù)據(jù)的患者合計(jì)56例。經(jīng)過數(shù)據(jù)連接處理后,具有癌組織甲基化芯片數(shù)據(jù)和mRNA表達(dá)數(shù)據(jù)的病人合計(jì)455例,具有臨床預(yù)后信息和癌組織甲基化芯片數(shù)據(jù)的患者合計(jì)418例。
在對(duì)組學(xué)數(shù)據(jù)進(jìn)行預(yù)處理后,篩選差異性甲基化位點(diǎn)和差異性mRNA表達(dá)的基因(錯(cuò)誤發(fā)現(xiàn)率(false discovery rate, FDR)<0.05且差異倍數(shù)(fold change)>2或<0.5),并選擇甲基化、mRNA表達(dá)水平具有顯著性關(guān)聯(lián)的甲基化位點(diǎn)進(jìn)行后續(xù)分析(P<0.05且R2>0.2)。共篩選出158個(gè)差異性甲基化位點(diǎn)。
將418例肺腺癌病人隨機(jī)分成兩組,一組為探索人群(251人,60%),一組為驗(yàn)證人群(167人,40%)。在探索人群中采用最小絕對(duì)收斂和選擇算子(Least absolute shrinkage and selection operator, LASSO)篩選對(duì)肺腺癌風(fēng)險(xiǎn)有影響的甲基化位點(diǎn),并在驗(yàn)證人群中對(duì)前期篩選出的甲基化位點(diǎn)進(jìn)行結(jié)論驗(yàn)證。
線性相關(guān)方法用于分析甲基化位點(diǎn)甲基化水平、肺腺癌之間的關(guān)聯(lián)性,非條件Logistic回歸模型評(píng)估甲基化位點(diǎn)與肺腺癌預(yù)后的關(guān)系。同時(shí)運(yùn)用受試者工作特征曲線(receiver operating characteristic curve,ROC)分析評(píng)估甲基化位點(diǎn)對(duì)肺腺癌風(fēng)險(xiǎn)的預(yù)測(cè)效果。
應(yīng)用GraPad Prism 5、SAS 9.4軟件、R 3.3.0軟件開展數(shù)據(jù)分析和繪圖。t檢驗(yàn)比較兩樣本均數(shù)差異,P<0.05為有統(tǒng)計(jì)學(xué)差異。
圖1 本研究數(shù)據(jù)篩選流程圖
符合條件的肺腺癌病人共有418例。研究人群平均年齡(65.10±10.14)歲,術(shù)后化療病人152人(36.4%)、放療病人88人(21.1%),在隨訪結(jié)束時(shí)有102人死亡,占比24.4%。
將418例肺腺癌病人隨機(jī)分成兩組,一組為探索人群(251人,60%),一組為驗(yàn)證人群(167人,40%)。在對(duì)數(shù)據(jù)進(jìn)行預(yù)處理后,根據(jù)篩選標(biāo)準(zhǔn),最后共有158個(gè)甲基化位點(diǎn)在癌和癌旁組織中具有顯著差異且與其所在基因mRNA表達(dá)顯著相關(guān)。圖2展示了使用LASSO回歸的分析結(jié)果,當(dāng)模型最優(yōu)時(shí),僅有cg19378330甲基化位點(diǎn)納入模型。cg19378330在TCGA數(shù)據(jù)庫的注釋信息顯示其所在基因?yàn)锳BCC2。
圖2 LASSO回歸篩選與肺腺癌預(yù)后有關(guān)的甲基化位點(diǎn)
圖3 56例肺腺癌病例的癌組織和癌旁組織中前50個(gè)差異表達(dá)基因熱圖情況
圖3為前50個(gè)顯著性差異甲基化位點(diǎn)和基因無監(jiān)督聚類分析,結(jié)果顯示在肺腺癌病人的癌和癌旁組織中,甲基化位點(diǎn)的甲基化水平及所在基因mRNA表達(dá)水平有較大差異?;騁O(Gene ontology)富集性分析顯示,基因可以被分為23個(gè)功能聚類,其中有13個(gè)P<0.05的GO功能分類。主要參與G蛋白偶聯(lián)受體介導(dǎo)的信號(hào)通路、細(xì)胞生長(zhǎng)負(fù)調(diào)控蛋白等蛋白調(diào)控功能,膜的生物發(fā)生、膜筏組織調(diào)控等細(xì)胞相關(guān)功能,以及影響粘著斑結(jié)構(gòu)功能等生物學(xué)過程(圖4)。
圖4 前50個(gè)差異甲基化位點(diǎn)基因GO分析結(jié)果
甲基化位點(diǎn)cg19378330的甲基化水平對(duì)肺腺癌死亡風(fēng)險(xiǎn)的影響見表1和表2。結(jié)果顯示,在探索階段人群中,位點(diǎn)cg19378330甲基化水平增加,肺腺癌死亡風(fēng)險(xiǎn)增高(OR=9.82, 95%CI=1.84~52.48)。甲基化位點(diǎn)水平高于中位數(shù)的患者,歸入高風(fēng)險(xiǎn)組,甲基化位點(diǎn)低于中位數(shù)的為低風(fēng)險(xiǎn)組。結(jié)果發(fā)現(xiàn)與低風(fēng)險(xiǎn)組相比,高風(fēng)險(xiǎn)組的死亡風(fēng)險(xiǎn)比低風(fēng)險(xiǎn)組增加了38%(OR=1.38, 95%CI=1.16~2.69)。在驗(yàn)證人群中表現(xiàn)出相似結(jié)果。
表1 甲基化位點(diǎn)cg19378330的甲基化水平與肺腺癌之間的關(guān)系(探索人群)
表2 甲基化位點(diǎn)cg19378330的甲基化水平與肺腺癌之間的關(guān)系(驗(yàn)證人群)
采用ROC曲線分析評(píng)估甲基化位點(diǎn)cg19378330對(duì)肺腺癌風(fēng)險(xiǎn)的預(yù)測(cè)效果結(jié)果顯示,在探索階段人群中其ROC曲線下面積(area under the curve,AUC)的結(jié)果為0.80(0.73~0.88),靈敏度為86.2%。在驗(yàn)證人群中,甲基化位點(diǎn)cg19378330的甲基化水平與肺腺癌風(fēng)險(xiǎn)之間的關(guān)系更為顯著(表2)。與低風(fēng)險(xiǎn)組肺腺癌病人相比,高風(fēng)險(xiǎn)組病人的風(fēng)險(xiǎn)明顯增加(OR=3.62, 95%CI=1.53~8.56)。ROC曲線分析顯示AUC為0.81(0.73~0.89),靈敏度為90.1%。甲基化位點(diǎn)cg19378330與其所在基因ABCC2 mRNA表達(dá)水平之間的關(guān)系見圖5。上述研究結(jié)果表明,甲基化位點(diǎn)cg19378330與肺腺癌具有較顯著的關(guān)聯(lián)性,且可以對(duì)肺腺癌的風(fēng)險(xiǎn)進(jìn)行有效的預(yù)測(cè)。
圖5 肺腺癌病人癌組織、癌旁組織中甲基化和基因mRNA表達(dá)水平
本文利用TCGA公共數(shù)據(jù)庫中肺腺癌有關(guān)數(shù)據(jù),篩選出1個(gè)甲基化位點(diǎn)(cg19378330)與肺腺癌風(fēng)險(xiǎn)相關(guān)。依據(jù)甲基化位點(diǎn)中位數(shù)進(jìn)行分組,高于甲基化位點(diǎn)水平中位數(shù)的,歸入高風(fēng)險(xiǎn)組,低于甲基化位點(diǎn)中位數(shù)的為低風(fēng)險(xiǎn)組,高風(fēng)險(xiǎn)組死亡風(fēng)險(xiǎn)是低風(fēng)險(xiǎn)組的1.38倍。采用ROC曲線分析評(píng)估甲基化位點(diǎn)cg19378330對(duì)肺腺癌風(fēng)險(xiǎn)的預(yù)測(cè)效果結(jié)果顯示,AUC為0.80,靈敏度為86.2%。且在驗(yàn)證人群中表現(xiàn)出類似結(jié)果。提示甲基化位點(diǎn)cg19378330與肺腺癌具有較顯著的關(guān)聯(lián)性,且可以對(duì)肺腺癌的風(fēng)險(xiǎn)進(jìn)行有效的預(yù)測(cè)。
cg19378330位于10號(hào)染色體99840130-99840469的CpG島序列,為基因ABCC2的gene body區(qū)。ABCC2全稱為三磷酸腺苷結(jié)合盒轉(zhuǎn)運(yùn)體C2(ATP-binding cassette transporters C2, ABCC2),是一種屬于ABC轉(zhuǎn)運(yùn)體C亞家族的膜轉(zhuǎn)運(yùn)蛋白[10, 11]。ABCC2可以激活三磷酸腺苷酶,在水解ATP獲取能量后將底物泵出,因此在藥物吸收、分布、排泄過程中發(fā)揮重要作用[12]。同時(shí),ABCC2基因在人體內(nèi)存在著遺傳變異現(xiàn)象,其多態(tài)性可影響腫瘤細(xì)胞編碼蛋白的表達(dá)和功能[13]。有研究結(jié)果顯示,ABCC2的基因過表達(dá)及變異情況可以作為預(yù)測(cè)非小細(xì)胞肺癌預(yù)后情況的有效生物標(biāo)志物,且ABCC2的基因表達(dá)水平與非小細(xì)胞肺癌病人的化療效果有關(guān)[14-15]。非小細(xì)胞肺癌最常使用鉑類化療,ABCC2蛋白轉(zhuǎn)移鉑類藥物與還原型谷胱甘肽的結(jié)合物,降低細(xì)胞內(nèi)藥物濃度從而使非小細(xì)胞肺癌病人產(chǎn)生耐藥,影響化療效果[16-18]。在肺腺癌病人中,cg19378330位點(diǎn)顯示為高甲基化狀態(tài),且與基因ABCC2的表達(dá)相關(guān),結(jié)果表明cg19378330可能通過調(diào)節(jié)自身甲基化狀態(tài)從而影響ABCC2基因的表達(dá),進(jìn)而影響肺腺癌的發(fā)病及預(yù)后。
本研究具有一定的創(chuàng)新性和科學(xué)價(jià)值。第一,在TCGA數(shù)據(jù)庫選擇有顯著性差異的與肺腺癌風(fēng)險(xiǎn)相關(guān)的甲基化位點(diǎn)cg19378330,提出甲基化水平改變與肺腺癌風(fēng)險(xiǎn)之間存在潛在關(guān)聯(lián)的研究假設(shè),國內(nèi)外未見此甲基化位點(diǎn)的類似報(bào)道;第二,通過對(duì)公共組學(xué)數(shù)據(jù)庫進(jìn)行挖掘,證明甲基化位點(diǎn)與肺腺癌預(yù)后風(fēng)險(xiǎn)的評(píng)估效果,研究結(jié)論可以為腫瘤的個(gè)性化治療提供新的探索方向。
綜上所述,通過TCGA數(shù)據(jù)庫挖掘,篩選出肺腺癌相關(guān)的特異性甲基化位點(diǎn)cg19378330,且甲基化位點(diǎn)cg19378330對(duì)肺腺癌病人的預(yù)后有較好預(yù)測(cè)價(jià)值,為肺腺癌預(yù)后提供更多可供選擇的標(biāo)志物。