劉雅峰,魯繼斌
(中國醫(yī)科大學(xué)附屬盛京醫(yī)院胸外科,沈陽 110004)
肺癌是全球癌癥死亡的最主要原因。在我國,其發(fā)病率和死亡率亦位于惡性腫瘤之首[1]。肺腺癌屬于非小細(xì)胞肺癌,是肺癌最常見的病理類型,約占肺癌整體的40%[2]。分子靶向治療和免疫治療已經(jīng)成為肺腺癌的常規(guī)治療手段,使其預(yù)后有所改善,但我國肺癌患者總體5年生存率仍小于20%。因此,尋找預(yù)測肺癌預(yù)后的生物標(biāo)志物十分必要。
銅是生物體必需的微量元素。但當(dāng)細(xì)胞內(nèi)的銅離子濃度超過穩(wěn)態(tài)閾值時(shí),會(huì)表現(xiàn)出細(xì)胞毒性。銅死亡是一種新型細(xì)胞程序性死亡,其原理為過量的銅離子直接與三羧酸循環(huán)中的脂?;煞纸Y(jié)合,誘導(dǎo)脂酰化蛋白質(zhì)聚集和鐵硫簇蛋白質(zhì)丟失,激發(fā)蛋白質(zhì)毒性應(yīng)激,從而導(dǎo)致細(xì)胞死亡[3]。已有研究[4]表明,銅離子與腫瘤的生長、增殖和抗血管生成等密切相關(guān)。
長鏈非編碼RNA (long noncoding RNA,lncRNA)是一種長度超過200個(gè)核苷酸的非編碼RNA。許多研究[5-6]證實(shí),lncRNA可以調(diào)控肺腺癌的生物學(xué)行為,還可以作為預(yù)測肺腺癌預(yù)后等的潛在生物標(biāo)志物。本研究旨在開發(fā)新型銅死亡相關(guān)配對(duì)lncRNA的預(yù)后標(biāo)志物,以期提高預(yù)測肺腺癌患者預(yù)后的準(zhǔn)確性以及評(píng)估其藥物敏感性。
由癌癥基因組圖譜 (The Cancer Genome Atlas,TCGA) 數(shù)據(jù)庫獲取肺腺癌患者轉(zhuǎn)錄組數(shù)據(jù)、基因突變信息和對(duì)應(yīng)的臨床信息。使用Ensembl數(shù)據(jù)庫來源的注釋文件,注釋其中的lncRNA。從已有文獻(xiàn)中獲取共10個(gè)銅死亡相關(guān)基因,包括FDX1、LIAS、LIPT1、DLD、DLAT、PDHA1、PDHB、MTF1、GLS和CDKN2A。以相關(guān)系數(shù)|r|>0.4且P< 0.000 1為標(biāo)準(zhǔn)進(jìn)行Pearson相關(guān)性分析,得到銅死亡相關(guān)lncRNA (cuproptosisrelated lncRNA,crlncRNA)。使用R語言limma包,設(shè)定閾值為|log2FC|>1且P< 0.05進(jìn)行差異分析,獲得DEcrlncRNA。
對(duì)DEcrlncRNA進(jìn)行兩兩循環(huán)配對(duì)分析。根據(jù)lncRNA的相對(duì)表達(dá)水平,若lncRNA1與 lncRNA2的表達(dá)水平之比>1,標(biāo)記該配對(duì)lncRNA為1,反之記錄為0,從而構(gòu)造出包含1或0的表達(dá)矩陣。僅保留0或1在所有樣本中比率在0.2~0.8之間的配對(duì)lncRNA。
使用單因素Cox回歸分析確定與患者總生存時(shí)間 (overall survival,OS) 相關(guān)的配對(duì)DEcrlncRNA。為了防止模型過度擬合,應(yīng)用LASSO回歸分析進(jìn)行進(jìn)一步收斂。然后采用多因素Cox回歸分析,構(gòu)建風(fēng)險(xiǎn)模型并計(jì)算風(fēng)險(xiǎn)評(píng)分。根據(jù)風(fēng)險(xiǎn)評(píng)分的中位數(shù),將肺腺癌患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組。使用Kaplan-Meier生存分析驗(yàn)證高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組間患者的生存差異。此外,通過繪制受試者操作特征(receiver operating characteristic,ROC) 曲線,以曲線下面積 (area under curve,AUC) 為標(biāo)準(zhǔn),評(píng)估風(fēng)險(xiǎn)評(píng)分預(yù)測1 年、3 年和 5 年生存情況的準(zhǔn)確性。繪制風(fēng)險(xiǎn)評(píng)分與臨床參數(shù)的ROC曲線,以對(duì)比預(yù)測效能。最后,對(duì)風(fēng)險(xiǎn)評(píng)分和常見的臨床參數(shù)進(jìn)行單因素和多因素Cox回歸分析,以驗(yàn)證構(gòu)建的風(fēng)險(xiǎn)模型是否可以獨(dú)立于性別、年齡和腫瘤分期等臨床參數(shù),有效預(yù)測肺腺癌患者的預(yù)后。
應(yīng)用R語言clusterProfiler包,并基于基因本體(gene ontology,GO) 以及京都基因和基因組數(shù)據(jù)庫(Kyoto Encyclopedia of Genes and Genomes,KEGG),探索影響銅死亡風(fēng)險(xiǎn)評(píng)分高低的生物學(xué)功能機(jī)制,分析潛在通路。
為了進(jìn)一步分析不同銅死亡相關(guān)風(fēng)險(xiǎn)分組的基因突變圖景,使用R語言maftools包處理由TCGA數(shù)據(jù)庫獲取的肺腺癌患者基因突變信息,分別分析并展示高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組基因突變的頻率和特點(diǎn)。
為了更好的評(píng)估風(fēng)險(xiǎn)模型對(duì)肺腺癌患者的臨床應(yīng)用價(jià)值,使用癌癥基因組計(jì)劃數(shù)據(jù)庫來源的藥物處理信息,應(yīng)用R語言pRRophetic包評(píng)估常見肺腺癌化療藥物的半數(shù)抑制濃度 (half maximal inhibitory concentration,IC50)。比較高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組間IC50的差異。
采用R語言4.1.0版本進(jìn)行統(tǒng)計(jì)學(xué)分析。采用Pearson相關(guān)性分析評(píng)估相關(guān)系數(shù)。采用t檢驗(yàn)確定組間差異。采用Kaplan-Meier法進(jìn)行生存分析,采用對(duì)數(shù)秩檢驗(yàn)確定差異顯著性。P< 0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1.1 DEcrlncRNA的篩選:納入TCGA數(shù)據(jù)庫中臨床信息完整的481個(gè)肺腺癌樣本和59個(gè)癌旁組織樣本的轉(zhuǎn)錄組數(shù)據(jù)。提取其中的lncRNA數(shù)據(jù),與銅死亡相關(guān)基因進(jìn)行相關(guān)性分析后,共得到267個(gè)crlncRNA。crlncRNA經(jīng)差異分析后共篩選出145個(gè)DEcrlncRNA,其中上調(diào)lncRNA 74個(gè),下調(diào)lncRNA 71個(gè)。
2.1.2 配對(duì)DEcrlncRNA的確定:對(duì)145個(gè)DEcrlncRNA循環(huán)配對(duì)并計(jì)算0/1矩陣,再次篩選后得到有效配對(duì)DEcrlncRNA,共3 647對(duì)。
2.2.1 預(yù)后模型的構(gòu)建:采用單因素Cox回歸分析篩選出OS相關(guān)配對(duì)DEcrlncRNA共178個(gè),行LASSO回歸分析。之后使用逐步回歸法,得到用于構(gòu)建風(fēng)險(xiǎn)模型的6個(gè)配對(duì)DEcrlncRNA (表1)。基于以上配對(duì)DEcrlncRNA,通過多因素Cox回歸分析計(jì)算風(fēng)險(xiǎn)評(píng)分。
表1 配對(duì)DEcrlncRNA的單因素和多因素Cox回歸分析Tab.1 Univariate or multivariate Cox regression analysis of DEcrlncRNA pairs
2.2.2 預(yù)后模型的評(píng)估:Kaplan-Meier生存分析曲線提示,高風(fēng)險(xiǎn)組預(yù)后更差,進(jìn)一步證實(shí)了預(yù)后模型的有效性 (圖1A)。預(yù)后模型1年、3年和5年生存率ROC曲線的AUC范圍為0.69~0.76 (圖1B)。此外,比較預(yù)后模型與常見臨床相關(guān)因素對(duì)3年生存率的預(yù)測能力,發(fā)現(xiàn)風(fēng)險(xiǎn)評(píng)分具有最大AUC (圖1C),這些結(jié)果充分說明了預(yù)后風(fēng)險(xiǎn)模型的優(yōu)異性。對(duì)風(fēng)險(xiǎn)評(píng)分與常見臨床因素進(jìn)行單因素和多因素Cox回歸分析,結(jié)果顯示,僅風(fēng)險(xiǎn)評(píng)分和臨床分期為肺腺癌患者的獨(dú)立預(yù)后因素 (圖1D、1E),可見風(fēng)險(xiǎn)評(píng)分具有良好的預(yù)后預(yù)測價(jià)值。
圖1 預(yù)后模型的評(píng)估Fig.1 Validation of the prognostic signature
為深入探究不同風(fēng)險(xiǎn)組間潛在的生物學(xué)機(jī)制,進(jìn)行了基于高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組間差異基因的GO和KEGG分析。GO分析結(jié)果 (圖2A) 顯示,風(fēng)險(xiǎn)評(píng)分差異基因主要作用于生長因子的結(jié)合、細(xì)胞外基質(zhì)構(gòu)成和分泌顆粒等生物學(xué)過程。KEGG通路分析結(jié)果 (圖2B) 提示,差異基因主要集中于p53信號(hào)通路、腫瘤的轉(zhuǎn)錄調(diào)控通路和白細(xì)胞介素-17信號(hào)通路等。
使用基因突變?nèi)胺治?,?duì)理解基因突變層面的高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組的差別意義重大。高風(fēng)險(xiǎn)組患者基因突變頻率更高,TP53與TTN為2組患者最常見的突變基因 (圖3)。此外,多數(shù)的2組間共有基因,在低風(fēng)險(xiǎn)組中突變頻率顯著降低。COL1A1等基因突變頻率較高,僅發(fā)生于高風(fēng)險(xiǎn)組,這可能與高風(fēng)險(xiǎn)組更差的預(yù)后相關(guān)。
圖3 基因突變瀑布圖Fig.3 The waterfall plot of gene mutation
鑒于高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組間生存差異顯著,對(duì)肺腺癌患者常用的化療藥物進(jìn)行篩選、分析,以期進(jìn)一步指導(dǎo)臨床決策。比較高風(fēng)險(xiǎn)組與低風(fēng)險(xiǎn)組化療藥物的IC50,發(fā)現(xiàn)在高風(fēng)險(xiǎn)組的患者中,順鉑、紫杉醇、吉他西濱、多西他賽、長春瑞濱和依托泊苷的IC50均相對(duì)較低 (圖4)。這些結(jié)果表明,更高的風(fēng)險(xiǎn)評(píng)分與化療藥物敏感性的增加相關(guān),證實(shí)風(fēng)險(xiǎn)模型是指導(dǎo)臨床個(gè)體化治療的優(yōu)秀指標(biāo)。
圖4 藥物敏感性分析Fig.4 Drug sensitivity analysis
肺腺癌是肺癌的最常見亞型。近年來,應(yīng)用低劑量CT進(jìn)行肺癌篩查逐漸普及,顯著降低了肺腺癌的死亡率。分子靶向藥物和免疫治療不斷進(jìn)步,明顯改善了肺腺癌患者的預(yù)后。然而,肺腺癌具有異質(zhì)性,不同人群對(duì)治療的反應(yīng)程度及其生存時(shí)間有很大的差異性。此外,肺癌的總體預(yù)后仍然較差。由此可見,目前仍迫切需要開發(fā)肺腺癌相關(guān)的預(yù)后模型,發(fā)現(xiàn)新的肺腺癌治療靶點(diǎn),并探索其潛在的生物學(xué)機(jī)制。
細(xì)胞程序性死亡是最具潛力的抗腫瘤機(jī)制之一。最近,QU等[6]提出了銅死亡的概念,它是一種不同于細(xì)胞凋亡、鐵死亡和焦亡等的全新的銅依賴性細(xì)胞程序性死亡。銅死亡的發(fā)現(xiàn),進(jìn)一步豐富了抗腫瘤的潛在機(jī)制。目前已有研究[7-8]證實(shí),銅死亡相關(guān)的特征模型對(duì)肺腺癌患者預(yù)后具有預(yù)測價(jià)值或免疫治療相關(guān)性,其中部分研究[8]建立了基于lncRNA的模型??紤]到測序平臺(tái)、檢測時(shí)間和標(biāo)準(zhǔn)化處理等的差異帶來的批次效應(yīng),可能影響基于表達(dá)量進(jìn)行預(yù)后預(yù)測的準(zhǔn)確性。受既往研究[9]啟發(fā),本研究采用一種新算法,即根據(jù)lncRNA相對(duì)表達(dá)量而非具體的表達(dá)量,來構(gòu)建預(yù)后模型。這種模型既削弱了批次效應(yīng),還可以利用如免疫組織化學(xué)、PCR、轉(zhuǎn)錄組數(shù)據(jù)和基因芯片等各種來源的lncRNA表達(dá)量數(shù)據(jù),具有較高的臨床應(yīng)用價(jià)值。
本研究中,預(yù)后風(fēng)險(xiǎn)模型共包含10個(gè)lncRNA(基于6個(gè)配對(duì)DEcrlncRNA),其中5個(gè)lncRNA已被證實(shí)與肺腺癌或其他腫瘤的發(fā)生、發(fā)展和預(yù)后密切相關(guān)。研究[10]證實(shí),OGFRP1通過干擾miR-124-3p進(jìn)而上調(diào)LYPD3表達(dá)來促進(jìn)非小細(xì)胞肺癌進(jìn)展。LIU等[11]發(fā)現(xiàn),OGFRP1還可通過miR-4640-5p/eIF5A 軸在肺腺癌中發(fā)揮癌基因作用。CARD8-AS1表達(dá)量降低與肺腺癌較差的預(yù)后相關(guān),其機(jī)制可能是CARD8-AS1下調(diào)后,通過靶向miR-650進(jìn)而下調(diào)Bax表達(dá)實(shí)現(xiàn)[12]。JIAO等[13]證明,TDRKH-AS1還可通過激活Wnt/β-catenin信號(hào)通路促進(jìn)結(jié)直腸癌細(xì)胞的增殖和侵襲,且其與結(jié)直腸癌預(yù)后呈負(fù)相關(guān)。LINC02518和AC026401.3被證實(shí)與肝細(xì)胞癌預(yù)后呈負(fù)相關(guān)[14-15],其中AC026401.3通過與OCT1相互作用來增加E2F2的轉(zhuǎn)錄,以此增強(qiáng)肝細(xì)胞癌對(duì)索拉非尼和侖伐替尼的耐藥性。以上研究為構(gòu)建的模型提供了理論支持。
本研究存在一定的局限性。首先,本研究為回顧性研究,未來需要多中心前瞻性的真實(shí)世界臨床數(shù)據(jù)來進(jìn)一步證實(shí)結(jié)論。其次,本研究僅采用來自于TCGA數(shù)據(jù)庫的轉(zhuǎn)錄組數(shù)據(jù),需要更多的實(shí)驗(yàn)數(shù)據(jù)來探究以上lncRNA 調(diào)節(jié)銅死亡和影響銅死亡等方面的潛在機(jī)制,以進(jìn)一步支持這些結(jié)論。最后,受臨床數(shù)據(jù)和藥物數(shù)據(jù)庫所限,本研究僅能分析部分肺腺癌常用化療藥物 (如順鉑、紫杉醇和依托泊苷等) 的IC50,缺乏對(duì)靶向藥和免疫治療藥物敏感性的分析數(shù)據(jù)。
綜上所述,本研究確立了一種由配對(duì)DEcrlncRNA構(gòu)建的新模型,它可以有效預(yù)測肺腺癌患者的預(yù)后情況,不受lncRNA精確表達(dá)量和數(shù)據(jù)來源的限制,并且有助于預(yù)測治療敏感性,這可能有利于篩選出相應(yīng)的潛在受益人群。