張競(jìng)飛,李 玲,秦 漢,蔡 圳*
(1濱州醫(yī)學(xué)院口腔醫(yī)學(xué)院,山東 煙臺(tái) 264000;2臨沂市人民醫(yī)院,山東 臨沂 276000)
口腔鱗狀細(xì)胞癌(Oral squamous cell carcinoma,OSSC)是口腔最常見的惡性腫瘤,預(yù)后較差[1]。選擇合適的治療策略對(duì)增加生存時(shí)間(OS)至關(guān)重要。目前,OSCC的臨床預(yù)后判斷方法主要是經(jīng)典的AJCC TNM分期。但該分期系統(tǒng)只考慮了疾病的解剖范圍,沒有考慮非解剖因素,如年齡、性別以及腫瘤的臨床和病理特征,不能準(zhǔn)確預(yù)測(cè)OSCC的預(yù)后[2]。近年來,體液(如唾液和血清)和腫瘤組織中蛋白質(zhì)編碼基因、信使RNA和長(zhǎng)鏈非編碼RNA等多種生物標(biāo)志物在預(yù)后預(yù)測(cè)方面受到了越來越多的關(guān)注[3]。但單一特征通常不足以預(yù)測(cè)個(gè)體的存活率,而組合則可以提供更好的預(yù)后可靠性[4]。隨著生物信息學(xué)技術(shù)的快速發(fā)展,預(yù)后預(yù)測(cè)模型逐漸應(yīng)用于癌癥,但OSCC相關(guān)臨床預(yù)后模型較少[5]。本研究旨在利用癌癥基因組圖譜(The cancer genome atlas,TCGA)數(shù)據(jù)庫來探索OSCC和正常組織中基因表達(dá)譜的差異,以尋找潛在的生物標(biāo)記物并評(píng)估其在預(yù)測(cè)OSCC患者生存方面的價(jià)值。
1.1數(shù)據(jù)獲取 從TCGA數(shù)據(jù)庫中下載了OSCC隊(duì)列基因表達(dá)譜的原始數(shù)據(jù)和相應(yīng)臨床信息,包括340例腫瘤樣本和32例正常樣本。排除無隨訪時(shí)間和隨訪時(shí)間小于90 d的樣本后,共納入319名OSCC患者。
1.2差異分析 利用R軟件中的limma包對(duì)TCGA-OSCC隊(duì)列中的所有基因進(jìn)行差異表達(dá)分析,以|log2Fc|>1和FDR<0.05為標(biāo)準(zhǔn)獲取腫瘤組織與正常組織間的差異表達(dá)基因(DEGs)。
1.3構(gòu)建預(yù)后模型 將OSCC患者按3∶2比例隨機(jī)分為訓(xùn)練集(n=192)和測(cè)試集(n=127)。在訓(xùn)練集中,應(yīng)用單因素COX回歸分析(α=0.01)聯(lián)合lasso-Cox回歸分析篩選與OSCC預(yù)后相關(guān)DEGs,在此基礎(chǔ)上進(jìn)行多因素Cox回歸分析,以構(gòu)建DEGs的OSCC預(yù)后模型。
1.4評(píng)價(jià)預(yù)后模型的預(yù)測(cè)能力 利用多因素Cox回歸分析得到的基因回歸系數(shù)和基因表達(dá)水平計(jì)算每個(gè)患者的風(fēng)險(xiǎn)評(píng)分,根據(jù)風(fēng)險(xiǎn)評(píng)分中位數(shù),將OSCC患者分為低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組。對(duì)兩組患者進(jìn)行Kaplan-Meier(KM)生存分析并繪制生存曲線。為了評(píng)估預(yù)后模型的預(yù)測(cè)準(zhǔn)確性,構(gòu)建了1、3、5年生存率的時(shí)間依賴受試者工作特征(ROC)曲線,并計(jì)算曲線下面積(AUC),AUC值越大模型的預(yù)測(cè)能力越好。為了確定獨(dú)立的預(yù)后因素并驗(yàn)證預(yù)后模型的獨(dú)立預(yù)后價(jià)值,以風(fēng)險(xiǎn)評(píng)分和其他傳統(tǒng)臨床特征為自變量、OS為因變量進(jìn)行Cox回歸分析,以確定預(yù)后模型的預(yù)測(cè)能力是否獨(dú)立于其他臨床變量(包括年齡、性別、組織學(xué)分級(jí)和病理分期)。
1.5驗(yàn)證預(yù)后模型 在測(cè)試集中,風(fēng)險(xiǎn)分?jǐn)?shù)計(jì)算使用與訓(xùn)練集相同的公式,后續(xù)分組中使用與訓(xùn)練集相同的截止值,接下來通過KM生存分析、ROC曲線分析對(duì)預(yù)后模型的預(yù)測(cè)能力進(jìn)行驗(yàn)證。
2.1OSCC患者基因表達(dá)譜差異分析 在OSCC腫瘤組織與正常組織中,差異分析共篩選出4248個(gè)DEGs,其中包括1301個(gè)下調(diào)基因和2947個(gè)上調(diào)基因。
2.2OSCC預(yù)后模型的構(gòu)建 在訓(xùn)練集中發(fā)現(xiàn)25個(gè)差異表達(dá)基因與OSCC患者的OS顯著相關(guān),通過Lasso回歸分析進(jìn)一步縮小DEGs的范圍,結(jié)果共得到18個(gè)DEGs;最后進(jìn)行多因素Cox回歸分析,建立包含10個(gè)基因的預(yù)后模型(見表1),其中AC079921.2、RELT、BCAM、GPX7、HOTAIRM1、AC009948.4、AL162413.1和PPIAP31為保護(hù)基因;HS3ST1和BRINP1為危險(xiǎn)基因。
表1 10個(gè)預(yù)后相關(guān)DEGs的風(fēng)險(xiǎn)比和95%置信區(qū)間
2.3模型預(yù)測(cè)能力評(píng)價(jià) 利用10個(gè)基因的表達(dá)水平和多因素Cox回歸得到的基因相關(guān)系數(shù)計(jì)算風(fēng)險(xiǎn)評(píng)分,具體公式為:-1.283×AC079921.2+0.146×HS3ST1+0.857×BRINP1+0.197×RELT+0.005×BCAM-0.069×GPX7+0.070×HOTAIRM1+0.668×AC009948.4+0.029×AL162413.1+0.029×PPIAP31
訓(xùn)練集中,高風(fēng)險(xiǎn)組96名,低風(fēng)險(xiǎn)組96名。KM生存分析結(jié)果顯示,兩組的OS有顯著差異(P<0.01)。1、3、5年生存率的AUC值分別為0.80、0.84、0.81。另一項(xiàng)涉及風(fēng)險(xiǎn)評(píng)分和臨床因素的ROC曲線分析表明風(fēng)險(xiǎn)評(píng)分的AUC值最大為0.783;年齡、性別、分級(jí)、分期、T分期和N分期的AUC值分別為0.532、0.525、0.552、0.554、0.531、0.607。另外,對(duì)風(fēng)險(xiǎn)評(píng)分和臨床因素進(jìn)行單因素Cox回歸分析,結(jié)果顯示預(yù)后模型有一定的預(yù)測(cè)價(jià)值(風(fēng)險(xiǎn)比=1.042,95%置信區(qū)間:1.026-1.059,P<0.01)。將年齡、性別、病理分期、和預(yù)后模型納入多因素Cox回歸分析,結(jié)果顯示預(yù)后模型與OSCC患者的預(yù)后仍然密切相關(guān)(風(fēng)險(xiǎn)比=1.041,95%置信區(qū)間:1.024-1.059,P<0.01)。
2.4模型驗(yàn)證 利用訓(xùn)練集的風(fēng)險(xiǎn)評(píng)分計(jì)算公式計(jì)算測(cè)試集患者的風(fēng)險(xiǎn)評(píng)分,結(jié)果127例患者中低風(fēng)險(xiǎn)組60例、高風(fēng)險(xiǎn)組67例。KM生存分析結(jié)果表明,OSCC高風(fēng)險(xiǎn)組患者的OS顯著低于低風(fēng)險(xiǎn)組(P=0.04)。此外,測(cè)試集中1年生存率的時(shí)間依賴ROC曲線分析表明,該預(yù)后模型能夠預(yù)測(cè)OSCC患者的OS(AUC=0.694)。
從患者和臨床醫(yī)生的角度來看,準(zhǔn)確的預(yù)后判斷對(duì)于患者術(shù)后危險(xiǎn)分層和個(gè)體化輔助治療的選擇具有重要意義[6]。為了改善OSCC患者的臨床預(yù)后,必須確定許多潛在和有價(jià)值的生物標(biāo)志物并建立預(yù)后模型。本研究建立的預(yù)后模型包括10個(gè)DEGs,其中AC079921.2、HOTAIRM1、AC009948.4和AL162413.1同屬于lncRNA。許多研究表明,lncRNA具有調(diào)節(jié)功能,影響腫瘤細(xì)胞的生物學(xué)行為、免疫反應(yīng)和細(xì)胞的表型轉(zhuǎn)化,并與腫瘤的發(fā)生、發(fā)展和轉(zhuǎn)移過程密切相關(guān)[7-9]。其中HS3ST1、RELT、GPX7為代謝相關(guān)基因。OSCC的分子發(fā)病機(jī)制很復(fù)雜,目前已有研究證實(shí)OSCC與代謝相關(guān)基因的突變和代謝物水平改變之間相互作用密切相關(guān)[10-12]。另外,BCAM上調(diào)與轉(zhuǎn)移性胃癌預(yù)后不良有關(guān)[13]。目前尚未有研究證實(shí)BRINP1和PPIAP31在OSCC發(fā)生中的分子機(jī)制。
將上述基因構(gòu)成的預(yù)后模型進(jìn)行KM生存分析和ROC曲線分析,KM曲線表明該預(yù)后模型可以成功地將OSCC患者分為OS明顯不同的低危和高危兩組;1、3、5年ROC的AUC值均大于0.80。這意味著該預(yù)后模型在預(yù)測(cè)OSCC患者OS時(shí)具有較高的靈敏度和特異度。將預(yù)后模型風(fēng)險(xiǎn)評(píng)分和年齡、性別等臨床因素放在一個(gè)ROC曲線中,發(fā)現(xiàn)與年齡、性別、分級(jí)、分期、T分期和N分期相比,預(yù)后模型風(fēng)險(xiǎn)評(píng)分的AUC值最大。這證明預(yù)后模型較臨床因素具有更高的預(yù)測(cè)性能。以上結(jié)果表明預(yù)后模型的風(fēng)險(xiǎn)評(píng)分可以將患者分為不同風(fēng)險(xiǎn)組并準(zhǔn)確預(yù)測(cè)OSCC患者預(yù)后。通過Cox回歸分析評(píng)價(jià)風(fēng)險(xiǎn)評(píng)分和臨床因素的獨(dú)立預(yù)后能力,結(jié)果證明風(fēng)險(xiǎn)評(píng)分可以作為OSCC的獨(dú)立預(yù)后因素。上述結(jié)果在測(cè)試集中均得到了證實(shí)。但本研究屬于回顧性研究,且僅分析了來自于公共數(shù)據(jù)庫的基因表達(dá)譜,在以后的研究中還需要對(duì)OSCC發(fā)生、發(fā)展和轉(zhuǎn)移過程中的分子機(jī)制進(jìn)行進(jìn)一步探索。
綜上所述,本研究結(jié)果表明,以10個(gè)DEGs為基礎(chǔ)的預(yù)后模型是預(yù)測(cè)OSCC患者OS的可靠工具,它可以幫助臨床醫(yī)生為OSCC患者選擇個(gè)性化的治療方案。