余長(zhǎng)云,張倩倩,薛彬彬,張彩,張晨,李金映,曹華,吉倩婧
(鄭州大學(xué)第一附屬醫(yī)院 耳鼻咽喉頭頸外科,河南 鄭州 450052)
口底鱗狀細(xì)胞癌(簡(jiǎn)稱口底鱗癌)系原發(fā)于口底黏膜的癌癥,是口腔頜面部腫瘤中較為常見(jiàn)的惡性腫瘤之一,具有易發(fā)生局部浸潤(rùn)和頸淋巴結(jié)轉(zhuǎn)移的特點(diǎn)[1-2]。目前,口底鱗癌的治療方式是以手術(shù)切除為主,并輔以放療、化療、基因治療的綜合治療。近年來(lái),盡管診斷及治療手段不斷更新改進(jìn),口底鱗癌患者的生存率及生存質(zhì)量并未得到顯著提高,其中重要原因就是腫瘤的早期轉(zhuǎn)移及復(fù)發(fā)[3-5]。研究表明,大部分患者就診時(shí)已出現(xiàn)局部或遠(yuǎn)處轉(zhuǎn)移,這部分患者容易復(fù)發(fā),預(yù)后相對(duì)較差[6-7]。因此,探索新的對(duì)腫瘤預(yù)后有價(jià)值的檢測(cè)指標(biāo),對(duì)提高口底鱗癌患者的生存率及生存質(zhì)量將具有重要意義。
長(zhǎng)鏈非編碼 RNA(long non-coding RNA,lncRNA)是一類轉(zhuǎn)錄本長(zhǎng)度超過(guò)200 nt、不編碼蛋白的RNA,參與發(fā)育、分化、代謝等多方面的調(diào)控[8-9]。研究表明,lncRNA 在多種惡性腫瘤中異常表達(dá),與腫瘤細(xì)胞生長(zhǎng)、分化、上皮-間質(zhì)轉(zhuǎn)化、干細(xì)胞特性、轉(zhuǎn)移等多種生物學(xué)行為相關(guān)[10-12]。近期,越來(lái)越多的證據(jù)表明,lncRNA可作為包括乳腺癌、肺癌、胃癌等多種惡性腫瘤診斷或預(yù)后標(biāo)志物[13-15]。然而,目前l(fā)ncRNA與口底鱗癌患者預(yù)后的關(guān)系并不十分清楚。在本研究中,以癌癥基因組圖譜(the cancer genome atlas,TCGA)數(shù)據(jù)庫(kù)為基礎(chǔ),采用Cox回歸分析構(gòu)建新的具有預(yù)測(cè)價(jià)值的lncRNA風(fēng)險(xiǎn)模型,以期為口底鱗癌患者的生存預(yù)測(cè)提供新的思路。
1.1 資料下載本研究從TCGA數(shù)據(jù)庫(kù)下載原始研究數(shù)據(jù)集(https://cancergenome.nih.gov/),并從中提取lncRNA表達(dá)矩陣。納入標(biāo)準(zhǔn):口底鱗癌患者;完整的lncRNA表達(dá)轉(zhuǎn)錄組數(shù)據(jù)和臨床信息;完整的隨訪資料。本研究共納入54例口底鱗癌樣本及3例對(duì)應(yīng)癌旁組織樣本。
1.2 lncRNA差異表達(dá)譜分析將下載的原始口底鱗癌轉(zhuǎn)錄組數(shù)據(jù)(count)進(jìn)行ID轉(zhuǎn)換,并添加基因?qū)傩?,提取lncRNA表達(dá)矩陣。在R語(yǔ)言軟件中,采用edgeR包對(duì)下載的數(shù)據(jù)進(jìn)行處理,先對(duì)表達(dá)量(count)進(jìn)行校正,并計(jì)算變異數(shù);然后根據(jù)篩選標(biāo)準(zhǔn)(P≤0.001,倍數(shù)變化≥2)篩選在口底鱗癌組織和對(duì)應(yīng)癌旁組織樣本中差異表達(dá)的lncRNA。
1.3 lncRNA風(fēng)險(xiǎn)預(yù)測(cè)模型的構(gòu)建采用單變量Cox回歸分析篩選與患者總生存率相關(guān)的差異表達(dá)lncRNA,將P<0.01的lncRNA納入隨后的多變量Cox回歸分析中,并刪除信息量重疊的lncRNA,建立lncRNA口底鱗癌預(yù)后模型。根據(jù)模型中l(wèi)ncRNA的表達(dá)量及表達(dá)系數(shù)計(jì)算口底鱗癌患者的風(fēng)險(xiǎn)評(píng)分(risk score,RS)。采用如下公式計(jì)算風(fēng)險(xiǎn)評(píng)分[16]:
S=ΣβiXi。
式中S為風(fēng)險(xiǎn)評(píng)分,βi為lncRNA的表達(dá)系數(shù),Xi為lncRNA在口底鱗癌患者中的表達(dá)水平。
1.4 檢測(cè)風(fēng)險(xiǎn)評(píng)分與口底鱗癌患者預(yù)后的相關(guān)性根據(jù)風(fēng)險(xiǎn)評(píng)分公式計(jì)算每例口底鱗患者的風(fēng)險(xiǎn)評(píng)分,按照中位風(fēng)險(xiǎn)值將口底鱗癌患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組(風(fēng)險(xiǎn)評(píng)分高于或等于中位風(fēng)險(xiǎn)值的患者為高風(fēng)險(xiǎn)組,風(fēng)險(xiǎn)評(píng)分低于中位風(fēng)險(xiǎn)值的患者為低風(fēng)險(xiǎn)組),繪制風(fēng)險(xiǎn)評(píng)分曲線、生存狀態(tài)散點(diǎn)圖及l(fā)ncRNA的表達(dá)熱圖。Kaplan-Meier法繪制高、低風(fēng)險(xiǎn)組患者的生存曲線。繪制受試者工作特征(receiver operator characteristic,ROC)曲線以評(píng)估口底鱗癌患者風(fēng)險(xiǎn)評(píng)分對(duì)生存評(píng)估的靈敏度和特異度,曲線下面積(the area under curve,AUC)越接近1表明預(yù)測(cè)性能越好。
1.5 統(tǒng)計(jì)分析本研究中所有統(tǒng)計(jì)分析均在R軟件(版本3.5.1)中進(jìn)行。采用edgeR包篩選差異lncRNA;Survival包進(jìn)行單變量和多變量Cox風(fēng)險(xiǎn)回歸分析,并建立基于多個(gè)lncRNA的風(fēng)險(xiǎn)預(yù)測(cè)模型;Survival ROC包繪制ROC曲線,并計(jì)算AUC。所有檢驗(yàn)均為雙側(cè)檢驗(yàn),P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
2.1 差異表達(dá)lncRNA在口底鱗癌組織與對(duì)應(yīng)癌旁組織中共識(shí)別出138個(gè)差異lncRNA,其中40個(gè)上調(diào)lncRNA和98個(gè)下調(diào)lncRNA,圖1中熱圖和火山圖顯示上調(diào)和下調(diào)的差異lncRNA。根據(jù)倍數(shù)變化(fold change,F(xiàn)C)值排序前10位差異表達(dá)lncRNA,表1中顯示前5位上調(diào)和下調(diào)的lncRNA。
A為熱圖;B為火山圖。圖1 138個(gè)差異表達(dá)lncRNA的熱圖和火山圖
表1 前5位下調(diào)和上調(diào)的lncRNA
2.2 口底鱗癌患者lncRNA風(fēng)險(xiǎn)預(yù)測(cè)模型的建立對(duì)篩選出的40個(gè)上調(diào)lncRNA和98個(gè)下調(diào)lncRNA進(jìn)行單變量Cox回歸分析,確定與口底鱗癌患者總生存相關(guān)的lncRNA。根據(jù)篩選標(biāo)準(zhǔn)(P<0.01),納入5個(gè)與總生存期相關(guān)的lncRNA(MIR1-1HG、HOXC13-AS、RAMP2-AS1、LINC02454、LINC00702),進(jìn)一步使用多變量Cox回歸對(duì)5個(gè)lncRNA與生存的關(guān)系進(jìn)行分析,并刪除信息量重疊的lncRNA,最終建立包含MIR1-1HG、HOXC13-AS、RAMP2-AS1的3個(gè)lncRNA的口底鱗癌患者風(fēng)險(xiǎn)預(yù)測(cè)模型,一致性系數(shù)(concordance index,CI)為0.77(表2,圖3)。S=0.291X1+0.280X2-0.433X3,S為風(fēng)險(xiǎn)評(píng)分,X1為MIR1-1HG的表達(dá)水平,X2為HOXC13-AS的表達(dá)水平,X3為RAMP2-AS1的表達(dá)水平。風(fēng)險(xiǎn)系數(shù)顯示MIR1-1HG、HOXC13-AS為危險(xiǎn)因素(β>0),RAMP2-AS1為保護(hù)因素(β<0)(表2)。Kaplan-Meier生存曲線顯示MIR1-1HG、HOXC13-AS高表達(dá)組患者生存率低于低表達(dá)組患者,RAMP2-AS1高表達(dá)組患者生存率高于低表達(dá)組患者(圖2)。
表2 多變量Cox回歸分析結(jié)果
圖2 口底鱗癌患者預(yù)后相關(guān)lncRNA的Kaplan-Meier生存曲線
圖3 多變量Cox回歸模型中3個(gè)lncRNA森林圖
2.3 lncRNA預(yù)測(cè)模型的評(píng)估風(fēng)險(xiǎn)評(píng)分曲線(圖4)、生存狀態(tài)散點(diǎn)圖(圖4)顯示,隨著風(fēng)險(xiǎn)評(píng)分的增高,患者死亡率也增高。風(fēng)險(xiǎn)基因表達(dá)熱圖(圖4)顯示,MIR1-1HG、HOXC13-AS在高風(fēng)險(xiǎn)口底鱗癌患者中表達(dá)相對(duì)較高,而RAMP2-AS1在低風(fēng)險(xiǎn)口底鱗癌患者中表達(dá)相對(duì)較高。Kaplan-Meier生存分析結(jié)果顯示,高風(fēng)險(xiǎn)口底鱗癌患者的總生存率低于低風(fēng)險(xiǎn)口底鱗癌患者(P<0.001)(圖5)。ROC曲線顯示口底鱗癌預(yù)后相關(guān)lncRNA AUC為0.895,模型具有較好的靈敏度和特異度(圖6)。
A為風(fēng)險(xiǎn)評(píng)分點(diǎn)圖;B為生存時(shí)間點(diǎn)圖;C為lncRNA表達(dá)熱圖。圖4 風(fēng)險(xiǎn)評(píng)分與生存時(shí)間點(diǎn)圖及相關(guān)lncRNA表達(dá)熱圖
圖5 高、低風(fēng)險(xiǎn)組口底鱗癌患者的Kaplan-Meier生存分析
圖6 多變量Cox分析模型ROC曲線
口底區(qū)域解剖結(jié)構(gòu)復(fù)雜,有豐富的淋巴管,相對(duì)口腔其他部位,該部位腫瘤更易淋巴結(jié)轉(zhuǎn)移[17],預(yù)后較口腔其他部位腫瘤差,患者生存質(zhì)量及生存率均較低[18-19]。因此,口底鱗癌的早期篩查及早期干預(yù)至關(guān)重要。目前,TNM分期系統(tǒng)常用于臨床確定治療方案、評(píng)估治療效果及預(yù)后。然而,TNM分期僅考慮腫瘤的臨床特點(diǎn),并未考慮腫瘤的分子特點(diǎn),并不能精確反映腫瘤特征,尤其是早期腫瘤[20]。同一分期的腫瘤具有不同的進(jìn)展正說(shuō)明了這一點(diǎn)[4]。因此,急需尋找新的、有效的預(yù)后指標(biāo)用于口底鱗癌患者預(yù)后評(píng)估及治療方案的指導(dǎo)。
隨著生物信息技術(shù)的發(fā)展,越來(lái)越多的研究人員開(kāi)始關(guān)注lncRNA對(duì)腫瘤患者預(yù)后的意義。一些lncRNA具有組織特異性,在疾病發(fā)展過(guò)程中起著至關(guān)重要的作用。Zhang等[21]觀察到在胃癌中,lncRNA AOC4P可通過(guò)上皮-間質(zhì)轉(zhuǎn)化促進(jìn)腫瘤的發(fā)生和發(fā)展,進(jìn)而促進(jìn)胃癌不良預(yù)后。Bo等[22]的研究表明,lncRNA AFAP1-AS1在宮頸癌發(fā)生發(fā)展中發(fā)揮重要作用。Beltrán-Anaya等[23]的研究也證實(shí)lncRNA KLHDC7B的低表達(dá)與乳腺癌患者預(yù)后不良相關(guān)。
在本研究中,共篩選出138個(gè)差異lncRNA,其中40個(gè)上調(diào)lncRNA和98個(gè)下調(diào)lncRNA。通過(guò)單變量和多變量Cox回歸分析,構(gòu)建了一個(gè)基于3-lncRNA的風(fēng)險(xiǎn)模型預(yù)測(cè)口底鱗癌患者的預(yù)后,該模型的一致性系數(shù)為0.77。風(fēng)險(xiǎn)分層及ROC曲線分析結(jié)果顯示,高風(fēng)險(xiǎn)組患者生存率及生存時(shí)間低于低風(fēng)險(xiǎn)組患者,ROC曲線下面積為0.895。這些表明,基于這3個(gè)lncRNA的風(fēng)險(xiǎn)預(yù)測(cè)模型具有很好的靈敏度和特異度,能為口底鱗癌患者提供一個(gè)很好的預(yù)測(cè)工具。
模型中3個(gè)lncRNA中僅HOXC13-AS、RAMP2-AS1在口底鱗癌及其他腫瘤中被研究過(guò)。Li等[24]研究表明,HOXC13-AS在乳腺癌中高表達(dá),并通過(guò)miR-497-5p/PTEN通路促乳腺癌細(xì)胞增殖。一項(xiàng)鼻咽癌的研究表明,HOXC13-AS在鼻咽癌組織中高表達(dá),并通過(guò)miR-383-3p/HMGA2通路促進(jìn)鼻咽癌細(xì)胞增殖和侵襲[25]。在口腔鱗癌中,HOXC13-AS呈高表達(dá),可作為競(jìng)爭(zhēng)性內(nèi)源RNA,通過(guò)miR-378g/HOXC13軸促進(jìn)口腔鱗癌細(xì)胞增殖、侵襲及上皮-間質(zhì)轉(zhuǎn)化形成[26]。本研究中HOXC13-AS風(fēng)險(xiǎn)系數(shù)大于0,且高表達(dá)HOXC13-AS組患者生存率低于低表達(dá)組患者,這些提示HOXC13-AS在口底鱗癌發(fā)生發(fā)展中起促進(jìn)作用。在舌鱗狀細(xì)胞癌中,檢測(cè)舌鱗狀細(xì)胞癌中l(wèi)ncRNA表達(dá),發(fā)現(xiàn)HOXC13-AS與患者預(yù)后呈負(fù)相關(guān)[27]。本研究中RAMP2-AS1風(fēng)險(xiǎn)系數(shù)小于0,且高表達(dá)RAMP2-AS1組患者生存率低于低表達(dá)組患者,提示RAMP2-AS1可抑制喉鱗癌發(fā)生發(fā)展。以上這些表明,本研究篩選出的lncRNA將為口底鱗癌研究提供新的生物指標(biāo)。
本研究經(jīng)過(guò)TCGA口底鱗癌表達(dá)譜數(shù)據(jù)庫(kù)的挖掘,篩選出差異表達(dá)lncRNA,并成功構(gòu)建一個(gè)基于3個(gè)lncRNA的新的口底鱗癌風(fēng)險(xiǎn)預(yù)測(cè)模型,為口底鱗癌風(fēng)險(xiǎn)分層及臨床預(yù)后判斷提供幫助,并為基礎(chǔ)研究提供更多可供選擇的生物標(biāo)志物。該模型僅包含3個(gè)lncRNA,在臨床應(yīng)用中可操作性強(qiáng)。然而,一方面本研究納入患者相對(duì)較少,模型的預(yù)測(cè)能力仍需大量臨床試驗(yàn)證據(jù)證實(shí);另一方面,納入模型的lncRNA在口底鱗癌細(xì)胞及生物體內(nèi)的功能尚不明確,其在口底鱗癌發(fā)生發(fā)展中起的作用尚缺乏實(shí)驗(yàn)證據(jù)的支持,仍需進(jìn)一步的功能實(shí)驗(yàn)研究。