吳良銀,李文麗,劉 俊
(粵北人民醫(yī)院a.檢驗(yàn)科;b.生殖醫(yī)學(xué)中心,廣東韶關(guān) 512025)
肝癌作為一種高發(fā)的惡性腫瘤,發(fā)病率呈現(xiàn)上升的趨勢,目前肝癌已成為全球惡性腫瘤死亡原因之一,中國每年新發(fā)肝癌的病人數(shù)占全球新發(fā)肝癌近一半。原發(fā)性肝癌主要分為三型,其中肝細(xì)胞癌是最主要的一種亞型,約占原發(fā)性肝癌的85%。肝細(xì)胞癌引起的死亡率較高,特別是在發(fā)展中國家,如亞洲、非洲地區(qū)。雖然當(dāng)今醫(yī)學(xué)診療技術(shù)不斷提高,聯(lián)合檢測甲胎蛋白(AFP)、鐵蛋白(FER)和血清腫瘤特異性生長因子(TSGF)可提高肝臟惡性腫瘤診斷的準(zhǔn)確度[1],以及其他檢測標(biāo)志物,但肝癌的早期難發(fā)現(xiàn),肝癌切除術(shù)后轉(zhuǎn)移率和復(fù)發(fā)率較高,嚴(yán)重影響著肝癌病人的治療效果和生存期。因此,在加強(qiáng)肝癌早期診斷研究的同時(shí),闡述引起肝癌發(fā)生發(fā)展及生存預(yù)后的具體機(jī)制,進(jìn)而探索新的干預(yù)措施,增加患者的存活率和生活質(zhì)量對疾病的預(yù)防和治療具有重大意義。
肝細(xì)胞癌病理學(xué)復(fù)雜,隨著生物信息學(xué)的發(fā)展,大量的基因測序數(shù)據(jù)被上傳到公共數(shù)據(jù)庫中,例如癌癥基因組圖譜(the cancer genome atlas,TCGA)數(shù)據(jù)庫,它為我們進(jìn)一步研究肝細(xì)胞癌發(fā)生發(fā)展及生存預(yù)后的分子機(jī)制提供了很好的工具,以篩選出新的預(yù)后標(biāo)志物和分子治療靶點(diǎn)。
長鏈非編碼RNA(LncRNA)是長度大于200個(gè)核苷酸的非編碼RNA,雖然缺少有效的開放式閱讀框不編碼蛋白,但有著復(fù)雜的生物學(xué)功能,在生物體內(nèi)發(fā)揮著非常重要的作用,也是近期研究的熱點(diǎn)。越來越多的研究集中在肝細(xì)胞癌中涉及的致病LncRNA,這可能有利于更好地理解肝細(xì)胞癌發(fā)生和發(fā)展的分子機(jī)制。LncRNA也被證明是肝細(xì)胞癌的重要調(diào)節(jié)因子,它們在肝細(xì)胞癌發(fā)展中占有重要地位。對于LncRNA參與調(diào)控肝細(xì)胞癌不同階段的研究也是一個(gè)令人興奮和快速發(fā)展的領(lǐng)域,其中LncRNA-H19,HOTAIR和MALAT1等已經(jīng)證明其表達(dá)和肝癌的發(fā)生發(fā)展及預(yù)后相關(guān)[2]。肝細(xì)胞癌是一種高度異質(zhì)化的疾病,其發(fā)生發(fā)展是多基因參與,多步驟調(diào)控的過程,目前的研究認(rèn)識還不足以為早期疾病的診斷和預(yù)后風(fēng)險(xiǎn)評估提供詳實(shí)的證據(jù)。
本研究中提取了癌癥基因組圖譜(TCGA)數(shù)據(jù)庫中含有臨床信息的所有LncRNA表達(dá)樣本,包括50個(gè)對照和374個(gè)肝癌組織,首先篩選出有差異表達(dá)的LncRNA。進(jìn)一步對差異基因做單因素生存分析,篩選對預(yù)后有影響的基因,隨后用這些基因做一千次lasso回歸進(jìn)一步篩選有顯著影響的LncRNA,最后又對降維后的LncRNA做了多因素的Cox回歸,最終篩選出在預(yù)后中有顯著差異的LncRNA,為后期臨床及動(dòng)物實(shí)驗(yàn)提供研究方向和依據(jù)。
1材料和方法
1.1 數(shù)據(jù)來源和處理 從癌癥基因組圖譜(TCGA)數(shù)據(jù)庫(https://tcga‐data.nci.nih.gov/tcga/)中查詢肝細(xì)胞癌的LncRNA表達(dá)數(shù)據(jù)。納入的標(biāo)準(zhǔn)是:①病理類型是肝細(xì)胞癌;②可獲得病人的總體生存時(shí)間;③可獲得標(biāo)準(zhǔn)化LncRNA的表達(dá)數(shù)據(jù)。篩選后,獲得來自TCGA數(shù)據(jù)庫中的LIHC數(shù)據(jù)集中的表達(dá)數(shù)據(jù)和相應(yīng)的臨床數(shù)據(jù)。在此項(xiàng)研究中我們根據(jù)病人的生存時(shí)間來構(gòu)建預(yù)后模型,所以本研究排除了臨床數(shù)據(jù)不完整或總體生存率不到1個(gè)月的標(biāo)本,最終有374例肝細(xì)胞癌患者和50例對照參與了本研究。用R軟件的edgeR包(http://www.bioconductor.org/packages/release/bioc/html/edgeR.html)進(jìn)行差異基因的篩選,篩選標(biāo)準(zhǔn)是|log2FC|≥1,adjustP<0.05,并對差異基因進(jìn)行標(biāo)準(zhǔn)化處理。
1.3 統(tǒng)計(jì)學(xué)分析 評估LncRNA風(fēng)險(xiǎn)模型,用R軟件的survival包和timeROC包繪制受試者工作特征曲線(ROC曲線),通過計(jì)算ROC曲線下的面積(AUC)對LncRNA風(fēng)險(xiǎn)模型進(jìn)行評估。對于生存分析,我們應(yīng)用Kaplan-Meier方法計(jì)算不同風(fēng)險(xiǎn)組的總體生存時(shí)間,進(jìn)行對數(shù)秩檢驗(yàn)以檢查統(tǒng)計(jì)學(xué)顯著性,使用P<0.05確定統(tǒng)計(jì)學(xué)顯著性,所有分析均在R軟件中進(jìn)行。
2結(jié)果差異LncRNA的鑒定:從癌癥基因組圖譜(TCGA)數(shù)據(jù)庫中下載肝細(xì)胞癌的表達(dá)數(shù)據(jù),包括50例對照和374例癌癥組織,以及對應(yīng)的臨床隨訪信息。通過對比50例肝細(xì)胞癌正常組織和374例肝癌組織,我們篩選出1 292個(gè)表達(dá)有顯著差異的LncRNA,其中包括1 212個(gè)在肝癌組織中上調(diào)的LncRNA和80個(gè)下調(diào)的LncRNA。
構(gòu)建LncRNA的風(fēng)險(xiǎn)模型:在1 292個(gè)差異表達(dá)的LncRNA中,進(jìn)一步做單因素生存分析計(jì)算每一個(gè)LncRNA的預(yù)后影響的顯著性,其中P<0.05的有899個(gè)LncRNA。隨后,又利用lasso回歸進(jìn)一步降維處理篩選出31個(gè)LncRNA,進(jìn)一步用多因素Cox回歸,篩選出5個(gè)與生存預(yù)后最顯著相關(guān)的LncRNA,包括B3GALT5-AS,KC877982.1,MIR7-3JG,PGM5P3-AS1和TBX5-AS1,其P<0.01,見圖1。
圖1 LncRNA的95%置信區(qū)間及HR值
風(fēng)險(xiǎn)模型的評估:根據(jù)5個(gè)LncRNA的多因素預(yù)后結(jié)果進(jìn)行風(fēng)險(xiǎn)評分,分為低風(fēng)險(xiǎn)組和高風(fēng)險(xiǎn)組,其K-M生存風(fēng)險(xiǎn)曲線顯示高風(fēng)險(xiǎn)組具有較差的預(yù)后,其P值<0.001(圖2)。同時(shí),繪制ROC曲線用AUC面積來評價(jià)我們的預(yù)測模型,結(jié)果顯示其預(yù)測三年總體生存率的曲線下面積為0.801,其預(yù)測五年總體生存率的曲線下面積為0.823。其結(jié)果反映出我們建立的預(yù)測模型具有較好的準(zhǔn)確性(圖3)。說明我們構(gòu)建篩選出來的5個(gè)與生存預(yù)后顯著相關(guān)的LncRNA(B3GALT5-AS,KC877982.1,MIR7-3JG,PGM5P3-AS1和TBX5-AS)表達(dá)特征與患者的存活風(fēng)險(xiǎn)具有較高的關(guān)聯(lián)性,聯(lián)合檢測這五個(gè)LncRNA能較準(zhǔn)確地預(yù)測肝細(xì)胞癌患者的三年和五年生存率。
圖2 根據(jù)5個(gè)LncRNA的多因素預(yù)后結(jié)果進(jìn)行分類成高低風(fēng)險(xiǎn)組的K-M生存風(fēng)險(xiǎn)曲線
a代表對3年生存預(yù)后的評估,b代表對5年生存預(yù)后的評估。
圖3受試者特征曲線
3討論大部分肝癌患者在確診時(shí)已經(jīng)處于中晚期,無法進(jìn)行手術(shù)時(shí),只能采取傳統(tǒng)的化療藥物治療,但由于肝癌具有較強(qiáng)的化療抵抗性,治療效果不明顯。對于實(shí)施手術(shù)切除術(shù)的病人,肝癌的高復(fù)發(fā)率也會導(dǎo)致不好的預(yù)后。在過去的十幾年中,已經(jīng)證明LncRNA在癌癥發(fā)生和腫瘤進(jìn)展中起重要作用。一些LncRNA被認(rèn)為在評估肝細(xì)胞癌患者的預(yù)后中是有效的,例如UCA1和RP11-466I1.1[3-4]。本研究利用生物信息學(xué)方法提取含有臨床信息的LncRNA表達(dá)信息,研究肝細(xì)胞癌患者生存預(yù)后相關(guān)LncRNA,為肝細(xì)胞癌的發(fā)生發(fā)展及預(yù)后提供了新的研究思路,也希望能為肝細(xì)胞癌治療提供新靶點(diǎn)。
WANG等[5]人的研究表明B3GALT5-AS通過調(diào)節(jié)miR-203介導(dǎo)結(jié)腸癌的上皮間質(zhì)轉(zhuǎn)化,通過激活B3GALT5-AS/miR-203軸可能是結(jié)腸癌肝轉(zhuǎn)移的潛在治療策略,本研究結(jié)果也表明B3GALT5-AS在肝細(xì)胞癌患者的預(yù)后中有意義。ZHANG等[6]人建立了肝細(xì)胞癌患者生存時(shí)間的風(fēng)險(xiǎn)評分系統(tǒng),其研究結(jié)果表明PGM5P3-AS1與肝細(xì)胞癌的診斷和預(yù)后顯著相關(guān),這與本研究的預(yù)測結(jié)果一致。QIAO等[7]人的研究表明TBX5-AS1的表達(dá)與不吸煙女性肺癌的預(yù)后不良有關(guān),我們的預(yù)測結(jié)果表明TBX5-AS1與肝細(xì)胞癌的不良預(yù)后相關(guān),其說明TBX5-AS1的表達(dá)與癌癥的發(fā)生發(fā)展有關(guān)系。KC877982.1和MIR7-3HG的表達(dá)也與肝細(xì)胞癌的不良預(yù)后相關(guān),而且目前還未見報(bào)道這兩個(gè)LncRNA在其它疾病中的作用。
在本研究中,選取了大樣本,通過構(gòu)建與生存預(yù)后相關(guān)的模型來篩選關(guān)鍵LncRNA,并對模型進(jìn)行了評估,采用單因素Cox回歸,lasso回歸以及多回素Cox回歸篩選出12個(gè)與生存預(yù)后顯著相關(guān)的LncRNA,其中B3GALT5-AS,KC877982.1,MIR7-3HG,PGM5P3-AS1和TBX5-AS1最為顯著,其P<0.01,選取這5個(gè)LncRNA構(gòu)建了預(yù)后模型,并且還對模型的預(yù)測能力進(jìn)行了評估,顯示其預(yù)測三年總體生存率及其預(yù)測五年總體生存率的都有很好的準(zhǔn)確性,為臨床應(yīng)用提供有力證據(jù)。本研究將這5個(gè)LncRNA組合成一個(gè)驗(yàn)證小組,并對肝細(xì)胞癌患者總體生存率有較準(zhǔn)確的預(yù)測性。
肝細(xì)胞癌的發(fā)生是受表觀遺傳和多基因變化調(diào)控的復(fù)雜過程[8]。LncRNA AB209371的表達(dá)促進(jìn)肝細(xì)胞癌的上皮間質(zhì)轉(zhuǎn)化,PREX2基因的體細(xì)胞突變促進(jìn)了細(xì)胞增殖,并且與肝細(xì)胞癌的侵襲相關(guān)[9]。已知的幾條致癌信號通路如PI3K/AKT和NF-κB都與肝細(xì)胞癌的發(fā)生發(fā)展相關(guān)[10-11]。本研究從TCGA數(shù)據(jù)庫中鑒定出異常表達(dá)的關(guān)鍵LncRNA,構(gòu)建了基于肝細(xì)胞癌生存預(yù)后的一個(gè)風(fēng)險(xiǎn)評估模型,用于預(yù)測關(guān)鍵LncRNA的表達(dá)與肝細(xì)胞癌患者不良預(yù)后的關(guān)系。結(jié)果表明B3GALT 5-AS,KC877982.1,MIR7-3JG,PGM5P 3-AS1和TBX5-AS1表達(dá)特征與患者的存活風(fēng)險(xiǎn)具有較高的關(guān)聯(lián)性,聯(lián)合檢測這五個(gè)LncRNA能較準(zhǔn)確地預(yù)測肝細(xì)胞癌患者的三年和五年生存率,而且其有可能成為肝細(xì)胞癌治療的潛在靶點(diǎn)。后續(xù)我們會通過臨床及動(dòng)物實(shí)驗(yàn)來進(jìn)一步驗(yàn)證本研究結(jié)果的準(zhǔn)確性。
現(xiàn)代檢驗(yàn)醫(yī)學(xué)雜志2019年4期