殷瑞康,李 萍 綜述,付振明 審校
(武漢大學(xué)人民醫(yī)院腫瘤中心,武漢 430060)
原發(fā)性肝癌是癌癥相關(guān)死亡的第二大原因,發(fā)病率位居第6[1]。肝細(xì)胞癌(hepatocellular carcinoma,HCC)是原發(fā)性肝癌中最主要的組織學(xué)亞型,占85%~90%。HCC主要的致癌因素包括乙型肝炎病毒(hepatitis bvirus,HBV)、丙型肝炎病毒(hepatitis cvirus,HCV)感染、酒精性肝病、煙草、食物污染等。這些致癌因素的內(nèi)源性或外源性作用過程反映在基因組上的結(jié)果稱為突變特征。通過分析突變特征可以了解細(xì)胞惡變的機(jī)制、腫瘤發(fā)展的風(fēng)險(xiǎn)因素,有助于更好地理解HCC基因組學(xué)發(fā)展。目前部分突變特征已得到揭示,較為常見的如年齡與甲基胞嘧啶的脫甲基化相關(guān),煙草中多環(huán)芳烴可致堿基C到A的替換,CTNNB1基因突變常見于酒精相關(guān)HCC;較為少見的如HBV導(dǎo)致TERT、CCNE1和CcNA2基因的插入突變、錯配修復(fù)缺陷引起堿基C到T的替換及缺失,馬兜鈴酸引起三核苷酸中堿基T到A的替換等。近年來隨著全基因組測序(whole genome sequencing,WGS)、全外顯子組測序(whole exome sequencing,WES)、轉(zhuǎn)錄組測序(RNA sequencing,RNA-Seq)等二代測序檢測手段不斷發(fā)展,HCC基因組學(xué)得到了進(jìn)一步揭示及剖析。本文將在HCC基因組研究的大方向之下,回顧及綜述近年該領(lǐng)域的進(jìn)展。
DNA測序技術(shù)的發(fā)展已經(jīng)使生命研究從單一、局部的基因或基因的片段轉(zhuǎn)變成了整個基因組。近年飛速發(fā)展的WGS、WES、RNA-Seq等高通量二代測序技術(shù),具有通量高、檢測高速、靈敏度高、成本低等特點(diǎn)。高通量測序能夠?qū)蚪M進(jìn)行多種分析,如單核苷酸變異(single nucleotide variant,SNV)、基因組的插入及缺失(insertion or deletion,InDel)、染色體結(jié)構(gòu)變異(structural variation,SV)、拷貝數(shù)目變異(copy number variant,CNV)、雜合性缺失(loss of heterozygosity,LOH)。目前,WGS和WES應(yīng)用最為頻繁,WGS相較于WES可以檢測基因組的完整序列,包括非編碼區(qū),盡管較為復(fù)雜,對于涉及大型結(jié)構(gòu)基因組的翻譯和臨床意義至關(guān)重要,如CNV和染色體重排。WES則往往針對編碼基因組,更易于鑒定影響蛋白質(zhì)結(jié)構(gòu)和功能的SNV、InDel和SV等。
SNV可存在于胚系和體細(xì)胞中。前者為發(fā)生在配子中的突變亦稱為遺傳突變,后者是不參與遺傳的體細(xì)胞突變。經(jīng)典的遺傳突變?nèi)鏏TP7B、FAH、HFE和SERPINA1,可以分別產(chǎn)生肝豆?fàn)詈俗冃?、酪氨酸血癥、血色沉著癥、α-1抗胰蛋白酶缺乏癥,繼而增加肝硬化、HCC的發(fā)展傾向;HSD17B13 rs72613567、PNPLA3 rs738409、TM6SF2 rs58542926等位點(diǎn)的不穩(wěn)定性則直接與肝硬化和HCC階段相關(guān)[2-4]。體細(xì)胞突變中,目前研究發(fā)現(xiàn)較為確切的基因有TERT啟動子、ACVR2A、ARID1A、ARID2、AXIN1、CTNNB1和FGF19等基因[5-6]。
SNV作為HCC中最普遍的的基因組學(xué)改變,常存在于HCC中最為熟知的突變基因如CTNNB1、TP53及TERT啟動子[5]。細(xì)數(shù)SNV的分類,C:G>T:A和鳥嘌呤轉(zhuǎn)化是最多見的[7]。近年新發(fā)現(xiàn)了Ash1、NCOR1和MACROD2等HCC驅(qū)動基因的突變,及RPS6KA3、RB1、LZTR1、EEF1A1和SF3B1等頻繁發(fā)生而缺少研究的體細(xì)胞突變[6]。按HCC病因、環(huán)境風(fēng)險(xiǎn)因素分類,AXIN1、TP53突變常見于HBV陽性病例中,ARID1A突變更常見于非病毒病例中。按腫瘤分期分,TERT啟動子突變常見于早期HCC,F(xiàn)GF3、FGF4、FGF19或CCND1擴(kuò)增,TP53和CDKN2A改變出現(xiàn)在較晚期[5]。按腫瘤來源分,多中心來源的HCC一般分別起源于獨(dú)立的突變,盡管體細(xì)胞突變存在差異,但它們的全基因組替換模式是相似的。按相關(guān)信號通路及機(jī)制分,新發(fā)現(xiàn)的LZTR1、EEF1A1分別編碼含CUL3的E3連接酶復(fù)合物接頭、翻譯延伸因子基因;而如AZIN1、RP1L1、GPATCH4、CREB3L3、AHCTF1和HIST1H1等顯著突變基因暫時(shí)未得到相關(guān)研究[6]。
在預(yù)測HCC發(fā)展和預(yù)后方面,LAMA2突變預(yù)示著復(fù)發(fā)和較差生存;TP53突變與微血管浸潤獨(dú)立相關(guān),CTNNB1突變與AFP獨(dú)立相關(guān),暗示它們可能是通過調(diào)節(jié)p53通路和端粒修復(fù)通路來促進(jìn)HCC的發(fā)生和發(fā)展的[7]。MACROD2的缺失則通過激活GSK-3β/β-Catenin通路促進(jìn)腫瘤的生長[8]。
InDel是在基因組的某個位置上所發(fā)生的小片段序列的插入或者缺失,長度通常在2~50 bp。近年,大型研究確定了非編碼區(qū)InDel可以將細(xì)胞譜系與腫瘤緊密聯(lián)系起來,無論在HCC還是他腫瘤類型中,譜系決定基因具有非編碼區(qū)InDel熱點(diǎn),而InDel熱點(diǎn)與AAT AAT D序列和特殊的染色質(zhì)內(nèi)容相關(guān)聯(lián)[9]。比如,HCC中與HCV陽性相關(guān)的ARID1A和與酒精攝入相關(guān)的ARID2屬于染色質(zhì)內(nèi)容突變,均以InDel為主,ARID家族基因的下調(diào)促進(jìn)了細(xì)胞增殖,其中ARID2的敲除影響DNA修復(fù)過程,繼而引起更多潛在的突變。另外,三磷酸腺苷(ATP)結(jié)合盒蛋白亞家族B成員5被發(fā)現(xiàn)存在終止密碼子和影響mRNA剪接的非編碼區(qū)InDel[10]。既往該蛋白過表達(dá)被認(rèn)為能夠增強(qiáng)腫瘤干細(xì)胞特性,在黑色素瘤中影響腫瘤生長和化療耐藥,目前在HCC中同樣有所發(fā)現(xiàn)。這些InDel對于細(xì)胞蛋白質(zhì)功能是不利的。
SV是指基因組中一種較大的結(jié)構(gòu)性的染色體變異,包括大片段丟失、插入、重復(fù),以及拷貝數(shù)的變異、倒位、易位。HCC中受SV影響最大的基因是MACROD2[8]。MACROD2因發(fā)生SV呈現(xiàn)低表達(dá)狀態(tài),繼而抑制糖原合成酶激酶-3β活性,激活β-Catenin通路,明顯促進(jìn)上皮間充質(zhì)轉(zhuǎn)化和腫瘤增殖、侵襲。SV同樣存在于AXIN1、CTNNB1和TERT基因中。TERT啟動子的SV主要為HBV整合和非病毒依賴性的易位。HBV整合的SV還存在于MLL4、CCNE1及纖維化相關(guān)基因FN1、HS6ST3、KNG1和ROCK1中,可引起CCNE1、HBx-MLL4融合蛋白等的高表達(dá),進(jìn)一步驅(qū)動HCC的發(fā)生[11]。預(yù)后方面,發(fā)生SV的基因組中存在雙特異性蛋白激酶這個關(guān)鍵的有絲分裂檢查點(diǎn)調(diào)節(jié)因子,且該調(diào)節(jié)因子與p53信號通路有關(guān)。因此,包含SV的差異表達(dá)基因功能富集分析可能有助于揭示HCC的進(jìn)化、侵襲性等生物學(xué)過程。
染色體碎裂是一種災(zāi)難性的SV,經(jīng)過大規(guī)模的破壞、重新排布,染色體區(qū)域片段會整合成一種新的基因組配置。研究發(fā)現(xiàn),HCC中的染色體碎裂既能夠影響染色體臂1q和8q以產(chǎn)生基因擴(kuò)增及癌基因的高表達(dá),也可以影響腫瘤耐藥,它通過驅(qū)動環(huán)狀染色體外DNA的擴(kuò)增使其不斷進(jìn)化而獲得藥物耐受性,因此與HCC不良預(yù)后也是密切相關(guān)的[12]。
CNV是一種基因組結(jié)構(gòu)變異,覆蓋的核苷酸數(shù)量遠(yuǎn)超SNV,表現(xiàn)為基因組片段的拷貝數(shù)增加或者減少。CNV對HCC基因組某些特定區(qū)域基因的表達(dá)和調(diào)控具有極為重要的生物學(xué)意義,它引起的基因組片段擴(kuò)增、缺失可能與癌基因、抑癌基因相關(guān)?;贑NV的研究發(fā)現(xiàn),染色體位點(diǎn)15q13.3的低頻率重復(fù)與HBV相關(guān)性HCC的風(fēng)險(xiǎn)密切相關(guān)[13]。該區(qū)域的小核仁RNA SNORA18L5過表達(dá)可抑制p53依賴的細(xì)胞周期阻滯和凋亡,從而促進(jìn)HCC的發(fā)生和發(fā)展。類似地,MYC、RSPO2、CCND1和FGF19高拷貝擴(kuò)增可以使p53、Wnt、磷脂酰肌醇3激酶(PIK3)/RAS、細(xì)胞周期和染色質(zhì)重塑通路均發(fā)生異常。抑癌基因GATA4的CNV在HCC中也極為常見[14]。GATA4可直接結(jié)合并有效地抑制β-Catenin的轉(zhuǎn)錄活性,因此,癌基因β-Catenin本身也是抑癌基因。檢測循環(huán)腫瘤DNA中CNV和SNV水平,較蛋白生物標(biāo)記物(如甲胎蛋白、去γ-羧基凝血酶原)能更提前預(yù)測HCC的發(fā)生[15]。但相較于傳統(tǒng)的腫瘤標(biāo)志物,CNV等突變檢測的應(yīng)用成本稍高,其準(zhǔn)確性也有待進(jìn)一步研究。
LOH是染色體上某一對具有高度多態(tài)性等位基因上一個等位基因的缺失,失去雜合性的改變常造成相應(yīng)抑癌基因的失活,從而促進(jìn)HCC的發(fā)生。HCC中LOH常存在于1p、4q、6q、8p、9p、10q、16q、17q等染色體臂[16]。其中,8p區(qū)域DLC1、CCDC25、ELP3、PROSC、SH2D4A、SORBS3基因的LOH常發(fā)生于HCC早期,提示著不良預(yù)后。D4S2964區(qū)域的ARD1B、SEPT11基因的LOH與較差的總生存期相關(guān),6q26-q27區(qū)域甘露糖-6-磷酸/胰島素樣生長因子受體2(M6P/IGF2R)的LOH預(yù)示著HCC手術(shù)切除患者的不良預(yù)后。近來,還發(fā)現(xiàn)19p13區(qū)域PRKACA的LOH與無慢性肝病或肝硬化的女性相關(guān),它的存在提示病理發(fā)展傾向于肝纖維板層癌[17]。LOH、雜合性增益和SNV負(fù)載之間存在相關(guān)性,這幾種突變負(fù)荷在肝硬化肝比正常肝中更常見[18]??傊琇OH往往提示著HCC的發(fā)展與不良的預(yù)后。
不同的表觀遺傳機(jī)制,比如DNA甲基化、組蛋白修飾、染色質(zhì)重塑和非編碼RNA的表達(dá),控制著染色質(zhì)結(jié)構(gòu)和DNA對轉(zhuǎn)錄機(jī)制的可及性。DNA啟動子甲基化的改變往往發(fā)生于在肝硬化和HCC的前期,甚至可能早于遺傳突變和基因組不穩(wěn)定的發(fā)生[19]。組蛋白甲基化修飾酶突變主要發(fā)生在MLL基因家族,其中最為常見的是MLL4基因的HBV插入[20]。染色質(zhì)重塑相關(guān)的突變基因?yàn)锳RID1A、ARID2[5]。酗酒者HCC中抑癌基因ARID1A失活明顯比其他病因的腫瘤更常見,該突變與CTNNB1突變相關(guān),其引起的PI3K/蛋白激酶B(AKT)通路激活是HCC發(fā)生的關(guān)鍵機(jī)制之一。ARID2同樣參與基因轉(zhuǎn)錄激活、抑制,但它的低發(fā)生率限制了相關(guān)研究。
表觀遺傳修飾可通過染色質(zhì)重塑和轉(zhuǎn)錄后調(diào)節(jié)影響非編碼RNA的活性,這些RNA包括微小RNA、PIWI關(guān)聯(lián)RNA、短干擾RNA、增強(qiáng)子RNA和長鏈非編碼RNA(lncRNA)。近年,研究發(fā)現(xiàn)lncRNA在HCC中存在差異表達(dá),且可通過各種機(jī)制影響HCC的發(fā)生、發(fā)展[21]。lncRNA HAND2-AS1可與染色質(zhì)重塑子INO80復(fù)合體結(jié)合,誘導(dǎo)BMPR1A啟動子使骨形成蛋白(BMP)信號通路激活而促進(jìn)肝癌發(fā)生[22]。lncRNA?;撬嵘险{(diào)基因1(TUG1)可使組蛋白發(fā)生H3K27三甲基化而發(fā)生表達(dá)沉默,lncRNA Linc-GALH則可改變DNMT1泛素化水平從而調(diào)控Gankyrin啟動子的甲基化水平,進(jìn)而影響HCC的轉(zhuǎn)移[23]。非編碼RNA曾被認(rèn)為不具生物學(xué)功能,是轉(zhuǎn)錄的“轉(zhuǎn)錄噪聲”[24]。隨著分子生物學(xué)的發(fā)展,越來越多的研究表明這些分子發(fā)揮著重要的調(diào)節(jié)作用。
HCC的轉(zhuǎn)移途徑包括直接侵犯、肝外播散和區(qū)別于其他惡性腫瘤的肝內(nèi)轉(zhuǎn)移。近年,ARID1A、ARID2、VACM1、CDK14和PIK3CA等基因與HCC轉(zhuǎn)移的關(guān)系得到進(jìn)一步揭示。ARID1A上調(diào)可促進(jìn)10號染色體上缺失的磷酸酶和張力蛋白同源物(PTEN)、p53、磷脂酰肌醇激酶-3催化亞基α(PIK3CA)基因表達(dá)上調(diào),基質(zhì)金屬蛋白酶9(MMP9)和表皮生長因子(VEGF)基因表達(dá)下調(diào),使HCC細(xì)胞的遷移、侵襲、增殖和凋亡能力下降[5]。WNK基因主要發(fā)生SNV(5.3%)和CNV(27.2%),它的失活導(dǎo)致細(xì)胞外信號調(diào)節(jié)激酶1/2(ERK1/2)信號激活、腫瘤相關(guān)巨噬細(xì)胞浸潤[25]。肝內(nèi)轉(zhuǎn)移方面,過去已確定了包括H-ras、MDM2、C-myc、CD44、OPN、hTcf-4、RhoC等一百余個顯著相關(guān)的基因,而且原發(fā)腫瘤與其周圍轉(zhuǎn)移腫瘤的基因表達(dá)模式相似,這表明促進(jìn)侵襲的基因激活始于原發(fā)性瘤灶。不同患者的所有病灶間共有的突變稱為泛突變,泛突變百分比為8%~97%[26]。這暗示腫瘤內(nèi)存在較大異質(zhì)性,單個病灶的序列分析不足以描述HCC的基因組特征。血管生成的失調(diào)、lncRNA和其他各種分子事件協(xié)同作用,同樣促進(jìn)HCC的轉(zhuǎn)移。非編碼高表達(dá)癌基因lncRNA MCM3AP-AS1,可以促進(jìn)叉頭盒蛋白A1(FOXA1)高表達(dá),與患者預(yù)后呈負(fù)相關(guān)[27]。這種直接或間接地與表觀遺傳調(diào)控因子相互作用,能夠調(diào)節(jié)基因表達(dá),影響HCC的轉(zhuǎn)移。類似地,lncRNA UBE2CP3通過調(diào)節(jié)血管生成參與HCC的轉(zhuǎn)移,機(jī)制為抑制磷酸甘油酸激酶1的分泌來激活腫瘤誘導(dǎo)的血管生成。
轉(zhuǎn)移灶數(shù)量方面,既往在腎癌伴肺轉(zhuǎn)移患者中發(fā)現(xiàn)不同轉(zhuǎn)移灶數(shù)量存在基因的差異表達(dá),隨著HCC寡轉(zhuǎn)移概念的提出,類似的猜想支持著基因測序及相關(guān)研究的進(jìn)行,但目前在寡轉(zhuǎn)移與廣泛轉(zhuǎn)移之間未發(fā)現(xiàn)有意義的基因組學(xué)差別的證據(jù)。
目前,HCC分子靶向治療主要通過抑制VEGF來抑制血管生成和腫瘤生長,但基因測序分析發(fā)現(xiàn)Wnt信號、MDM4、MET、MCL1、IDH1、TERT存在抑制劑的潛在治療靶點(diǎn)[6]。這些潛在靶點(diǎn)值得進(jìn)一步研究攻克。另外,抗體靶向治療自若干年前被提出,至今仍無明顯進(jìn)展,僅有某些數(shù)據(jù)表明抗FGF19抗體1A6可以選擇性地抑制攜帶FGF或細(xì)胞周期蛋白D1(CCND1)基因擴(kuò)增的HCC細(xì)胞生長。
免疫治療則主要通過不斷研究攻克包括細(xì)胞毒性T淋巴細(xì)胞抗原4(CTLA-4)、程序性細(xì)胞死亡蛋白1(PD-1)和程序性細(xì)胞死亡1配體1(PD-L1)在內(nèi)的免疫檢查點(diǎn)受體或配體,來延緩免疫耐受及腫瘤進(jìn)展。阻斷骨橋蛋白/集落刺激因子1/集落刺激因子1受體(OPN/CSF1/CSF1R)軸可阻止腫瘤相關(guān)巨噬細(xì)胞轉(zhuǎn)運(yùn),從而增強(qiáng)免疫檢查點(diǎn)抑制劑療效[28]。預(yù)后方面,某些基因及其產(chǎn)物能夠預(yù)測免疫治療的效果,比如低PD-L1表達(dá)與免疫治療效果不佳相關(guān);細(xì)胞角蛋白19(CK19)陽性或羅雙樹樣蛋白4(SALL4)陽性的患者預(yù)后較好[29]。具有Wnt信號通路突變的HCC對免疫檢查點(diǎn)阻滯劑的反應(yīng)更差,其中位生存時(shí)間明顯短于無上述突變的患者(9.1個月vs.15.2個月)[30]。這可以用Wnt-CTNNB1突變、CNV和LOH與免疫耐藥和腫瘤逃逸密切相關(guān)來解釋,因?yàn)閃nt通路常發(fā)生免疫相關(guān)基因的突變,免疫事件如樹突狀細(xì)胞的啟動和激活、干擾素-γ反應(yīng)、調(diào)節(jié)性T淋巴細(xì)胞激活均受到影響[31]。而檢測患者免疫檢查點(diǎn)抑制劑敏感性,需要通過第二代測序技術(shù)檢測基因組中的腫瘤突變負(fù)荷。根據(jù)不同基因組特征,或許可以開發(fā)出HCC免疫反應(yīng)的個性化評估,從而實(shí)現(xiàn)最佳的個性化免疫治療。
目前,大多數(shù)HCC相關(guān)的基因事件仍待揭示,但隨著基因測序和數(shù)據(jù)分析的自動化和跨越發(fā)展,更多未知的基因組序列可以轉(zhuǎn)化為有價(jià)值的生物學(xué)見解。比如,循環(huán)腫瘤DNA特定位點(diǎn)甲基化水平的檢測,可以對HCC進(jìn)行準(zhǔn)確的早期診斷及療效和預(yù)后預(yù)測,具有無創(chuàng)性、實(shí)時(shí)性、準(zhǔn)確性等特點(diǎn),當(dāng)前需要在HCC及更多實(shí)體瘤中進(jìn)一步研究測試。與處理成千上萬個細(xì)胞后得到平均變異水平的傳統(tǒng)測序相比,單細(xì)胞測序這種新手段可以揭示每個細(xì)胞獨(dú)特的變化,有利于探索各細(xì)胞亞群間的聯(lián)系及相關(guān)的基因表達(dá)。最近出現(xiàn)的第3代測序,即可以繪制更加完整的人類基因組圖譜的長讀測序,更是克服了二代測序讀數(shù)短、無法直接檢測天然DNA表觀遺傳修飾等弱點(diǎn)[32]。但產(chǎn)出如此高質(zhì)量基因組組裝仍需科研及市場的檢驗(yàn)。治療方面,除了既定的HCC治療模式和方案外,全球范圍都在積極進(jìn)行靶向、免疫藥物或全新治療計(jì)劃的臨床試驗(yàn),新時(shí)代的基因組學(xué)研究已為之后的治療帶來了曙光。