周澤文張若昕魏慶義余紅平
作者單位:530021南寧 1廣西醫(yī)科大學(xué)附屬腫瘤醫(yī)院;2廣西醫(yī)科大學(xué)公共衛(wèi)生學(xué)院;200433上海 3復(fù)旦大學(xué)公共衛(wèi)生學(xué)院流行病學(xué)教研室;4教育部公共安全重點(diǎn)實(shí)驗(yàn)室;5復(fù)旦大學(xué)附屬腫瘤醫(yī)院腫瘤研究所
2018年全球腫瘤統(tǒng)計(jì)分析結(jié)果顯示[1],全球新發(fā)癌癥病例數(shù)為18 078 957例,其中肝癌新發(fā)病例841 080例,占全球腫瘤新發(fā)病例的4.65%,位列第六;死亡病例9 555 027例,其中肝癌死亡病例數(shù)為781 631例,占全球腫瘤死亡病例的8.18%,位列第四。肝癌是世界范圍內(nèi)常見的高發(fā)腫瘤,嚴(yán)重威脅人類健康。肝癌發(fā)病率在世界范圍內(nèi)差異很大,在東亞、東南亞和撒哈拉以南非洲最高,而全球肝癌患者中約有一半在中國[2]。我國的肝癌類型與歐美和日本等國家不同,乙型肝炎病毒(hepatitis B virus,HBV)感染是我國肝癌發(fā)生的最主要原因[3]。肝癌惡性程度高、病程進(jìn)展迅速、易復(fù)發(fā)和轉(zhuǎn)移,確診患者多以中、晚期為主,5年生存率僅為4%左右,仍是目前臨床上治療效果最差的腫瘤之一[4-5]。雖然超過80%的肝癌與慢性乙型病毒性肝炎相關(guān),但最終只有一小部分乙型病毒性肝炎患者罹患肝癌,提示不同個(gè)體對肝癌存在遺傳易感性,遺傳因素在肝癌的發(fā)生中起重要作用[6-8]。闡明肝癌的易感基因,不僅有助于深入理解肝癌的發(fā)病機(jī)制,而且能為預(yù)測個(gè)體肝癌發(fā)生風(fēng)險(xiǎn)、早期預(yù)防、個(gè)體化治療及新型高效藥物的篩選提供理論依據(jù)和生物靶標(biāo),具有重要意義。
全基因組關(guān)聯(lián)分析(genome-wide association study,GWAS)研究是在全基因組層面上開展的多中心、大樣本、多階段驗(yàn)證的遺傳變異,即單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)與疾病的關(guān)聯(lián)性研究,使我們可能在全基因組范圍內(nèi)發(fā)現(xiàn)與疾病相關(guān)的易感基因及其遺傳變異[9]。GWAS已被科學(xué)界公認(rèn)是行之有效的系統(tǒng)搜尋重大疾病易感基因的研究方法,并且這一方法無需預(yù)先提出致病基因的假設(shè),這一點(diǎn)與候選基因策略不同,已經(jīng)成為研究人類腫瘤遺傳變異的有力工具[10-13]。GWAS的流程示意圖如圖1所示。自2010年第一篇關(guān)于肝細(xì)胞癌(hepatocellular carcinoma,HCC)的GWAS文章[14]發(fā)表以來,有關(guān)HCC的GWAS研究已有20余篇。本文將對目前GWAS在HCC中的研究進(jìn)行總結(jié),并分析GWAS在HCC研究中的優(yōu)勢、局限性和未來展望。
圖1 GWAS流程示意圖
目前關(guān)于HCC的GWAS研究集中在東亞人群,研究主要采用兩階段法或多階段法,第一階段在覆蓋全基因組范圍的SNP進(jìn)行關(guān)聯(lián)性分析,篩選出與HCC遺傳易感性相關(guān)聯(lián)的SNP位點(diǎn),接著對這些關(guān)聯(lián)的SNP進(jìn)行第二階段或多階段的大樣本量人群進(jìn)一步驗(yàn)證,然后結(jié)合兩階段或多階段結(jié)果進(jìn)行綜合分析。HCCGWAS研究中的病例組為HCC患者,對照組為慢性乙型病毒性肝炎患者、慢性丙型病毒性肝炎患者或肝硬化患者,涉及的研究人群主要來自中國、日本、韓國和泰國。
2010年,張紅星等首次報(bào)道了我國HBV相關(guān)性HCC GWAS研究,并確定1p36.22為HCC的易感區(qū)域[14]。同年,CLIFFORD等[15]報(bào)道了韓國人群HCC GWAS研究結(jié)果,發(fā)現(xiàn)了與拷貝數(shù)變異顯著關(guān)聯(lián)的T細(xì)胞受體γ和α基因易感區(qū)域和包括MHC-Ⅱ區(qū)域在內(nèi)的3個(gè)遺傳位點(diǎn)。2011年,KUMAR等[16]開展了日本丙型肝炎病毒(hepatitis C virus,HCV)相關(guān)性HCC GWAS研究,發(fā)現(xiàn)位于基因座6p21.33區(qū)域的SNP rs2596542位點(diǎn)與HCV相關(guān)性HCC易感性顯著相關(guān)。文獻(xiàn)[14-25]報(bào)道的GWAS研究發(fā)現(xiàn)的HCC易感區(qū)域和位點(diǎn)詳見表1。
表1 GWAS研究發(fā)現(xiàn)的HCC易感區(qū)域和位點(diǎn)
1p36.22區(qū)域是最早被發(fā)現(xiàn)與HCC遺傳易感性相關(guān)的區(qū)域,在中國人群開展的一項(xiàng)GWAS研究[14]在該區(qū)域發(fā)現(xiàn)了1個(gè)SNP位點(diǎn)(KIF1β基因的內(nèi)含子SNP:rs17401966)和2個(gè)可能的致病基因UBE4β和PDG,表明1p36.22區(qū)域是HBV相關(guān)性HCC的遺傳易感區(qū)域,這一區(qū)域KIF1β,UBE4β與PGD基因相關(guān)的表達(dá)產(chǎn)物或生物學(xué)通路途徑可能參與了HCC的發(fā)生發(fā)展過程。后續(xù)的研究[27]顯示,KIF1β是HCC的抑癌基因,該基因通過整聯(lián)蛋白通路調(diào)控細(xì)胞侵襲、遷移和轉(zhuǎn)移,其低表達(dá)與HCC的高轉(zhuǎn)移風(fēng)險(xiǎn)顯著相關(guān)。
染色體6p21.3區(qū)域同時(shí)存在HBV相關(guān)性和HCV相關(guān)性HCC的遺傳易感位點(diǎn)。前期的肝癌GWAS研究結(jié)果顯示[28-29],SNP位點(diǎn)變異與宿主感染HCV后發(fā)展成慢性丙型病毒性肝炎密切相關(guān),但是否與HCV相關(guān)性HCC相關(guān)聯(lián)尚缺乏研究證據(jù)。為了確定HCV相關(guān)性HCC遺傳易感位點(diǎn),一項(xiàng)GWAS研究[16]在日本人群中開展,結(jié)果發(fā)現(xiàn)位于染色體6p21.33區(qū)域的SNP位點(diǎn)rs2596542與HCV易感性無關(guān)聯(lián)(P=0.61),但在慢性丙型病毒性肝炎發(fā)展為HCC的進(jìn)程中發(fā)揮重要作用。進(jìn)一步研究結(jié)果顯示,該SNP位點(diǎn)rs2596542位于主要組織相容性復(fù)合體的Ⅰ類相關(guān)鏈A(major histocompatibility complex classⅠ-related chain A,MICA)基因座,并且可以影響該基因的表達(dá),攜帶rs2596542A等位基因的HCC患者中MICA的表達(dá)呈低水平。前期有研究結(jié)果[30]顯示,血清可溶性MICA水平與膜結(jié)合的MICA25水平成正比,而與膜結(jié)合的MICA25對激活自然殺傷細(xì)胞和CD8+T細(xì)胞以消除感染了HCV的細(xì)胞至關(guān)重要,這一系列的研究表明,宿主免疫系統(tǒng)遺傳變異在HCV相關(guān)性HCC發(fā)生中起關(guān)鍵作用。
前期GWAS研究[31-32]表明,人類白細(xì)胞相關(guān)抗原(human leukocyte antigen,HLA)編碼區(qū)域的變異與HBV感染之間存在關(guān)聯(lián)性,HLA-DRB1位點(diǎn)的遺傳變異與持續(xù)感染HBV的風(fēng)險(xiǎn)密切相關(guān)。一項(xiàng)在中國開展的HBV相關(guān)性HCC的GWAS研究[19]發(fā)現(xiàn),染色體6p21.32區(qū)域的SNP位點(diǎn)rs9272105與HBV相關(guān)性HCC易感性有關(guān)聯(lián),該位點(diǎn)位于6p21.32區(qū)域的HLA-DQA1和HLA-DRB1之間。在中國開展的另一項(xiàng)GWAS研究[20]對在日本慢性丙型病毒性肝炎人群發(fā)展成HCC起到關(guān)鍵作用,位于染色體6p21.33區(qū)域的SNP位點(diǎn)rs2596542在中國HBV相關(guān)肝癌人群中進(jìn)行了檢驗(yàn),發(fā)現(xiàn)該位點(diǎn)與HBV相關(guān)性HCC不相關(guān)(OR=0.93,P=0.24)。這種關(guān)聯(lián)的差異提示HCV和HBV相關(guān)性HCC易感性的不同遺傳背景。一項(xiàng)在臺(tái)灣地區(qū)開展的HCV相關(guān)性HCC GWAS研究也在染色體6p21.3的HLA區(qū)域發(fā)現(xiàn)了HCC相關(guān)的8個(gè)易感位點(diǎn),這8個(gè)易感位點(diǎn)均位于HLA-DQB1基因座中,而且HCV基因型與HLA-DQB1之間存在HCC風(fēng)險(xiǎn)的相互作用[24]。
一項(xiàng)在中國HBV相關(guān)性HCC人群開展的GWAS研究發(fā)現(xiàn)染色體7q21.13區(qū)域存在HCC的新關(guān)聯(lián)位點(diǎn)rs10272859,該位點(diǎn)位于CDK14基因內(nèi)的第5個(gè)內(nèi)含子中。前期研究表明,CDK14是細(xì)胞周期蛋白依賴性激酶(cyclin-dependent kinases,CDK)家族成員,該家族在細(xì)胞周期進(jìn)程和細(xì)胞增殖中起關(guān)鍵作用[33]。CDK14的移位表達(dá)可誘導(dǎo)HCC細(xì)胞大量侵襲和遷移[34]。此外,CDK14表達(dá)增加與低分化程度HCC以及微血管浸潤有關(guān)[35]。該項(xiàng)GWAS研究進(jìn)一步證實(shí)了CDK14表達(dá)上調(diào)與肝癌患者總生存期減少有關(guān),且SNP位點(diǎn)rs10272859參與調(diào)控CDK14表達(dá)并影響HCC患者預(yù)后[25]。
抑制谷氨酸釋放和(或)谷氨酸受體活性可以抑制乳腺癌[36]、喉癌[37]、胰腺癌[38]和胃癌[39]腫瘤細(xì)胞增殖和侵襲,表明谷氨酸及其信號(hào)通路在多種癌癥發(fā)展中起重要作用。在中國人群中開展的一項(xiàng)GWAS研究[19]將染色體21q21.3區(qū)域的SNP位點(diǎn)rs455804鑒定為HCC的易感位點(diǎn)。rs455804位于GRIK1基因的第1個(gè)內(nèi)含子中,而GRIK1編碼參與谷氨酸信號(hào)傳導(dǎo)的信號(hào)蛋白CLUR5,這項(xiàng)研究不僅表明了谷氨酸信號(hào)通路在肝癌發(fā)展過程中的潛在作用,也為谷氨酸信號(hào)通路在癌癥發(fā)展中的重要作用提供了新的證據(jù)。
STAT4傳輸白介素12和Ⅰ型干擾素(IFN-α或IFN-β)的信號(hào),以誘導(dǎo)IFN-γ產(chǎn)生[40]。IFN-γ是一種多效細(xì)胞因子,在宿主防御中起著至關(guān)重要的作用[41]。STAT4對IFN-γ的激活受損可能會(huì)降低其抗病毒和抗腫瘤活性,而IFN-γ過表達(dá)則可能導(dǎo)致自身免疫性疾病的發(fā)展[42-43]。此前,多個(gè)GWAS和基于候選基因的關(guān)聯(lián)研究報(bào)告了STAT4遺傳變異,特別是SNP位點(diǎn)rs7574865與各種自身免疫性疾病發(fā)病風(fēng)險(xiǎn)有關(guān)聯(lián)[44-45]。一項(xiàng)HBV相關(guān)性HCC的GWAS研究發(fā)現(xiàn)SNP位點(diǎn)rs7574865的G等位基因與HCC發(fā)生風(fēng)險(xiǎn)較高相關(guān)[20],而該等位基因與自身免疫疾病發(fā)生風(fēng)險(xiǎn)較低相關(guān),這一結(jié)果支持STAT4在自身免疫性疾病和HBV相關(guān)性HCC發(fā)病中的雙重作用。
GWAS研究發(fā)現(xiàn)的其他易感位點(diǎn)所在染色體區(qū)域主要有1p13.3、1q25.3、3q24、8p12、11q14.2、12q24.1、13q14.3、17q11.2、17q12和18p11.31等,這些區(qū)域的位點(diǎn)或位于基因荒漠區(qū),或所在區(qū)域基因功能尚未完全闡明,故目前對這些區(qū)域位點(diǎn)的功能研究較少,尚待后續(xù)研究進(jìn)一步探索闡明其在HCC發(fā)生發(fā)展過程中的機(jī)制作用。
MICA基因?yàn)镠CV相關(guān)性HCC的易感基因,在HCC患者中MICA蛋白往往呈低表達(dá)[16]。鑒于MICA蛋白在免疫激活中的重要作用[46],調(diào)節(jié)MICA表達(dá)的藥物可能是HCC免疫治療的新靶標(biāo)?;谏鲜鼋Y(jié)果,GOTO等[47]通過刪選在FDA批準(zhǔn)的藥物庫中發(fā)現(xiàn)組蛋白去乙酰化酶抑制劑(histone deacetylase inhibitor,HDACi)可以恢復(fù)MICA表達(dá),進(jìn)一步的代謝組學(xué)分析結(jié)果顯示,HDACi誘導(dǎo)的HCC細(xì)胞特異性MICA表達(dá)增強(qiáng)可以增強(qiáng)自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性,MICA脫氫酶抑制劑處理可以進(jìn)一步增強(qiáng)這種毒性,兩者都增強(qiáng)了自然殺傷細(xì)胞的抗腫瘤活性,進(jìn)而起到抑制腫瘤生長的作用,這一研究結(jié)果揭示了腫瘤免疫治療的新機(jī)制,為HCC化學(xué)免疫治療提供新思路。
GWAS已在STAT4和HLA-DQ以及HLA I類區(qū)域的基因座和1p36.22、6p21.32、7q21.13及21q21.3等處鑒定了HCC的遺傳易感位點(diǎn)[14-26]。但是,與HCC患者術(shù)后生存相關(guān)的基因位點(diǎn)知之甚少。由于HCC病情復(fù)雜,單個(gè)基因變異不可能對HCC的臨床結(jié)果產(chǎn)生巨大影響,但是一系列SNP的協(xié)同可能對疾病進(jìn)展起重要作用[48-49]。近期在中國開展的一項(xiàng)以HCC術(shù)后患者為研究對象的GWAS研究,研究第一階段通過367例HCC患者鑒定與預(yù)后相關(guān)的SNPs,第二階段在758例患者中對發(fā)現(xiàn)的與預(yù)后相關(guān)的SNP位點(diǎn)進(jìn)行驗(yàn)證,研究最終確定了5個(gè)SNP位點(diǎn)(rs10893585、rs2431、rs34675408、rs6078460和rs6766361)與患者生存時(shí)間顯著相關(guān),隨后通過Cox比例風(fēng)險(xiǎn)回歸建立預(yù)后模型預(yù)測HCC患者術(shù)后生存,生存預(yù)測模型的敏感性和特異性分別為58.8%和74.8%,用該模型計(jì)算HCC患者術(shù)后5年生存率準(zhǔn)確可靠[50]。
目前,GWAS研究鑒定出了大量HCC易感區(qū)域和基因,基于這些易感基因開展基因型-表型及相關(guān)分子作用途徑的研究成為新的研究熱點(diǎn)。大量研究證據(jù)表明TP53基因在HCC發(fā)生發(fā)展中起重要作用[51]。有研究者基于其前期一項(xiàng)GWAS研究探討HBV相關(guān)性HCC患者中與TP53蛋白表達(dá)狀態(tài)相關(guān)的候選SNPs和分子通路,闡明其可能的機(jī)制,并提出SNP-togene-to-pathway的科學(xué)假說。該研究發(fā)現(xiàn)了18個(gè)與HBV相關(guān)性HCC中TP53表達(dá)狀態(tài)相關(guān)的候選SNPs和10個(gè)候選通路,其中最強(qiáng)的作用機(jī)制涉及主要組織相容性復(fù)合體Ⅱ類DP beta1(HLA-DPB1-rs1042153)、主要組織相容性復(fù)合體Ⅱ類DQ beta 1(HLA-DQB1-rs1130399、HLA-DQB1-rs1049056、HLA-DQB1-rs1049059和HLA-DQB1-rs1049060)和主要組織相容性復(fù)合體Ⅱ類DR beta 1(HLA-DRB1-rs35445101),在此基礎(chǔ)上提出了5個(gè)新的SNP-to-gene-to-pathway假說;生存分析表明,TP53陰性狀態(tài)下的COL6A3-rs111231885、COL6A3-rs113155945和COL6A3區(qū)域的4 CC單倍型可能對肝切除術(shù)后HBV相關(guān)的HCC患者具有保護(hù)作用,并且可以作為潛在的預(yù)后評估生物標(biāo)志物[52]。以往研究結(jié)果顯示,MKI67標(biāo)記指數(shù)與包括肝癌在內(nèi)的多種腫瘤的臨床病理特征和臨床預(yù)后相關(guān)[53-54],而NM23在腫瘤組織中的表達(dá)與HCC患者腫瘤轉(zhuǎn)移和生存期有關(guān)[55]。兩項(xiàng)分別針對MKI67和NM23蛋白表達(dá)與HCC患者預(yù)后的GWAS研究在中國開展,針對MKI67蛋白表達(dá)的GWAS研究結(jié)果發(fā)現(xiàn),靠近TNN和CCDC8的5個(gè)位點(diǎn)(rs3813243、rs2288563、rs2562832、rs56142888和rs34186470)與MKI67蛋白表達(dá)有關(guān),位于TTN基因SNP位點(diǎn)rs2288563和rs25622832可以作為HBV相關(guān)性HCC患者的臨床預(yù)后標(biāo)志物[56];而針對與NM23蛋白表達(dá)水平相關(guān)的候選SNP研究結(jié)果顯示,銀屑病易感性1候選物1(PSORS1C1)和含StAR相關(guān)脂質(zhì)反式結(jié)構(gòu)域3(STARD3)的SNP與NM23表達(dá)相關(guān),PSORS1C1的遺傳變異是預(yù)測HBV相關(guān)性HCC患者術(shù)后臨床結(jié)局的潛在生物標(biāo)志物,PSORS1C1和STARD3的遺傳變異與HBV相關(guān)性HCC患者NM23表達(dá)和臨床結(jié)局有關(guān)[57]。
GWAS在研究人群基因組中對數(shù)十萬至數(shù)百萬個(gè)遺傳變異進(jìn)行分析以鑒定基因型-表型關(guān)聯(lián),在過去十年間已經(jīng)徹底改變了復(fù)雜疾病的遺傳學(xué)研究方式[58-59]。在GWAS之前,為了研究HCC易感性與SNP的關(guān)聯(lián),研究者主要采用候選基因策略[60-61]。該策略著眼于預(yù)設(shè)的候選基因而遺漏了基因組內(nèi)大部分的遺傳信息。GWAS研究的最大優(yōu)勢在于摒棄了候選基因方法中的預(yù)先假設(shè),不再著眼于已知的生物學(xué)通路基因,而是從人類全基因組范圍內(nèi)篩選出與復(fù)雜疾病易感性關(guān)聯(lián)的遺傳變異[62-63]。此外,GWAS研究一般樣本量較候選基因方法大,采用更嚴(yán)格的檢驗(yàn)水準(zhǔn),且往往進(jìn)行多階段、多中心驗(yàn)證,研究結(jié)果的可靠性得到了有效保障。
GWAS研究也存在局限性。首先,HCC GWAS研究往往基于嚴(yán)格的檢驗(yàn)水準(zhǔn)[64],一般只選擇少量的峰值位點(diǎn)進(jìn)行后期驗(yàn)證,降低了假陽性,但同時(shí)也可能損失其他潛在的遺傳位點(diǎn);其次,目前大部分的研究主要聚焦在SNP位點(diǎn)信息與遺傳易感性的關(guān)聯(lián)性,一定程度上忽略了拷貝數(shù)變異(copy number variations,CNVs)、基因缺失、串聯(lián)重復(fù)序列等其他變異,而且對基因-環(huán)境因素交互作用也缺乏足夠重視[65];再次,目前GWAS研究主要在于發(fā)現(xiàn)關(guān)聯(lián)性強(qiáng)的SNP位點(diǎn),這些位點(diǎn)大多位于基因的非編碼區(qū)或基因和基因之間的結(jié)構(gòu)區(qū)域甚至基因的荒漠區(qū)[66],對于這些SNP的生物學(xué)功能仍處于探索階段,這也極大限制了GWAS研究結(jié)果的實(shí)際應(yīng)用;最后,不可回避的問題是任何肝癌GWAS研究中鑒定的單核苷酸變異只能解釋復(fù)雜性狀的遺傳性的一小部分[67-68],而且關(guān)聯(lián)位點(diǎn)和肝癌發(fā)生發(fā)展并不一定存在因果關(guān)系。對于肝癌這一復(fù)雜多基因疾病,尋找全面的致病遺傳標(biāo)志物和基因仍是未來的重要研究方向。
GWAS改變了HCC的遺傳學(xué)研究,已經(jīng)開展的GWAS研究不僅闡述了HCC發(fā)生、發(fā)展的遺傳學(xué)基礎(chǔ),積累了豐富的遺傳學(xué)數(shù)據(jù),也為檢測、治療、預(yù)后評估以及藥物開發(fā)提供了寶貴的遺傳生物標(biāo)志物信息。隨著新的分子生物學(xué)技術(shù)與新方法的出現(xiàn)以及基于數(shù)據(jù)挖掘的生物信息學(xué)研究方法研究的不斷深入,后GWAS時(shí)代已經(jīng)來臨?;贖CC GWAS發(fā)現(xiàn)的SNP以及在同一區(qū)域中連鎖的SNP位點(diǎn)可多達(dá)成百上千個(gè),如何從中找到真正與HCC相關(guān)聯(lián)的SNP,并從生物學(xué)上解釋其功能及其與HCC的關(guān)系,是后GWAS時(shí)代面臨的重大挑戰(zhàn),也是今后復(fù)雜疾病GWAS領(lǐng)域研究的方向和熱點(diǎn)。對HCC GWAS鑒定出的疾病易感基因功能研究的不斷深入,將有助于人類明確認(rèn)知基因變化與HCC的關(guān)系,從分子水平層面詮釋HCC的發(fā)病機(jī)制,發(fā)現(xiàn)新的HCC相關(guān)標(biāo)志物和診療靶點(diǎn),改善HCC的預(yù)防、診斷與治療,促進(jìn)精準(zhǔn)醫(yī)學(xué)理念下HCC預(yù)防與治療的發(fā)展,進(jìn)一步提升我國HCC的綜合防治水平。