姜 赟,史加海
(1 南通大學(xué)附屬瑞慈醫(yī)院胸心外科,南通 226010;2 南通大學(xué)附屬醫(yī)院胸心外科)
食管癌是發(fā)生在食管上皮組織的惡性腫瘤,是人類常見的消化道惡性腫瘤之一,其侵襲性較高、預(yù)后較差。食管癌的患病率在世界各地分布不均,據(jù)WHO 報道,全世界約50%的食管癌發(fā)生在中國[1]。由于食管癌早期診斷不易,50%以上的患者就診時已處于中晚期。該病自然病程僅6~8 個月,診斷后的總5 年生存率僅12.8%[2-3]。上皮來源的食管癌主要有兩種病理類型:食管鱗狀細(xì)胞癌和食管腺癌,其中食管鱗狀細(xì)胞癌是我國食管癌的主要組織學(xué)類型,占90%~95%。食管癌的易感性受環(huán)境和遺傳因素的雙重影響,涉及到食管癌發(fā)生過程中的危險因素和機制目前尚不清楚。
全基因組關(guān)聯(lián)研究(genome-wide association studies,GWAS)作為研究疾病遺傳因素的重要方法,利用芯片通過對單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)位點進(jìn)行檢測,發(fā)現(xiàn)了與數(shù)百種疾病特征相關(guān)的變異[4]。2012 年,我國研究者[5]發(fā)現(xiàn)rs1050631和rs7242481 與漢族食管鱗癌患者的生存相關(guān)聯(lián)。2016 年發(fā)表的一項研究在64 例中國食管癌患者的樣本中檢測了45 個基因的737 個位點,發(fā)現(xiàn)主要的突變基因有TP53、PIK3CA、FBXW7 和KRAS[6]。然而,GWAS 研究中找到與疾病或表型相關(guān)的SNPs 大部分位于非編碼區(qū)[7],通過SNPs 解釋其在疾病發(fā)病發(fā)生機制中的生物學(xué)功能時存在難度。DNA 元素百科全書協(xié)會研究[8]表明,非編碼區(qū)的SNPs 也含有調(diào)控元件,可間接調(diào)控近端或遠(yuǎn)端基因的表達(dá)。全基因組表達(dá)定量性狀位點(genome-wide expression quantitative trait locus,eQTL)分析是研究SNP 對基因表達(dá)影響的一種典型且有效的統(tǒng)計方法[9-10]。eQTL 分析通過測量基因型和基因表達(dá)水平數(shù)據(jù),使用關(guān)聯(lián)分析或連鎖分析尋找基因型和基因表達(dá)水平之間是否存在關(guān)聯(lián)[10-11]。
挖掘已發(fā)現(xiàn)的與疾病相關(guān)的SNP 功能是后GWAS 時代的主要任務(wù)和挑戰(zhàn)之一。有必要進(jìn)一步研究這些GWAS 研究中發(fā)現(xiàn)的SNP 的作用靶點,以明確它們在疾病發(fā)生中的作用機制。因此,本研究通過搜索GWAS 數(shù)據(jù)庫中與食管癌相關(guān)的SNPs,利用eQTL 數(shù)據(jù)庫對SNPs 進(jìn)行靶基因預(yù)測,并在食管癌腫瘤組織、癌旁腫瘤組織和正常組織中檢測這些基因的表達(dá)水平,進(jìn)一步尋找與食管癌相關(guān)的遺傳因素。
1.1 GWAS 數(shù)據(jù)庫下載與食管癌相關(guān)的SNPs 及其功能注釋 本研究在GWAS Central 和The Phenotype-Genotype Integrator(PheGenI)網(wǎng)站下載與食管癌相關(guān)的SNPs,表型檢索詞為“Esophageal Neoplasms”。使用UCSC Table Browser 對SNPs 進(jìn)行相應(yīng)的功能注釋。利用UCSC Table Browser 可獲得某些特定的基因或整條染色體的DNA 序列信息和注釋信息,并可用文本形式來獲取存儲在Genome Browser 數(shù)據(jù)庫中的基因組匯編和注釋數(shù)據(jù)[12]。
1.2 eQTL 數(shù)據(jù)庫查找SNPs 調(diào)控的基因 通過搜索應(yīng)用4 個在線eQTL 數(shù)據(jù)庫:https://genenetwork.nl/bloodeqtlbrowser/,http://bioinfo.life.hust.edu.cn/PancanQTL/,http://eqtl.uchicago.edu/cgi-bin/gbrowse/eqtl/和https://www.hsph.harvard.edu/liming-liang/software/eqtl/,篩選SNPs 所作用的具有eQTL 效應(yīng)基因。
1.3 研究對象 收集南通大學(xué)附屬瑞慈醫(yī)院2018—2019 年住院期間行食管癌切除術(shù)切除食管鱗狀細(xì)胞癌組織標(biāo)本的患者。排除標(biāo)準(zhǔn):(1)慢性肝腎功能不全的患者;(2)術(shù)前曾進(jìn)行放療或化療的患者;(3)有其他部位惡性腫瘤的患者。收集研究對象的一般人口學(xué)信息,吸煙史、飲酒史、病史和家族史資料,體格檢查資料,實驗室檢查資料,TNM 分期,臨床病理資料,臨床診斷治療信息等。
1.4 RNA 提取,反轉(zhuǎn)錄cDNA 后進(jìn)行逆轉(zhuǎn)錄實時定量聚合酶鏈?zhǔn)椒磻?yīng)(reverse transcription-real-time quantitative polymerase chain reaction,RT-PCR)檢測術(shù)中另保留一份患者的腫瘤組織、癌旁組織和食管遠(yuǎn)端正常黏膜組織,用去RNA 的無核酶水清洗,剪成<0.5 cm 的薄片后放入離心管,經(jīng)研磨后得到破碎的組織原液。加入1 mL Trizol 充分吹打裂解,采用苯酚氯仿法提取細(xì)胞RNA,并反轉(zhuǎn)錄獲得cDNA。按照引物設(shè)計原則設(shè)計待測基因的PCR 引物,見表1。
表1 待測基因引物序列
將cDNA 加入無核酶水稀釋5 倍,取出1 μL,分別加入0.5 μL 上、下游引物,10 μL 2×GoTaq qPCR Master Mix 和8 μL 無核酶水,配置成總體積為20 μL的RT-PCR 反應(yīng)體系,采用GAPDH 作為內(nèi)參基因,每組設(shè)置3 個平行孔,采用ABI QuantStudioTM6 Flex全功能實時熒光定量PCR 系統(tǒng)的標(biāo)準(zhǔn)程序進(jìn)行RTPCR。反應(yīng)程序:94 ℃預(yù)變性30 s;94 ℃變性5 s,55 ℃退火15 s,共40 個循環(huán)。
1.5 統(tǒng)計學(xué)方法 采用SPSS 19.0 統(tǒng)計軟件對收集的資料進(jìn)行數(shù)據(jù)分析。計量資料以表示,符合正態(tài)分布的計量資料組間比較采用t 檢驗,不符合正態(tài)分布的計量資料采用非參數(shù)檢驗。計數(shù)資料采以n(%)表示,組間比較采用χ2檢驗或Fisher 確切概率法。對RT-PCR 差異表達(dá)基因的計算,先計算△Ct值:△Ct=Ct(檢測基因)-Ct(內(nèi)參基因);再計算△△Ct,△△Ct=△Ct(腫瘤組織/癌旁組織)-△Ct(正常組織),采用2-△△CT方法計算基因表達(dá)的差異倍數(shù)。P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 數(shù)據(jù)庫中發(fā)現(xiàn)與食管癌相關(guān)的SNPs 在數(shù)據(jù)庫中共發(fā)現(xiàn)40 個SNPs 與食管癌相關(guān),來自7 個以東亞人群為研究對象的GWAS 研究,SNPs 的位置信息和-lgP 值如圖1 所示。使用UCSC Table Browser對上述40 個SNPs 進(jìn)行功能注釋,只有2 個SNP 位于編碼區(qū),18 個SNPs 位于內(nèi)含子區(qū)域,有4 個SNPs,錯義突變1 個SNP 位于基因3′端未轉(zhuǎn)譯區(qū)域。
2.2 與食管癌相關(guān)SNPs 具有eQTL 效應(yīng)的基因在Bloodeqtlbrowser 數(shù)據(jù)庫中,共發(fā)現(xiàn)26 對SNPmRNA,其中22 對為順式作用eQTL(cis-eQTL),4 對為反式作用eQTL(Trans-eQTL)。在PancanQTL 數(shù)據(jù)庫中共發(fā)現(xiàn)19 對SNP-mRNA,其中18 對為ciseQTL,僅1 對為Trans-eQTL。在uchicagoeQTL 數(shù)據(jù)庫發(fā)現(xiàn)1 個食管癌相關(guān)的SNP,具有cis-eQTL 效應(yīng)。在Liming-liang/software/eqtl 數(shù)據(jù)庫中發(fā)現(xiàn)6 對SNP-mRNA,其中5 對為cis-eQTL,1 對為Trans-eQTL。
采用Cytoscape Version 3.6.1 軟件對上述數(shù)據(jù)庫中發(fā)現(xiàn)的具有eQTL 效應(yīng)的SNP 和基因的關(guān)聯(lián)進(jìn)行可視化呈現(xiàn),結(jié)果如圖2 所示。共有20 個SNP 參與了對34 個基因的調(diào)控作用,其中包含3 個較為復(fù)雜的調(diào)控網(wǎng)絡(luò),如:rs2239815、rs4822983 和rs738722共同參與調(diào)控了卷曲螺旋結(jié)構(gòu)域117 基因(coiled-coil domain containing 117,CCDC117)、細(xì)胞周期檢測點激酶2(checkpoint kinase 2,CHEK2)和HSCB 基因。此外,Cytoscape 還可視化呈現(xiàn)了多個單一的SNP-基因調(diào)控關(guān)聯(lián)。
2.3 驗證基因確定 選擇在以上eQTL 數(shù)據(jù)庫中得到兩次驗證的基因進(jìn)行下一步研究,共發(fā)現(xiàn)5 個基因在2 個eQTL 數(shù)據(jù)庫得到一致結(jié)果,分別是絲氨酸羧化酶基因(serine racemase,SRR),CCDC117、CHEK2、XBP1 和NOC3 樣DNA 復(fù)制調(diào)節(jié)因子(NOC3 like DNA replication regulator,NOC3L)。
2.4 食管癌患者的一般情況 本研究中36 例食管癌患者均為食管鱗狀細(xì)胞癌,年齡54~78 歲,平均(61.86±9.65)歲。男23 例,女13 例,不同性別的患者間吸煙史和飲酒史差異有統(tǒng)計學(xué)意義(P<0.05),年齡、高血壓、糖尿病、生化檢查資料及TNM 分期上差異均無統(tǒng)計學(xué)意義(均P>0.05),見表2。
2.5 食管癌腫瘤組織、癌旁組織和正常組織RT-PCR結(jié)果的比較 分別從食管癌腫瘤組織、癌旁組織和正常組織提取RNA,反轉(zhuǎn)錄后進(jìn)行RT-PCR 檢測SRR、CCDC117、CHEK2、XBP1 和NOC3L 的表達(dá)。結(jié)果顯示:與正常組織比較,食管癌腫瘤組織中CCDC117(t=6.25,P<0.001,差異倍數(shù)=1.90)、CHEK2(t=9.37,P<0.001,差異倍數(shù)=3.08)、XBP1(t=10.77,P<0.001,差異倍數(shù)=2.67)呈現(xiàn)高表達(dá),NOC3L(t=1.86,P=0.06,差異倍數(shù)=1.33)和SRR(t=0.24,P=0.81,差異倍數(shù)=0.98)的表達(dá)差異無統(tǒng)計學(xué)意義。此外,腫瘤組織與癌旁組織在CHEK2(t=2.17,P=0.03)和XBP1(t=1.86,P<0.001)的表達(dá)上差異也存在統(tǒng)計學(xué)意義,CCDC117、NOC3L和SRR 在腫瘤組織和癌旁組織中表達(dá)差異無統(tǒng)計學(xué)意義,見圖3。
表2 食管癌患者基本資料和不同性別之間臨床資料的比較(,n,%)
表2 食管癌患者基本資料和不同性別之間臨床資料的比較(,n,%)
食管癌是發(fā)生在食管上皮組織的惡性腫瘤,是人類常見的消化道惡性腫瘤之一。眾所周知,遺傳學(xué)上的基因突變是導(dǎo)致腫瘤發(fā)生的根本原因,也與食管癌的發(fā)生、發(fā)展和預(yù)后密切相關(guān)。GWAS 作為研究疾病遺傳因素的重要方法,為研究者探索和識別參與食管癌過程的危險因素或易感基因提供了巨大的機遇。本研究利用GWAS 網(wǎng)站共發(fā)現(xiàn)40 個與食管癌相關(guān)的SNPs。對這些SNPs 進(jìn)行功能注釋發(fā)現(xiàn)大多數(shù)SNPs 位于內(nèi)含子區(qū)域。位于內(nèi)含子本身的SNPs位點可能會通過影響基因的轉(zhuǎn)錄水平、剪接(內(nèi)含子剪接增強子或沉默子)等機制影響基因的功能。
本研究先采用4 個eQTL 在線表達(dá)數(shù)量性狀位點數(shù)據(jù)庫篩選出SNPs 所作用的具有eQTL 效應(yīng)基因。Bloodeqtlbrowser 對來自5 311 個個體的未轉(zhuǎn)化外周血樣本進(jìn)行了eQTL 分析,并在2 775 個個體中進(jìn)行重復(fù)驗證[13]。PancanQTL 綜合提供了33 種癌癥類型的cis-eQTL 結(jié)果(SNPs 影響局部基因表達(dá))和Trans-eQTL 結(jié)果(SNPs 影響遠(yuǎn)處基因表達(dá))[14]。uchicagoeQTL 數(shù)據(jù)庫是來源于芝加哥大學(xué)Pritchard實驗室和Gilad 實驗室的基因調(diào)控資源。哈佛大學(xué)liming-liang/software/eqtl 數(shù)據(jù)庫分別利用Affymetrix HG U133+2.0 芯片對405 個樣本、利用Illumina Human6V1 陣列對550 個樣本的淋巴母細(xì)胞系的基因表達(dá)進(jìn)行了研究[15]。在4 個eQTL 數(shù)據(jù)庫中共發(fā)現(xiàn)20 個SNPs 參與了對34 個基因的調(diào)控。
進(jìn)一步選擇在以上eQTL 數(shù)據(jù)庫中得到兩次驗證的SRR、CCDC117、CHEK2、XBP1 和NOC3L 基因,在食管癌腫瘤組織、癌旁組織和正常組織中進(jìn)行驗證。結(jié)果發(fā)現(xiàn)食管癌腫瘤組織樣本中XBP1 和CHEK2基因的表達(dá)比癌旁組織和正常組織高,CCDC117 基因在食管癌腫瘤組織樣本中也呈現(xiàn)一定程度的高表達(dá)。XBP1 位于人類第22 號染色體上,是亮氨酸拉鏈蛋白家族的成員之一。XBP1 基因參與人體多種生理功能,在促進(jìn)細(xì)胞生長、分化、促進(jìn)內(nèi)質(zhì)網(wǎng)擴張、抵御氧化應(yīng)激中都發(fā)揮著重要作用[16-17]。研究[18]發(fā)現(xiàn)XBP1 在食管鱗狀細(xì)胞癌腫瘤組織中的表達(dá)水平明顯高于正常食管組織。CCDC117 是卷曲螺旋結(jié)構(gòu)域家族蛋白成員之一,位于人類第22 號染色體。CCDC家族蛋白成員參與調(diào)控多種惡性腫瘤細(xì)胞的侵襲、轉(zhuǎn)移。研究[19]發(fā)現(xiàn)CCDC33、CCDC34、CCDC67 和CCDC88A 蛋白的表達(dá)異常和相關(guān)通路改變可明顯影響膀胱癌、肺癌、胰腺癌的進(jìn)展,但目前尚沒有對CCDC117 和食管癌進(jìn)行研究。CHEK2 位于22 號染色體,是一種絲氨酸/蘇氨酸激酶,在細(xì)胞周期調(diào)控、內(nèi)源性癌基因激活、DNA 雙鏈斷裂后的修復(fù)等方面起著非常重要的作用[20]。有研究[21]報道了15 例患者的腫瘤和血液標(biāo)本的全基因組測序結(jié)果,發(fā)現(xiàn)CHEK2 基因與食管鱗癌有關(guān)聯(lián)。此外,目前還有研究[22-23]發(fā)現(xiàn)CHEK2 基因突變與乳腺癌、胰腺癌、前列腺癌等許多惡性腫瘤的遺傳易感性有關(guān)聯(lián)。
綜上所述,本研究在GWAS 數(shù)據(jù)庫中發(fā)現(xiàn)多個與食管癌相關(guān)的SNPs 位點,通過eQTL 數(shù)據(jù)庫分析和外周血檢測發(fā)現(xiàn)這些SNPs 可能通過參與調(diào)控基因XBP1、CCDC117 和CHEK2,進(jìn)而影響食管癌的發(fā)生。