羅勇軍,陳 郁,蒲 懿,張 莉,董紅梅△
(1.陸軍軍醫(yī)大學(xué)陸軍衛(wèi)勤訓(xùn)練基地軍事醫(yī)學(xué)地理學(xué)教研室,重慶 400038;2.陸軍軍醫(yī)大學(xué)基礎(chǔ)醫(yī)學(xué)院學(xué)員五大隊(duì)十五隊(duì),重慶 400038;3.中國人民解放軍聯(lián)勤保障部隊(duì)第941醫(yī)院心腎內(nèi)科,西寧 810001)
當(dāng)進(jìn)入海拔超過2 500 m的高原地區(qū)后,人體會(huì)在低氧環(huán)境作用下出現(xiàn)明顯的生理反應(yīng),因而醫(yī)學(xué)界將海拔超過2 500 m定義為醫(yī)學(xué)高原[1]。為代償?shù)脱醐h(huán)境、改善低氧血癥,紅細(xì)胞會(huì)明顯增生,這種增生在一定程度內(nèi)能夠提高運(yùn)氧能力和血氧水平、減輕缺氧損傷,是人體習(xí)服高原環(huán)境的重要機(jī)制。然而,當(dāng)紅細(xì)胞增生超過一定范圍時(shí),就會(huì)演變?yōu)楦咴t細(xì)胞增多癥(high altitude polycythemia,HAPC)[2],其帶來的危害已經(jīng)抵消了原有的有益效應(yīng)。過度增生的紅細(xì)胞降低血流速度,而動(dòng)脈血氧飽和度降低進(jìn)一步加重低氧血癥,可造成全身多器官多系統(tǒng)的缺氧損傷,并伴有相應(yīng)的臨床癥狀及體征,嚴(yán)重影響高原居民的身體健康,尤其在高原移居人群中更為普遍,造成的危害也更為嚴(yán)重。HAPC是高原環(huán)境和人體遺傳因素相互作用的結(jié)果,其發(fā)病機(jī)制較為復(fù)雜,也尚未完全闡明。因此,探討HAPC的發(fā)病機(jī)制是降低HAPC危害的重要研究方向。
DNA甲基化是調(diào)控基因表達(dá)的重要表觀遺傳學(xué)機(jī)制之一,能夠顯著影響疾病的發(fā)生與進(jìn)展[3]。HAPC的遺傳易感因素較為復(fù)雜,多個(gè)基因參與其中,單個(gè)基因的甲基化并不能解釋HAPC的發(fā)病機(jī)制,在全基因組層面的甲基化研究也還處于初步階段。本研究通過全基因組DNA甲基化芯片技術(shù)建立高原移居漢族HAPC特異性甲基化基因表達(dá)譜,對比HAPC患者與健康者基因組水平DNA甲基化差異,并借助生物信息學(xué)的方法和技術(shù)篩選相關(guān)差異基因,分析其潛在功能和分子作用網(wǎng)絡(luò),為探索HAPC的發(fā)病機(jī)制,以及可能的靶向治療和預(yù)防方案提供理論依據(jù)。
按照HAPC的診斷標(biāo)準(zhǔn)[4],在世居中國青海省西寧市的漢族男性人群中篩選了4例HAPC患者(病例組),血紅蛋白(hemoglobin,Hb)水平216~253 g/L;另選取同期體檢的5例高原漢族健康者作為對照組,Hb水平170~181 g/L,年齡、性別匹配。本研究經(jīng)陸軍軍醫(yī)大學(xué)倫理委員會(huì)批準(zhǔn)(批準(zhǔn)編號:2020第001-02號),所有受試者均簽署知情同意書。
1.2.1血樣采集
抽取受試者晨起空腹外周靜脈血2 mL,經(jīng)乙二胺四乙酸(EDTA)抗凝后,用于提取基因組DNA。
1.2.2基因組DNA提取與質(zhì)檢
采用美國OMEGA生物技術(shù)有限公司的全血基因組提取試劑盒(貨號:D3392-02)提取血樣中的基因組DNA[5]。提取完成后先用分光光度計(jì)定量,并將樣品調(diào)到標(biāo)準(zhǔn)水平50 ng/μL,取20 μL,然后用0.8%的瓊脂糖凝膠電泳質(zhì)檢。樣品電泳結(jié)果提示基因組DNA主帶清晰,通常相對分子質(zhì)量不小于10×103,沒有明顯降解,總量5 μg以上,能夠進(jìn)行下游的甲基化芯片檢測。
1.2.3基因組DNA甲基化水平檢測
采用美國Illumina公司的甲基化芯片Infinium MethylationEPIC BeadChip(850 k芯片)檢測受試者基因組DNA甲基化水平[6]。該芯片覆蓋了853 307個(gè)CpG位點(diǎn),并全面覆蓋基因啟動(dòng)子區(qū)、基因編碼區(qū)、CpG島、增強(qiáng)子區(qū)及99%的RefSeq基因。后續(xù)的亞硫酸鹽轉(zhuǎn)化,DNA擴(kuò)增,DNA的片段化、沉淀和重懸,DNA與芯片的雜交,芯片清洗、單堿基延伸、染色及芯片掃描和數(shù)據(jù)提取在北京博奧晶典生物技術(shù)有限公司完成。
將處理好的芯片放入掃描儀,利用激光激發(fā)芯片上的單堿基延伸產(chǎn)物的熒光基團(tuán),掃描儀獲取由熒光基團(tuán)發(fā)出的熒光,并生成原始數(shù)據(jù),記錄掃描結(jié)果存放的位置。由此所得的數(shù)據(jù)直接導(dǎo)入GenomeStudio軟件進(jìn)行分析,根據(jù)Illumina官方甲基化分析算法獲得每個(gè)位點(diǎn)的原始信號強(qiáng)度值。然后經(jīng)過對不同熒光、探針類型引起的偏差校正及歸一化、位點(diǎn)過濾,得到高質(zhì)量CpG位點(diǎn)的歸一化后甲基化水平,即β值,用于質(zhì)控。根據(jù)β值計(jì)算樣品間Pearson相關(guān)系數(shù)(Pearson correlation coefficient,PCC),以評估受試樣品芯片信號質(zhì)量的重復(fù)率(β值為0表示該位點(diǎn)無甲基化,β值為1表示該位點(diǎn)完全甲基化)。質(zhì)控后的數(shù)據(jù),采用R軟件包IMA3.1.2進(jìn)行差異甲基化分析,其采用的方法為Limma中的經(jīng)驗(yàn)貝葉斯統(tǒng)計(jì)[7-8]。同時(shí)針對多重假設(shè)檢驗(yàn)問題,計(jì)算錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,FDR)校正P值,以降低假陽性率。差異甲基化位點(diǎn)的選取標(biāo)準(zhǔn)為:校正P≤0.05(如果所有位點(diǎn)均校正P>0.05,或≤0.05的位點(diǎn)很少,則以校正之前的P≤0.05為標(biāo)準(zhǔn))。針對差異甲基化位點(diǎn),使用R腳本對樣本進(jìn)行聚類分析,并使用通路富集工具KOBAS注釋這些差異位點(diǎn)映射到的基因,通過與京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)GENES數(shù)據(jù)庫交聯(lián)鏈接,挖掘出統(tǒng)計(jì)上明顯的基因本體論(gene ontology,GO)功能富集分析和KEGG信號通路分析[9],探討差異甲基化基因的潛在功能及在HAPC發(fā)病機(jī)制中可能的作用。通過上述生物信息學(xué)分析,探討差異甲基化基因及其作用網(wǎng)絡(luò)在高原移居漢族HAPC發(fā)病機(jī)制中可能的作用。所有檢驗(yàn)為雙側(cè),以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
將掃描得到的原始數(shù)據(jù)通過GenomeStudio軟件獲得每個(gè)位點(diǎn)的原始信號值和測量P值(DetectionP值),二者用于質(zhì)控以評估數(shù)據(jù)質(zhì)量和后續(xù)分析。測量P>0.05表明樣品的質(zhì)量較低,需要去除。原始信號值提示所有樣品的位點(diǎn)檢測率均在99.9%以上,保證了檢測范圍。質(zhì)控包括樣本獨(dú)立對照(sample-independent controls,SICs)、樣本非獨(dú)立對照(Sample-dependent controls,SDCs)、位點(diǎn)質(zhì)控及個(gè)體質(zhì)控。SICs用于評估操作步驟,SDSs用于評估樣品質(zhì)量。位點(diǎn)質(zhì)控要求位點(diǎn)在95%以上的個(gè)體中測量P<0.05,同時(shí)去除位于X、Y染色體上的位點(diǎn)。個(gè)體質(zhì)控要求個(gè)體在95%以上位點(diǎn)中的測量P<0.05。在經(jīng)歷嚴(yán)格的質(zhì)控后,獲取了病例組和對照組的β值。PCC分析提示病例-對照β值的PCC為0.997 9,表明芯片信號質(zhì)量很好,所得數(shù)據(jù)可以用于后續(xù)分析,見圖1。
圖1 病例組與對照組甲基化水平Pearson相關(guān)性分析
按照差異甲基化位點(diǎn)的篩選標(biāo)準(zhǔn),共篩選得到96 360個(gè)差異甲基化位點(diǎn)。其中,根據(jù)位點(diǎn)所屬區(qū)域差異,分為CpG島(10 699,11.1%)、島灘區(qū)(23 799,24.7%)、島架區(qū)(7 370,7.6%)和其他區(qū)域(54 492,56.6%)。根據(jù)甲基化水平變化,病例組的高甲基化位點(diǎn)共10 564個(gè)(11.0%),低甲基化位點(diǎn)共85 796個(gè)(89.0%)。根據(jù)對照組與病例組對比結(jié)果顯示:對照組中大部分CpG位點(diǎn)呈現(xiàn)高甲基化狀態(tài),而病例組大部分甲基化水平降低,與對照組相比差異甲基化基因24 054個(gè)。根據(jù)差異甲基化位點(diǎn)所映射的基因變化,與對照組相比,病例組的高甲基化基因共5 981個(gè),低甲基化基因共18 073個(gè)。
在前述篩選出的差異甲基化位點(diǎn)所處的基因中,按照篩選標(biāo)準(zhǔn)獲取了10個(gè)最明顯的高甲基化基因,分別是含黃素單氧化酶3(flavin-containing monooxygenase 3,FMO3)、G蛋白核仁2(G protein nucleolar 2,GNL2)、鈣調(diào)磷酸酶類似EF-Hand蛋白2(calcineurin like EF-hand protein 2,CHP2)、?;o酶A硫酯酶2(acyl-CoA thioesterase 2,ACOT2)、染色體1開放閱讀框25(chromosome 1 open reading frame 25,C1orf25)、OCA2黑素體跨膜蛋白(OCA2 melanosomal transmembrane protein,OCA2)、肌動(dòng)蛋白相關(guān)蛋白2/3復(fù)合亞基4(actin related protein 2/3 complex subunit 4,ARPC4)、錨蛋白重復(fù)域55(ankyrin repeat domain 55,ANKRD55)、GRB10交互作用GYF蛋白2(GRB10 interacting GYF protein 2,GIGYF2)、溶酶體蛋白跨膜4β(lysosomal protein transmembrane 4 beta,LAPTM4B),見表1。篩選的10個(gè)最明顯低甲基化基因分別是黏附蛋白偶聯(lián)受體B1(adhesion G protein-coupled receptor B1,ADGRB1)、Rab親和蛋白3A類似物(不含C2結(jié)構(gòu)域)[rabphilin 3A Like (without C2 domains),RPH3AL]、酰輔酶A硫酯酶1(acyl-CoA thioesterase 2,ACOT1)、ATP結(jié)合盒亞家族C成員13(ATP binding cassette subfamily C member 13,ABCC13)、鈣粘蛋白22(cadherin 22,CDH22)、染色體1開放閱讀框109(chromosome 1 open reading frame 109,C1orf109)、防御素β128(defensin beta 128,DEFB128)、錨蛋白重復(fù)域23(ankyrin repeat domain 23,ANKRD23)、酰基輔酶A合成酶家族成員3(Acyl-CoA synthetase family member 3,ACSF3)、鈣/鈣調(diào)蛋白依賴性蛋白激酶1D(calcium/calmodulin dependent protein kinase 1D,CAMK1D),見表2。
表1 篩選出的10個(gè)最明顯高甲基化基因(病例組 vs. 對照組)
表2 篩選出的10個(gè)最明顯低甲基化基因(病例組 vs.對照組)
2.4.1GO功能富集分析
按照篩選標(biāo)準(zhǔn),病例組與對照組的差異甲基化位點(diǎn)所在基因相關(guān)的GO條目共19 585個(gè),根據(jù)P值篩選了前10個(gè)最明顯的GO條目。其中,主要富集于生物過程的物質(zhì)定位、生物過程和細(xì)胞過程的正向調(diào)控及細(xì)胞發(fā)育等,以及細(xì)胞組分的細(xì)胞質(zhì)及分子功能的結(jié)合,見表3。
表3 差異甲基化位點(diǎn)所在基因的GO分析
2.4.2KEGG信號通路分析
病例組與對照組的差異甲基化位點(diǎn)所在基因相關(guān)的KEGG信號通路共305個(gè),符合篩選條件的信號通路共42條(P<0.05),并根據(jù)P值篩選了前10個(gè)最明顯的信號通路,見表4。結(jié)果提示,差異甲基化位點(diǎn)所在基因涉及的信號通路主要包括代謝通路、癌癥通路及絲裂原活化蛋白激酶(MAPK)信號通路。
表4 差異甲基化位點(diǎn)所在基因的KEGG通路分析
HAPC是高原地區(qū)的常見疾病,海拔4 000 m以上地區(qū)患病率高達(dá)24.0%[10],而在海拔超過5 000 m的喀喇昆侖山脈地區(qū)則更高,移居人群如漢族人群可達(dá)80%以上[11],嚴(yán)重威脅著高原地區(qū)人群的健康。因此,探索HAPC的發(fā)病機(jī)制是維護(hù)高原人群生命安全的重要研究方向。HAPC的發(fā)生是高原環(huán)境和人體相互作用的結(jié)果,涉及多個(gè)系統(tǒng)和多個(gè)環(huán)節(jié),其分子機(jī)制不僅與核基因序列、線粒體DNA(mtDNA)序列改變相關(guān),還涵蓋表觀遺傳學(xué)的變化,包括DNA甲基化、組蛋白修飾(如乙?;⑻K木化和磷酸化)及非編碼RNA調(diào)控等多種機(jī)制。PENG等[12]發(fā)現(xiàn)了缺氧誘導(dǎo)因子(hypoxia inducible factor,HIF)途徑的內(nèi)皮含PAS結(jié)構(gòu)域蛋白1(EPAS1)和脯氨酰羥化酶蛋白(EGLN1)基因可能是高海拔遺傳適應(yīng)的候選基因。FAN等[13]通過全外顯子測序發(fā)現(xiàn),在西藏世居人群中磷脂酰肌醇-3激酶催化亞基δ(PIK3CD)和Ⅳ型膠原蛋白α3鏈(COL4A3)基因上存在差異單核苷酸多態(tài)性(SNP)位點(diǎn)。ZHOU等[14]通過全基因組關(guān)聯(lián)研究,發(fā)現(xiàn)紅細(xì)胞生成調(diào)節(jié)基因小泛素相關(guān)修飾蛋白特異性蛋白酶1(SENP1)和癌基因酸性富含亮氨酸的核磷蛋白32家族成員D(ANP32D)在患有慢性高原疾病的患者中表達(dá)上調(diào)。陳輝等[15]發(fā)現(xiàn),白細(xì)胞介素-12受體B1(IL12RB1)基因的SNPsrs393548、rs436857 和rs845380與西藏世居人群HAPC的發(fā)生有關(guān)。
目前,關(guān)于HAPC遺傳易感機(jī)制的研究多為DNA水平,表觀遺傳機(jī)制研究較少。本研究借助高通量基因芯片技術(shù),首次從全基因組層面分析了中國漢族HAPC患者的基因組DNA甲基化水平,發(fā)現(xiàn)HAPC患者基因組DNA大部分呈低甲基化狀態(tài),并篩選了以FMO3為代表的高甲基化基因和以ADGRB1為代表的低甲基化基因,借助生物信息學(xué)分析富集了相關(guān)的信號通路,提示基因組DNA的異常甲基化也是HAPC發(fā)生的重要機(jī)制。
除了基因本身的變化外,表觀遺傳學(xué)的改變也是人體適應(yīng)高原的重要機(jī)制[16]。DNA甲基化作為表觀遺傳的主要機(jī)制之一,其核心是由S-腺苷甲硫氨酸作為甲基供體,在DNA甲基化轉(zhuǎn)移酶的催化下,提供的甲基被轉(zhuǎn)移到相應(yīng)堿基的一種DNA共價(jià)修飾方式,并不涉及DNA序列的改變[17]。已有研究提示,作為高原適應(yīng)的主要候選基因EGLN1,其啟動(dòng)子區(qū)域的高甲基化與安第斯山印第安人HAPC有關(guān)[16];而另一個(gè)高原適應(yīng)候選基因EPAS1,其甲基化水平與安第斯山印第安人的早期發(fā)育和終生高海拔暴露及高海拔適應(yīng)性表型有關(guān)[18-19],而血管緊張素Ⅱ 1型受體相關(guān)蛋白的配體(Apelin)基因的高甲基化也在高原肺水腫的發(fā)生中發(fā)揮著重要作用[20]。在本研究中,發(fā)現(xiàn)HAPC患者的基因組DNA多呈低甲基化狀態(tài),提示其基因表達(dá)較為活躍。在長期的低氧環(huán)境刺激下,作為低氧反應(yīng)重要的調(diào)控因子HIFs,在與特異的順式作用元件相結(jié)合后,啟動(dòng)了一系列基因的轉(zhuǎn)錄,并以此形成信號轉(zhuǎn)導(dǎo)的級聯(lián)放大效應(yīng),建構(gòu)復(fù)雜的分子作用網(wǎng)絡(luò),涵蓋人體對缺氧的感知和反應(yīng),從造血干細(xì)胞分化成紅系祖細(xì)胞再到成熟紅細(xì)胞的形成,骨髓造血微環(huán)境的調(diào)節(jié),促紅細(xì)胞生成素的分泌與反饋,Hb合成所需的鐵、維生素B12等原料的吸收合成與利用。上述過程中不可避免的涉及多種表觀遺傳學(xué)變化,而本研究發(fā)現(xiàn)了HAPC患者和高原健康對照在多個(gè)基因的甲基化有著不同程度的變化,提示異常的甲基化改變在上述過程中發(fā)揮著重要的調(diào)節(jié)作用。
在大鼠的HAPC模型中,EGLN1基因的甲基化水平與正常對照并無明顯差異[21],而von Hippel-Lindau(VHL)基因啟動(dòng)子的高甲基化會(huì)降低VHL基因表達(dá),進(jìn)而促進(jìn)HIF-2α和促紅細(xì)胞生成素(EPO)的表達(dá),誘導(dǎo)HAPC的發(fā)生[22]。本研究提示,HAPC患者的FMO3呈現(xiàn)高甲基化狀態(tài),而抑制FMO3的表達(dá)能夠降低全血中膠原依賴的血小板與基質(zhì)的黏附性,對血栓形成有抑制作用[23]。在HAPC患者中,由于紅細(xì)胞過度增生易并發(fā)血栓,尤其是誘導(dǎo)微循環(huán)障礙,加重全身缺氧損傷。因此,推測HAPC患者的高甲基化FMO3狀態(tài)可能是功能代償,從血小板角度抑制血栓形成。在低甲基化基因方面,本研究提示HAPC患者的ADGRB1基因差異最為明顯。ADGRB1基因主要在腦部表達(dá),在吞噬、炎癥、突觸形成、抑制血管生成和成肌細(xì)胞融合等方面發(fā)揮著重要作用[24]。研究發(fā)現(xiàn),ADGRB1基因的高表達(dá)能夠抑制腦血管生成,與腦部腫瘤發(fā)生和腫瘤周圍腦水腫呈負(fù)相關(guān)[25]。此外,研究提示HAPC患者出現(xiàn)了不同程度的腦水腫[26],而本研究中發(fā)現(xiàn)的低甲基化ADGRB1基因可能也是通過提高其表達(dá)水平以拮抗腦水腫的發(fā)生。
在本研究中,借助多種生物信息學(xué)分析方式探討了差異甲基化基因的功能及其潛在的作用網(wǎng)絡(luò),探尋其在HAPC發(fā)生中的作用。綜合分析兩組差異甲基化位點(diǎn),提示病例組和對照組基因組DNA甲基化水平差異明顯,而且病例組絕大部分CpG差異甲基化位點(diǎn)數(shù)目低于對照組?;蚪MDNA的高甲基化位點(diǎn)意味著基因表達(dá)水平下降,而HAPC患者的高甲基化位點(diǎn)數(shù)目較健康者明顯下降,表明在長期的低氧環(huán)境刺激下,人體內(nèi)部分基因被激活,其形成的信號放大機(jī)制和分子相互作用網(wǎng)絡(luò)在HAPC的發(fā)生、發(fā)展中發(fā)揮了重要作用。GO分析提示,差異甲基化基因參與了生物過程的正向調(diào)控、細(xì)胞質(zhì)、解剖結(jié)構(gòu)發(fā)展和解剖結(jié)構(gòu)形態(tài)發(fā)生等過程。上述富集的功能均可能涉及HAPC的發(fā)病機(jī)制,如紅細(xì)胞生成與細(xì)胞發(fā)育和正向調(diào)控有關(guān),細(xì)胞質(zhì)的變化是紅細(xì)胞在成熟過程中的必然反應(yīng),而結(jié)合既包含了轉(zhuǎn)錄因子和DNA的結(jié)合,也包括了蛋白和蛋白之間的結(jié)合與相互作用,在紅細(xì)胞生成和成熟過程中均發(fā)揮了重要作用。KEGG通路分析提示,包括代謝通路、癌癥通路和MAPK信號通路等在HAPC對照組中呈現(xiàn)高富集。紅細(xì)胞增生過程中涵蓋了代謝通路的調(diào)整,也必然涉及能量代謝的改變,而MAPK信號通路在能量代謝過程中發(fā)揮著重要作用。此外,紅細(xì)胞的過度增生,在生物學(xué)過程方面類似于癌細(xì)胞的過度增殖,故在信號通路富集過程中也涉及癌癥通路的變化。上述結(jié)果進(jìn)一步提示,HAPC的發(fā)生是機(jī)體在應(yīng)對低氧環(huán)境刺激時(shí)調(diào)控網(wǎng)絡(luò)失衡的結(jié)果,低氧感知、紅細(xì)胞發(fā)育分化與成熟、造血微環(huán)境如炎癥狀態(tài)、紅細(xì)胞生成原料攝取等相關(guān)信號通路依然是探索HAPC發(fā)病機(jī)制的重要方向,如FMO3可影響血栓形成,ADGRB1在炎癥免疫、血管生成和腫瘤發(fā)生中均發(fā)揮著不同程度的效應(yīng),這也進(jìn)一步提示甲基化在HAPC的發(fā)生中發(fā)揮了重要的調(diào)控作用。
綜上所述,本研究借助高通量基因芯片技術(shù),從基因組甲基化角度探索了HAPC可能的發(fā)生機(jī)制,并發(fā)現(xiàn)了甲基化異常與HAPC發(fā)生有關(guān)。雖然納入的樣本量較小,生物學(xué)重復(fù)也未完成,在結(jié)果解釋方面有一定的局限性,但是目前Infinium MethylationEPIC BeadChip(850 k芯片)的應(yīng)用越來越廣,研究方法和技術(shù)穩(wěn)定,研究結(jié)果仍有一定的借鑒意義,提示甲基化改變也在HAPC發(fā)生中發(fā)揮著重要作用,異常的甲基化位點(diǎn)可能是HAPC發(fā)生的診斷標(biāo)志物。本研究在基因組層面檢測了甲基化水平,并未對某個(gè)具體部位或某個(gè)基因的具體位置再檢測,針對差異甲基化基因,后期還需要借助甲基化特異性PCR進(jìn)一步擴(kuò)大樣本驗(yàn)證結(jié)果。此外,雖然本研究只是甲基化改變在HAPC發(fā)生機(jī)制研究的開端,但是其中也提供了大量證據(jù),提示HAPC的發(fā)病機(jī)制研究也要注意炎癥免疫、血管生成和血栓形成等信號通路,其相關(guān)的表觀遺傳學(xué)調(diào)控機(jī)制是HAPC早期治療和預(yù)警的客觀依據(jù)。