劉鐵城
解放軍總醫(yī)院 眼科,北京 100853
講 座
基因檢測在臨床與科研中的應(yīng)用
劉鐵城
解放軍總醫(yī)院 眼科,北京 100853
近年來,基因檢測在臨床疾病診斷和科學(xué)研究中發(fā)揮著越來越重要的作用。特別是新一代測序(next-generation sequencing,NGS)技術(shù)的出現(xiàn)使許多疾病的致病基因被發(fā)現(xiàn),大量科研成果不斷涌現(xiàn)出來,極大地提高了臨床診斷水平和科研水平。本文重點介紹了幾種常見的基因測序技術(shù),比較其優(yōu)缺點和在疾病診斷及科研中的應(yīng)用,旨在對研究生、臨床醫(yī)生在疾病診斷和科研工作中起到促進作用。
基因;遺傳;外顯子組測序
隨著人類基因組計劃的完成,人類對自身遺傳信息的了解和掌握有了前所未有的進步。與此同時,分子水平的基因檢測技術(shù)平臺不斷發(fā)展和完善,使得基因檢測技術(shù)得到了迅猛發(fā)展,基因檢測效率不斷提高。從最初第一代以Sanger測序為代表的直接檢測技術(shù)和以連鎖分析為代表的間接測序技術(shù),到2005年以Illumina公司的Solexa技術(shù)和ABI公司的SOLiD技術(shù)為標(biāo)志的新一代測序(next-generation sequencing,NGS)的相繼出現(xiàn),測序效率明顯提升,時間明顯縮短,費用明顯降低,基因檢測手段有了革命性的變化。其技術(shù)正向著大規(guī)模、工業(yè)化的方向發(fā)展,極大地提高了基因檢測的檢出率,并擴展了疾病在基因水平的研究范圍。2009年3月,約翰霍普金斯大學(xué)的研究人員在《Science》雜志上發(fā)表了通過NGS外顯子測序技術(shù),發(fā)現(xiàn)了一個新的遺傳性胰腺癌的致病基因PALB2的報道,標(biāo)志著NGS測序技術(shù)成功應(yīng)用于致病基因的鑒定研究[1]。同年,《Nature》發(fā)表了采用NGS技術(shù)發(fā)現(xiàn)罕見弗里曼謝爾登綜合征MYH3致病基因突變,《Nat Genet》發(fā)表了遺傳疾病米勒綜合征致病基因[2-3]。此后,通過NGS技術(shù),與遺傳相關(guān)的致病基因不斷被發(fā)現(xiàn),NGS技術(shù)已成為里程碑式的進步。2010年,《Science》雜志將這一技術(shù)評選為當(dāng)年“十大科學(xué)進展”。
近兩年,基因檢測成為臨床診斷和科學(xué)研究的熱點,得到了突飛猛進和日新月異的發(fā)展,越來越多的臨床和科研成果不斷涌現(xiàn)出來。同時,基因檢測已經(jīng)從單一的遺傳疾病專業(yè)范疇擴展到復(fù)雜疾病和個體化應(yīng)用領(lǐng)域,其臨床檢測范圍包括高危疾病的新生兒篩查、遺傳疾病的診斷和基因攜帶的檢測以及基因藥物檢測用于指導(dǎo)個體化用藥劑量、選擇和藥物反應(yīng)等諸多方面的研究[4-5]。目前,基因檢測在臨床診斷和醫(yī)學(xué)研究的應(yīng)用正越來越受到醫(yī)生的普遍重視,引起研究人員的極大的興趣。
本文介紹了幾種DNA水平基因檢測的常見方法,比較其優(yōu)缺點和在臨床診斷和科學(xué)研究中的應(yīng)用,對指導(dǎo)研究生和臨床醫(yī)生課外學(xué)習(xí),推進臨床科研工作和提升科研教學(xué)水平有著指導(dǎo)意義。
1.1 Sanger測序 Sanger測序采用的是直接測序法。1977年,Sanger等發(fā)明了雙脫氧鏈末端終止法,這一技術(shù)隨后成為最為常用的基因測序技術(shù)[1]。2001年,Maxam和Gibert發(fā)明了Sanger測序法,并在此后的10年內(nèi)成為基因檢測的金標(biāo)準(zhǔn)[6]。其基本原理即雙脫氧核苷三磷酸(dideoxyribonucleoside triphosphate,ddNTP)缺乏PCR延伸所需的3'-OH,因此每當(dāng)DNA鏈加入分子ddNTP,延伸便終止。每次DNA測序是由4個獨立的反應(yīng)組成,將模板、引物和4種含有不同的放射性同位素標(biāo)記的核苷酸的ddNTP分別與DNA聚合酶混合形成長短不一的片段,大量起始點相同、終止點不同的DNA片段存在于反應(yīng)體系中,具有單個堿基差異的DNA序列可以被聚丙烯酰胺變性凝膠電泳分離出來,得到放射性同位素自顯影條帶。依據(jù)電泳條帶讀取DNA雙鏈的堿基序列。
人類基因組的測序正是基于該技術(shù)完成的。Sanger測序這種直接測序方法具有高度的準(zhǔn)確性和簡單、快捷等特點[7]。目前,依然對一些臨床上小樣本遺傳疾病基因的鑒定具有很高的實用價值。例如,臨床上采用Sanger直接測序FGFR 2基因證實單基因Apert綜合征,直接測序TCOF1基因可以檢出多達90%的與Treacher Collins綜合征相關(guān)的突變[8-9]。
值得注意的是,Sanger測序是針對已知致病基因的突變位點設(shè)計引物,進行PCR直接擴增測序。單個突變點的擴增包括該位點在內(nèi)的外顯子片段即可,不必將該點所在基因的全部外顯子都擴增。因此,應(yīng)明確定位要擴增的位點所在的基因外顯子和該點的具體位置,設(shè)計包括該點在內(nèi)的上下游150 ~ 200 bp的外顯子片段引物。此外,盡管有NGS的出現(xiàn),但Sanger測序?qū)τ谥虏』蛭稽c明確并且數(shù)量有限的單基因遺傳疾病的致病基因的檢測是非常經(jīng)濟和高效的。到目前為止,Sanger測序仍然是作為基因檢測的金標(biāo)準(zhǔn),也是NGS基因檢測后進行家系內(nèi)和正常對照組驗證的主要手段。
值得注意的是,Sanger測序目的是尋找與疾病有關(guān)的特定的基因突變。對于沒有明確候選基因或候選基因數(shù)量較多的大樣本病例篩查是難以完成的,此類測序研究還要依靠具有高通量測序能力的NGS。雖然Sanger測序具有高度的分析準(zhǔn)確性,但其準(zhǔn)確性還取決于測序儀器以及測序條件的設(shè)定。另外,Sanger測序不能檢測出大片段缺失或拷貝數(shù)變異等基因突變的類型,因此對于一些與此相關(guān)的遺傳性疾病還不能做出基因?qū)W診斷。1.2 連鎖分析 采用的是間接測序法。在NGS出現(xiàn)之前,國際通用的疾病基因定位克隆策略是建立在大規(guī)模全基因掃描和連鎖分析基礎(chǔ)上的位置候選基因克隆。人類的染色體成對出現(xiàn),一條來自父親,一條來自母親,每一對染色體在同樣的位置上擁有相同的基因,但是其序列并不完全相同,被稱為父系和母系等位基因。遺傳標(biāo)記是指在人群中表現(xiàn)出多態(tài)現(xiàn)象的DNA序列,可追蹤染色體、染色體某一節(jié)段或某個基因座在家系中傳遞的任何一種遺傳特性。它存在于每一個人,但大小和序列有差別,具有可遺傳性和可識別性。目前采用第二代遺傳標(biāo)記,即重復(fù)序列多態(tài)性,特別是短串聯(lián)重復(fù)序列,又稱微衛(wèi)星標(biāo)記。連鎖分析是以連鎖這種遺傳現(xiàn)象為基礎(chǔ),研究致病基因與遺傳性標(biāo)記之間關(guān)系的方法。如果控制某一表型性狀的基因附近存在遺傳標(biāo)記,那么利用某個遺傳標(biāo)記與某個擬定位的基因之間是否存在連鎖關(guān)系和連鎖的緊密程度就能將該基因定位到染色體某一位置上。1986年Morton等提出優(yōu)勢對數(shù)記分法(log odds score method,LOD),主要檢測兩基因以某一重組率連鎖時的似然性。LOD值為正,支持連鎖;LOD值為負(fù),則否定連鎖。通過計算家系中的微衛(wèi)星標(biāo)記與致病位點之間的LOD值,可以初步估算二者間的遺傳距離及連鎖程度,從而確定該基因在染色體上的粗略位置。然后利用該區(qū)域的染色體基因圖譜,分析定位區(qū)域內(nèi)所有基因的功能與表達,選擇合適的候選基因進行突變檢測,最終將致病基因定位或克隆。
然而,采用連鎖分析進行基因檢測存在很大的局限性。不但所需遺傳樣本量較大,一般要求提供三代及以上遺傳家系患者血樣,而且數(shù)據(jù)量大、處理復(fù)雜、產(chǎn)出速度較慢、定位不夠精確(一般只能定位在染色體某一區(qū)間),這就使得研究工作繁重和定位基因的時間周期特別長。目前,連鎖分析采用的單核苷酸多肽性和短串聯(lián)重復(fù)序列還在使用,但經(jīng)典的間接測序方法,如單鏈構(gòu)象多肽性、變性梯度凝膠電泳和異源雙鏈分析在美國已被淘汰,而在發(fā)展中國家作為研究手段還在有限使用[7]。
主要包括全基因組重測序(whole-genome sequencing,WGS)、全外顯子組測序(whole-exome sequencing,WES)和目標(biāo)區(qū)域測序(targeted regions sequencing,TRS),它們屬于新一代測序技術(shù)??傮w而言,NGS技術(shù)具有通量大、時間短、精確度高和信息量豐富等優(yōu)點,使得遺傳學(xué)研究者可以在短時間內(nèi)對感興趣的基因進行精確定位。但這些不同的測序技術(shù)在測序范圍、數(shù)據(jù)分析量以及測序費用和時間等方面又有很大差異,如果選擇適合的方法,對于臨床診斷和科學(xué)研究將起到事半功倍的作用。
2.1 目標(biāo)區(qū)域測序 目前常用的是基因芯片技術(shù)。其測序原理是基于DNA雜交原理,利用目標(biāo)基因組區(qū)域定制的探針與基因組DNA進行芯片雜交或溶液雜交,將目標(biāo)基因區(qū)域DNA富集,再通過NGS技術(shù)進行測序。其測序過程是通過把數(shù)以萬計的cDNA或寡聚核苷酸置于芯片上制成列陣,將芯片上固定好的已知序列的核苷酸探針與溶液中含有熒光標(biāo)記的相應(yīng)核酸序列進行互補配對,根據(jù)測序儀所顯示強熒光的位置和強度,獲取每組點陣列信息,再利用生物信息學(xué)算法確定目的靶核苷酸的序列組成。測序所選定的目標(biāo)區(qū)域可以是連續(xù)的DNA序列,也可以是分布在同一個染色體不同區(qū)域或不同染色體上的片段。目標(biāo)區(qū)域測序技術(shù),對于以往通過連鎖分析將基因突變鎖定在染色體某一片段區(qū)域內(nèi),但無法找出突變的情況是一個非常好的進一步檢測手段。2010年,Nicholas等[10]使用基因分型芯片聯(lián)合連鎖分析技術(shù),成功發(fā)現(xiàn)頭小畸形的新基因WDR62,文章發(fā)表在《Nat Genet》雜志。類似的研究在家族性胰腺癌中確定8個候選變異位點和在家族性滲出性玻璃體視網(wǎng)膜病變發(fā)現(xiàn)易感基因TSPAN12[11-12]。
基因芯片測序技術(shù)可以將經(jīng)過連鎖分析鎖定了目標(biāo)范圍和經(jīng)過全基因組篩選的特定基因或區(qū)域進行更深一層的研究,是解決連鎖分析無法發(fā)現(xiàn)致病基因的有效手段?;蛐酒夹g(shù)對于已知基因突變的篩查具有明顯優(yōu)勢,可以快速、全面地檢測出目標(biāo)基因突變。同時,由于目標(biāo)區(qū)域受到了限制,測序范圍大幅度減少,測序時間和費用相應(yīng)降低。但基因芯片檢測所需要大量的DNA,由于已提取的DNA存在降解的風(fēng)險,用于基因芯片研究的血標(biāo)本最好是冷凍的全血,這樣可以使用于檢測DNA的量有充分保證。
2.2 全外顯子組測序 外顯子組是單個個體的基因組DNA上所有蛋白質(zhì)編碼序列的總合。人類外顯子組序列約占人類全部基因組序列的1%,約包含85%的致病突變。WES是利用序列捕獲技術(shù)將全外顯子區(qū)域DNA捕捉并富集后進行高通量測序的基因分析方法。采用的技術(shù)平臺主要是羅氏公司的SeqCap EZ全外顯子捕獲系統(tǒng),Illumina公司的Solexa技術(shù)和Agilent公司的SureSelect外顯子靶向序列富集系統(tǒng)。其捕獲的目標(biāo)區(qū)為34 ~ 62 M,不僅包括編碼區(qū),同時也加入了部分非編碼區(qū)。NGS的測序過程主要包括DNA測序文庫的制備、錨定橋接、PCR擴增、單堿基延伸測序和數(shù)據(jù)分析。研究者根據(jù)測序儀捕獲到在測序過程中摻入有不同熒光標(biāo)記堿基片段,經(jīng)計算機將熒光信號轉(zhuǎn)化成不同顏色的測序峰圖和堿基序列。基因測序結(jié)果與NCBI的SNP數(shù)據(jù)庫、千人基因組數(shù)據(jù)庫等國際權(quán)威數(shù)據(jù)庫比對,最終確定是否為突變基因。
自NGS技術(shù)問世以來,利用WES在臨床疾病致病基因的鑒定研究中取得前所未有的成果。這些成果不僅集中在單基因遺傳疾病,還在多基因影響的復(fù)雜疾病中發(fā)現(xiàn)大量相關(guān)基因。在單基因遺傳性疾病中,如視網(wǎng)膜色素變性、終端骨發(fā)育不良等發(fā)現(xiàn)新基因或已知基因新突變[13-14]。在一些罕見的疾病中,如Kabuki綜合征、家族性混合型低脂血癥和脊髓小腦共濟失調(diào)癥等疾病中發(fā)現(xiàn)新的致病基因[2,15-16]。同時,在小細(xì)胞肺癌、慢性淋巴細(xì)胞性白血病等腫瘤研究和諸如肥胖癥、腦皮質(zhì)發(fā)育不良等復(fù)雜疾病的研究中也取得豐碩成果[17-20]。
WES技術(shù)在篩查范圍和檢出率等方面較其他測序技術(shù)具有明顯的優(yōu)勢。例如,對于采用Sanger測序和基因芯片測序不能篩查出基因的樣本,可以采用WES來進一步基因篩查鑒定。應(yīng)用WES技術(shù)能夠獲得較傳統(tǒng)方法對編碼區(qū)測序更深的覆蓋度和更準(zhǔn)確的數(shù)據(jù)。由于信息量的大幅度增加,WES可以獲得更多個體的編碼區(qū)信息,因此成為檢測致病基因和易感基因位點的有效手段。與連鎖分析定位方法比較,WES對家系的要求并不十分嚴(yán)格,在單基因遺傳病同一家系中有2 ~3個患者和1個正常人即可進行致病基因的鑒定研究,而不需要連續(xù)三代的遺傳家系。由于不需要嚴(yán)格的三代以上的遺傳家系,WES使以前不能進行研究的家系成為可能。不僅對于單基因遺傳病是一個很好的研究手段,對于許多常見病,如腫瘤、糖尿病等疾病也可進行大規(guī)模比較研究。
2.3 全基因組重測序 WGS是對已知基因組序列的物種進行不同個體的全基因組的測序,經(jīng)過數(shù)據(jù)分析后對序列進行拼接、組裝并獲得基因組圖譜,或是對不同組織進行測序并分析體細(xì)胞突變的一種研究方法。盡管WES可以快速全面地找出個體基因組上的所有突變,從而找到個體間的差異,但對于外顯子以外的區(qū)域則不能有效地進行基因檢測。對于此種情況,目前還要借助WGS進行全基因組檢測。但由于人類基因組過于龐大,一次單端全基因組測序很難達到所需要的測序深度。因此,需要重復(fù)測序或雙端測序,由此帶來測序成本的大幅度提高,由于不能達到足夠的測序深度導(dǎo)致結(jié)果準(zhǔn)確性降低。而對于臨床疾病診斷和普通科研工作,其高昂的檢測費用也是難以承受的。盡管如此,對于部分臨床研究和WES不能解決的科研課題還需要借助WGS進行更加全面的基因檢測。
NGS的出現(xiàn)為新興的基因組技術(shù)增添了無限的活力和想象空間。特別是基因芯片的問世和其已在臨床上應(yīng)用于大樣本的疾病篩查和基因診斷中所展現(xiàn)出的活力,以及其商業(yè)化發(fā)展的模式都令人鼓舞。眼科是單基因病最常見的學(xué)科,利用芯片技術(shù)進行Laber病的篩查已使很多病因不明的視神經(jīng)萎縮得到明確診斷。而原發(fā)性開角型青光眼是眼科最具隱蔽性和危險性的致盲性眼病,其致病基因或突變的鑒定研究對疾病篩查將有著非常重要的臨床價值,并有巨大的商業(yè)價值。在新生兒糖尿病的篩查中采用基因芯片技術(shù)可以更快速、全面、經(jīng)濟,避免第一代測序的過于繁瑣和漏檢。基因芯片技術(shù)在產(chǎn)前診斷中更加具有發(fā)展前景。只要對孕婦進行DNA血液檢查即可進行遺傳疾病的篩查,避免以往通過羊膜穿刺抽取羊水進行有創(chuàng)檢查的局限性和危險性。目前,隨著基因檢測技術(shù)水平的提升和檢測費用的不斷降低,使發(fā)展大規(guī)模個體化基因檢測在不久的將來成為可能。同時,藥物易感性基因和疾病發(fā)生易感基因的檢測的深入開展,個體化醫(yī)療將在基因檢測的基礎(chǔ)上得以實現(xiàn)。有理由相信,隨著人們生活水平的不斷提高和健康意識的不斷增強,基因檢測在未來醫(yī)學(xué)發(fā)展中的應(yīng)用前景將十分光明。
1 Jones S, Hruban RH, Kamiyama M, et al. Exomic sequencing identifies PALB2 as a pancreatic cancer susceptibility gene[J]. Science, 2009, 324(5924):217.
2 Ng SB, Turner EH, Robertson PD, et al. Targeted capture and massively parallel sequencing of 12 human exomes[J]. Nature,2009, 461(7261): 272-276.
3 Ng SB, Buckingham KJ, Lee C, et al. Exome sequencing identifies the cause of a mendelian disorder[J]. Nat Genet, 2010, 42(1):30-35.
4 Sequeiros J, Paneque M, Guimar?es B, et al. The wide variation of definitions of genetic testing in international recommendations,guidelines and reports[J]. J Community Genet, 2012, 3(2):113-124.
5 Kiezun A, Garimella K, Do R, et al. Exome sequencing and the genetic basis of complex traits[J]. Nat Genet, 2012, 44(6):623-630.
6 Bakker E. Is the DNA sequence the Gold standard in genetic testing? Quality of molecular genetic tests assessed[J]. Clin Chem, 2006,52(4): 557-558.
7 Katsanis SH, Katsanis N. Molecular genetic testing and the future of clinical genomics[J]. Nat Rev Genet, 2013, 14(6): 415-426.
8 Robin NH, Falk M J and Haldeman-Englert CR. FGFR-related craniosynostosis syndromes[J/OL]. http://www.ncbi.nlm.nih.gov/books/NBK1455 (updated 7 Jun 2011).
9 Katsanis SH and Jabs EW. Treacher Collins syndrome[J]. http://www.ncbi.nlm.nih.gov/books/NBK1532 (updated 30 Aug 2012).
10 Nicholas AK, Khurshid M, Désir J, et al. WDR62 is associated with the spindle Pole and is mutated in human microcephaly[J]. Nat Genet, 2010, 42(11): 1010-1014.
11 Nikopoulos K, Gilissen C, Hoischen A, et al. Next-generation sequencing of a 40 Mb linkage interval reveals TSPAN12 mutations in patients with familial exudative vitreoretinopathy[J]. Am J Hum Genet, 2010, 86(2):240-247.
12 Rosa-Rosa JM, Gracia-Aznárez FJ, Hodges E, et al. Deep sequencing of target linkage assay-identified regions in familial breast cancer: methods, analysis pipeline and troubleshooting[J]. PLoS One, 2010, 5(4):e9976.
13 Liu T, Jin X, Zhang X, et al. A novel missense SNRNP200 mutation associated with autosomal dominant retinitis pigmentosa in a Chinese family[J]. PLoS One, 2012, 7(9):e45464.
14 Sun Y, Almomani R, Aten E, et al. Terminal osseous dysplasia is caused by a single recurrent mutation in the FLNA gene[J]. Am J Hum Genet, 2010, 87(1): 146-153.
15 Musunuru K, Pirruccello JP, Do R, et al. Exome sequencing,ANGPTL3 mutations, and familial combined hypolipidemia[J]. N Engl J Med, 2010, 363(23):2220-2227.
16 Wang JL, Yang X, Xia K, et al. TGM6 identified as a novel causative gene of spinocerebellar ataxias using exome sequencing[J]. Brain,2010, 133(Pt 12): 3510-3518.
17 Byun M, Abhyankar A, Lelarge V, et al. Whole-exome sequencingbased discovery of STIM1 deficiency in a child with fatal classic Kaposi sarcoma[J]. J Exp Med, 2010, 207(11): 2307-2312.
18 Harbour JW, Onken MD, Roberson ED, et al. Frequent mutation of BAP1 in metastasizing uveal melanomas[J]. Science, 2010, 330(69): 1410-1413.
19 Bowden DW, An SS, Palmer ND, et al. Molecular basis of a linkage peak: exome sequencing and family-based analysis identify a rare genetic variant in the ADIPOQ gene in the IRAS Family Study[J]. Hum Mol Genet, 2010, 19(20): 4112-4120.
20 Bilgüvar K, Oztürk AK, Louvi A, et al. Whole-exome sequencing identifies recessive WDR62 mutations in severe brain malformations[J]. Nature, 2010, 467(7312):207-210.
Genetic testing in clinical and basic science research
LIU Tie-cheng
Department of Ophthalmology, Chinese PLA General Hospital, Beijing 100853, China
The first author: LIU Tie-cheng. Email: ltc301@sina.com
Recently genetic testing has played an increasingly substantial role in the diagnosis of clinical disease as well as basic science research. Owing to the application of next-generation sequencing (NGS) technology, more and more pathogenic genes are found, which tremendously improve both clinical practice and science research. This article therefore aimes to highlight several genetic sequencing techniques that are commonly used, to compare their advantages and disadvantages in both disease diagnosis and science research, and to facilitate postgraduate students and clinicians in their clinical practice and scientif i c activities.
genes; inheritance; exome sequencing
R 394.3
A
2095-5227(2014)06-0648-04 DOI:10.3969/j.issn.2095-5227.2014.06.037
2014-03-25 17:13
http://www.cnki.net/kcms/detail/11.3275.R.20140325.1713.004.html
2014-02-25
海南省自然科學(xué)基金項目(813221);解放軍總醫(yī)院臨床扶持基金(2021FC-CXYY-1005)
Supported by the Natural Science Foundation of Hainan Provience(813221)
劉鐵城,男,碩士,副主任醫(yī)師,碩士生導(dǎo)師。研究方向:眼底病及眼遺傳性疾病基因鑒定及功能研究。Email: ltc301@sina. com