李洪波 綜述 袁慧軍 韓東一 審校
近幾年,新一代測(cè)序技術(shù)(next-generation sequencing technology,NGS)已經(jīng)被廣泛的應(yīng)用。該技術(shù)可以提供高質(zhì)量和處理數(shù)目龐大的測(cè)序數(shù)據(jù),幫助研究人員深入地理解掌握基因組和轉(zhuǎn)錄組,并將深入到醫(yī)學(xué)病理分析、臨床診斷、疾病預(yù)測(cè)、表型鑒定和個(gè)體化的治療等各個(gè)領(lǐng)域,極大地推動(dòng)生物學(xué)和生物醫(yī)學(xué)的研究和發(fā)展。但是這項(xiàng)技術(shù)目前依舊是非常復(fù)雜的,為了很好的將其用于生物學(xué)和生物醫(yī)學(xué)的研究,需要將分子生物學(xué)技術(shù)和生物信息學(xué)兩方面的知識(shí)結(jié)合。本綜述主要介紹新一代測(cè)序技術(shù)的特點(diǎn)、原理、應(yīng)用平臺(tái)和功能及其在耳聾基因研究中的應(yīng)用和面臨的挑戰(zhàn)。
DNA 測(cè)序技術(shù)是現(xiàn)代分子生物學(xué)和生物醫(yī)學(xué)研究中常用的一種技術(shù)手段。1977年,第一代測(cè)序技術(shù)(Sanger測(cè)序法)出現(xiàn)。人類(lèi)基因組計(jì)劃(human genome project,HGP)利用該技術(shù)加以自動(dòng)化改進(jìn)之后,各國(guó)政府相繼投入資金幾十億美元,耗時(shí)約13年,完成了人類(lèi)遺傳密碼30億對(duì)堿基序列的測(cè)定[1~4]。由于高昂的測(cè)序成本限制了該技術(shù)更常規(guī)的使用。2005年以后出現(xiàn)的新一代測(cè)序技術(shù),由于測(cè)序成本的大幅度降低,使之能夠成為解決一般性的基因分子生物學(xué)問(wèn)題的有效工具[5,6]。該技術(shù)的諸多優(yōu)點(diǎn)也為研究者快速確定疾病病因、促進(jìn)疾病的預(yù)防以及診斷技術(shù)和新藥的開(kāi)發(fā)提供了越來(lái)越多的可能。
新一代測(cè)序技術(shù)主要分成兩大類(lèi)[7~9],即合成測(cè)序(sequenceing by synthesis,SBS)和DNA 單分子測(cè)序技術(shù),其中合成測(cè)序又可以稱(chēng)為第二代測(cè)序技術(shù),而單分子測(cè)序技術(shù)可以稱(chēng)為第三代測(cè)序技術(shù)。本文主要介紹第二代測(cè)序技術(shù),其不同于傳統(tǒng)測(cè)序之處在于采用的測(cè)序策略為循環(huán)芯片測(cè)序法(cyclic-array sequencing)。所謂循環(huán)芯片測(cè)序法,就是對(duì)布滿(mǎn)DNA 樣品的芯片重復(fù)進(jìn)行基于DNA的聚合酶反應(yīng)(模板變性、引物退火雜交及延伸)以及熒光序列讀取反應(yīng)。該技術(shù)具有超高通量并行測(cè)序能力,一次可以讀取最大400萬(wàn)條序列,讀取長(zhǎng)度根據(jù)平臺(tái)不同從25bp到450bp,不同的測(cè)序平臺(tái)在一次實(shí)驗(yàn)中,可以讀取1G 到14G 不等的堿基數(shù),這樣龐大的測(cè)序能力是傳統(tǒng)測(cè)序技術(shù)所不能比擬的。傳統(tǒng)測(cè)序是對(duì)多個(gè)DNA 分子的混合物進(jìn)行測(cè)序,其測(cè)序結(jié)果是多個(gè)DNA 分子綜合的序列信息,而合成測(cè)序先對(duì)單個(gè)DNA 分子進(jìn)行PCR 以放大DNA 分子數(shù)量,再對(duì)這些DNA 分子進(jìn)行測(cè)序,就可以得到原來(lái)單個(gè)DNA 分子的序列信息。第三代測(cè)序技術(shù)也有其自身特點(diǎn),它比第二代測(cè)序技術(shù)擁有更高的測(cè)序通量,更加低廉的測(cè)序價(jià)格。該技術(shù)不需要制備DNA 文庫(kù)及對(duì)DNA 片段進(jìn)行單分子擴(kuò)增[10,11],因而具有更快的測(cè)序速度。
第二代測(cè)序技術(shù)在Sanger等測(cè)序方法的基礎(chǔ)上,通過(guò)技術(shù)創(chuàng)新發(fā)展而來(lái),該技術(shù)的核心思想是邊合成邊測(cè)序,其主要原理是通過(guò)把大量被測(cè)的模板DNA 片段在芯片上進(jìn)行固定,并在固定化的DNA測(cè)序模板上雜交結(jié)合通用的DNA 引物,利用不同的方法分別控制4 種堿基在DNA 引物上的延伸,通過(guò)檢測(cè)延伸反應(yīng)過(guò)程或延伸堿基,實(shí)現(xiàn)高通量并行的DNA 序列信息的檢測(cè)。目前,比較成熟的技術(shù)平臺(tái)主要包括美國(guó)Roche Applied Science公司的454 基因組測(cè)序儀、美國(guó)Illumina 公司和英國(guó)Solexa technology公司合作開(kāi)發(fā)的Illumina測(cè)序儀和美國(guó)Applied Biosystems公司的SOLiD 測(cè)序儀。這三個(gè)技術(shù)平臺(tái)各有優(yōu)缺點(diǎn),它們?cè)跍y(cè)序原理上也有著不同的差別。
2.1 454 基因組測(cè)序平臺(tái) 美國(guó)Roche Applied Science公司的454測(cè)序技術(shù)平臺(tái)主要應(yīng)用焦磷酸測(cè)序(pyrosequencing)原理[12]:該技術(shù)是在DNA聚合酶、ATP 硫酸化酶(ATP sulfurylase)、熒光素酶(luciferase)和三磷酸腺苷雙磷酸酶(apyrase)的協(xié)同作用下催化的同一反應(yīng)體系中的酶級(jí)聯(lián)化學(xué)發(fā)光反應(yīng),在每一輪測(cè)序反應(yīng)中,只加入一種dNTP,若該dNTP與模板配對(duì),聚合酶就可以將其摻入到引物鏈中并釋放出相同摩爾數(shù)的焦磷酸基團(tuán)(PPi)。PPi可最終轉(zhuǎn)化為可見(jiàn)光信號(hào),通過(guò)CCD 光學(xué)系統(tǒng)即可獲得一個(gè)特異的檢測(cè)峰,峰值的高低則和相匹配的堿基數(shù)成正比。反應(yīng)體系中剩余的dNTP 和殘留的少量ATP在apyrase的作用下發(fā)生降解,這樣,就可以在反應(yīng)體系中加入另一種dNTP,使以上反應(yīng)重復(fù)進(jìn)行,根據(jù)獲得的峰值圖即可讀取準(zhǔn)確的DNA 序列信息[13~16]。Roche Applied Science公司推出的GS FLX 系統(tǒng)[14]即應(yīng)用上述的焦磷酸測(cè)序(pyrosequencing)原理,將基因組分割為長(zhǎng)度為300到500個(gè)堿基對(duì)的片段,然后將雙鏈解開(kāi),棄去互補(bǔ)鏈當(dāng)中的一條,將另一條鏈通過(guò)接頭(adaptor)與磁珠上的復(fù)合物結(jié)合,并使得每個(gè)珠子只與一條鏈發(fā)生結(jié)合,所有的磁珠即構(gòu)成了樣品文庫(kù)。隨后將包含磁珠和擴(kuò)增試劑的水溶液注入到礦物油中,水溶液分散形成小水滴,被礦物油包裹,形成了油包水(water-in-oil)的乳濁液結(jié)構(gòu),每個(gè)小水滴中就是只包含一個(gè)磁珠及PCR 試劑的微反應(yīng)器。通過(guò)聚合酶鏈反應(yīng)(polymerase chain reaction,PCR)對(duì)結(jié)合在小珠上的片段進(jìn)行復(fù)制,直到各個(gè)片段的拷貝完全覆蓋其所在的小珠為止。乳濁液PCR(emulsion PCR,emPCR)在每個(gè)微反應(yīng)器中獨(dú)立進(jìn)行,排除了其他序列的影響。每個(gè)片段擴(kuò)增后產(chǎn)生了幾百萬(wàn)個(gè)相同的拷貝,這些拷貝也結(jié)合在磁珠上。接下來(lái)將珠子分散在一個(gè)包含大約160萬(wàn)個(gè)直徑為44μm 小孔的平板(picotiter plate)上,先使特異性的測(cè)序引物和單鏈DNA 模板結(jié)合后,在多種酶和熒光素(luciferin)等的共同參與下,將每一個(gè)dNTP 的聚合與熒光信號(hào)的釋放偶聯(lián)起來(lái)。用CCD 將每個(gè)微球發(fā)出光及其強(qiáng)度進(jìn)行記錄同時(shí)成像,并將所記錄下的發(fā)光現(xiàn)象與當(dāng)時(shí)加入的核苷酸相關(guān)聯(lián),可以得到同時(shí)發(fā)生的幾十萬(wàn)個(gè)DNA 片段的延伸情況[12,17~19]。焦磷酸測(cè)序反應(yīng)在磁珠上進(jìn)行,每個(gè)磁珠都產(chǎn)生一條讀長(zhǎng),最新的GS FLX 系統(tǒng),一次運(yùn)行可獲得一百多萬(wàn)個(gè)讀長(zhǎng)片段,高質(zhì)量讀長(zhǎng)達(dá)到200~300bp,讀取超過(guò)5億個(gè)堿基信息,并通過(guò)GS FLX 系統(tǒng)進(jìn)行分析。
2.2 Illumina Genome Analyzer測(cè)序平臺(tái) Illumina公司和Solexa technology公司開(kāi)發(fā)的Solexa測(cè)序平臺(tái)采用了與454基因組測(cè)序儀不同的合成測(cè)序原理[20~22],其核心專(zhuān)利是DNA 簇和可逆性末端終結(jié)(reversible terminator)。DNA 簇是指將待測(cè)序的單個(gè)基因組DNA 片段固定在載玻片表面不同的位置上,形成DNA 文庫(kù),并產(chǎn)生DNA 簇的過(guò)程。芯片表面連接有一層與接頭互補(bǔ)的寡核苷酸,DNA 片段兩端通過(guò)接頭與芯片固定后,形成橋(bridge)結(jié)構(gòu),并以寡核苷酸為引物進(jìn)行PCR,復(fù)制過(guò)程將每個(gè)DNA 片段轉(zhuǎn)換為大約1 000個(gè)完全一樣的拷貝,并位于同一個(gè)DNA 簇之中,成為單克隆的DNA 簇群。可逆性末端終結(jié)是指在測(cè)序過(guò)程中,使用可逆終止子邊合成邊測(cè)序。該技術(shù)中使用的dNTP,經(jīng)過(guò)了特殊的修飾,四種不同的dNTP分別被標(biāo)記上了不同的熒光基團(tuán),這些帶熒光標(biāo)記的dNTP就是可逆終止子,在所有的dNTP中加入了3’末端保護(hù)基團(tuán),這些基團(tuán)能夠封閉dNTP 的3’端黏性,阻止另一個(gè)dNTP與之相連。因此,測(cè)序的每個(gè)循環(huán)只摻入單個(gè)堿基,直到其熒光信號(hào)被收集后,將熒光基團(tuán)去除,再將封閉基團(tuán)去掉,從而進(jìn)行下一步反應(yīng),而每步反應(yīng)所收集到的熒光信號(hào),則對(duì)應(yīng)了所要檢測(cè)的序列。具體過(guò)程是,序列合成反應(yīng)體系包括引物、DNA 聚合酶、4 種標(biāo)記了不同熒光的核苷酸,每個(gè)核苷酸的堿基被保護(hù)基團(tuán)封閉。引物與1個(gè)dNTP相連,激光掃描芯片表面,讀取各個(gè)位置的熒光信號(hào)之后,將基團(tuán)化學(xué)切割,恢復(fù)3’端黏性,繼續(xù)聚合下一個(gè)dNTP,直到測(cè)序完成。每次反應(yīng)摻入一個(gè)核苷酸,該核苷酸類(lèi)別可通過(guò)標(biāo)記熒光進(jìn)行識(shí)別,經(jīng)過(guò)掃描,讀取該次反應(yīng)顏色后,位于堿基3’末端的保護(hù)基團(tuán)被除去,繼續(xù)下一輪反應(yīng),如此反復(fù),得出片段的精確序列。
2.3 SOLiD 測(cè)序平臺(tái) Church等發(fā)明了另一種不同的測(cè)序方法[23,24],后被美國(guó)Applied Biosystems公司發(fā)展為SOLiD(supported oligo ligation detection)測(cè)序技術(shù)。它與上述測(cè)序技術(shù)的不同之處在于以四色熒光標(biāo)記寡核苷酸的連續(xù)合成為基礎(chǔ),取代了傳統(tǒng)的聚合酶連接反應(yīng),因此也被稱(chēng)作為連接測(cè)序(sequenceing by ligation),可對(duì)單拷貝DNA片段進(jìn)行大規(guī)模擴(kuò)增和高通量并行測(cè)序,同時(shí)利用了獨(dú)特的雙堿基編碼原理。SOLiD 在文庫(kù)構(gòu)建和PCR擴(kuò)增方面,與GS FLX 系統(tǒng)類(lèi)似,微珠通過(guò)接頭捕獲DNA 片段,并進(jìn)行乳液PCR。不過(guò)SOLiD系統(tǒng)的微珠直徑只有1μm,而GS FLX 系統(tǒng)采用的磁珠是20μm。在該方法中,DNA 片段文庫(kù)生成以后,待測(cè)的短的DNA 片段的兩側(cè),被連上SOLiD接頭,分別是P1接頭和P2接頭,然后,對(duì)加上接頭的待測(cè)片段,在特定的磁珠表面進(jìn)行擴(kuò)增,具體則是通過(guò)油包水PCR 反應(yīng)進(jìn)行的,其中,和P1接頭對(duì)應(yīng)的P1 引物,被固定在P1 磁珠的表面,在PCR 反應(yīng)前,將含有PCR 反應(yīng)所有成分的水溶液,注入高速旋轉(zhuǎn)的礦物油表面,形成了類(lèi)似于GS FLX 系統(tǒng)的油包水乳濁液結(jié)構(gòu)。理想狀況下,形成每個(gè)小液滴中只包含一個(gè)磁珠及PCR 試劑的微反應(yīng)器,隨著PCR 反應(yīng)的進(jìn)行,磁珠上就形成了若干具有相同來(lái)源的擴(kuò)增產(chǎn)物,為后續(xù)的測(cè)序反應(yīng)做好了準(zhǔn)備,再加入測(cè)序引物,與固定在每個(gè)微珠上的DNA 片段中已知的起始序列發(fā)生結(jié)合,該測(cè)序引物與磁珠上的擴(kuò)增產(chǎn)物的P1 接頭可以互補(bǔ)雜交,隨后,向混合物中加入長(zhǎng)度為8個(gè)堿基的熒光標(biāo)記寡核苷酸探針開(kāi)始測(cè)序。最新的SOLiD3系統(tǒng)單次運(yùn)行可產(chǎn)生50GB 的序列數(shù)據(jù),相當(dāng)于17倍人類(lèi)基因組覆蓋度。同時(shí)由于SOLiD 系統(tǒng)在測(cè)序過(guò)程中對(duì)每個(gè)堿基判讀兩次,從而減少原始數(shù)據(jù)錯(cuò)誤,并且該技術(shù)使用連接酶替代聚合酶能明顯減少因堿基錯(cuò)配而出現(xiàn)的錯(cuò)誤,測(cè)序過(guò)程中更換引物也能減少背景噪聲和錯(cuò)誤率。多項(xiàng)措施的采用,確保了SOLiD 系統(tǒng)原始?jí)A基數(shù)據(jù)的高準(zhǔn)確度。
以上所描述的是幾種相對(duì)成熟的技術(shù),但這三項(xiàng)技術(shù)還遠(yuǎn)談不上完美。例如,454 技術(shù)的樣品準(zhǔn)備過(guò)程過(guò)于復(fù)雜,Solexa技術(shù)的測(cè)序閱讀長(zhǎng)度還比較短,而SOLiD 技術(shù)還需要得到更多科研群體的廣泛驗(yàn)證,這些具體的問(wèn)題,都需要一一解決[25]。事實(shí)上,除這幾種技術(shù)外,許多依據(jù)其它不同的原理的技術(shù)也正在研究中,即第三代測(cè)序技術(shù),從目前看,它們的潛力是非常巨大的。
2.4 單分子測(cè)序 為了克服第二代合成測(cè)序的一些問(wèn)題,比如閱讀長(zhǎng)度過(guò)短,需要對(duì)測(cè)序的模板分子進(jìn)行擴(kuò)增,試劑的消耗量過(guò)大等,單分子測(cè)序應(yīng)運(yùn)而生。實(shí)現(xiàn)單分子實(shí)時(shí)測(cè)序,需要解決三個(gè)關(guān)鍵的技術(shù),第一是熒光標(biāo)記的脫氧核苷酸。目前的顯微鏡還無(wú)法真正的實(shí)時(shí)觀看到“單分子”,但是它可以實(shí)時(shí)記錄熒光的強(qiáng)度變化。第二是納米微孔。由于光的衍射作用,DNA 鏈周?chē)姸酂晒鈽?biāo)記的脫氧核苷酸形成的強(qiáng)大的熒光背景會(huì)使單分子的熒光探測(cè)成為不可能。利用納米微孔技術(shù),可以形成非常穩(wěn)定的背景熒光信號(hào),便于顯微鏡捕捉閱讀。第三是共聚焦顯微鏡實(shí)時(shí)快速地對(duì)集成在板上無(wú)數(shù)的納米小孔同時(shí)進(jìn)行記錄。單分子測(cè)序技術(shù)解決了上述三個(gè)關(guān)鍵問(wèn)題,不但能夠直接測(cè)定DNA 的序列[26],同時(shí)還能夠?qū)NA 分子序列和甲基化的DNA 序列進(jìn)行測(cè)定。目前的第三代測(cè)序儀主要包括Helicos Biosciences 公司的 HeliScope 測(cè)序儀(http://www.helicosbio.com/)、Pacific Biosciences公司推出的“Single Molecule Real Time(SMRTTM)DNA Sequencing” (http://www.pacificbiosciences.com/)、VisiGen Biotechnologies公司的單分子合成測(cè)序儀、LI-COR Biosciences公司單分子測(cè)序儀(http://www.licor.com/bio/)、ABI(Ion Torrent)新一代測(cè)序儀(http://www.appliedbiosystems.com)、Oxford Nanopore 的納米孔測(cè)序技術(shù)(http://www.nanoporetech.com/)等,各個(gè)公司的測(cè)序儀和第二代測(cè)序技術(shù)有著顯著的不同:首先單分子測(cè)序不需要PCR 擴(kuò)增,更能反映細(xì)胞或組織內(nèi)分子的真實(shí)情況,特別是在需要定量分析的情況下[27];其次該技術(shù)具有更高的通量[28];最后該項(xiàng)技術(shù)擁有更高的測(cè)序準(zhǔn)確性。盡管如此,單分子測(cè)序也存在新的問(wèn)題,比如:如何降低非檢測(cè)特異性背景的干擾,如何更準(zhǔn)確快速地記錄測(cè)序反應(yīng)的結(jié)果,如何自動(dòng)快速處理巨量的DNA 序列信息等[29]。這些都是亟待進(jìn)一步研究解決的問(wèn)題。
遺傳性聾分為非綜合征型聾(nonsyndromic hearing impairment,NSHI)和綜合征型聾(syndromic hearing impairment,SHI)。全部NSHI和絕大部分SHI是符合孟德?tīng)栠z傳規(guī)律的單基因遺傳病。隨著分子生物學(xué)技術(shù)的發(fā)展,與耳聾相關(guān)的基因的定位、分離、克隆及基因的突變得到深入的研究。目前,非綜合征型聾已確定了135 個(gè)基因座,65個(gè)非綜合征型聾基因被克隆,據(jù)預(yù)測(cè)耳聾相關(guān)基因可能有大約600 個(gè)[30]。檢測(cè)基因突變的篩查方法很多,直接測(cè)序是尋找突變的金標(biāo)準(zhǔn)。新一代測(cè)序技術(shù)作為生命科學(xué)的又一重大技術(shù)創(chuàng)新,以其固有的平行高效的檢測(cè)特點(diǎn),與耳聾基因的高遺傳異質(zhì)性相契合,成為一種極具潛力的耳聾基因診斷和篩查工具。2010年,Shearer等[31]利用454基因組測(cè)序平臺(tái)和Illumina Genome Analyzer測(cè)序平臺(tái)分別對(duì)9名經(jīng)sanger技術(shù)確診的遺傳性聾患者進(jìn)行測(cè)序,證明了新一代測(cè)序技術(shù)的可靠性。同年,Rehman等[32]利用外顯子靶向捕獲技術(shù)聯(lián)合NGS,對(duì)來(lái)源于一個(gè)近親的常染色體隱性非綜合型遺傳性聾的DFNB79家系患者基因組DNA 進(jìn)行了分析,將致病基因定位于染色體9q34.3 中一個(gè)2.9 Mb區(qū)間內(nèi),這個(gè)區(qū)間共包含有108個(gè)候選區(qū)基因,通過(guò)對(duì)402 554個(gè)序列讀長(zhǎng)文庫(kù)進(jìn)行分析,發(fā)現(xiàn)了8個(gè)之前沒(méi)有報(bào)道過(guò)的突變,在這8個(gè)突變中,其中有6個(gè)是多態(tài),一個(gè)是非編碼基因,剩下的一個(gè)為基因C9orf75,重新被命名為T(mén)PRN 的無(wú)義突變。同時(shí)對(duì)其他3個(gè)DFNB79連鎖的家系進(jìn)行分析,在這個(gè)基因上也發(fā)現(xiàn)了3個(gè)移碼突變。2011年,Schraders等[33]對(duì)一個(gè)X 連鎖語(yǔ)后聾荷蘭家系進(jìn)行基因定位連鎖分析時(shí)發(fā)現(xiàn),在DXS7108 和DXS7110.之間12.9 Mb 的一個(gè)區(qū)間,包含了之前曾經(jīng)描述的DFNX4和75個(gè)候選基因,利用NGS檢測(cè)到SMPX一個(gè)無(wú)義突變,該基因主要編碼小肌肉蛋白,同時(shí)進(jìn)一步對(duì)26個(gè)來(lái)自X 連鎖遺傳性聾的小家系患者進(jìn)行篩查,沒(méi)有找到該基因的突變,只是找到一個(gè)該基因的框移突變,分離分析發(fā)現(xiàn)該突變與耳聾遺傳共分離。在眾多的學(xué)者利用NGS對(duì)遺傳性聾家系患者進(jìn)行DNA 測(cè)序、以期定位致病基因的同時(shí),Mortazavi等[34]利用NGS對(duì)小鼠的大腦、肝臟和骨骼肌等組織器官RNA 進(jìn)行了測(cè)序,對(duì)測(cè)得的序列進(jìn)行分析發(fā)現(xiàn),約90%的數(shù)據(jù)顯示落在已知的外顯子中,同時(shí),也發(fā)現(xiàn)了許多序列并不在已知的外顯子序列中,而那些在已知序列之外的信息,通過(guò)數(shù)據(jù)分析展示的是從未被報(bào)道過(guò)的RNA 剪切、3’端非翻譯區(qū)、變動(dòng)的啟動(dòng)子以及潛在的小分子RNA 前體等,而這些信息用傳統(tǒng)技術(shù)是無(wú)法發(fā)現(xiàn)的。在全基因組基因表達(dá)譜的分析上,相信利用NGS對(duì)內(nèi)耳基因表達(dá)情況進(jìn)行深入研究,也將有可能發(fā)現(xiàn)新的在內(nèi)耳表達(dá)的基因,并成為新的候選基因。2009年,Lewis等[35]開(kāi)發(fā)了一個(gè)耳聾的小鼠模型,通過(guò)該模型人們首次證明microRNA 對(duì)形成此病有直接影響。microRNA 基因的相應(yīng)片斷可以對(duì)小鼠及人內(nèi)耳中的聽(tīng)覺(jué)細(xì)胞產(chǎn)生影響。在隨后的研究中,進(jìn)一步發(fā)現(xiàn)一種被稱(chēng)為miR-96[36]的一個(gè)特定的microRNA的突變引起的耳聾,突變的miR-96可以影響感覺(jué)毛細(xì)胞的生理發(fā)育。由于這些小分子RNA 的序列較短,并且高度同源,傳統(tǒng)的方法在檢測(cè)突變時(shí)具有一定的困難[37,38],而NGS能很好的解決這個(gè)問(wèn)題,同時(shí)測(cè)序方法還能在實(shí)驗(yàn)中發(fā)現(xiàn)新的小分子RNA[39,40]。
在過(guò)去10年,人類(lèi)基因組計(jì)劃的完成和測(cè)序技術(shù)的飛速發(fā)展,極大地促進(jìn)了遺傳性聾致病基因的研究進(jìn)展,雖然測(cè)序技術(shù)越來(lái)越成熟,成本也越來(lái)越低,但是目前依舊面臨許多的挑戰(zhàn),其中一個(gè)很大的挑戰(zhàn)是如何認(rèn)識(shí)基因變異對(duì)遺傳性聾發(fā)生、發(fā)展的影響。雖然測(cè)序研究能夠提示那些可能導(dǎo)致遺傳性聾發(fā)生的基因,但是還需要相應(yīng)的功能研究來(lái)證實(shí)。目前,大量突變基因中只有部分得到了進(jìn)一步的研究,而遺傳性聾的發(fā)生和發(fā)展,除了基因本身的改變,還有轉(zhuǎn)錄、翻譯和表觀遺傳方面的改變。因此,需要重視各類(lèi)數(shù)據(jù)的有效整合。相信隨著測(cè)序技術(shù)的逐步成熟,遺傳性聾的本質(zhì)會(huì)逐漸被揭示出來(lái)。
1 Eric SL,Lauren ML,Bruce B,et al.Initial sequencing and analysis of the human genome[J].Nature,2001,409:860.
2 Craig JV,Mark DA,Eugene WM,et al.The Sequence of the Human Genome[J].Science,2001,291:304.
3 Francis SC,Eric DG,Alan EG,et al.A vision for the future of genomics research[J].Nature,2003,422:835.
4 Chu TJ,Kimberly BW,Allen H,et al.Statistical model for whole genome sequencing and its application to minimally invasive diagnosis of fetal genetic disease[J].Bioinformatics,2009,25:1 244.
5 Melissa JF,Chia-LW,Edison TL,et al.Next-generation DNA sequencing of paired-end tags(PET)for transcriptome and genome analyses[J].Genome Res,2009,19:521.
6 Talima P,Richard TO,Jeffrey TF,et al.Phylogenetic understanding of clonal populations in an era of whole genome sequencing[J].Infection,Genetics and Evolution,2009,9:1 010.
7 Kling J.Ultrafast DNA sequencing[J].Nature Biotechnology,2003,21:1 425.
8 Metzker ML.Emerging technologies in DNA sequencing[J].Genome Res,2005,15:1 767.
9 Jay S,Robi DM,Chris V,et al.Advanced sequencing technologies:methods and goals[J].Nature Reviews Genetics,2004,5:335.
10 Pushkarev D,Neff NF,Quake SR.Single-molecule sequencing of an individual human genome[J].Nat Biotechnol,2009,27:847.
11 Branton D,Deamer DW,Marziali A,et al.The potential and challenges of nanopore sequencing[J].Nat Biotechnol,2008,26:1 146.
12 Marcel M,Michael E,William EA,et al.Genome sequencing in microfabricated high-density picolitre reactors[J].Nature,2005,437:376.
13 Karl VV,Shale AD,Durtschi JD.Next-generation sequencing:from basic research to diagnostics[J].Clinical Chemistry,2009,55:641.
14 Marcus Droege BH.The Genome sequencer FLXTMsystemlonger reads,more applications,straight forward bioinformatics and more complete data sets[J].Journal of Biotechnology,2008,136:3.
15 Daniel M,Jonatyan DGJ,David J.Studholme.Application of'next-generation'sequencing technologies to microbial genetics[J].Nature Reviews Microbiology,2009,7:287.
16 Mardis ER.Next-generation DNA sequencing methods[J].Annual Review of Genomics and Human Genetics,2008,9:387.
17 John HL,William LL,Karrie RT,et al.A massively parallel PicoTiterPlate?based platform for discrete picoliter-scale polymerase chain reactions[J].Electrophoresis,2003,24:3 769.
18 Elahe E,Mostafa R.Pyrosequencing:A Tool for DNA sequencing analysis[J].Methods in Molecular Biology 2004,255:211.
19 Ronaghi M.Pyrosequencing sheds light on DNA sequencing[J].Genome Res,2001,11:3.
20 Sydney B,Mana J,John B,et al.Gene expression analysis by massively parallel signature sequencing (MPSS)on microbead arrays[J].Nature Biotechnology,2000,18:630.
21 Bennett ST,Bames C,Cox A,et al.Toward the$1000human genome[J].Pharmacogenomics,2005,6:373.
22 Meyer M,Kircher M.Illumina sequencing library preparation for highly multiplexed target capture and sequencing[J].Cold Spring Harb Protoc,2010,2010:5 448.
23 Douglas RS,Aaron RQ,Heather EP,et al.Rapid whole-genome mutational profiling using next-generation sequencing technologies[J].Genome Res,2008,18:1 638.
24 Jay S,Gregory JP,Nikos BR,et al.Accurate multiplex polony sequencing of an evolved bacterial genome[J].Science,2005,309:1 728.
25 Matsumura H,Kruger DH,Kahl G,et al.Super SAGE:a modern platform for genome-wide quantitative transcript profiling[J].Current Pharmaceutical Biotechnology,2008,9:368.
26 Ozsolak F,Platt AR,Jones DR,et al.Direct RNA sequencing[J].Nature,2009,461:814.
27 Ido B,Benidict H,Emil K,et al.Sequence information can be obtained from single DNA molecules[J].PNAS,2003,100:3 960.
28 Harris TD,Buzby PR,Babcock H,et al.Single-molecule DNA sequencing of a viral genome[J].Science,2008,320:106.
29 Korlach J,Marks PJ,Cicero RL,et al.Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nanostructures[J].Proc Natl Acad Sci USA,2008,105:1 176.
30 Nance WE.The genetics of deafness[J].Ment Retard Dev Disabil Res Rev,2003,9:109.
31 Shearer AE,Deluca AP,Hildebrand MS,et al.Comprehensive genetic testing for hereditary hearing loss using massively parallel sequencing[J].Proc Natl Acad Sci USA,2010,107:21104.
32 Rehman AU,Morell RJ,Belyantseva IA,et al.Targeted capture and next-generation sequencing identifies C9orf75,encoding taperin,as the mutated gene in nonsyndromic deafness DFNB79[J].Am J Hum Genet,2010,86:378.
33 Schraders M,Haas SA,Weegerink NJ,et al.Next-generation sequencing identifies mutations of SMPX,which encodes the small muscle protein,X-linked,as a cause of progressive hearing impairment[J].Am J Hum Genet,2011,88:628.
34 Mortazavi A,Williams BA,Mccue K,et al.Mapping and quantifying mammalian transcriptomes by RNA-Seq[J].Nat Methods,2008,5:621.
35 Lewis MA,Quint E,Glazier AM,et al.An ENU-induced mutation of miR-96associated with progressive hearing loss in mice[J].Nat Genet,2009,41:614.
36 Kuhn S,Johnson SL,F(xiàn)urness DN,et al.miR-96regulates the progression of differentiation in mammalian cochlear inner and outer hair cells[J].Proc Natl Acad Sci USA,2011,108:2 355.
37 Xu G,F(xiàn)ewell C,Taylor C,et al.Transcriptome and targetome analysis in MIR155expressing cells using RNA-seq[J].Rna,2010,16:1 610.
38 Perez-Enciso M,F(xiàn)erretti L.Massive parallel sequencing in animal genetics:wherefroms and wheretos[J].Anim Genet,2010,41:561.
39 Kreuze JF,Perez A,Untiveros M,et al.Complete viral genome sequence and discovery of novel viruses by deep sequencing of small RNAs:ageneric method for diagnosis,discovery and sequencing of viruses[J].Virology,2009,388:1.
40 Armisen J,Gilchrist MJ,Wilczynska A,et al.Abundant and dynamically expressed miRNAs,piRNAs,and other small RNAs in the vertebrate Xenopus tropicalis[J].Genome Res,2009,19:1 766.