劉 政,黃 玲,萬紹貴,劉曉平
(1.贛南醫(yī)學(xué)院第一臨床醫(yī)學(xué)院;2.贛南醫(yī)學(xué)院基礎(chǔ)醫(yī)學(xué)院;3.贛南醫(yī)學(xué)院分子病理中心;4.贛南醫(yī)學(xué)院第一附屬醫(yī)院普外科,江西 贛州 341000)
過去數(shù)十年的研究證實(shí)基因突變是腫瘤形成的重要因素,融合基因是其典型例子[1]。融合基因是腫瘤產(chǎn)生、發(fā)展的重要驅(qū)動因素,同時(shí)也作為臨床重要的分子生物學(xué)標(biāo)志,在癌癥的診斷、靶向治療以及預(yù)后具有重要的意義[1-2]。然而現(xiàn)有的臨床檢測技術(shù)都存在一些不足。第二代測序技術(shù)(Second generation sequencing,SGS)憑借其高通量和相較于第一代基因測序技術(shù)更低的價(jià)格,成為現(xiàn)代醫(yī)學(xué)遺傳常規(guī)診斷工具[3-4]。但其短讀長及過高的價(jià)格,限制了其在臨床上的應(yīng)用。近年來第三代基因測序技術(shù)(Third generation sequencing,TGS)的出現(xiàn)為高通量測序技術(shù)的臨床應(yīng)用帶來了曙光,TGS 技術(shù)最大的特點(diǎn)就是單分子實(shí)時(shí)測序,相對于SGS技術(shù),不僅在價(jià)格上具有優(yōu)勢,其獨(dú)特的長讀長測序在結(jié)構(gòu)變異及重復(fù)序列檢測方面更加準(zhǔn)確,更加適用于融合基因檢測。
融合基因是兩個(gè)獨(dú)立的基因串聯(lián)產(chǎn)生的染色體結(jié)構(gòu)變異(圖1)。堿基的缺失、重復(fù)和倒置,且錯(cuò)誤序列達(dá)到50 bp以上時(shí),就能產(chǎn)生融合基因[2]。近些年也有研究表明,臨近基因的轉(zhuǎn)錄通讀或mRNA分子的剪接,前信使RNA 的反式和順式剪接是導(dǎo)致融合基因產(chǎn)生的重要原因[5-6]。關(guān)于融合基因?qū)е掳┌Y的產(chǎn)生機(jī)制,目前已知的有兩種:癌基因與強(qiáng)啟動子融合而導(dǎo)致其表達(dá)上調(diào)[7];融合基因可以翻譯兩個(gè)基因的嵌合結(jié)構(gòu)域,從而表達(dá)融合蛋白,使得這種嵌合蛋白的活性異常或者內(nèi)源性蛋白功能喪失。如NRG1 融合蛋白可通過MAPK 或其他途徑促進(jìn)病理信號轉(zhuǎn)導(dǎo),CCDC6 與RET 融合后導(dǎo)致RET過度表達(dá)從而促進(jìn)甲狀腺發(fā)生癌變,分別對應(yīng)著第一種和第二種[8]。
圖1 染色體易位導(dǎo)致融合基因的生成
融合基因在人類腫瘤中雖然并不常見,但融合基因往往是致癌基因。因此,不管是對腫瘤生物學(xué)研究還是在臨床,鑒定融合基因都有重要意義[9]。ARDINI 等[10]報(bào) 告 了CRC 中 復(fù) 發(fā) 性 的 融 合 基 因TPM3-NTRK1,并且還發(fā)現(xiàn)恩替替尼(NMS-P626;RXDX-101)是新型、高效且選擇性的pan-Trk 抑制劑。對TPM3-NTRK1 的CRC 患者使用恩替替尼進(jìn)行治療,不僅能緩解癥狀,同時(shí)也減少了肝臟和腎上腺的轉(zhuǎn)移性病變[11]。此外,在人類GBM 中首次發(fā)現(xiàn)FGFR-TACC 融合體之后,也在其他腫瘤中檢測出FGFR-TACC 基因融合體,其頻率通常在1%~4%之間[12],是迄今為止人類癌癥中最常見的染色體易位。研究人員發(fā)現(xiàn),F(xiàn)GFR3-TACC3融合蛋白在腫瘤塊內(nèi)均有表達(dá),可作為治療的最佳靶點(diǎn)[9]。近些年的臨床試驗(yàn)也在研究其抑制劑,包括PRN1371、TAS120、H3B-6527等[13-15]。
目前臨床上使用的融合基因檢測技術(shù)包括細(xì)胞遺傳學(xué)技術(shù)[16]、RT-PCR[17]、熒光原位雜交(Fluorescence in situ hybridization,F(xiàn)ISH)[18]、免 疫 組 化(immunohistochemistry,IHC)[19]等。但這些方法操作復(fù)雜、周轉(zhuǎn)時(shí)間長且對某些特定融合不敏感、存在假陽性、只能檢測已知融合并且容易受到樣本材料的限制[20-24](表1),使得他們在臨床上的應(yīng)用受到限制。近些年SGS 技術(shù)憑借其高通量的優(yōu)點(diǎn)[3-4],成為現(xiàn)代醫(yī)學(xué)遺傳常規(guī)的診斷工具。然而SGS 短讀長,使得其在結(jié)構(gòu)變異、重復(fù)區(qū)域、等位基因的分期和區(qū)分高度同源的基因區(qū)域存在不足[25-26]。TGS 技術(shù)的出現(xiàn)在檢測基因結(jié)構(gòu)變異方面取得了巨大突破,TGS 即單分子實(shí)時(shí)測序技術(shù),具有長讀長,高通量、單分子實(shí)時(shí)測序的優(yōu)點(diǎn),該技術(shù)能對每一條核酸分子進(jìn)行單獨(dú)測序且測序前無需經(jīng)過PCR。目前常用的TGS 測序平臺有PacBio 公司的SMART(Single Molecule Real-Time)測序和Oxford Nanopore Technologies(ONT)公司的納米孔測序,他們在測序的原理上各有不同。SMART 測序儀采用的是邊合成邊分析的化學(xué)信號分析方式,以環(huán)狀DNA 為模板,4 種熒光標(biāo)記的dNTPs 為底物。當(dāng)dNTPs 在單分子DNA 聚合酶的作用下與模板發(fā)生堿基配對,就能產(chǎn)生識別堿基的光脈沖[27-28],從而可以直接識別堿基序列。與SMART 不同,Nanopore是通過電信號識別堿基序列,雙鏈DNA 分子在馬達(dá)蛋白作用下解螺旋并在其牽引下通過納米孔,DNA 分子在穿過孔道時(shí),不同堿基產(chǎn)生不同的偏轉(zhuǎn)電流,將記錄的電信號經(jīng)過特定的軟件BaseCalling,轉(zhuǎn)化為所需的堿基序列[29]。
表1 各種融合基因檢測技術(shù)的優(yōu)缺點(diǎn)
目前常用的融合基因檢測技術(shù)雖能檢測到融合基因及其融合伴侶,但難以了解融合序列的具體信息。YASUDA 等[30]對急性淋巴細(xì)胞白血?。ˋLL)患者使用PacBio SMRT 測序技術(shù)發(fā)現(xiàn)了一種獨(dú)特的融合基因,并使用全長轉(zhuǎn)錄組測序?qū)ζ溥M(jìn)一步研究。在對73 名Ph-患者使用基于SGS 技術(shù)的RNA-seq 鑒定其融合轉(zhuǎn)錄本后,研究人員得到26 種融合基因,其中12 種為新發(fā)現(xiàn)的融合基因。在新發(fā)現(xiàn)的融合基因中發(fā)現(xiàn)了一種只存在于青年人群中的特殊融合——DUX4-IGH。該技術(shù)雖能檢測到融合基因,但其短讀長的缺陷,使得研究人員無法窺得該融合基因的全貌。為了深入研究該融合基因的結(jié)構(gòu),有學(xué)者使用TGS 技術(shù)對一位19 歲的ALL 患者進(jìn)行全基因組測序,結(jié)果顯示D4Z4 序列中有兩個(gè)拷貝易位到IGH 位點(diǎn)。此外,IGHD2-15 和IGHVII-60-1 區(qū)域發(fā)生了輕微重排。實(shí)驗(yàn)結(jié)果表明,基于長讀長高通量基因測序技術(shù)可以檢測融合基因的全貌,能夠作為其他鑒定技術(shù)的補(bǔ)充,進(jìn)一步深入了解融合基因的具體結(jié)構(gòu)。
此外,融合基因融合位點(diǎn)還可以作為分子檢測的生物學(xué)標(biāo)記,對疾病的診斷、預(yù)后、治療靶點(diǎn)的確定以及血液惡性腫瘤的檢測具有重要意義。CHUN HANG AU 等[31]以一位64 歲中國婦女白血病患者(根據(jù)臨床癥狀、體征以及輔助治療確診)外周血為樣本,通過FISH 鑒定出該患者存在NUP98 易位突變,并且通過SGS 測序準(zhǔn)確檢測出了該患者存在NUP98-NSD1 以及NSD1-NUP98 的突變。盡管我們已知NUP98-NSD1 是一個(gè)潛在的驅(qū)動突變,但其易位特性并不明確,臨床上需要進(jìn)一步鑒定其DNA 斷裂點(diǎn)。研究人員使用基于三代測序的納米孔Min-ION sequencer 對患者外周血進(jìn)行全基因組測序。隨著實(shí)時(shí)長讀長測序的進(jìn)行,在短短6.4 h 內(nèi),不僅得到了NUP98(染色體11p15.4)和NSD1(染色體5q35.3)之間確切的斷裂點(diǎn),同時(shí)還發(fā)現(xiàn)了另一組潛在的融合基因——DUSP13-GRIN2B(兩個(gè)基因分別為于10 號染色體和12 號染色體),并且獲得其準(zhǔn)確的斷裂位點(diǎn)。不同于SGS全基因組測序成本高而且操作復(fù)雜。納米孔全基因測序,不僅具有成本低、耗時(shí)短的優(yōu)點(diǎn),且對潛在融合具有較高的敏感性,在臨床應(yīng)用方面比SGS更具有優(yōu)勢。
由t(9;22)(q34;q11)融合產(chǎn)生的22 號染色體被稱為費(fèi)城染色體(Ph)是慢性粒細(xì)胞白血病(CML)的標(biāo)志[32]。伊馬替尼是治療慢性粒細(xì)胞白血?。–ML)的特異性靶向藥物,能與Bcr-Abl融合蛋白高度特異性結(jié)合,抑制酪氨酸激酶的活性[33-34]。此外,在急性淋巴白血病部分患者中也存在BCR-ABL基因融合,一旦發(fā)現(xiàn)該種融合,則表明患者預(yù)后不良[35]。MINERVINI 等[36]利用納米孔MinION 技術(shù)的深度測序?qū)CR-ABL1 陽性白血病的突變分析,實(shí)驗(yàn)樣本是24名Ph+患者,并分為兩組,第一組包括11名TKI 治療過程中出現(xiàn)抗藥性的患者和1 名新診斷的ALL 患者;第二組包括新診斷的8 名CML 患者和4名ALL患者。使用RNasy Mini Kit(QIGEN)從外周血細(xì)胞中提取細(xì)胞總RNA經(jīng)過反轉(zhuǎn)錄擴(kuò)增合成cDNA,對樣品進(jìn)行純化、定量和評估后,根據(jù)ONT 測序試劑盒(SQK-MAP006)構(gòu)建文庫,將樣品加入MinION flowcell 后進(jìn)行測序并對數(shù)據(jù)進(jìn)行分析。結(jié)果顯示,在第一組的9 名患者中發(fā)現(xiàn)10 個(gè)BCR-ABL1 KD 突變,其中4 號患者為復(fù)合突變。此外,10 號患者在BCR-ABL1 KD 中顯示了單核苷酸多態(tài)性。測序結(jié)果還與Sanger測序進(jìn)行對比,結(jié)果一致性達(dá)到92%。此外,Sanger 測序最初未檢測到低水平突變的2 號患者和8 號患者。Nanopore 測序技術(shù)不僅能準(zhǔn)確檢測耐藥患者存在BCR-ABL1 融合突變,還能識別潛在的低水平變體(小于15%~20%變體頻率,超出Sanger測序能力檢測范圍)和區(qū)分“復(fù)合突變體”。
臨床發(fā)現(xiàn)BCR-ABL1融合轉(zhuǎn)錄本發(fā)生突變會導(dǎo)致臨床靶向藥物的治療效果不佳。CAVELIER 等[37]使用了一種基于PacBio測序技術(shù)的檢測方法,通過使用長讀長測序技術(shù)直接對整個(gè)1 578 bp的BCR-ABL1轉(zhuǎn)錄本進(jìn)行測序來檢驗(yàn)轉(zhuǎn)錄本突變,樣本來自Uppsala University Hospital 的6名確診為CML且TKI治療效果不佳的患者,將BCR-ABL1 樣品進(jìn)行不同梯度稀釋之后使用Clontech Advantage PCR 試劑盒(Clontech,CA,USA)對BCR-ABL1 p210 轉(zhuǎn)錄本進(jìn)行反轉(zhuǎn)錄,擴(kuò)增后制備試劑盒構(gòu)建文庫,將所得的文庫在PacBio SMRT cell 上進(jìn)行測序并對數(shù)據(jù)進(jìn)行分析,并在3 天內(nèi)出結(jié)果報(bào)告,除了1 名患者外,其他5名患者均發(fā)現(xiàn)了耐藥性的突變并且在其中2名患者中還發(fā)現(xiàn)了BCR-ABL1 多種轉(zhuǎn)錄本亞型。結(jié)果表明,PacBio 測序法對診斷和后續(xù)CML 患者樣品中的BCR-ABL1 耐藥性突變不僅具有較高的敏感性,還能同時(shí)鑒別多種轉(zhuǎn)錄本亞型。說明在同時(shí)檢測多個(gè)轉(zhuǎn)錄本亞型方面,SMRT 相對于常規(guī)的檢測方法如Sanger、RT-PCR更有優(yōu)勢。
高度同源的RLN1 和RLN2 基因在前列腺中同時(shí)表達(dá),導(dǎo)致了難以檢測單個(gè)松弛素在前列腺中的準(zhǔn)確表征和功能研究。為了全面識別RLN1和RLN2轉(zhuǎn)錄變體,GREGOR 等[38]使用PacBio 的SMART 測序技術(shù)和RNA-Seq 分析技術(shù)對LNCap 細(xì)胞的中的RLN1和RLN2 轉(zhuǎn)錄本進(jìn)行測序。為了全面的鑒別RLN1 和RLN2 的變體,實(shí)驗(yàn)人員使用long cDNACap 和SMRT sequencing 檢測LNCap 細(xì)胞,并且在與環(huán)狀共識序列上(circular consensus sequences,CCSs)的RLN1-RLN2 位點(diǎn)進(jìn)行比對,結(jié)果只檢測到RLN1 基因,并未檢測到RLN2基因。除此之外,科研人員還檢測到了兩條較長的RLN2突變轉(zhuǎn)錄本,它們分別與RLN1基因融合,生成兩個(gè)融合轉(zhuǎn)錄本RLN1-RLN2-1和RLN1-RLN2-2。對新發(fā)現(xiàn)的融合轉(zhuǎn)錄本進(jìn)一步解析,研究人員還研究了其具有編碼的開放閱讀框,以及解釋了合轉(zhuǎn)錄本的表達(dá)和調(diào)控之間的關(guān)系,并發(fā)現(xiàn)RLN1 在PCa 細(xì)胞系中的表達(dá)不足。該實(shí)驗(yàn)可以說明,三代測序技術(shù)的轉(zhuǎn)錄本測序,不僅可以檢測轉(zhuǎn)錄本的完整性,同時(shí)可以解釋其變異類型,為后續(xù)研究提供可靠的基礎(chǔ)。
為了進(jìn)一步提高融合基因檢測效率,CHRISTINA STANGL等[39]還基于納米孔測序技術(shù),開發(fā)了FUDGE(FUsion Detection from Gene Enrichment),一種基于納米孔和測序通過CRISPR-Cas9靶向富集檢測融合基因。FUDGE 靶向富集的原理是針對具有多個(gè)伴侶的融合基因,以其共有融合片段作為切割的靶點(diǎn)并設(shè)計(jì)引物,通過引物與PAM 的位置決定測序的方向。將提取好的DNA 進(jìn)行去磷酸化,并使用我們設(shè)計(jì)好的引物引導(dǎo)Cas9 結(jié)合到目標(biāo)靶點(diǎn)并切割,切割的端口處于磷酸化狀態(tài)。由于Cas9 蛋白與能與PAM 遠(yuǎn)端發(fā)生結(jié)合,從而覆蓋了這一端的磷酸化側(cè),而暴露了近側(cè)的磷酸化末端。斷裂的末端具有dA 尾能與適配器發(fā)生連接,從而將DNA 引導(dǎo)入納米孔進(jìn)行測序(圖2)。理論上說,我們只對需要的序列進(jìn)行富集,而無關(guān)序列則不會被檢測,因此我們能在低通量的情況下得到我們想要的序列。不僅如此,該技術(shù)只對已知的伴侶基因進(jìn)行切割。因此只需要了解其中一個(gè)伴侶基因的資料便可,不僅可以檢測已知的融合以及其斷裂點(diǎn),也能檢測到目前尚未發(fā)現(xiàn)的融合伴侶和斷點(diǎn),這對融合基因檢測技術(shù)上來說是巨大的進(jìn)步。
圖2 CRISPR-Cas9靶向富集檢測融合基因原理
TGS 測序是近些年出現(xiàn)的新型測序技術(shù),在融合基因檢測中的初步應(yīng)用已顯示出其檢測優(yōu)勢。如通過檢測白血病患者BCR-ABL1突變而指導(dǎo)臨床用藥;檢測BCR-ABL1 融合位點(diǎn)作為生物學(xué)分子標(biāo)記;以及檢測發(fā)現(xiàn)新的未知融合伴侶和新的融合位點(diǎn)。上述均體現(xiàn)了TGS在融合基因檢測方面具有不小的優(yōu)勢。尤其是基于納米孔測序技術(shù)CRISPR-Cas9靶向富集的發(fā)明,使得研究人員在只知道其中一個(gè)融合伴侶的保守序列的情況下,可同時(shí)檢測多個(gè)融合伴侶且獲得其結(jié)構(gòu)和斷裂位點(diǎn)。隨著三代測序技術(shù)的應(yīng)用和檢測方法不斷地推陳出新,基于長讀長高通量基因測序技術(shù)在腫瘤融合基因檢測無疑擁有更為廣闊的應(yīng)用前景。