王琪峰 蕭野
日前,美國(guó)國(guó)立衛(wèi)生研究院首)欠發(fā)布了“泛癌癥圖譜”,以27篇論文的形式發(fā)表在國(guó)際期刊《細(xì)胞》上。研究人員對(duì)患有33種癌癥的約1.1萬例患者進(jìn)行了詳細(xì)的腫瘤基因測(cè)序及分析,“繪制”出了部分癌癥的基因組變化圖譜。該研究全面而透徹地指出了一些癌癥的發(fā)病機(jī)理,顛覆了癌癥的分類方式和治療方法。有專家評(píng)價(jià),它是十多年來開創(chuàng)性癌癥研究的“巔峰之作”,為未來選擇精準(zhǔn)治療方案、高效開發(fā)新藥提供了“路線圖”。那么,這份癌癥圖譜何以獲得如此高的評(píng)價(jià)呢?
癌癥研究有了“谷歌地圖”
2018年4月5日,美國(guó)權(quán)威醫(yī)學(xué)雜志《細(xì)胞》刊登了該國(guó)“癌癥基因組圖譜研究(The Cancer GenomeAtlas)”項(xiàng)目的最新成果—一“泛癌癥圖譜(Pan-CancerAltas)”。該圖譜對(duì)33種癌癥、11286份腫瘤樣本進(jìn)行了分析,以27篇論文的形式轟炸式發(fā)表。
癌癥基因組圖譜研究項(xiàng)目(英文簡(jiǎn)稱TCGA),是2006年美國(guó)國(guó)家人類基因組研究所和美國(guó)國(guó)家癌癥中心聯(lián)合發(fā)起的。TCGA的第一階段為試點(diǎn)項(xiàng)目,以肺癌、卵巢癌和膠質(zhì)母細(xì)胞瘤作為研究重點(diǎn)。TCGA第二階段計(jì)劃完成20~25種不同癌型的分析,于2013年截止臨床收案,共研究了33種類型的癌癥,其中包括10個(gè)罕見癌種。這兩家牽頭機(jī)構(gòu)都隸屬于美國(guó)國(guó)立衛(wèi)生研究院(NIH)。該項(xiàng)目投入的研究經(jīng)費(fèi)多達(dá)3億美元,共有20多家研究機(jī)構(gòu)、超過150名科研人員參與其中。累積的信息量為2.5拍字節(jié)(“拍字節(jié)”即計(jì)算機(jī)存儲(chǔ)單位PB,1PB等于100萬GB),如果用DVD來儲(chǔ)存,至少需要53萬片DVD?;谶@些數(shù)據(jù)和信息的分析,TCGA形成了“泛癌癥圖譜”。
泛癌癥圖譜的內(nèi)容分為三大類別,每個(gè)類別都以一篇摘要論文為基礎(chǔ),描述該主題的核心結(jié)果,主題包括癌細(xì)胞來源樣式、致癌進(jìn)展以及致癌訊息傳遞路徑,再通過多份研究報(bào)告深入探索這些類別中的各個(gè)主題。
“關(guān)于一種癌癥如何與另一種形式的癌癥有關(guān)的探討,可能具有真正的臨床意義,”美國(guó)加州大學(xué)圣克魯茲分校生物分子工程學(xué)教授、泛癌癥圖譜倡議組成員喬什·斯圖亞特說,“在某些情況下,我們可以了解的疾病中借用臨床實(shí)踐方案,將其應(yīng)用于治療方案不明的癌癥?!狈喊┌Y圖譜是“是迄今為止最全面的跨癌癥分析”,為今后更好地收集抗癌藥物臨床試驗(yàn)數(shù)據(jù)信息、選擇精準(zhǔn)治療方案、高效開發(fā)新藥提供了路線圖,被稱為“迄今最全面的跨癌癥研究”和“人類癌癥研究的谷歌地圖”。《細(xì)胞》雜志還開辟了一個(gè)專門網(wǎng)頁(yè),收錄這些論文,供全球?qū)W者下載閱讀。
不按長(zhǎng)癌部位而以分子特征分類
癌變,是指細(xì)胞基因突變后導(dǎo)致細(xì)胞不受機(jī)體控制,惡性增殖,最終引起惡性腫瘤形成。突變是關(guān)鍵的致癌基因進(jìn)程之一。90%以上的癌癥始于基因突變。從一個(gè)小小的基因突變到形成張牙舞爪的癌細(xì)胞大軍,其中包含無數(shù)的“分子變化”。
傳統(tǒng)癌癥的分類多以患病部位為標(biāo)準(zhǔn),比如胃癌、肝癌。在癌癥的發(fā)展過程中,病原體和炎癥等導(dǎo)致突變因素,都會(huì)影響癌細(xì)胞的基因組,這就造成傳統(tǒng)分類上的同一種癌癥,可能在“分子水平”上具有很大差異。人體不同部位不同細(xì)胞類型的基因組改變,會(huì)導(dǎo)致數(shù)百種不同形式的癌癥。
2013年9月,加州大學(xué)圣克魯茲分校的喬什·斯圖亞特教授和加州大學(xué)舊金山分校的臨床腫瘤學(xué)家克里斯托弗·本茲等研究人員,完成了第一波跨腫瘤比較。當(dāng)時(shí),他們分析了TCGA項(xiàng)目提供的12種腫瘤圖譜。斯圖亞特說:“當(dāng)我們發(fā)現(xiàn)了不同類型的癌癥之間有相似之處時(shí),大家希望能夠做一個(gè)更全面的分析?!?014年,科學(xué)家們對(duì)腫瘤的分子數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,將腫瘤按照亞型或簇(clusters)進(jìn)行分類。之后,國(guó)際科學(xué)家團(tuán)隊(duì)對(duì)TCGA腫瘤數(shù)據(jù)的完整集合,從“分子水平”的角度詳盡分析了致癌突變與基因、蛋白各分子層面的作用,相當(dāng)于給癌癥“重新畫像”,讓人們能更清楚地“看見”癌癥如何生長(zhǎng)。
從泛癌癥圖譜的研究結(jié)果可知,根據(jù)腫瘤細(xì)胞和基因組成而非起源部位,被分析的33種腫瘤可以被重新劃分為28種不同的分子類型,即不同的亞型或簇。例如,頭、頸、肺部、食道、膀胱及子宮頸的鱗狀細(xì)胞癌,以往根據(jù)發(fā)生部位的不同而分成不同腫瘤,但其實(shí)它們都有很強(qiáng)的分子相似性,可劃歸為一類。此外,胃部、結(jié)腸和直腸等部位發(fā)生的癌癥屬同一系統(tǒng),也具有分子相似性,也可劃為一類。而腎癌等部分癌癥雖在同一器官發(fā)生,卻可能是截然不同的分子亞型。
靶向藥物可能用錯(cuò)了地方?
研究者估計(jì),如果以分子特征作為基準(zhǔn),那么至少會(huì)有1/10的癌癥患者需要重新分類并采用新的治療方案。本茲教授指出,基于此,美國(guó)FDA批準(zhǔn)原本用于治療某一種癌癥的特定免疫療法,可能也會(huì)使其他多種類型的癌癥患者受益。根據(jù)TCGA的分析,有半數(shù)以上的基因突變可以使用已獲準(zhǔn)的“靶向藥物”進(jìn)行針對(duì)性治療,原因是過去這些靶向藥物可能“用錯(cuò)了地方”。
TCGA強(qiáng)調(diào),不該根據(jù)癌癥是先在體內(nèi)哪個(gè)部位(例如肺、腸或胸部)發(fā)現(xiàn)、產(chǎn)生來進(jìn)行治療,而要看它屬哪種分子類型的腫瘤。若患者的腫瘤能首先根據(jù)基因組和分子組成進(jìn)行分類,他們將有最好的機(jī)會(huì)獲得最佳的治療。
揪出853個(gè)罕見遺傳基因突變
誘發(fā)癌癥的基因突變可分為兩大類:第一類是從父母方遺傳到的生殖細(xì)胞系突變;第二類是因?yàn)槔匣?、抽煙或其他環(huán)境影響所造成的體細(xì)胞突變。大多數(shù)人罹患癌癥的原因來自體細(xì)胞突變,生殖細(xì)胞系突變相對(duì)而言并不常見,約有5%~10%的癌癥病患具有強(qiáng)烈家族遺傳史。
找出這些癌癥高風(fēng)險(xiǎn)家族,早期進(jìn)行預(yù)防性醫(yī)療.是癌癥精準(zhǔn)預(yù)防的新挑戰(zhàn)?;诖髷?shù)據(jù),挖掘癌癥遺傳風(fēng)險(xiǎn)、繪制癌癥遺傳風(fēng)險(xiǎn)圖譜,是癌癥研究的前沿領(lǐng)域和熱點(diǎn)方向,而且能夠廣泛應(yīng)用于癌癥風(fēng)險(xiǎn)篩查、癌癥分子預(yù)警、癌癥精準(zhǔn)體檢和早診,是臨床輔助決策的重要基線之一。
TCGA展現(xiàn)了“迄今最全面的癌癥遺傳風(fēng)險(xiǎn)圖譜研究”:對(duì)無數(shù)腫瘤基因組的DNA、染色體和RNA進(jìn)行編目,與相應(yīng)的正常細(xì)胞基因組相比,并分析它們的表觀遺傳和蛋白質(zhì)結(jié)果,進(jìn)而發(fā)現(xiàn)人體細(xì)胞DNA、RNA、蛋白質(zhì)和表觀遺傳水平上的“分子畸變”。該項(xiàng)目對(duì)約1.1萬個(gè)患者的14.6億個(gè)基因突變進(jìn)行鑒定,最終發(fā)現(xiàn)其中有853個(gè)罕見的遺傳基因突變,這些突變會(huì)導(dǎo)致癌癥發(fā)生、發(fā)展,在多種癌癥中很常見。
這些發(fā)現(xiàn)有助于解釋一些癌癥的遺傳性,為遺傳變異分類和檢測(cè)等下游研究奠定了基礎(chǔ)。該研究由美國(guó)圣劉易斯華盛頓大學(xué)、哈佛大學(xué)一麻省理工學(xué)院Broad研究所、貝勒醫(yī)學(xué)院、梅奧臨床醫(yī)學(xué)院和西安交通大學(xué)等13家研究機(jī)構(gòu)歷時(shí)近3年合作完成。
和遺傳基因相關(guān)的癌癥包括:卵巢癌、胃癌、乳癌、前列腺癌、神經(jīng)膠質(zhì)瘤、頭頸部腫瘤、子宮內(nèi)膜癌、腎癌、多型性神經(jīng)膠質(zhì)母細(xì)胞瘤等。研究人員圣劉易斯華盛頓大學(xué)的醫(yī)學(xué)副教授丁莉(音譯)表示,通過對(duì)上萬個(gè)腫瘤樣本的分析,研究人員從細(xì)節(jié)上了解了哪些遺傳性突變會(huì)驅(qū)動(dòng)癌癥,并認(rèn)識(shí)到隨年齡增長(zhǎng)而不斷積累的基因錯(cuò)誤,使腫瘤形成了特定的分子特征,現(xiàn)在可以利用癌癥的分子特征揪出致癌細(xì)胞。
丁莉表示,早期大多數(shù)臨床試驗(yàn)的設(shè)計(jì)并沒有考慮到基因組學(xué),現(xiàn)在可以對(duì)患者的腫瘤樣本進(jìn)行測(cè)序,尋找其基因組學(xué)與藥物療效之間的相關(guān)性,這將幫助醫(yī)生設(shè)計(jì)更好的醫(yī)療方案。
TCGA指出,針對(duì)腫瘤組織旁邊的健康組織進(jìn)行測(cè)序,對(duì)于優(yōu)化治療非常重要;還可以針對(duì)不同基因特性,在臨床上通過預(yù)防性檢測(cè)、標(biāo)靶治療甚至預(yù)后監(jiān)測(cè)(在醫(yī)學(xué)上,“預(yù)后”是指根據(jù)經(jīng)驗(yàn)預(yù)測(cè)疾病發(fā)展情況)等不同方式,預(yù)防或治療癌癥。
“安吉麗娜-朱莉基因”突變會(huì)引發(fā)哪些癌癥?
“泛癌癥圖譜”還加深了對(duì)于某些基因突變的研究。比如,BRCA1和BRCA2是兩種具有免疫作用的基因,一旦出現(xiàn)突變就可能導(dǎo)致乳腺癌或卵巢癌,這在以往的研究中已經(jīng)得到確認(rèn)。國(guó)際知名影星安吉麗娜·朱莉就是因?yàn)椴槌鲇蠦RCA1突變,并且有乳腺癌家族史,所以才采取了預(yù)防性的雙乳切除術(shù)?!癇RCA1”和“BRCA2”兩種跟乳癌或卵巢癌有關(guān)的基因,也因此被外界稱為“安吉麗娜·朱莉基因”。
可是人們并不清楚BRCA1和BRCA2的哪些突變是無害的,哪些會(huì)引發(fā)何種癌癥。泛癌癥圖譜發(fā)現(xiàn),BRCA1和BRCA2有21種突變可能引起乳腺癌,3種突變可能導(dǎo)致宮頸癌,1種突變可能引起直腸癌,還有1種突變可能引起惡性膠質(zhì)瘤,38種突變可能引起卵巢癌。
樣本采集是關(guān)鍵形成基因鑒定流程
TCGA還強(qiáng)調(diào)了一個(gè)問題——樣品的獲得,這也是研究中最大的財(cái)政負(fù)擔(dān)。TCGA最初只有3個(gè)實(shí)驗(yàn)性項(xiàng)目,收集的數(shù)據(jù)不足以在基因分子水平上給各類癌癥“畫像”并分析其機(jī)理。十余年來基因測(cè)序技術(shù)飛速發(fā)展對(duì)癌癥研究發(fā)揮了重要作用,然而找到合適的方法采集樣本、提取分子研究物和進(jìn)行分子鑒定,仍是癌癥基因研究的關(guān)鍵所在,這是所有后續(xù)研究的基礎(chǔ),難度最大,成本也最高。
經(jīng)過多年實(shí)驗(yàn),TCGA形成了一套基因鑒定流程,這套流程被美國(guó)癌癥基因中心廣泛用于各種癌癥基因研究項(xiàng)目,將病患提供的癌癥組織樣本加工成可供今后多年科研使用的數(shù)據(jù)。
TCGA生物標(biāo)本核心資源項(xiàng)目的負(fù)責(zé)人羅伊·塔努澤博士表示,“只有樣本及其臨床指標(biāo)合格,其他研究才有可能合格。在開展研究之前,先要搞清楚需要什么樣的標(biāo)本和臨床數(shù)據(jù)?!北热?,研究腫瘤對(duì)化療的反應(yīng),就要知道化療的時(shí)間和劑量;研究相鄰的正常組織,就要弄清腫瘤與正常組織之間的距離有多遠(yuǎn)。
在TCGA剛啟動(dòng)時(shí),研究的主要目的僅局限于繪制癌癥基因突變的圖譜,所以只需要收集為數(shù)較少的基礎(chǔ)數(shù)據(jù);而目前的研究將癌癥基因突變與臨床結(jié)果相聯(lián)系,需要采集的臨床數(shù)據(jù)已經(jīng)超過125項(xiàng),而且要根據(jù)統(tǒng)一標(biāo)準(zhǔn)進(jìn)行采集。開展大規(guī)模的基因研究總會(huì)遇到波動(dòng)和偏差。即便像TCGA這樣已經(jīng)開展了十余年研究,其樣本采集流程至今依然在不斷完善。
TCGA大規(guī)模搜集特定癌癥病患的信息數(shù)據(jù),并在其官網(wǎng)公開了定序數(shù)據(jù)與分析結(jié)果,供大家瀏覽及下載,目的是打造完整的癌癥基因組信息,有助于人類癌癥的預(yù)防、診斷與治療。
云技術(shù)為所有科學(xué)家提供平臺(tái)
從海量的基因數(shù)據(jù)中分析出有效的防癌治癌信息,無異于大海撈針。如今,全球的基因數(shù)據(jù)正以每年1澤字節(jié)(相當(dāng)于1萬億GB,或者約2500億張DVD的容量)的速度增長(zhǎng)。癌癥基因研究注定與大數(shù)據(jù)密不可分。
將癌癥基因數(shù)據(jù)與患者的其他數(shù)據(jù)結(jié)合起來,如表觀基因組、蛋白質(zhì)組、影像分析、治療結(jié)果、病例人口分布等,再進(jìn)行分析,無疑會(huì)使研究人員對(duì)癌癥的認(rèn)識(shí)更深入、全面??蓡栴}是,隨著大量數(shù)據(jù)產(chǎn)生,對(duì)其有效加以利用的難度也越來越大。如何解釋不同研究得出的數(shù)據(jù)?如何使不同格式的數(shù)據(jù)兼容?對(duì)研究者來說,若不能很好地解決這些問題,那么無數(shù)的基因圖譜終將變成一座座尋不到出口的迷宮,而非指明方向的“谷歌地圖”。
2016年,美國(guó)國(guó)家癌癥研究所發(fā)起了基因數(shù)據(jù)共同體項(xiàng)目以及另外3個(gè)癌癥基因云項(xiàng)目,制訂了一套標(biāo)準(zhǔn)化的基因數(shù)據(jù)提交程序,以確保數(shù)據(jù)合格、統(tǒng)一格式,并保證數(shù)據(jù)可以安全獲得。3個(gè)基因云項(xiàng)目則與谷歌和亞馬遜的商用云平臺(tái)合作,使癌癥基因數(shù)據(jù)的下載快速便捷,又大大降低了數(shù)據(jù)的使用成本。云技術(shù)除了讓研究者可以利用平臺(tái)上現(xiàn)有的尖端分析流程,還讓他們能將自己研發(fā)的研究工具上傳到云平臺(tái)上。在癌癥基因云項(xiàng)目開展不到一年的時(shí)間里,就有美、澳、法、印等多國(guó)研究人員上傳了數(shù)據(jù)。
人類已知癌癥已經(jīng)超過200種,但目前對(duì)它們的認(rèn)知還只是冰山一角,科學(xué)家相信,憑借人類的勇氣、智慧和不懈的努力,癌癥隱藏的秘密遲早會(huì)被一一揭開。