劉陽(yáng),白卉,伯曉晨
軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所,北京 100850
基因表達(dá)譜大數(shù)據(jù)在抗癌藥物研發(fā)中的應(yīng)用
劉陽(yáng),白卉,伯曉晨
軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所,北京 100850
作為功能基因組學(xué)中重要的組成部分,基因表達(dá)譜在生物學(xué)、醫(yī)學(xué)和藥物研發(fā)等多個(gè)領(lǐng)域發(fā)揮著重要作用。特別是隨著精準(zhǔn)醫(yī)療概念的提出,整合包括基因表達(dá)譜在內(nèi)的多組學(xué)數(shù)據(jù)用于個(gè)性化醫(yī)療是未來(lái)的發(fā)展趨勢(shì)。從抗癌藥物研發(fā)背景出發(fā),介紹了基于細(xì)胞擾動(dòng)表達(dá)譜的大數(shù)據(jù)分析方法,并且總結(jié)了其在抗癌藥物研發(fā)中的應(yīng)用。
基因表達(dá)譜;關(guān)聯(lián)圖譜;整合網(wǎng)絡(luò)細(xì)胞印記庫(kù);抗癌藥物研發(fā)
受中國(guó)老齡化程度加深和社會(huì)環(huán)境變遷,特別是環(huán)境污染等的影響,國(guó)內(nèi)惡性腫瘤患者的發(fā)病率和死亡率逐年增加。惡性腫瘤逐漸成為最主要的公共衛(wèi)生問(wèn)題。根據(jù)2015年國(guó)家癌癥中心在癌癥研究頂級(jí)期刊《CA: A Cancer Journal for Clinicians》上發(fā)布的統(tǒng)計(jì)數(shù)據(jù),2000—2011年,中國(guó)癌癥發(fā)病率逐年增長(zhǎng)(男0.2%,女2.2%),給癌癥的治療和抗癌藥物的研發(fā)帶來(lái)極大挑戰(zhàn)[1]。未來(lái)癌癥很可能代替心腦血管疾病成為人類(lèi)健康的首要?dú)⑹帧?/p>
目前,癌癥的常規(guī)治療仍然以手術(shù)、化療和放療3種手段互相輔助進(jìn)行。這3種治療方法沒(méi)有先后主次之分,臨床上往往根據(jù)癌癥類(lèi)型和其嚴(yán)重程度采用不同的治療程序。新出現(xiàn)的靶向治療藥物和免疫治療藥物逐漸在癌癥治療中發(fā)揮重要作用。在全球藥物研發(fā)市場(chǎng)中,抗癌藥物研發(fā)一直是藥物研究的熱點(diǎn),其研發(fā)量約占全球藥物研發(fā)總量的1/3。雖然中途停研項(xiàng)目多、最終上市率低,但是各國(guó)政府和大型制藥公司在抗癌藥物研發(fā)的資金投入?yún)s逐年增長(zhǎng)。2005—2014年的10年時(shí)間里,美國(guó)食品與藥品管理局(FDA)批準(zhǔn)了超過(guò)60種抗癌藥物。目前全球抗癌藥物銷(xiāo)量最高的是單抗類(lèi)靶向藥物,如羅氏的美羅華(利妥昔單抗,Rituxan)、安維?。ㄘ惙ブ閱慰?,Avastin)和赫賽汀(曲妥珠單抗,Herceptin)等。
癌癥如何產(chǎn)生目前并沒(méi)有定論,人們廣泛接受的理論是突變累積學(xué)說(shuō)[2],即癌癥的形成是由基因突變帶來(lái)的選擇性生長(zhǎng)優(yōu)勢(shì)造成的,正常細(xì)胞從良性增殖發(fā)展到惡性癌細(xì)胞會(huì)經(jīng)歷一系列的突變。其他學(xué)說(shuō)則嘗試從代謝和進(jìn)化等角度解釋癌癥的發(fā)生過(guò)程[3]。Hanahan等人[4]總結(jié)了癌癥的十大特征,其中給抗癌藥物研發(fā)帶來(lái)巨大挑戰(zhàn)的是其高度基因異質(zhì)性(tumor heterogeneity)[5-7],即其基因突變往往因時(shí)間點(diǎn)、腫瘤位置、病人而異。這種異質(zhì)性造成對(duì)于同一種癌癥類(lèi)型,也需要不同的藥物進(jìn)行合理用藥和精準(zhǔn)治療的現(xiàn)狀。癌癥異質(zhì)性是造成抗癌藥物藥效不一致、研發(fā)成功率低的重要原因。
2015年1月,美國(guó)總統(tǒng)奧巴馬提出精準(zhǔn)醫(yī)療(precision medicine initiative)計(jì)劃[8],該計(jì)劃強(qiáng)調(diào)準(zhǔn)確、準(zhǔn)時(shí)、共享、個(gè)體化四大要素,要求根據(jù)病人的基因組學(xué)、表觀遺傳學(xué)以及臨床病例等信息合理用藥,提供最佳的聯(lián)合方案和合適的藥物劑量,減少藥物的毒副作用,在取得最佳治療方案的同時(shí)將費(fèi)用降到最低,這在解決癌癥異質(zhì)性造成的療效差異方面邁出了重要一步。美國(guó)精準(zhǔn)醫(yī)學(xué)計(jì)劃由兩個(gè)目標(biāo)組成:近期目標(biāo)關(guān)注癌癥領(lǐng)域,著力解決精準(zhǔn)癌癥醫(yī)學(xué)中的難題,如難以解釋的耐藥性問(wèn)題、癌癥基因組異質(zhì)性、癌癥反應(yīng)監(jiān)測(cè)與復(fù)發(fā)風(fēng)險(xiǎn)評(píng)估、組合用藥問(wèn)題[8];長(zhǎng)期目標(biāo)擴(kuò)展到人類(lèi)各種疾病的治療,包括疾病風(fēng)險(xiǎn)評(píng)估、闡釋疾病機(jī)制、預(yù)測(cè)各種疾病的最佳治療方法等。
受美國(guó)“精準(zhǔn)醫(yī)療”計(jì)劃的影響,中國(guó)也在大力推進(jìn)精準(zhǔn)醫(yī)療[9]。2016年中國(guó)全面啟動(dòng)精準(zhǔn)醫(yī)療計(jì)劃,其規(guī)模比美國(guó)的精準(zhǔn)醫(yī)療計(jì)劃大很多,預(yù)計(jì)在2030年前將投入600億元用于該計(jì)劃。2016年3月,中華人民共和國(guó)科學(xué)技術(shù)部發(fā)布了中國(guó)精準(zhǔn)醫(yī)療白皮書(shū)?!熬珳?zhǔn)醫(yī)學(xué)研究”專(zhuān)項(xiàng)的總體目標(biāo)如下。
● 以我國(guó)常見(jiàn)疾病及若干流行率相對(duì)較高的罕見(jiàn)病為切入點(diǎn),協(xié)同攻關(guān),構(gòu)建百萬(wàn)人以上的健康隊(duì)列和重大疾病專(zhuān)病隊(duì)列。
● 建立生物醫(yī)學(xué)大數(shù)據(jù)共享平臺(tái),突破組學(xué)臨床應(yīng)用技術(shù)和生物醫(yī)學(xué)大數(shù)據(jù)分析技術(shù),建立疾病預(yù)警、診斷、治療與療效評(píng)價(jià)的生物標(biāo)志物、靶標(biāo)、制劑的實(shí)驗(yàn)和分析技術(shù)體系。
● 以臨床應(yīng)用為導(dǎo)向,形成重大疾病的風(fēng)險(xiǎn)評(píng)估、預(yù)測(cè)預(yù)警、早期篩查、分型分類(lèi)、個(gè)體化治療、療效和安全性預(yù)測(cè)及監(jiān)控等精準(zhǔn)防診治方案和臨床決策系統(tǒng),形成可用于精準(zhǔn)醫(yī)學(xué)應(yīng)用全過(guò)程的生物醫(yī)學(xué)大數(shù)據(jù)參考咨詢(xún)、分析判斷、快速計(jì)算和精準(zhǔn)決策的系列分類(lèi)應(yīng)用技術(shù)平臺(tái)。
● 建設(shè)中國(guó)人群典型疾病精準(zhǔn)醫(yī)學(xué)臨床方案的示范、應(yīng)用和推廣體系,推動(dòng)一批精準(zhǔn)治療藥物和分子檢測(cè)技術(shù)產(chǎn)品進(jìn)入國(guó)家醫(yī)保目錄,為顯著提升人口健康水平、減少無(wú)效和過(guò)度醫(yī)療、避免有害醫(yī)療、遏制醫(yī)療費(fèi)用支出快速增長(zhǎng)提供科技支撐,使精準(zhǔn)醫(yī)學(xué)成為經(jīng)濟(jì)社會(huì)發(fā)展新的增長(zhǎng)點(diǎn)。
不同國(guó)家常見(jiàn)癌癥類(lèi)型和人群本身基因組存在差異,因此中國(guó)的精準(zhǔn)醫(yī)學(xué)計(jì)劃有自己的側(cè)重點(diǎn)。但是中國(guó)的精準(zhǔn)醫(yī)學(xué)計(jì)劃也存在大量挑戰(zhàn),如國(guó)內(nèi)醫(yī)院研究轉(zhuǎn)化效率低、臨床樣本共享難、自主研發(fā)藥物少等問(wèn)題。中國(guó)精準(zhǔn)醫(yī)學(xué)計(jì)劃的實(shí)施還需要科研機(jī)構(gòu)的廣泛合作與國(guó)家的統(tǒng)籌協(xié)調(diào)。
隨著高通量測(cè)序技術(shù)和全基因組DNA芯片檢測(cè)技術(shù)的日臻成熟及成本大幅降低,與癌癥相關(guān)的各種組學(xué)數(shù)據(jù)(基因組拷貝數(shù)變異、基因突變、甲基化數(shù)據(jù)以及轉(zhuǎn)錄組、蛋白質(zhì)組、代謝組數(shù)據(jù))正在快速積累。癌癥相關(guān)多組學(xué)公共大數(shù)據(jù)為整合分析癌癥異質(zhì)性及其對(duì)抗癌藥物影響、進(jìn)而指導(dǎo)精準(zhǔn)藥物治療提供了良好的數(shù)據(jù)基礎(chǔ)。整合患者癌癥細(xì)胞/組織的基因組、轉(zhuǎn)錄組、細(xì)胞藥物敏感性基因組等多組學(xué)數(shù)據(jù)以及基因通路信息,指導(dǎo)合理(組合)用藥,是實(shí)現(xiàn)個(gè)性化治療并最終提高治療有效性的重要方法和手段。
基因表達(dá)譜是后基因組時(shí)代最先發(fā)展起來(lái)的高通量技術(shù)[10],其能夠從整體水平研究基因的結(jié)構(gòu)與功能,揭示特定的生物學(xué)過(guò)程和疾病發(fā)生發(fā)展的分子機(jī)制,是目前識(shí)別和描述與特定表型或者擾動(dòng)相關(guān)的基因表達(dá)模式最為有效、準(zhǔn)確和高重復(fù)性的數(shù)據(jù)類(lèi)型,在生物醫(yī)學(xué)領(lǐng)域被廣泛應(yīng)用[11]?;虮磉_(dá)譜的典型應(yīng)用包括:構(gòu)建可能介導(dǎo)某個(gè)重要的生物過(guò)程或者疾病發(fā)生發(fā)展相關(guān)的基因調(diào)控網(wǎng)絡(luò)[12-14];識(shí)別與特定表型或者擾動(dòng)相關(guān)的基因表達(dá)模式;鑒定疾病診斷和預(yù)后判斷的基因標(biāo)志物[15];尋找潛在的藥靶,用于疾病治療;藥物重定位等。
細(xì)胞擾動(dòng)基因表達(dá)譜是在給定擾動(dòng)的條件下(如基因沉默、基因過(guò)表達(dá)、不同濃度小分子化合物作用),采取多時(shí)間點(diǎn)測(cè)量細(xì)胞全基因組的轉(zhuǎn)錄水平表達(dá)量。2006年Lamb等人[16]首先測(cè)定了5個(gè)人類(lèi)癌癥細(xì)胞系上1309種藥物作用后的全基因組表達(dá)譜,并利用此數(shù)據(jù)構(gòu)建了關(guān)聯(lián)圖譜(connectivity map,CMap)數(shù)據(jù)集。CMap采用基因集富集分析(gene set enrichment analysis,GSEA)方法[17],通過(guò)與組織細(xì)胞在不同生理、病理、藥物作用等條件下的基因表達(dá)譜印記進(jìn)行對(duì)比分析,建立基因—疾病—藥物之間的聯(lián)系,成功用于藥物重定位和發(fā)現(xiàn)藥物新作用方式等[18]。該方法由3部分組成:參考基因表達(dá)譜數(shù)據(jù)庫(kù)、查詢(xún)表達(dá)譜印記、模式匹配算法。圖1為CMap方法的原理。
圖1左半部分為基因表達(dá)譜印記,代表誘導(dǎo)產(chǎn)生的目標(biāo)細(xì)胞狀態(tài);中間部分為大量擾動(dòng)的人體細(xì)胞系表達(dá)譜構(gòu)成的參考數(shù)據(jù)庫(kù),采用模式匹配算法對(duì)查詢(xún)的表達(dá)譜印記進(jìn)行打分,評(píng)估富集程度和方向;右半部分根據(jù)關(guān)聯(lián)打分排列擾動(dòng)藥物,排名置頂(正相關(guān))和置底(負(fù)相關(guān))的藥物與查詢(xún)的目標(biāo)細(xì)胞狀態(tài)表達(dá)譜印記建立聯(lián)系。
圖1 關(guān)聯(lián)圖譜原理[16]
參考基因表達(dá)譜數(shù)據(jù)庫(kù)包含不同生物狀態(tài)下的基因表達(dá)譜,如不同的擾動(dòng)類(lèi)型、細(xì)胞系、作用時(shí)間、濃度條件等。查詢(xún)表達(dá)譜印記是由用戶(hù)提供的基因集,用于描述特定的生物狀態(tài)。根據(jù)研究目的的不同,其可以來(lái)自人體樣本、疾病動(dòng)物模型、小分子藥物作用的細(xì)胞和組織等,一般通過(guò)相關(guān)表達(dá)譜數(shù)據(jù)進(jìn)行差異表達(dá)分析得到。目前存在一些整理的表達(dá)譜印記集可用于CMap分析,如分子印記數(shù)據(jù)庫(kù)(molecular signatures database,MSigDB)[17]是GSEA(基因集富集分析)附帶的表達(dá)譜印記數(shù)據(jù)集?;蛴∮洈?shù)據(jù)庫(kù)(gene signature database,GeneSigDB)[19]是通過(guò)文獻(xiàn)整理得到的表達(dá)譜印記數(shù)據(jù)庫(kù),最新第四版數(shù)據(jù)包含從1604篇文章整理得到的3515個(gè)表達(dá)譜印記。這些數(shù)據(jù)集可以提供不同生物狀態(tài)下的參考表達(dá)譜印記,為相關(guān)領(lǐng)域的科學(xué)研究提供了極大便利。模式匹配算法用于評(píng)估查詢(xún)表達(dá)譜印記與參考表達(dá)譜之間的相關(guān)性,GSEA基于Kolmogorov-Smirnov統(tǒng)計(jì)[20],是一種非參數(shù)、基于秩序列的模式匹配算法。
然而,CMap項(xiàng)目?jī)H在5個(gè)細(xì)胞系測(cè)量了1300多種藥物作用后的基因表達(dá)譜,作為比對(duì)關(guān)聯(lián)的參考數(shù)據(jù)集,其數(shù)據(jù)規(guī)模大大限制了其潛在應(yīng)用。2010年,美國(guó)國(guó)立衛(wèi)生研究院(NIH)資助布羅德研究所(Broad Institute)啟動(dòng)了整合網(wǎng)絡(luò)細(xì)胞印記庫(kù)項(xiàng)目(Library of Integrated Network-based Cellular Signatures,LINCS)。該項(xiàng)目旨在在更多不同細(xì)胞系上測(cè)量不同擾動(dòng)類(lèi)型引起的轉(zhuǎn)錄組變化,獲得更大規(guī)模的表達(dá)譜數(shù)據(jù)進(jìn)行關(guān)聯(lián)網(wǎng)絡(luò)分析,推動(dòng)新的生物醫(yī)學(xué)發(fā)現(xiàn)。值得注意的是,LINCS項(xiàng)目表達(dá)譜測(cè)定采用L1000[21]技術(shù),該技術(shù)考慮基因表達(dá)之間的相關(guān)性,將需要測(cè)量的基因數(shù)量大幅減少,達(dá)到控制成本的目的。L1000挑選978個(gè)標(biāo)志基因進(jìn)行測(cè)量,進(jìn)一步通過(guò)構(gòu)建模型外推出其他基因的表達(dá)量。實(shí)驗(yàn)數(shù)據(jù)表明這些標(biāo)志基因的表達(dá)可以代表全基因組80%的信息。雖然存在一定誤差,但是該技術(shù)可以將成本減小到全基因組基因芯片成本的1%,使得測(cè)量大規(guī)模基因表達(dá)譜可以實(shí)現(xiàn)。在降低成本、保證數(shù)據(jù)質(zhì)量的前提下已獲得并公開(kāi)包括基因沉默(RNA interference)、基因過(guò)表達(dá)(overexpression)、小分子化合物(small-molecule compounds)這三大類(lèi)擾動(dòng)類(lèi)型下不同種類(lèi)細(xì)胞系的基因表達(dá)譜。截至2016年2月,LINCS計(jì)劃已公開(kāi)的表達(dá)譜數(shù)據(jù)規(guī)模已超過(guò)百萬(wàn),涉及77個(gè)細(xì)胞系、4372個(gè)基因沉默、3124個(gè)基因過(guò)表達(dá)、20413個(gè)小分子化合物的多因素?cái)_動(dòng)的表達(dá)譜,且其主要的細(xì)胞擾動(dòng)表達(dá)譜均是在不同癌癥細(xì)胞系上測(cè)量獲得的,主要包括乳腺癌(MCF7)、結(jié)腸癌(HT29)、肝癌(HEPG2)、肺癌(A549、HCC515)、黑色素瘤(A375)和前列腺癌(PC3、VCAP)。這些癌癥細(xì)胞系的選擇代表了美國(guó)每年新增癌癥病例最多的癌癥類(lèi)型。
除了不同的擾動(dòng)類(lèi)型,LINCS細(xì)胞擾動(dòng)表達(dá)譜還涉及不同序列(基因沉默)、不同時(shí)間、不同劑量(小分子化合物)的影響,如何綜合考慮不同因素的作用,從數(shù)據(jù)產(chǎn)出有價(jià)值的信息,是LINCS細(xì)胞擾動(dòng)表達(dá)譜大數(shù)據(jù)處理的難點(diǎn)。另外L1000的線(xiàn)性外推模型本身存在誤差,其數(shù)據(jù)預(yù)處理方法也值得深入研究。Chen等人[22]采用深度學(xué)習(xí)算法挖掘基因表達(dá)之間的非線(xiàn)性關(guān)系,并宣稱(chēng)其將預(yù)測(cè)的基因表達(dá)量精度提高了15.33%。
在LINCS表達(dá)譜數(shù)據(jù)計(jì)算中,考慮到數(shù)據(jù)規(guī)模和關(guān)聯(lián)圖譜本身的計(jì)算復(fù)雜度,需要借助大規(guī)模并行計(jì)算才能在短時(shí)間內(nèi)得到計(jì)算結(jié)果。事實(shí)上,筆者在天河高性能計(jì)算機(jī)上完成了相關(guān)計(jì)算流程的構(gòu)建。同時(shí)也要看到,雖然LINCS細(xì)胞擾動(dòng)大數(shù)據(jù)相比其他領(lǐng)域的大數(shù)據(jù)規(guī)模較小,但是其已經(jīng)遠(yuǎn)遠(yuǎn)超出傳統(tǒng)表達(dá)譜數(shù)據(jù)產(chǎn)出的規(guī)模,有效利用該數(shù)據(jù)對(duì)于生物醫(yī)學(xué)和轉(zhuǎn)化醫(yī)學(xué)研究都具有重大潛在價(jià)值。
與傳統(tǒng)的基于單一藥效指標(biāo)的高通量篩選不同,關(guān)聯(lián)圖譜指導(dǎo)下的藥物發(fā)現(xiàn)是建立在疾病表型(disease phenotype)特異的表達(dá)譜印記基礎(chǔ)上的大規(guī)模關(guān)聯(lián)篩選。具體來(lái)說(shuō),在抗癌藥物研發(fā)中,其一般方法是測(cè)定多個(gè)臨床癌癥樣本的表達(dá)譜并提取一組特征性差異表達(dá)的基因集合,即表達(dá)譜印記,然后在公共的大規(guī)模藥物擾動(dòng)細(xì)胞基因表達(dá)譜數(shù)據(jù)庫(kù)中進(jìn)行比對(duì)和關(guān)聯(lián)分析,篩選出與之高度負(fù)相關(guān)的候選藥物,進(jìn)而通過(guò)體內(nèi)外實(shí)驗(yàn)進(jìn)行抗癌活性評(píng)價(jià)。
經(jīng)過(guò)近10年的發(fā)展,以CMap為先導(dǎo)的表達(dá)譜印記比對(duì)及關(guān)聯(lián)網(wǎng)絡(luò)分析方法在基礎(chǔ)和臨床、系統(tǒng)生物學(xué)和藥物發(fā)現(xiàn)之間架起了橋梁,尤其在抗癌藥物發(fā)現(xiàn)領(lǐng)域得到了諸多成功應(yīng)用[18]。Wang等人[23]根據(jù)基因芯片表達(dá)譜數(shù)據(jù)得到與肺腺癌高度相關(guān)的表達(dá)譜印記,然后采用該方法發(fā)現(xiàn)HSP90抑制劑、PPAR拮抗劑和PI3K抑制劑這幾類(lèi)藥物與肺腺癌特異性表達(dá)譜印記高度負(fù)相關(guān),并且實(shí)驗(yàn)證實(shí)了17-AAG(一種HSP90抑制劑)能夠抑制肺腺癌細(xì)胞生長(zhǎng)。Siavelis等人[24]整合了5個(gè)阿爾茲海默癥相關(guān)的表達(dá)譜數(shù)據(jù),采用CMap、SPIEDw[25]、sscMap[26]、LINCS-L10004個(gè)分析工具分別對(duì)藥物作用細(xì)胞表達(dá)譜數(shù)據(jù)集進(jìn)行分析,發(fā)現(xiàn)了27個(gè)阿爾茲海默癥的潛在治療藥物,進(jìn)一步的信號(hào)通路和蛋白質(zhì)相互作用網(wǎng)絡(luò)分析發(fā)現(xiàn)這些藥物可能是通過(guò)影響表皮生長(zhǎng)因子受體相關(guān)的通路來(lái)發(fā)揮作用的。表1列出了2013年至今CMap和LINCS數(shù)據(jù)應(yīng)用于抗癌藥物研發(fā)的應(yīng)用案例,更多研究應(yīng)用可以參考[18]。
LINCS細(xì)胞表達(dá)譜數(shù)據(jù)除了可以直接利用小分子化合物表達(dá)譜進(jìn)行抗癌藥物預(yù)測(cè)外,還可以結(jié)合基因沉默和過(guò)表達(dá)擾動(dòng)的表達(dá)譜數(shù)據(jù)尋找潛在的抗癌藥物藥靶、確定小分子化合物的潛在靶點(diǎn)、構(gòu)建某個(gè)生物過(guò)程的基因調(diào)控網(wǎng)絡(luò)確定關(guān)鍵基因
等,可以從多角度服務(wù)于抗癌藥物的研發(fā),是轉(zhuǎn)化醫(yī)學(xué)研究的重要數(shù)據(jù)資源。
表1 CMap與LINCS用于抗癌藥物研發(fā)研究匯總(2012年至今)
作為一種有效的技術(shù)方法,基因表達(dá)譜在抗癌藥物的早期發(fā)現(xiàn)、后期研發(fā)以及臨床用藥指導(dǎo)都發(fā)揮著重要作用[49]。而隨著測(cè)序技術(shù)的發(fā)展,轉(zhuǎn)錄組測(cè)序成本不斷降低,將使得在成本可控的條件下測(cè)量大量不同條件下的基因表達(dá)譜數(shù)據(jù)可行,結(jié)合最新的基因表達(dá)譜分析方法,將為藥物發(fā)現(xiàn)提供更為廣闊的空間。實(shí)際上,LINCS第二階段將大大增加數(shù)據(jù)類(lèi)型和數(shù)據(jù)規(guī)模,隨著相關(guān)研究的深入,其價(jià)值將逐漸凸顯。
隨著多組學(xué)時(shí)代的來(lái)臨,融合包括基因表達(dá)譜在內(nèi)的多組學(xué)數(shù)據(jù)是未來(lái)的發(fā)展趨勢(shì),而其應(yīng)用不僅僅局限于疾病分型和藥物重定位方向。結(jié)合最新的人工智能技術(shù),其已經(jīng)服務(wù)于精準(zhǔn)醫(yī)療,如國(guó)際商業(yè)機(jī)器公司(IBM)的沃森(Waston)系統(tǒng),可以將患者的組學(xué)數(shù)據(jù)與構(gòu)建的疾病知識(shí)庫(kù)比對(duì),根據(jù)患者的遺傳學(xué)特征提供最優(yōu)的治療方案。而組學(xué)數(shù)據(jù)的進(jìn)一步增長(zhǎng),將進(jìn)一步提高該系統(tǒng)的準(zhǔn)確度。目前,美國(guó)和加拿大的多家腫瘤中心以及國(guó)內(nèi)的多家醫(yī)院已經(jīng)部署沃森系統(tǒng),并應(yīng)用于癌癥診斷與治療中。
當(dāng)然,基因表達(dá)譜分析也存在一定的不足,如樣本少、特征太多引起的統(tǒng)計(jì)檢驗(yàn)有效性問(wèn)題。而LINCS的細(xì)胞擾動(dòng)表達(dá)譜數(shù)據(jù)的復(fù)雜度和誤差對(duì)數(shù)據(jù)分析方法提出更多挑戰(zhàn),如何降低預(yù)測(cè)結(jié)果的假陽(yáng)性和假陰性,為臨床醫(yī)學(xué)研究提供更多有價(jià)值的信息需要進(jìn)一步研究。相信隨著轉(zhuǎn)錄組測(cè)序技術(shù)和相關(guān)數(shù)據(jù)分析技術(shù)的持續(xù)發(fā)展,未來(lái)基因表達(dá)譜在抗癌藥物研發(fā)中將發(fā)揮更加重要的作用。
[1] CHEN W, ZHENG R, BAADE P D, et al.Cancer statistics in China, 2015[J].CA Cancer J Clin, 2016, 66(1): 115-132.
[2] NORDLING C O.A new theory on cancerinducing mechanism[J].British Journal of Cancer, 1953.7(1): 68-72.
[3] ROZHOK A I, DEGREGORI J.Toward an evolutionary model of cancer: Considering the mechanisms that govern the fate of somatic mutations[J].Proceedings of the National Academy of Sciences of the United States of America, 2015, 112(29): 8914-8921.
[4] HANAHA N D, WEINBERG R A.Hallmarks of cancer: the next generation[J].Cell, 2011, 144(5): 646-674.
[5] FISHER R, PUSZTAI L, SWANTON C.Cancer heterogeneity: implications for targeted therapeutics[J].British Journal of Cancer, 2013, 108(3): 479-485.
[6] SWANTON C.Intratumor heterogeneity: evolution through space and time[J].Cancer Research, 2012, 72(19): 4875-4882.
[7] YATES L R, CAMPBELL P J.Evolution of the cancer genome[J].Nature Reviews Genetics, 2012, 13(11): 795-806.
[8] COLLINS F S, H Varmus.A new initiative on precision medicine[J].New England Journal of Medicine, 2015, 372(9): 793-795.
[9] CYRANOSKI D.China embraces precision medicine on a massive scale[J].Nature, 2016, 529(7584): 9-10.
[10] LOCKHART D J, WINZELER E A.Genomics, gene expression and DNA arrays[J].Nature, 2000, 405(6788): 827-836.
[11] GLIGORIJEVIC V, MALOD-DOGNIN N, PRZULJ N.Integrative methods for analysing big data in precision medicine[J].Proteomics, 2015, 16(5): 7.
[12] MARGOLIN A A, NEMENMAN I, BASSO K,et al.ARACNE: an algorithm for the reconstruction of gene regulatory networks in a mammalian cellular context[J].BMC Bioinformatics, 2006, 7(2): S7.
[13] LEFEBVRE C, RAJBHANDARI P, ALVAREZ M J, et al.A human B-cell interactome identifies MYB and FOXM1 as master regulators of proliferation in germinal centers[J].Molecular Systems Biology, 2010, 6(1): 377.
[14] CHEN J C, ALVAREZ M, TALOS F, et al.Identification of causal genetic drivers of human disease through systems-level analysis of regulatory networks[J].Cell, 2014, 159(2): 402-414.
[15] D E H M E R M, M U E L L E R L A, EMMERTSTREIB F.Quantitative network measures as biomarkers for classifying prostate cancer disease states: a systems approach to diagnostic biomarkers[J].PLos One, 2013, 8(11): e77602.
[16] LAMB J, CRAWFORD E D, PECK D, et al.The connectivity map: using geneexpression signatures to connect small molecules, genes, and disease[J].Science, 2006, 313(5795): 1929-1935.
[17] SUBRAMANIAN A, TAMAYO P, MOOTHA V K, et al.Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles[J].Proceedings of the National Academy of Sciences, 2005, 102(43): 15545-15550.
[18] QU X A, RAJPAL D K.Applications of connectivity map in drug discovery and development[J].Drug Discovery Today, 2012, 17(23-24): 1289-1298.
[19] CULHANE A C, SCHR?DER M S, SU LTA NA R, et al.G ene Si g DB: a manually curated database and resource for analysis of gene expression signatures[J].Nucleic Acids Research, 2012, 40(Database Issue): 1060-1066.
[20] HOLLANDER M, WOLFE D A, CHICKEN E.Nonparametric statistical methods[M]// Biostatistics and Microbiology: A Survival Manual.New York: Springer New York, 2013: 121-162.
[21] PECK D, CRAWFORD E D, ROSS K N, et al.A method for high-throughput gene expression signature analysis[J].Genome Biology, 2006, 7(7): 91-96.
[22] CHEN Y, LI Y, NARAYAN R, et al.Gene expression inference with deep learning[J].Bioinformatics, 2016, 32(12): 1832-1839.
[23] WA NG G, Y E Y, YA NG X, et al.Expression-based in silico screening of candidate therapeutic compounds for lung adenocarcinoma[J].PLoS One, 2011, 6(1): e14573.
[24] SIAVELIS J C, BOURDAKOU M M, ATHANASIADIS E I, et al.Bioinformatics methods in drug repurposing for Alzheimer's disease[J].Briefings in Bioinformatics, 2015: 1-14.
[25] WILLIAMS G.SPIEDw: a searchable platform-independent expression database web tool[J].BMC Genomics, 2013, 14(1): 1-6.
[26] ZHANG S D, GANT T W.sscMap: an extensible Java application for connecting small-molecule drugs using gene-expression signatures[J].BMC Bioinformatics, 2009, 10(1): 236.
[27] GILLET J P, ANDERSEN J B, MADIGAN J P, et al.A gene expression signature associated with overall survival in patients with hepatocellular carcinoma suggests a new treatment strategy[J].Molecular Pharmacology, 2016, 89(2): 263-272.
[28] VENUGOPAL C, HALLETT R, VORA P, et al.Pyrvinium targets CD133 in human glioblastoma brain tumor-initiating cells[J].Clinical Cancer Research, 2015, 21(23): 5324-5337.
[29] LEE W Y, LEE W T, CHENG C H, et al.Repositioning antipsychotic chlorpromazine for treating colorectal cancer by inhibiting sirtuin 1[J].Oncotarget, 2015, 6(29): 27580-27595.
[30] CHURCHMAN M L, LOW J, QU C, et al.Efficacy of retinoids in IKZF1-mutated BCR-ABL1 acute lymphoblastic leukemia[J].Cancer Cell, 2015, 28(3): 343-356.
[31] WEN Q, O'REILLY P, DUNNE P D, et al.Connectivity mapping using a combined gene signature from multiple colorectal cancer datasets identified candidate drugs including existing chemotherapies[J].Bmc Systems Biology, 2015, 9(5): 1-11.
[32] FARIA C C, SAMEER A, MACK S C, et al.Identification of alsterpaullone as a novel small molecule inhibitor to target group 3 medulloblastoma[J].Oncotarget, 2015, 6(25): 21718-21729.
[33] VASCONCELLOS J F D, LEAL P C, BHASIN M K, et al.SB225002 induces cell death and cell cycle arrest in acute lymphoblastic leukemia cells through the activation of GLIPR1[J].Plos One, 2015, 10(8): 19.
[34] PULVINO M, CHEN L, OLEKSYNET D, et al.Inhibition of COP9-signalosome (CSN) deneddylating activity and tumor growth of diffuse large B-cell lymphomas by doxycycline[J].Oncotarget, 2015, 6(17): 14796-14813.
[35] LIU X, YANG X, CHEN X, et al.Expression profiling identifies bezafibrate as potential therapeutic drug for lung adenocarcinoma[J].Journal of Cancer, 2015, 6(12): 1214-1221.
[36] ZHUO W, ZHANG L, ZHU Y, et al.Valproic acid, an inhibitor of class I histone deacetylases, reverses acquired erlotinibresistance of lung adenocarcinoma cells: a connectivity mapping analysis and an experimental study[J].American Journal of Cancer Research, 2015, 5(7): 2202-2211.
[37] CAO C, GAO R, ZHANG M, et al.Role of LKB1-CRTC1 on glycosylated COX-2 and response to COX-2 inhibition in lung cancer[J].Jnci Journal of the National Cancer Institute, 2015, 107(1): 358.
[38] VAN N V, SCH?LCH S, ISKAR M, et al.Novel drug candidates for the treatment of metastatic colorectal cancer through global inverse gene-expression profiling[J].Cancer Research, 2014, 74(20): 5690-5699.
[39] KIM J, VASU V T, MISHRA R, et al.Bioinformatics-driven discovery of rational combination for overcoming EGFR-mutant lung cancer resistance to EGFR therapy[J].Bioinformatics, 2014, 30(17): 2393-2398.
[40] ZERBINI L F, BHASIN M K, VASCONCELLOS J F D, et al.C omput ational repositioning and preclinical validation of pentamidine for renal cell cancer[J].Molecular Cancer Therapeutics, 2014, 13(7): 1929-1941.
[41] GARDNER E E, CONNIS N, POIRIER J T, et al.Rapamycin rescues ABT-737 efficacy in small cell lung cancer[J].Cancer Research, 2014, 74(10): 2846-2856.
[42] CHOI Y E, BATTELLI C, WATSON J, et al.Sublethal concentrations of 17-AAG suppress homologous recombination DNA repair and enhance sensitivity to carboplatin and olaparib in HR proficient ovarian cancer cells[J].Oncotarget, 2014, 5(9): 2678-2687.
[43] CHUNG F H, CHIANG Y R, TSENG A L, et al.Functional module connectivity map (FMCM): a framework for searching repurposed drug compounds for systems treatment of cancer and an application to colorectal adenocarcinoma[J].PLos One, 2014, 9(1): e86299.
[44] HUANG C H, CHANG M H, LIN Y J, et al.Drug repositioning discovery for early- and late-stage non-small-cell lung cancer[J].Biomed Research International, 2014(1): 309-322.
[45] DING H, MCDONALD J S, YUN S, et al.Farnesyltransferase inhibitor tipifarnib inhibits Rheb prenylation and stabilizes Bax in acute myelogenous leukemia cells[J].Haematologica, 2014, 99(1): 60-69.
[46] WANG B S, LIU Z, SUN S L, et al.Identification of genes and candidate agents associated with pancreatic cancer[J].Tumour Biology: the Journal of the International Society for Oncodevelopmental Biology and Medicine, 2014, 35(1): 81-88.
[47] RAMSEY J M, KETTYLE L M J, SHARPE D J, et al.Entinostat prevents leukemia maintenance in a collaborating oncogenedependent model of cytogenetically normal acute myeloid leukemia[J].Stem Cells, 2013, 31(7): 1434-1445.
[48] MA C, TANG K, LIU Q, et al.Calmodulin as a potential target by which berberine induces cell cycle arrest in human hepatoma Bel7402 cells[J].Chemical Biology & Drug Design, 2013, 81(6): 775-783.
[49] BAI J P, ALEKSEYENKO A V, S TATN I KOV A, et al.St rat eg ic applications of gene expression: from drug discovery/development to bedside[J].Aaps Journal, 2013, 15(2): 427-437.
Application of large scale gene expression profiles in anticancer drug development
LIU Yang, BAI Hui, BO Xiaochen
Institute of Radiation Medicine, Academy of Military Medical Sciences, Beijing 100850, China
As an important part of functional genomics, gene expression profile plays an important role in many fields, such as biology, medicine and drug discovery.With the advent of precision medicine, integration of multi-omics data including gene expression profile data for personalized health care is becoming the trend of future medicine.The advances of anticancer drug development were introduced firstly, and then the methods for perturbational gene expression profile analysis were illustrated, especially connectivity map idea.Finally applications of these data in anticancer drug development were summarized.
gene expression profile, connectivity map, library of integrated network-based cellular signatures, anticancer drug development
Q811.4,R9
A
10.11959/j.issn.2096-0271.2016051
劉陽(yáng)(1988-),男,軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所博士生,主要研究方向?yàn)樯镝t(yī)學(xué)大數(shù)據(jù)挖掘。
白卉(1982-),女,軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所博士后,第四軍醫(yī)大學(xué)藥理學(xué)博士,主要研究方向?yàn)榉戳x抗菌核酸藥物和網(wǎng)絡(luò)藥理學(xué)。先后承擔(dān)各類(lèi)國(guó)家和軍隊(duì)科研項(xiàng)目10余項(xiàng),發(fā)表SCI期刊論文10篇,參編英文專(zhuān)業(yè)書(shū)稿3部,現(xiàn)為中國(guó)藥理學(xué)會(huì)會(huì)員。
伯曉晨(1973-),男,軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所研究員、博士生導(dǎo)師,主要研究方向?yàn)樯镝t(yī)學(xué)大數(shù)據(jù)處理與挖掘技術(shù)。先后承擔(dān)各類(lèi)國(guó)家和軍隊(duì)科研項(xiàng)目20余項(xiàng),發(fā)表SCI 期刊論文50篇。現(xiàn)兼任北京自動(dòng)化學(xué)會(huì)理事、中國(guó)藥理學(xué)會(huì)網(wǎng)絡(luò)藥理學(xué)專(zhuān)業(yè)委員會(huì)常務(wù)委員、軍隊(duì)轉(zhuǎn)化醫(yī)學(xué)委員會(huì)委員、中國(guó)生化與分子生物學(xué)會(huì)青年委員。
2016-06-29
國(guó)家自然科學(xué)基金資助項(xiàng)目(No.U1435222)
Foundation Item: The National Natural Science Foundation of China (No.U1435222)