張 媛,劉雨桐,李 達(dá),宋新蕊,周雪松,趙 勇
(北京市計算中心,北京 100094)
反向虛擬篩選平臺及應(yīng)用
張媛*,劉雨桐*,李達(dá),宋新蕊,周雪松,趙勇**
(北京市計算中心,北京 100094)
摘要:靶標(biāo)確證是老藥新用、藥物毒副作用研究的關(guān)鍵?;诜肿訉臃椒ˋutoDock Vina和內(nèi)部構(gòu)建的疾病靶標(biāo)數(shù)據(jù)庫,采用分布式架構(gòu),構(gòu)建了反向虛擬篩選平臺。應(yīng)用該平臺對藥物吡斯的明進(jìn)行靶標(biāo)確證,最終成功找到其靶標(biāo)乙酰膽堿酯酶,驗證了平臺的實用性和準(zhǔn)確性。
關(guān)鍵詞:老藥新用;毒副作用;反向虛擬篩選;AutoDock Vina
隨著計算機科學(xué)和生物信息學(xué)的迅猛發(fā)展,越來越多的生命科學(xué)數(shù)據(jù)被挖掘出來,常規(guī)藥物發(fā)現(xiàn)過程面臨投資大和回報周期長的問題,計算機模擬藥物設(shè)計通過輔助藥物發(fā)現(xiàn)的靶標(biāo)識別與確證、先導(dǎo)化合物發(fā)現(xiàn)與優(yōu)化、臨床前研究等模塊,大大節(jié)省了藥物發(fā)現(xiàn)的時間與資金投入,成為生命科學(xué)領(lǐng)域最為前沿的技術(shù)之一。
近十年,藥物多靶標(biāo)的研究成為越來越熱門的話題,截止目前,DrugBank數(shù)據(jù)庫中的7 759種藥物有28.5%(2 245個)是多靶標(biāo)作用[1]。藥物作用于多個靶標(biāo)是藥物毒副作用的根源,也是藥物新作用研究(老藥新用)的基礎(chǔ),對于藥物研發(fā)有著重大意義。
反向虛擬篩選(Reverse virtual screening)是一種對給定藥物或活性小分子通過計算方法找到其潛在藥物靶標(biāo)的技術(shù)[2]。對于已知藥物,反向虛擬篩選技術(shù)可以尋找其他潛在靶標(biāo),為藥物新作用研究、藥物毒副作用研究提供參考;對于活性小分子,反向虛擬篩選技術(shù)可以預(yù)測其潛在作用靶標(biāo),為活性化合物的后期改造和機制研究提供方向,尤其適用于藥理活性明確但靶標(biāo)未知的中藥等的研究(見圖1)。
反向虛擬篩選技術(shù)越來越多地應(yīng)用于藥物研發(fā)的各個方面。Bernard等運用反向分子對接方法發(fā)現(xiàn)了托非索泮(Tofisopam)的作用靶點[3]。托非索泮是一種外消旋體,80年代作為抗焦慮藥在亞洲和歐洲上市。托非索泮作用于磷酸二酯酶4,其S 型異構(gòu)體與已上市的PDE4抑制劑咯利普蘭相比,抑制作用更強,且不存在嘔吐的副作用,為PDE4的高選擇性抑制劑的研究提供了參考意義。張明波等人對中藥中的一種活性物質(zhì)槲皮素進(jìn)行了研究[4],他們利用反向?qū)拥姆椒ò验纹に嘏c抗腫瘤靶標(biāo)進(jìn)行反向?qū)?,確定了槲皮素抗腫瘤可能的作用靶標(biāo)和分子機制,為槲皮素的抗腫瘤藥物研發(fā)奠定了基礎(chǔ)。林愛斌等人利用反向?qū)拥姆椒A(yù)測異白花丹酮的人類疾病靶點[5],發(fā)現(xiàn)Vitamin D3 receptor GTPase Hras 和 Leuko-cyte elastase 可能是異白花丹酮的人類疾病靶點。許先進(jìn)等人對持久性有機污染物4,4’-DDE和CB-153利用反向虛擬篩選的方法搜索生物體內(nèi)潛在蛋白質(zhì)受體[6],發(fā)現(xiàn)反向虛擬篩選的方法在理解污染物分子的致病機制方面有很大的幫助。Gianluigi Lauro等人對天然產(chǎn)物黃腐酚和異黃腐酚針對腫瘤相關(guān)靶標(biāo)進(jìn)行了反向虛擬篩選[7],發(fā)現(xiàn)了黃腐酚和異黃腐酚具有激酶活性,進(jìn)一步證實了反向虛擬篩選方法的魯棒性。
圖 1 反向虛擬篩選和用途Fig.1 Reverse Virtual Screening and its usage
反向虛擬篩選分為基于受體的反向虛擬篩選和基于配體的反向虛擬篩選兩類?;谑荏w的反向虛擬篩選是將化合物一一對接到靶標(biāo)的活性位點處,根據(jù)化合物-靶標(biāo)的相互作用能或者藥效團(tuán)匹配得分排序,得分越高,潛在靶標(biāo)的可能性越大。常見的基于受體的反向虛擬篩選方法有idTarget[8],TarFisDock[9],Mdock[10]和PharmMapper[11]。
基于配體的反向虛擬篩選基于“Chemical similarity principle”原理[2],認(rèn)為相似的化合物具有相似的化學(xué)性質(zhì),甚至有著相似的作用靶標(biāo)。因此將提問化合物與數(shù)據(jù)庫中的化合物一一進(jìn)行相似性匹配打分,相似性最高的化合物作用靶標(biāo)即認(rèn)為是提問化合物的潛在作用靶標(biāo)。ChemMapper是基于化合物形狀和藥效匹配的反向虛擬篩選方法[12]。
反向虛擬篩選方法的成功率一方面取決于篩選方法的準(zhǔn)確性,另一方面取決于數(shù)據(jù)庫構(gòu)建的完整性和準(zhǔn)確性。IdTarget采用改良的AutoDock方法,數(shù)據(jù)庫包含PDB庫中所有晶體結(jié)構(gòu),靶標(biāo)針對性較差;TarFisDock基于DOCK方法[13],使用PDTD數(shù)據(jù)庫[14],該數(shù)據(jù)庫涵蓋了841個已知或者潛在藥物靶標(biāo)及其治療領(lǐng)域,針對性完整性較好。
為了保證靶標(biāo)數(shù)據(jù)庫的針對性和準(zhǔn)確性,同時考慮靶標(biāo)的結(jié)構(gòu)完整性,我們選擇現(xiàn)有人類基因組的可成藥基因在PDB數(shù)據(jù)庫中有完整解析和部分解析的蛋白質(zhì)結(jié)構(gòu)構(gòu)建了疾病靶標(biāo)數(shù)據(jù)庫,同時,我們應(yīng)用AutoDock Vina作為分子對接工具[15],結(jié)合疾病靶標(biāo)數(shù)據(jù)庫構(gòu)建了反向虛擬篩選平臺(http://reversedock.vslead.com/)。應(yīng)用該平臺對藥物吡斯的明進(jìn)行靶標(biāo)確證,成功找到其靶標(biāo)乙酰膽堿酯酶,驗證該平臺的實用性和準(zhǔn)確性。
1材料與方法
反向虛擬篩選平臺關(guān)鍵數(shù)據(jù)在于疾病靶標(biāo)數(shù)據(jù)庫的建立,該數(shù)據(jù)庫包含pdbqt格式的靶標(biāo)三維晶體結(jié)構(gòu)、活性位點參數(shù)文件和靶標(biāo)生物信息,分別從靶標(biāo)三維晶體結(jié)構(gòu)獲取、靶標(biāo)活性位點確定和靶標(biāo)生物信息收集三方面來進(jìn)行(見圖2)。
DGIdb是一個鑒定已知的和潛在的藥物-基因關(guān)系的網(wǎng)絡(luò)數(shù)據(jù)庫[16],其中收集的藥物-基因相互作用數(shù)據(jù)有多個來源,包括DrugBank[1]、TTD[17]、PharmGKB[18]等。從DGIdb數(shù)據(jù)庫中搜集人類基因組的可成藥基因,共獲取6 571條基因,篩選數(shù)據(jù)質(zhì)量可靠的基因條目,通過NCBI網(wǎng)站獲取對應(yīng)的蛋白序列,共得到12 946條蛋白序列。
應(yīng)用本地Blast方法,以12 946條蛋白序列為查詢序列,從PDB數(shù)據(jù)庫中搜索相似序列,對于每一個匹配結(jié)果進(jìn)行分析過濾。為了獲取全部基因序列和部分連續(xù)基因序列被解析出三維結(jié)構(gòu)的靶標(biāo),避免由于三維結(jié)構(gòu)的不連續(xù)而導(dǎo)致的篩選結(jié)果不可靠,選擇PDB數(shù)據(jù)庫中完全匹配的蛋白作為有完整解析結(jié)構(gòu)的蛋白,將匹配長度小于查詢序列,但匹配度為100%并且gap是0,錯配是0的蛋白作為有部分解析結(jié)構(gòu)的蛋白。
圖2 反向虛擬篩選平臺構(gòu)建方法Fig.2 Method of Reverse Virtual Screening platform
獲取疾病靶標(biāo)的三維結(jié)構(gòu)后,對靶標(biāo)的活性位點進(jìn)行確定?;钚晕稽c確定的方法主要有兩種,一種方法是以小分子周圍范圍殘基為活性位點殘基,此方法找到的活性位點多是生物活性位點,缺點是該靶標(biāo)必須有蛋白—小分子復(fù)合物晶體結(jié)構(gòu)。另一種是通過活性位點預(yù)測軟件預(yù)測得到,如LIGSITE[19]、PocketPicker[20],該方法適用于所有有晶體結(jié)構(gòu)的靶標(biāo),缺點是易出現(xiàn)假陽性活性位點。為確??诖臏?zhǔn)確性,采取第一種方法提取小分子6埃范圍內(nèi)殘基為活性位點殘基,以其所占立方體劃定盒子,確定篩選活性位點中心和尺寸。
從PubMed、UniProt、PDB等數(shù)據(jù)庫收集靶標(biāo)的對應(yīng)數(shù)據(jù)庫編號,通過數(shù)據(jù)庫檢索,可得到靶標(biāo)的文獻(xiàn)、序列、結(jié)構(gòu)等信息;另外,從DrugBank數(shù)據(jù)庫收集了靶標(biāo)對應(yīng)藥物的CAS號、DrugBank編號、藥物名稱信息,為用戶更全面了解疾病靶標(biāo)性質(zhì)提供參考。
在內(nèi)部構(gòu)建數(shù)據(jù)庫的基礎(chǔ)上,應(yīng)用AutoDock Vina方法,基于分布式虛擬篩選架構(gòu),結(jié)合高性能計算集群優(yōu)勢,構(gòu)建了反向虛擬篩選平臺。用戶提交小分子化合物文件、選擇要篩選的內(nèi)部靶標(biāo)數(shù)據(jù)庫(Whole或者part)、確定返回結(jié)果數(shù)(最多前100結(jié)果)即可提交反向虛擬篩選任務(wù)(見圖3)。
2結(jié)果與分析
構(gòu)建了600多個靶標(biāo)7 000多個活性位點的疾病靶標(biāo)數(shù)據(jù)庫,其中具有完整結(jié)構(gòu)的靶標(biāo)有140個,部分結(jié)構(gòu)的靶標(biāo)有506個(見表1)。此外,還給出每個靶標(biāo)的對應(yīng)PubMed、EC、UniProt、CAS、DrugBank等生物信息學(xué)數(shù)據(jù),為醫(yī)藥工作者的藥物研發(fā)提供幫助。
表 1 疾病靶標(biāo)數(shù)據(jù)庫
成功構(gòu)建了反向虛擬篩選服務(wù)平臺。用戶只需提供小分子化合物結(jié)構(gòu),即可得到其潛在作用靶標(biāo)(見圖4)。
圖3 反向虛擬篩選平臺工作流程Fig.3 Reverse virtual screening platform workflow
圖4 反向虛擬篩選平臺頁面Fig.4 Reverse virtual screening interface
3反向虛擬篩選平臺應(yīng)用
藥物吡斯的明對眼有縮瞳、降低眼內(nèi)壓的作用,作為抗膽堿酯酶藥使用,其作用靶標(biāo)是乙酰膽堿酯酶。用吡斯的明作為提問化合物,應(yīng)用反向虛擬篩選平臺進(jìn)行篩選,驗證該平臺是否能找到吡斯的明的作用靶標(biāo)乙酰膽堿酯酶。
從DrugBank數(shù)據(jù)庫下載得到吡斯的明的sdf格式結(jié)構(gòu)(見圖5a),針對part靶標(biāo)數(shù)據(jù)庫,應(yīng)用反向虛擬篩選平臺提交篩選任務(wù),最后選擇返回前100結(jié)果。
結(jié)合模式圖(見圖5b)可以看到,吡斯的明的酯鍵與Ser125和Tyr337形成H鍵相互作用,苯環(huán)與Trp86形成好的pi-pi相互作用。
結(jié)果顯示,吡斯的明成功找到了其作用靶標(biāo)乙酰膽堿酯酶。此外,結(jié)果文件還給出了乙酰膽堿酯酶的PubMed數(shù)據(jù)庫、UniProt數(shù)據(jù)庫、DrugBank數(shù)據(jù)庫的相關(guān)信息,為靶標(biāo)分析提供更多參考(見圖6)。
圖5 吡斯的明結(jié)構(gòu)和其結(jié)合模式圖Fig.5 Pyridostigmine structure and binding mode
圖6 吡斯的明反向虛擬篩選結(jié)果示例Fig.6 Result example of pyridostigmine reverse virtual screening
4結(jié)論
成功構(gòu)建了疾病靶標(biāo)數(shù)據(jù)庫,該數(shù)據(jù)庫包含了600多個疾病靶標(biāo)的7 000多個活性位點,為化合物的疾病治療提供參考;成功構(gòu)建了反向虛擬篩選平臺,應(yīng)用該平臺成功找到了藥物吡斯的明的靶標(biāo)乙酰膽堿酯酶,為反向虛擬篩選平臺的應(yīng)用提供基礎(chǔ)。該平臺具有良好的實用性和準(zhǔn)確性。
參考文獻(xiàn)
[1]LAW V, KNOX C, DJOUMBOU Y, et al. DrugBank 4.0: shedding new light on drug metabolism[J].Nucleic Acids Research, 2014, 42: 1091-1097.
[2]CERETO-MASSAGUE A, OJEDA M J, VALLS C, et al. Tools for in silico target fishing[J].Methods, 2015, 71: 98-103.
[3]BERNARD P,DUFRESNE-FAVETTA C,FAVETTA P,et al. Application of drug repositioning strategy to TOFISOPAM[J].Current Medicinal Chemistry, 2008, 15(30): 3196-3203.
[4]張明波 李莉, 孫艷濤, 等. 基于分子反向?qū)臃椒ǖ拈纹に乜鼓[瘤機制研究[J].中國實驗方劑學(xué)雜志, 2012, 23: 145-148.
ZHANG Mingbo, LI Li, SUN Yantao, et al. Study on Antitumor Mechanism of Quercetin based on Molecular Reverse Docking Method[J]. Chinese Journal of Experimental Traditional Medical Formulae, 2012, 23: 145-148.
[5] 林愛斌 劉亮, 姚曉敏, 等. 異白花丹酮的人類疾病靶點預(yù)測研究[J].中藥藥理與臨床, 2015, 01:63-66.
LIN Aibing, LIU Liang, YAO Xiaomin, et al. Study on human disease-related target prediction of isozeylanone[J].Pharmacology and Clinics of Chinese Materia Medica,2015,01: 63-66.
[6] 許先進(jìn) 蘇計國, 劉斌, 等. 持久性有機污染物4,4'-DDE和CB-153的反向虛擬篩選[J].物理化學(xué)學(xué)報, 2013, 10:2276-2285.
XU Xianjin,SU Jiguo,LIU Bin,et al.Reverse virtual screening of persistent organic pollutants 4,4'-DDE and CB-153[J].Acta PhysicoChimica Sinica,2013,10:2276-2285.
[7]LAURO G,MASULLO M,PIACENTE S,et al. Inverse Virtual Screening allows the discovery of the biological activity of natural compounds[J].Bioorganic & Medicinal Chemistry,2012,20(11): 3596-3602.
[8]WANG J C,CHU P Y,CHEN C M, et al. idTarget:a web server for identifying protein targets of small chemical molecules with robust scoring functions and a divide-and-conquer docking approach[J].Nucleic Acids Research,2012,40:393-399.
[9]LI H, GAO Z,KANG L,et al.TarFisDock:a web server for identifying drug targets with docking approach[J].Nucleic Acids Research, 2006, 34: 219-224.
[10]HUANG S Y and ZOU X.Construction and test of ligand decoy sets using MDock: community structure-activity resource benchmarks for binding mode prediction[J].Journal of Chemical Information and Modelling,2011,51(9):2107-2114.
[11]LIU X, OUYANG S,YU B,et al. PharmMapper server:a web server for potential drug target identification using pharmacophore mapping approach[J].Nucleic Acids Research,2010,38:609-614.
[12]GONG J,CAI C,LIU X,et al.ChemMapper:a versatile web server for exploring pharmacology and chemical structure association based on molecular 3D similarity method[J].Bioinformatics,2013,29(14):1827-1829.
[13]EWING T J, MAKINO S, SKILLMAN A G, et al.DOCK 4.0:search strategies for automated molecular docking of flexible molecule databases[J].Journal Computer Aided Molecular Design,2001,15(5):411-428.
[14]GAO Z, LI H, ZHANG H, et al. PDTD: a web-accessible protein database for drug target identification[J].BMC Bioinformatics,2008,9:104.
[15]TROTT O and OLSON A J. AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading[J].Journal of Computational Chemistry, 2010, 31(2): 455-461.
[16]GRIFFITH M, GRIFFITH O L, COFFMAN A C, et al. DGIdb: mining the druggable genome[J].Nature Methods, 2013,10(12):1209-1210.
[17]QIN C,ZHANG C,ZHU F,et al.Therapeutic target database update 2014:a resource for targeted therapeutics[J].Nucleic Acids Research, 2014, 42:1118-1123.
[18]THORN C F, KLEIN T E and ALTMAN R B.PharmGKB: the pharmacogenetics and pharmacogenomics knowledge base[J].Methods in Molecular Biology, 2005, 311:179-191.
[19]HENDLICH M, RIPPMANN F,BARNICKEL G. LIGSITE: automatic and efficient detection of potential small molecule-binding sites in proteins[J].Journal of Molecular Graphics and Modelling, 1997, 15(6): 359-363, 389.
[20]WEISEL M, PROSCHAK E and SCHNEIDER G. PocketPicker: analysis of ligand binding-sites with shape descriptors[J].Chemistry Central Journal, 2007,1: 7.
更正:本刊2007年第5卷第4期P157:“1.2置jdk1.4.2”更正為“1.2配置jdk1.4.2”。
Reverse virtual screening platform and its application
ZHANG Yuan*, LIU Yutong*,LI Da, SONG Xinrui, ZHOU Xuesong, ZHAO Yong**
(BeijingComputingCenter,Beijing100094,China)
Abstract:Computer based-target identification provides a unique tool for finding new application of old drugs and for the research on side effects of drug toxicity. Using molecular docking software AutoDock Vina and an in-house disease target database, we developed a Reverse Virtual Screening platform to identify protein targets for small molecules.The platform has been tested with pyridostigmine,a drug targeting acetylcholinesterase. This Reverse Virtual Screening successfully identified acetychlinesterase as pyridostigmine’s target,showing its applicability and accuracy in computer assisted drug design.
Keywords:New application of old drug;Side effects; Reverse virtual screening;AutoDock vina
中圖分類號:R91
文獻(xiàn)標(biāo)志碼:A
文章編號:1672-5565(2015)04-251-06
doi:10.3969/j.issn.1672-5565.2015.04.08
作者簡介:張媛,女,碩士研究生,計算化學(xué)工程師,研究方向:反向虛擬篩選;E-mail:zhangyuan@bcc.ac.cn.*同等貢獻(xiàn)作者:劉雨桐,女,本科生,研究方向:生物信息;E-mail:liuyutong1008@hotmail.com.**通信作者:趙勇,男,博士,北京市特聘專家,研究方向:生物信息學(xué)與計算藥物;E-mail:zhaoyong@bcc.ac.cn.
基金項目:北京市東城區(qū)科技計劃(2015-2-006)支持;北京市科學(xué)技術(shù)研究院創(chuàng)新團(tuán)隊計劃(IG201305C2)支持。
收稿日期:2015-09-29;修回日期:2015-11-17.