梁乾德,馬 靖,高 月
(軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所, 北京 100850)
2012-04-05;
2012-07-17
國家自然科學(xué)基金(81073161)資助
梁乾德(1971~),男(漢族),吉林農(nóng)安縣人,博士,從事藥物分析、中藥現(xiàn)代化等研究。E-mail: liangqiande@yahoo.com.cn
通信作者:高 月(1963~),女(漢族),江蘇宜興人,研究員,從事藥理毒理學(xué)、中藥現(xiàn)代化等研究。E-mail: gaoyue@bmi.ac.cnc
高分辨電噴霧離子化質(zhì)譜數(shù)據(jù)批量自動化預(yù)鑒別軟件的研制
梁乾德,馬 靖,高 月
(軍事醫(yī)學(xué)科學(xué)院放射與輻射醫(yī)學(xué)研究所, 北京 100850)
為了克服高分辨電噴霧離子化質(zhì)譜數(shù)據(jù)預(yù)鑒別工作量大、繁瑣的技術(shù)瓶頸,采用Microsoft Excel插件方式,研制了用于高分辨電噴霧離子化質(zhì)譜數(shù)據(jù)批量自動化預(yù)鑒別的軟件。此軟件可根據(jù)用戶指定的Excel文件中數(shù)據(jù)庫數(shù)據(jù)和待鑒別數(shù)據(jù)的位置,最小質(zhì)荷比偏差等信息,自動鑒別并生成鑒別結(jié)果報(bào)告。實(shí)際測試表明,該軟件與人工鑒別結(jié)果完全相同,既節(jié)省了人力,又能夠極大地提高工作效率,并且操作簡便,容錯性好,具有實(shí)用性。
質(zhì)譜;預(yù)鑒別;軟件;自動化;高分辨
代謝組學(xué)(metabolomics)致力于生物系統(tǒng)中小分子物質(zhì)(相對分子質(zhì)量<1 500)的定性和定量分析[1],目前已運(yùn)用于微生物學(xué)、動物學(xué)、植物學(xué)、診斷標(biāo)志物發(fā)現(xiàn)、毒理學(xué)、藥物研發(fā)、食品和環(huán)境科學(xué)等諸多領(lǐng)域[2-3]。核磁共振和質(zhì)譜是代謝組學(xué)研究的主要技術(shù)手段,后者在靈敏度等方面擁有優(yōu)勢[4-5]。近年來,高分辨質(zhì)譜技術(shù)的出現(xiàn),使質(zhì)譜定性分析能力大大提高,從而在代謝組學(xué)中的地位越來越重要[6-9]。其中,電噴霧離子化方式以其“軟電離”特性而倍受青睞[1]。
在代謝組學(xué)研究中,樣品組成不明確且目標(biāo)化合物不確定的分析稱為“非靶標(biāo)分析(untargeted analysis)”。目前,在基于質(zhì)譜的代謝組學(xué)領(lǐng)域,化合物的定性鑒別已經(jīng)成為非靶標(biāo)分析的技術(shù)瓶頸[6],這很大程度上因?yàn)閷?fù)雜樣品中大量化合物進(jìn)行定性鑒別的工作量極大[3]。含未知成分樣品的高分辨電噴霧離子化質(zhì)譜數(shù)據(jù)的鑒別通常需要借助化合物數(shù)據(jù)庫[3,10-14]。將實(shí)驗(yàn)獲得的待定精確質(zhì)荷比與數(shù)據(jù)庫中化合物相應(yīng)離子的精確質(zhì)荷比進(jìn)行比對,確定一種或數(shù)種可能的化合物,即預(yù)鑒別,然后用對照品進(jìn)行實(shí)驗(yàn)驗(yàn)證以確定化合物的結(jié)構(gòu)[1]。但是,優(yōu)質(zhì)的數(shù)據(jù)庫通?;衔飻?shù)量龐大,例如人類代謝組學(xué)數(shù)據(jù)庫HMDB(Human Metabolome Database)目前含有超過7 900個代謝物[15]。而且同一種化合物通過電噴霧離子化有可能形成多種形態(tài)的離子[3],如正離子模式下有可能形成[M+H]+、[M+NH4]+、[M+Na]+、[M+K]+、[2M+H]+、[2M+H+K]2+、[2M+H+Na]2+等,在負(fù)離子模式下有可能形成[M―H]-、[M+HCOO]-、[2M―H]-、[M+Cl]-等。必須分別對多種可能的離子形態(tài)進(jìn)行計(jì)算和比較,才能較為全面地排查,減少預(yù)鑒別的疏漏和誤判,可見預(yù)鑒別的工作量很大。另一方面,當(dāng)所分析的樣品為成分未知的復(fù)雜混合物(如中藥提取物、動植物體液、組織等)時,會產(chǎn)生大量待鑒別的數(shù)據(jù),從而進(jìn)一步增加預(yù)鑒別的工作量。
對于如此巨大的工作量,利用計(jì)算機(jī)實(shí)現(xiàn)自動化鑒別是必然的選擇。目前國外已經(jīng)研制了一些自動化預(yù)鑒別軟件[3],但國內(nèi)還未見這方面的研究報(bào)道。為了向國際水平靠攏,以及能夠根據(jù)自身需要開發(fā)具有特定功能的軟件,有必要開展在本領(lǐng)域的研究探索,獲得自主研制這類軟件的能力。本工作研制了一種用于高分辨電噴霧離子化質(zhì)譜數(shù)據(jù)批量自動化預(yù)鑒別的軟件,定名為“Searcher”。旨在用計(jì)算機(jī)代替人完成繁瑣的預(yù)鑒別工作,以期節(jié)省人力,提高工作效率。
1.1儀器與試劑
Microsoft WindowXPTM操作系統(tǒng),Microsoft ExcelTM軟件(2003或2007版本),普通個人電腦。Waters AcquityTM超高效液相色譜系統(tǒng)(UPLC),Waters SYNAPT HD MSTM四極桿飛行時間質(zhì)譜系統(tǒng)(使用電噴霧電離源),Waters HSS T3(100 m×2.1 mm×1.8 μm)色譜柱。乙腈(HPLC級):美國Fisher Scientific公司產(chǎn)品;甲酸(HPLC級):德國CNW Technologies GmbH公司產(chǎn)品;水:由美國Millipore超純水系統(tǒng)制備。
1.2Searcher軟件的工作原理及操作流程
Searcher軟件采取Excel插件的方式工作。安裝后在任意打開的Excel工作簿中生成一個啟動按鈕。首先將數(shù)據(jù)庫數(shù)據(jù)和待鑒別數(shù)據(jù)拷貝到任意一個Excel工作簿中。數(shù)據(jù)庫數(shù)據(jù)必須包含化合物各種離子形態(tài)下的精確質(zhì)荷比、化合物名稱等信息,排列方式為:每種化合物占一行,每種信息(各種離子的精確質(zhì)荷比、化合物名稱等)占一列。待鑒別數(shù)據(jù)必須排成一列。兩種數(shù)據(jù)可以拷貝到同一個工作表,也可以拷貝到不同工作表。點(diǎn)擊Searcher啟動按鈕后出現(xiàn)軟件界面,示于圖1。點(diǎn)擊界面上的“指定標(biāo)準(zhǔn)數(shù)據(jù)(庫數(shù)據(jù))的范圍”按鍵,用鼠標(biāo)選擇數(shù)據(jù)庫中用于預(yù)鑒別的精確質(zhì)荷比數(shù)據(jù)區(qū)域;點(diǎn)擊界面上的“指定標(biāo)準(zhǔn)數(shù)據(jù)(庫數(shù)據(jù))的標(biāo)識列”按鍵,用鼠標(biāo)選擇數(shù)據(jù)庫中化合物標(biāo)識(如化合物名稱)所在列;點(diǎn)擊界面上的“指定受檢數(shù)據(jù)(實(shí)際觀測數(shù)據(jù))的范圍”按鍵,用鼠標(biāo)選擇待鑒別質(zhì)荷比數(shù)據(jù)所在列。根據(jù)需要修改質(zhì)荷比準(zhǔn)確度(mass accuracy)的上限(單位是ppm),然后點(diǎn)擊“檢索鍵”,啟動鑒別。鑒別時,計(jì)算機(jī)對每一個待鑒別數(shù)據(jù),都會在全部指定的數(shù)據(jù)庫數(shù)據(jù)范圍內(nèi)逐一比對,當(dāng)二者差異小于等于指定的匹配準(zhǔn)確度上限時,就會將該數(shù)據(jù)認(rèn)定為匹配數(shù)據(jù)。鑒別完成后,自動生成一個鑒別結(jié)果報(bào)告表,示于圖2。報(bào)告表中列出全部待鑒別質(zhì)荷比,其中在庫中有匹配數(shù)據(jù)者所在單元格填充紅色,并在右側(cè)列出匹配化合物個數(shù)、全部匹配化合物的標(biāo)識及其匹配準(zhǔn)確度值(單位是ppm)。
圖2 鑒別結(jié)果報(bào)告表示例Fig.2 Example of identification results report sheet
1.3軟件功能的驗(yàn)證
通過文獻(xiàn)檢索,建立中藥地黃Rehmannia glutinosa LIBOSCH的化合物數(shù)據(jù)庫,共含有113種化合物。對其中所有化合物,依其分子式,計(jì)算出[M-H]-、[M+HCOO]-、[2M-H]-3種常見負(fù)離子的精確質(zhì)荷比。待鑒別數(shù)據(jù)是本實(shí)驗(yàn)室某次地黃成分分析獲得的部分精確質(zhì)荷比數(shù)據(jù),共62個,分析系統(tǒng)為UPLC-TOF MS,負(fù)離子模式,此處省略分析過程。所有數(shù)據(jù)在Excel表格中排成一列。分別以人工方式和軟件方式進(jìn)行預(yù)鑒別,然后比較鑒別結(jié)果。
2.1軟件功能驗(yàn)證結(jié)果
經(jīng)比較,人工方式和軟件方式預(yù)鑒別結(jié)果完全一致,共得到14個匹配數(shù)據(jù)。人工方式耗時數(shù)小時,而軟件方式耗時僅1 s左右。在節(jié)省人力的同時,工作效率得到極大提高。
2.2軟件特點(diǎn)
此軟件使用簡單方便,容錯度高。鑒于研究工作中通常以Microsoft Excel文件為質(zhì)譜實(shí)驗(yàn)數(shù)據(jù)和數(shù)據(jù)庫數(shù)據(jù)的載體,該軟件采取Excel插件的方式工作。在指定數(shù)據(jù)庫數(shù)據(jù)范圍和待鑒別數(shù)據(jù)范圍時,無需用鍵盤輸入,只需用鼠標(biāo)將Excel表上相應(yīng)范圍框住,然后點(diǎn)擊確定即可。在指定數(shù)據(jù)庫數(shù)據(jù)標(biāo)識列時,只需用鼠標(biāo)點(diǎn)擊該列任意單元格,然后點(diǎn)擊確定即可。匹配準(zhǔn)確度限值可以根據(jù)需要任意改變。當(dāng)發(fā)現(xiàn)不合法數(shù)據(jù)(非數(shù)值、空單元格等)時會自動跳過。
Searcher軟件能代替人工完成高分辨電噴霧離子化質(zhì)譜數(shù)據(jù)批量自動化預(yù)鑒別。既節(jié)省人力,又能夠極大地提高工作效率,并且操作簡便,容錯性好,具有實(shí)用性。
[1] XIAO J F, ZHOU B, RESSOM H W. Metabolite identification and quantitation in LC-MS/MS-based metabolomics[J]. Trends Anal Chem, 2012, 32: 1-14.
[2] SUGIMOTO M, KAWAKAMI M, ROBERT M, et al. Bioinformatics tools for mass spectroscopy-based metabolomic data processing and analysis[J]. Curr Bioinform, 2012, 7(1): 96-108.
[3] DUNN W, ERBAN A, WEBER R Z, et al. Mass appeal: Metabolite identification in mass spectrometry-focused untargeted metabolomics[J]. Metabol, 2012, published online: 26 May.
[4] THEODORIDIS G A, GIKA H G, WANT E J, et al. Liquid chromatography-mass spectrometry based global metabolite profiling: A review[J]. Anal Chim Acta, 2012, 711: 7-16.
[5] COY S L, CHEEMA A K, TYBURSKI J B,
et al. Radiation metabolomics and its potential in biodosimetry[J]. Int J Radiat Biol, 2011, 87(8): 802-823.
[6] KUEGER S, STEINHAUSER D, WILLMITZER L, et al. High-resolution plant metabolomics: From mass spectral features to metabolites and from whole-cell analysis to subcellular metabolite distributions[J]. Plant J, 2012, 70(1): 39-50.
[7] HNATYSHYN S, SHIPKOVA P, et al. Autom-
ated and unbiased analysis of LC-MS metabolomic data[J]. Bioanal, 2012, 4(5): 541-554.
[8] BURGESS K, CREEK D, DEWSBURY P, et al. Semi-targeted analysis of metabolites using capillary-flow ion chromatography coupled to high-resolution mass spectrometry[J]. Rapid Commun Mass Spectrom, 2011, 25(22): 3 447-3 452.
[9] REGAL P, ANIZAN S, ANTIGNAC J P, et al. Metabolomic approach based on liquid chromatography coupled to high resolution mass spectrometry to screen for the illegal use of estradiol and progesterone in cattle[J]. Anal Chim Acta, 2011, 700(1/2): 16-25.
[10] TSUTSUI H, MAEDA T, MIN J Z, et al. Biomarker discovery in biological specimens (plasma, hair, liver and kidney) of diabetic mice based upon metabolite profiling using ultra-performance liquid chromatography with electrospray ionization time-of-flight mass spectrometry[J]. Clin Chim Acta, 2011, 412(11/12): 861-872.
[11] MOHAMED R, VARESIO E, IVOSEV G,
et al. Comprehensive analytical strategy for biomarker identification based on liquid chromatography coupled to mass spectrometry and new candidate confirmation tools[J]. Anal Chem, 2009, 81(18): 7 677-7 694.
[12] YOO B C, KONG S Y, JANG S G, et al. Identification of hypoxanthine as a urine marker for non-Hodgkin lymphoma by low-mass-ion profiling[J]. BMC Cancer, 2010, 10: 55.
[13] LOFTUS N, BARNES A, ASHTON S, et al. Metabonomic investigation of liver profiles of nonpolar metabolites obtained from alcohol-dosed rats and mice using high mass accuracy MSn analysis[J]. J Proteome Res, 2011, 10(2): 705-713.
[14] XU F, ZOU L, LIN Q, et al. Use of liquid chromatography-tandem mass spectrometry and online databases for identification of phosphocholines and lysophosphatidylcholines in human red blood cells[J]. Rapid Commun Mass Spectrom, 2009, 23(19): 3 243-3 254.
[15] WISHART D S, KNOX C, GUO A C, et al. HMDB: A knowledgebase for the human metabolome[J]. Nucleic Acids Res, 2009, 37(Database issue): D603-610.
SoftwareDevelopmentforBatchAutomaticPreliminaryIdentificationofHighResolutionElectrosprayMassSpectrometricData
LIANG Qian-de, MA Jing, GAO Yue
(InstituteofRadiationMedicine,AcademyofMilitaryMedicalScience,Beijing100850,China)
In order to tackle the bottleneck of heavy-workload and cumbersomeness with preliminary identification of high resolution electrospray mass spectrometric data, a software as Microsoft Excel Plug-in for batch automatic preliminary identification of high resolution electrospray mass spectrometric data was developed, which performs automatic identification and creates report of results based on information such as location of library data and data to be identified in an Excel document and mass accuracy, etc. designated by user. Test showed that the software produces same result compared with handwork, but saves manpower and greatly improves efficiency, with simple operation, high fault tolerance and practicability.
mass spectrometry; identification; software; automatic; high resolution
O 657.63
A
1004-2997(2012)05-0286-04