趙 勇,黃勁松,宋新蕊,陳禹保*,童貽剛
(1.北京市計(jì)算中心,北京100094;2.軍事醫(yī)學(xué)科學(xué)院微生物流行病研究所,北京100071)
宏基因組學(xué)(metagenomics)是通過非微生物培養(yǎng)的方法對(duì)環(huán)境中微生物菌落進(jìn)行調(diào)查研究的一門新興學(xué)科,其主要研究對(duì)象為菌落中的細(xì)菌、古細(xì)菌、真菌和病毒等微生物,其主要目的是通過對(duì)微生物菌落中微生物的多樣性、種群結(jié)構(gòu)及其動(dòng)態(tài)改變、各成員之間相互關(guān)系及與環(huán)境之間的相互關(guān)系等方面的分析,揭示更深層次的遺傳與進(jìn)化規(guī)律[1]。環(huán)境中微生物群落的研究經(jīng)歷了早期的以革蘭氏染色和微生物培養(yǎng)為主要技術(shù)的階段,由于微生物培養(yǎng)的瓶頸的存在,微生物群落的研究始終處于較初級(jí)的水平。DNA測(cè)序和PCR擴(kuò)增技術(shù)的發(fā)展,極大地促進(jìn)了人們對(duì)微生物群落的了解,以16/18S rRNA和OTU等為基礎(chǔ)的數(shù)據(jù)庫的建立與應(yīng)用,使廣大科研工作者能夠?qū)ξ⑸锞渲形锓N的多樣性和種群結(jié)構(gòu)等有更加深入的認(rèn)識(shí)[2]。2005年以來,DNA二代測(cè)序技術(shù)的應(yīng)用和生物信息學(xué)的發(fā)展,為微生物群落的研究注入了一股強(qiáng)大的動(dòng)力,宏基因組學(xué)漸漸走入了人們的視線并成為當(dāng)代生物醫(yī)學(xué)研究的熱點(diǎn)[3-8]。本文旨在通過對(duì)過去幾年來二代測(cè)序在宏基因組學(xué)研究方面應(yīng)用的總結(jié),探討宏基因組學(xué)在未來的研究方向和發(fā)展?jié)摿Α?/p>
宏基因組學(xué)的研究分為兩個(gè)階段,基于傳統(tǒng)的克隆和鳥槍法測(cè)序分析的宏基因組研究和基于二代測(cè)序技術(shù)結(jié)合現(xiàn)代生物信息學(xué)分析的宏基因組研究階段。
傳統(tǒng)的宏基因組學(xué)研究主要流程為:選擇性提取環(huán)境中的樣品,如土壤等,抽提樣品中的DNA/RNA,將樣品中的DNA片段化,使用克隆技術(shù)將DNA隨機(jī)連接到質(zhì)?;蛘沉5容d體,然后轉(zhuǎn)化細(xì)菌并篩選克隆,通過對(duì)插入片段的測(cè)序和功能性分析,從而達(dá)到對(duì)微生物菌落的基本了解。在PCR技術(shù)發(fā)明之后,對(duì)微生物菌落的研究,尤其是對(duì)其多樣性和種群結(jié)構(gòu)方面的研究,開始傾向于16 S/18 S rRNA的測(cè)序和分析[9]??紤]到16 S/18 S rRNA測(cè)序和分析的分辨率不足以滿足分析的需求,操作分類單位(Operational taxonomic unit,OTU)開始引入微生物群落的多樣性分析[2]。由于微生物群落是一個(gè)多基因組的混合物,其中可能高達(dá)99%微生物不能單獨(dú)分離培養(yǎng),對(duì)個(gè)體微生物基因組全面的功能性研究遠(yuǎn)遠(yuǎn)落后于微生物群落分類學(xué)的發(fā)展。另外,傳統(tǒng)的宏基因組分析費(fèi)用高,周期長,極大地限制了宏基因組學(xué)研究的發(fā)展。
以Roche 454和Illumina Hiseq為代表的二代測(cè)序技術(shù),成功實(shí)現(xiàn)了高通量和低費(fèi)用的有效結(jié)合,將宏基因組學(xué)研究推向了前臺(tái)。不同于第一代以Sanger末端終止法為原理的測(cè)序技術(shù),二代測(cè)序技術(shù)基于邊合成邊測(cè)序的理念。Roche 454主要表現(xiàn)為通過檢測(cè)在合成過程中釋放的焦磷酸信號(hào)讀取基因的序列,Illumina則是通過讀取摻入染料的熒光信號(hào)獲得模板DNA的序列[10]。Roche 454最大的優(yōu)勢(shì)在于高質(zhì)量測(cè)序的讀長最長可達(dá)1 000 bp以上。Illumina Hiseq系列測(cè)序儀最大的特點(diǎn)是在較低費(fèi)用的基礎(chǔ)上一次測(cè)序產(chǎn)生最高可達(dá)600 G的數(shù)據(jù)量。近兩年來,Illumina推出的MiSeq則以簡單、快速、準(zhǔn)確受到部分終端用戶的好評(píng)[11]。
基于二代測(cè)序技術(shù)的宏基因組生物信息分析尚面臨很多挑戰(zhàn)。由于微生物群落包含物種的多樣性和復(fù)雜性,無論生物信息分析軟件和流程的開發(fā),還是當(dāng)前電腦計(jì)算能力的有限性,都對(duì)得到精確的分析結(jié)果造成了相當(dāng)?shù)睦щy。例如,通常情況下的基因組測(cè)序是針對(duì)單一物種的基因組,而微生物菌落的宏基因組測(cè)序事實(shí)上沒有一個(gè)特定的范圍[6]。微生物群落各成員的豐度不一和基因序列的相似度差異較大等都對(duì)目前使用的軟件和分析方法構(gòu)成了相當(dāng)大的影響[3-4]。
總體來說,宏基因組學(xué)研究的問題是:1)微生物群落的成分及其動(dòng)態(tài)改變;2)微生物群落中的各種微生物的基因結(jié)構(gòu)及其功能;3)微生物群落的各個(gè)成員之間及其與環(huán)境或宿主之間的關(guān)系;4)微生物群落研究成果在現(xiàn)實(shí)生活中的應(yīng)用。
微生物群落的多樣性分析:微生物群落中物種的多樣性依然是目前研究的重點(diǎn)。對(duì)群落結(jié)構(gòu)的研究,將有助于了解種群結(jié)構(gòu)的穩(wěn)定性,進(jìn)而了解種群內(nèi)物種間的相互依賴、相互制約的內(nèi)在聯(lián)系,為將來構(gòu)建功能性種群服務(wù)。鑒于微生物群落是一個(gè)多物種的集合體,其中高達(dá)95%以上的微生物物種無法分離也不能獨(dú)立培養(yǎng),拼裝出每個(gè)獨(dú)立個(gè)體的基因組現(xiàn)在也無法實(shí)現(xiàn),16 S測(cè)序分析依然是現(xiàn)階段微生物群落多樣性和多態(tài)性分析的基石[4]。不可忽略的是,雖然基于PCR和高通量測(cè)序技術(shù)的微生物群落多樣性分析結(jié)果與傳統(tǒng)的鳥槍測(cè)序結(jié)果存在的偏差在可以接受的范圍內(nèi)[6],但其物種的鑒別能力尚有很大的改善空間。因此,發(fā)現(xiàn)有效區(qū)分物種的基因標(biāo)記物仍是當(dāng)前需要追求的目標(biāo)之一。
微生物群落的成分分析:在物種多樣性分析的基礎(chǔ)上,一個(gè)微生物群落中物種的豐度和密度也是宏基因組學(xué)研究工作者共同關(guān)心的問題之一。某些物種豐度或密度的增減可能會(huì)改變種群的功能和特性[3]?;诟咄繙y(cè)序的數(shù)據(jù)分析,可以達(dá)到在個(gè)位數(shù)上了解微生物群落中物種的數(shù)目,使分析的結(jié)果更精確。對(duì)各個(gè)微生物種群隨著環(huán)境變化的動(dòng)態(tài)觀察,由于有效對(duì)照的缺失,結(jié)果往往不是十分精確;目前的成分分析結(jié)果大多是基于統(tǒng)計(jì)學(xué)的推測(cè),唯有微生物群落的主成分分析和群落之間的主成分分析是相對(duì)可靠的。
微生物群落基因組組裝分析:相較于微生物個(gè)體的基因組而言,目前的高通量測(cè)序依然是小片段測(cè)序,微生物群落中各個(gè)微生物個(gè)體的基因組拼裝是當(dāng)前無法完成的任務(wù)[12]。如果能夠找到合適的方法,無疑將為開展微生物群落的研究提供極大的幫助。當(dāng)前宏基因組的拼裝原則上采用assembling、Blast search和ORF相結(jié)合的方法[7]。
微生物群落中個(gè)體的功能性分析:一個(gè)微生物個(gè)體在群落中的存在既有其偶然性,也有其必然性。近期受到廣泛關(guān)注的人的腸道微生物課題(Human microbial project)的研究顯示,腸道微生物群落中包含有與抗菌素的耐藥性、藥物的代謝和應(yīng)激反應(yīng)等相關(guān)的基因,這些基因?qū)λ幬锏拇x和人體的健康都有著很大的影響[13]。微生物和宿主之間的相關(guān)關(guān)系的研究也揭示出一些新的信號(hào)傳遞系統(tǒng)和代謝系統(tǒng)[14]?;虻墓δ茴A(yù)測(cè)和實(shí)驗(yàn)驗(yàn)證依然是需要解決的問題。單個(gè)基因的功能預(yù)測(cè)原則上依然是采用同源基因比對(duì)的原理,如Blast是基于序列比對(duì),而pfam,HMM,CDD,COG等則是將基因序列與profile比對(duì)。
微生物群落的代謝通路分析:將微生物群落作為一個(gè)整體進(jìn)行代謝通路分析是一個(gè)新發(fā)展方向?,F(xiàn)有的代謝通路和信號(hào)傳遞系統(tǒng)都是基于單細(xì)胞的蛋白質(zhì)相互作用級(jí)聯(lián)反應(yīng)構(gòu)建的。微生物群落成員間、微生物群落和環(huán)境(或宿主)間存在有互動(dòng),例如代謝產(chǎn)物的互享互助,如何有效的建立微生物群落的代謝通路是目前尚待解決的問題[14]。(見表1)。對(duì)于在線分析服務(wù),如果不考慮數(shù)據(jù)的安全性,數(shù)據(jù)傳輸速度及數(shù)據(jù)處理的容量仍是進(jìn)行快速有效分析的限制因素。
各種生物信息學(xué)分析軟件有很多已經(jīng)被應(yīng)用于宏基因組的數(shù)據(jù)分析[26-27],常規(guī)分析包括基因比對(duì)、序列裝配、基因預(yù)測(cè)、統(tǒng)計(jì)分析等(見表1),這些分析都是根據(jù)數(shù)據(jù)的特性選擇合適的軟件并輔以適當(dāng)?shù)淖灾鏖_發(fā)腳本來完成。除上述可以獨(dú)立運(yùn)行的軟件外,有很多網(wǎng)站可以提供在線軟件分析服務(wù)當(dāng)前主流測(cè)序儀生成的數(shù)據(jù)原則上都需要進(jìn)行嚴(yán)格的質(zhì)量控制,數(shù)據(jù)質(zhì)控的差異是造成實(shí)驗(yàn)驗(yàn)證差異的主要原因。數(shù)據(jù)的格式轉(zhuǎn)換則是目前解決得最好的內(nèi)容。對(duì)數(shù)據(jù)質(zhì)控形成一個(gè)統(tǒng)一的標(biāo)準(zhǔn)并非不可能,我們相信,隨著測(cè)序質(zhì)量的提高,業(yè)界將有望達(dá)成這個(gè)目標(biāo)。
盡管宏基因組數(shù)據(jù)存在多樣化的問題,高通量數(shù)據(jù)生物信息分析流程化仍然是目前的總體趨勢(shì)。流程化分析將有效增加數(shù)據(jù)分析的可靠性和結(jié)果間的可對(duì)比性。不可否認(rèn)的是當(dāng)前的數(shù)據(jù)分析流程多有一定的局限性和較高的錯(cuò)誤率,特別是在序列拼裝方面,但基于流程化的分析很容易通過相關(guān)參數(shù)的調(diào)整或軟件的升級(jí)提高分析的精度。
表1 宏基因組分析相關(guān)的常用軟件及網(wǎng)站Table 1 Metagenomics analysis related software and website
宏基因組研究有著廣泛的應(yīng)用前景,在理論研究和實(shí)際應(yīng)用中都有很重要的研究價(jià)值。其中主要表現(xiàn)在以下幾個(gè)方面:
進(jìn)化分析:研究顯示,物種之間的差異既有該物種本身基因組的差異,也有與其伴隨的微生物的差異,某些相關(guān)微生物與宿主之間是共生關(guān)系。水平基因轉(zhuǎn)移的發(fā)生是廣泛存在的現(xiàn)象還是在特定條件下的產(chǎn)物?物種間的共生關(guān)系導(dǎo)致物種間水平基因轉(zhuǎn)移的機(jī)制及其意義的闡明將對(duì)生物物種的進(jìn)化理論產(chǎn)生重要的影響[23]。
基因發(fā)現(xiàn):基于高通量測(cè)序的宏基因組學(xué)研究為新基因的發(fā)現(xiàn)打開了一條新的通路。就種類和數(shù)量而言,微生物都是最大的基因資源庫。傳統(tǒng)的方法是在基因裝配的基礎(chǔ)上預(yù)測(cè)基因的存在,然后通過同源基因的比對(duì)和實(shí)驗(yàn)驗(yàn)證來確認(rèn)基因的發(fā)現(xiàn)。對(duì)于宏基因組而言,由于測(cè)序的主要成分為多物種的混合物,基因組的裝配尚無法完成。無論基于現(xiàn)有的哪個(gè)軟件,所預(yù)測(cè)的基因的實(shí)驗(yàn)驗(yàn)證依然是個(gè)主要問題。宏基因組代謝與信號(hào)傳導(dǎo)通路的研究是研究基礎(chǔ)最貧乏的方向,KEGG、IPA等數(shù)據(jù)庫的構(gòu)建都是基于單一物種,多物種之間的信號(hào)傳導(dǎo)通路尚處于不明朗狀態(tài),只能借鑒單一物種的數(shù)據(jù)。噬菌體是一類以特定細(xì)菌為宿主的病毒,在當(dāng)前抗生素耐藥菌泛濫而新的抗生素的研發(fā)遭遇瓶頸的情況下,新的噬菌體的發(fā)現(xiàn)有望為抗生素耐藥菌感染提供新的治療途徑。噬病毒體(virophage)[20-22]是近年來的一個(gè)新發(fā)現(xiàn),由于病毒本身的生物特性,開發(fā)以噬病毒體為基礎(chǔ)的新藥很有可能為流感、AIDS等病毒源性疾病的治療帶來新的曙光。
環(huán)境與生態(tài)研究:微生物群落生態(tài)系統(tǒng)的調(diào)查,特別是環(huán)境微生物的存在與環(huán)境生態(tài)改變的關(guān)系,是當(dāng)前最受重視的課題之一[25]。目前的研究顯示,冷熱酸堿等極端環(huán)境都對(duì)環(huán)境微生物群落有著多種多樣的影響。在環(huán)境污染的情況下,某些特殊功能的微生物群落也許對(duì)于難以降解的污染具有特殊的功效。環(huán)境微生物的存在與農(nóng)業(yè)植物栽培和林業(yè)培育關(guān)系密切,固氮菌的存在對(duì)大豆生長的影響是農(nóng)業(yè)栽培的實(shí)例。地球微生物組計(jì)劃(Earth microbiome project)旨在廣泛的開展對(duì)環(huán)境中的微生物的研究,以達(dá)到造福全球和全人類的目的[30]。
疾病和個(gè)體化醫(yī)療:目前粗略估計(jì)人體內(nèi)微生物的數(shù)量是人的細(xì)胞數(shù)目數(shù)十倍甚至于百倍。大量的研究證據(jù)顯示,人體微生物的種群和多樣性與人體疾病的發(fā)生有著顯著的相關(guān)性,例如肥胖、心血管疾病和腫瘤等。人類微生物組計(jì)劃(Human microbiome project)的調(diào)查顯示,腸道微生物中存在大量與藥物代謝和分解相關(guān)的細(xì)菌,提示在個(gè)體化醫(yī)療方面不僅僅要考慮宿主基因組中藥物的代謝相關(guān)基因,同時(shí)也需要考慮到消化道中微生物群落的存在和組成[27]。
生物信息軟件研發(fā)和分析平臺(tái)構(gòu)建:隨著測(cè)序技術(shù)的高速發(fā)展,優(yōu)質(zhì)的第三代測(cè)序儀將面世并且發(fā)展勢(shì)頭強(qiáng)勁,其特性表現(xiàn)為:更高的測(cè)序通量,更精確的測(cè)序質(zhì)量,更長的測(cè)序長度。這些特性將為生物信息分析提出更多的需求。后兩個(gè)特性將使得宏基因組的拼裝成為可能,而前一個(gè)特性毫無疑問將需要電腦硬件和軟件的進(jìn)一步整合,否則,計(jì)算能力將成為分析的瓶頸[27]。
References)
[1] Chen K,Pachter L.Bioinformatics for Whole-genome Shotgun Sequencing of Microbial Communities[J].PLoS Computational Biology,2005,1(2):106-112.
[2] Cole JR,Wang Q,Cardenas E,F(xiàn)ish J,Chai B,F(xiàn)arris RJ,Kulam-Syed-Mohideen AS,McGarrell DM,Marsh T,Garrity GM,Tiedje JM.The Ribosomal Database Project:Improved Alignments and New Tools for rRNA Analysis[J].Nucleic Acids Research,2009,37(suppl 1):D141-D145.
[3] Ley RE,Turnbaugh PJ,Klein S,Gordon JI.Microbial Ecology:Human Gut Microbes Associated with Obesity[J].Nature,2006,444(7122):1022-1023.
[4] Huber JA,Mark Welch DB,Morrison HG,Huse SM,Neal PR,Butterfield DA,Sogin ML.Microbial Population Structures in The Deep Marine Biosphere[J].Science,2007,318(5847):97-100.
[5] Ley RE,Hamady M,Lozupone C,Turnbaugh PJ,Ramey RR,Bircher JS,Schlegel ML,Tucker TA,Schrenzel MD,Knight R,Gordon JI.Evolution of Mammals and Their Gut Microbes[J].Science,2008,320(5883):1647-1651.
[6] Bartram AK,Lynch MD,Stearns JC,Moreno-Hagelsieb G,Neufeld JD.Generation of Multimillion-sequence 16s rrna Gene Libraries From Complex Microbial Communities by Assembling Paired-End Illumina Reads[J].Applied and Environmental Microbiology,2011,77(11):3846-3852.
[7] Mitreva M.Structure,F(xiàn)unction and Diversity of the Healthy Human Microbiome[J].Nature,2012,486:207-214.
[8] Diehl GE,Longman RS,Zhang JX,Breart B,Galan C,Cuesta A,Schwab SR,Littman DR.Microbiota Restricts Trafficking of Bacteria to Mesenteric Lymph Nodes by CX(3)CR1(hi)Cells[J].Nature,2013,494(7435):116-120.
[9] Rondon MR,August PR,Bettermann AD,Brady SF,Grossman TH,Liles MR,Loiacono KA,Lynch BA,MacNeil IA,Minor C,Tiong CL,Gilman M,Osburne MS,Clardy J,Handelsman J,Goodman RM.Cloning the Soil Metagenome:A Strategy for Accessing the Genetic and Functional Diversity of Uncultured Microorganisms[J].Applied and environmental microbiology,2000,66(6):2541-2547.
[10] Mardis E R.Next-Generation DNA Sequencing Methods[J].Annual Review of Genomics and Human Genetics,2008,9:387-402.
[11] Sikkema-Raddatz B,Johansson LF,de Boer EN,Almomani R,Boven LG,van den Berg MP,van Spaendonck-Zwarts KY,van Tintelen JP,Sijmons RH,Jongbloed JD,Sinke RJ.Targeted Next-Generation Sequencing can Replace Sanger Sequencing in Clinical Diagnostics[J].Human Mutation,2013,34(7):1035-1042.
[12] Dinsdale EA,Edwards RA,Hall D,Angly F,Breitbart M,Brulc JM,F(xiàn)urlan M,Desnues C,Haynes M,Li L,McDaniel L,Moran MA,Nelson KE,Nilsson C,Olson R,Paul J,Brito BR,Ruan Y,Swan BK,Stevens R,Valentine DL,Thurber RV,Wegley L,White BA,Rohwer F.Functional Metagenomic Profiling of Nine Biomes[J].Nature,2008,452(7187):629-632.
[13] Maurice CF,Haiser HJ,Turnbaugh PJ.Xenobiotics Shape the Physiology and GeneExpression oftheActiveHuman Gut Microbiome[J].Cell,2013,152(1):39-50.
[14] De Filippo C,Ramazzotti M,F(xiàn)ontana P,Cavalieri D.Bioinformatic Approaches for Functional Annotation and Pathway Inference in Metagenomics Data[J].Briefings in Bioinformatics,2012,13(6):696-710.
[15] Sanli K,Karlsson FH,Nookaew I,Nielsen J.FANTOM:Functional and Taxonomic Analysis of Metagenomes[J].BMC Bioinformatics,2013,14(1):38-43.
[16] Arumugam M,Harrington ED,F(xiàn)oerstner KU,Raes J,Bork P.SmashCommunity:A Metagenomic Annotation and Analysis Tool[J].Bioinformatics,2010,26(23):2977-2978.
[17] Parks D H,Beiko R G.Identifying Biologically Relevant Differences between Metagenomic Communities[J].Bioinformatics,2010,26(6):715-721.
[18] Kembel SW,Cowan PD,Helmus MR,Cornwell WK,Morlon H,Ackerly DD,Blomberg SP,Webb CO:Picante:R tools for Integrating Phylogenies and Ecology[J].Bioinformatics,2010,26(11):1463-1464.
[19] Angiuoli SV,Matalka M,Gussman A,Galens K,Vangala M,Riley DR,Arze C,White JR,White O,F(xiàn)ricke WF.CloVR:A Virtual Machine for Automated and Portable Sequence Analysis from the Desktop Using Cloud Computing[J].BMC Bioinformatics,2011,12:356.
[20] Fischer MG,Suttle CA.A Virophage at the Origin of Large DNA Transposons[J].Science,2011,332(6026):231-234.
[21] Boyer M,Yutin N,Pagnier I,Barrassi L,F(xiàn)ournous G,Espinosa L,Robert C,Azza S,Sun S,Rossmann MG,Suzan-Monti M,La Scola B,Koonin EV,Raoult D.Giant Marseillevirus Highlights the Role of Amoebae as a Melting Pot in Emergence of Chimeric Microorganisms[J]. Proceeding of the National Academy of Sciences,2009,106(51):21848-21853.
[22] La Scola B,Desnues C,Pagnier I,Robert C,Barrassi L,F(xiàn)ournous G,Merchat M,Suzan-Monti M,F(xiàn)orterre P,Koonin E,Raoult D.The Virophage as a Unique Parasite of the Giant Mimivirus[J].Nature,2008,455(7209):100-104.
[23] Sch?nknecht G,Chen WH,Ternes CM,Barbier GG,Shrestha RP,Stanke M,Br?utigam A,Baker BJ,Banfield JF,Garavito RM,Carr K,Wilkerson C,Rensing SA,Gagneul D,Dickenson NE,Oesterhelt C,Lercher MJ,Weber AP.Gene Transfer from Bacteria and Archaea Facilitated Evolution of an Extremophilic Eukaryote[J].Science,2013,339(6124):1207-1210.
[24] Caporaso JG,Kuczynski J,Stombaugh J,Bittinger K,Bushman FD,Costello EK,F(xiàn)ierer N,Pe?a AG,Goodrich JK,Gordon JI,Huttley GA,Kelley ST,Knights D,Koenig JE,Ley RE,Lozupone CA,McDonald D,Muegge BD,Pirrung M,Reeder J,Sevinsky JR,Turnbaugh PJ,Walters WA,Widmann J,Yatsunenko T,Zaneveld J,Knight R.QIIME Allows Analysis of High-throughput Community Sequencing Data[J].Nature Methods,2010,7(5):335-336.
[25] Sachdev DP,Cameotra SS.Biosurfactants in Agriculture[J].Applied Microbiology Biotechnology,2013,97(3):1005-1016.
[26] Teeling H,Gl?ckner FO.Current Opportunities and Challenges in Microbial Metagenome Analysis-A Bioinformatic Perspective[J].Briefings in Bioinformatics,2012,13(6):728-742.
[27] Morgan XC,Huttenhower C.Human Microbiome Analysis[J].PLoS Computational Biology,2012,8(12):e1002808.
[28] Meyer F,Paarmann D,D'Souza M,Olson R,Glass EM,Kubal M,Paczian T,Rodriguez A,Stevens R,Wilke A,Wilkening J,Edwards RA.The Metagenomics RAST Server-A Public Resource forthe Automatic Phylogenetic and FunctionalAnalysis of Metagenomes[J].BMC Bioinformatics,2008,9:386-394.
[29] Markowitz VM,Ivanova NN,Szeto E,Palaniappan K,Chu K,Dalevi D,Chen IM,Grechkin Y,Dubchak I,Anderson I,Lykidis A,Mavromatis K,Hugenholtz P,Kyrpides NC.IMG/M:A Data Management and Analysis System for Metagenomes[J].Nucleic Acids Research,2008,36(suppl 1):D534-D538.
[30] Jansson JK,Prosser JI.Microbiology:The Life Beneath our Feet[J].Nature,2013,494(7435):40-41.