印蕾,高向東,顧覺奮
微生物支撐著地球上的物質循環(huán)和生命延續(xù),除了自身可作為新基因資源的重要來源外,還可產生對人類有價值的活性物質。然而,傳統純培養(yǎng)方法嚴重限制了人們對微生物資源的認識和開發(fā)。一方面,隨著對微生物活性產物研究的深入,微生物往往被重復培養(yǎng)和篩選,從傳統方法來篩選新活性物質的幾率不斷下降。另一方面,多達 99% 的微生物在現有實驗條件和技術下尚未得到純培養(yǎng),其中蘊含著大量潛能微生物和基因資源[1]。近年來,隨著基因組學在各個領域的滲入和現代分子技術的逐漸成熟,宏基因組學(Metagenomics)應運而生,開啟了環(huán)境微生物研究的新方向。1986年,Olsen 等[2]提出直接從環(huán)境中克隆核糖體小亞基 DNA(16SrDNA),首次運用非純培養(yǎng)的分子生物學方法研究展開微生物多樣性研究。隨著環(huán)境基因組學(Environmental genomics)概念的出現[3]以及第一個海洋微生物宏基因組文庫的建立[4],宏基因組學研究開始受到廣泛關注。1998 年,Handelsman 等[5]在前人研究的基礎上正式提出了宏基因組(Metagenone)的概念,即“特定生態(tài)環(huán)境中所有生物遺傳物質的總和”。宏基因組學則以環(huán)境樣品中微生物群體基因組為研究對象,采用功能基因篩選和測序分析等研究工具,從不可培養(yǎng)微生物中來尋找新基因或開發(fā)新生物活性物質[6]。宏基因組學的產生使人們擺脫了物種界限,克服了傳統微生物培養(yǎng)方式的缺陷,擴大了微生物資源的利用,掀開了環(huán)境微生物研究的新篇章。
區(qū)別于傳統培養(yǎng)途徑(圖 1)[7],宏基因組學的研究過程包括從環(huán)境樣品中提取基因組 DNA;載體連接;轉化宿主細胞,形成一個重組的 DNA 文庫;篩選目的克隆 4 個步驟。
圖 1 傳統培養(yǎng)方法和宏基因組篩選微生物活性產物研究流程的簡略比較
宏基因組文庫構建的第一步是要得到高質量的 DNA,既應盡力保證環(huán)境樣品中總 DNA 的完全提取,又要得到較大的片段以獲取表達所需的完整的目的基因或基因簇。所以 DNA 提取時,應盡量在最大提取量和最小剪切力間保持平衡。目前已有許多商品化的宏基因組 DNA 提取試劑盒可用。最常用的兩種提取方法為直接裂解法和間接提取法。前者又稱原位裂解法,是將環(huán)境樣品直接懸浮在裂解緩沖液中處理后再抽提純化,可分為物理法(如高溫或凍融法、液氮研磨法、超聲法、玻璃珠擊打法等)、化學法、酶法(如蛋白酶 K)。此法所得到的 DNA 能更好地代表樣品微生物的多樣性,且快速有效、成本低、DNA 提取率高、重復性好。但由于難以完全去除樣品中的酚類物質,且存在強烈的機械剪切作用,導致所提取的 DNA 片段較?。? ~ 50 kb),常用于構建小片段基因組文庫。間接提取法又稱異位裂解法,先用物理方法(如尼可登介質密度梯度離心法)將微生物細胞從環(huán)境樣品中分離出來,然后用較溫和的方法抽提DNA。此法可獲得純度較高的大片段 DNA(20 ~ 500 kb),適用于構建大片段插入文庫,但操作繁瑣,成本高,分離過程中容易丟失物種信息,溫和條件下一些細胞壁較厚的微生物基因組也不容易抽提出來。需要注意的是,環(huán)境樣品中的諸多因素如酚類化合物及高濃度的金屬離子會干擾提取及下游基因工程操作中工具酶的活性,應盡量排除。此外,土壤中含有的腐植酸類物質可以用聚乙烯吡咯烷酮(PVP)或漆酶來處理。用于 RNA 提取的土壤樣品可以加入RNAlater避免 RNA 的降解[8]。
為了更好地反映環(huán)境中的微生物種群,在克隆之前可用不同方法對目的基因或基因組進行富集,通過提高樣品基因組 DNA 的特異性以利于進一步分離篩選。例如對富含 GC堿基基因的富集,可以直接從環(huán)境中提取 DNA,然后利用超速離心富集不同 GC 比例的 DNA。此外,還可運用穩(wěn)定同位素示蹤技術,利用一些比較穩(wěn)定的同位素如13C、18O、15N 標記底物并結合密度梯度離心技術來分離大分子 DNA和 RNA。而在采集一些低營養(yǎng)環(huán)境(如極地環(huán)境或巖石)樣品無法獲得足夠克隆的 DNA 時,則可運用興新的多重置換擴增技術(multiple displacement amplification,MDA)從少量細胞中獲得更多遺傳信息。
宏基因組文庫的構建需要適宜的克隆載體,主要從利于目的基因擴增以及易于控制活性物質表達量等方面選擇合適的載體。按照不同功能,常用的載體大致可分為以下3 類。
⑴克隆載體:以擴增 DNA 為目的、不需要得到目的基因編碼蛋白的載體。早期構建宏基因組文庫以質粒載體為主,操作簡便,拷貝數高,但插入片段小于 10 kb,不適用于大基因簇篩選。產生微生物次級代謝產物的代謝途徑由多基因簇調控,應該盡量插入大片段 DNA 以獲得完整的代謝途徑多基因簇。對于這些含較大基因簇或大片段 DNA的樣品,多采用 Cosimid 或 Fosmid載體(35 ~ 45 kb),前者比較常用,而后者插入穩(wěn)定性高;此外還有容量更大的細菌人工染色體(BAC)載體(通常為 100 kb),但克隆效率較低。
⑵表達載體:能使外源目的基因在宿主細胞中轉錄和表達的功能性載體。為了提高宏基因的表達,便于重組克隆的篩選和活性檢測,可以直接利用表達載體構建宏基因組文庫,但可插入的宏基因片段一般小于 10 kb,只適合于篩選單一基因或小片段的操縱子產物。
⑶穿梭載體:含有兩個親緣關系不同的復制子,能在不同宿主菌如原核大腸桿菌和真核酵母菌中復制。利用穿梭載體可擴大宿主范圍,將不同文庫中的信息進行轉移,促使并提高外源基因的表達。
宿主細胞的選擇主要應考慮轉化穩(wěn)定性、轉化效率、宏基因的表達量、目標性狀等。研究目的不同,選擇的宿主菌株也有所差異。常用的宿主菌有:
⑴大腸桿菌:大腸桿菌(Escherichia coli)因其具有操作簡單、繁殖迅速、培養(yǎng)代謝易于控制等優(yōu)點[9],是一種常用的宿主細胞。但是由于環(huán)境樣品總 DNA 中占很大比例的真核基因組 DNA 在細菌宿主中不能表達,因此這部分基因的篩選受到了極大的限制。
⑵鏈霉菌屬:鏈霉菌(Streptomyces spp.)具備天然的抗生素生產機制,其編碼次生代謝產物生物合成的基因成簇分布,而這些基因的表達同時受細胞內和細胞外信號轉導的調控。在鏈霉菌中已經表達出一些雜合抗生素、非核糖體多肽和一些聚酮,是目前次級代謝產物異源表達最合適的宿主菌。
⑶惡臭假單胞菌:惡臭假單胞菌(Pseudomonas putida)也是次生代謝產物的產生者。通過基因重組,惡臭假單胞菌可以獲得鏈霉菌噬菌體的插入位點,接受鏈霉菌 BAC 穿梭載體克隆并且能夠穩(wěn)定地表達[10]。
宏基因組文庫篩選主要可分為以下 4 種。其中,基于目的克隆功能和基于核酸序列差異的篩選是兩種最常見的策略:
⑴功能驅動篩選:功能驅動篩選(function driven screening)是根據重組克隆具有的生物活性進行篩選的方法,常見于工農業(yè)和醫(yī)藥業(yè)中酶類蛋白及抗生素等全新天然產物的發(fā)現。具體策略包括:①在含有化學染料和不可溶或發(fā)光的酶反應底物的培養(yǎng)基中,對具有產生特殊活性功能的克隆根據不同表型特征進行直接篩選。②利用含外源基因的宿主菌株與其突變體在選擇性條件下功能互補生長的特性在培養(yǎng)基上篩選陽性克隆。功能驅動篩選雖然不需了解基因序列信息,但必須依賴目的基因在宿主菌中的有效表達,因而要求選擇合適的宿主菌株,同時應克隆到完整的基因或基因簇。一旦基因的某個組件在克隆過程中被破壞將使基因無法表達,也就不能根據表型加以篩選。Park 等[11]還發(fā)現,宏基因組中不確定閱讀框(URFs)與宿主菌(如 E.coli)的開放閱讀框架(ORF)序列存在的大量差異也是使該法篩選陽性克隆率低的原因。此方法可篩選到全新的天然產物和蛋白基因,但工作量大、效率低,檢測手段有一定局限。
⑵序列驅動篩選:序列驅動篩選(sequence driven screening)基于已知的基因或基因表達產物的保守序列設計探針或 PCR 引物,通過 PCR 擴增或核酸雜交篩選目的克隆。序列驅動篩選適用于系統發(fā)育學中標志基因如 16sRNA基因的鑒定或高度保守的酶基因如聚酮合成酶的發(fā)現。其優(yōu)點是不依賴目的基因在宿主菌株中的表達,但由于探針的設計必須建立在已知基因序列的基礎上,因而無法篩選出與現有基因序列完全不同的新基因。序列驅動篩選通常需要基因芯片等高通量測序技術和生物信息學分析軟件的支持[12],相對功能篩選成本更高。
⑶化合物結構水平的篩選:化合物結構水平的篩選(screening on compound structure)是基于不同物質在色譜分析中產生不同吸收峰的原理,通過比較轉入外源基因前后宿主細胞或表達產物的色譜圖可迅速篩選出能生成新結構化合物的克隆子,再結合生物學手段進一步確定活性。此方法效率低、費用高、工作量大。
⑷底物誘導基因表達篩選:底物誘導基因表達篩選(substrate-induced gene expression screening,SIGEX)是利用合適的底物進行誘導,使目的基因表達進行篩選的方法,并可從底物推斷出未知基因的功能,尤其適用于在工業(yè)上篩選分解代謝相關基因和酶基因??寺?SIGEX 法可用于高通量篩選,而且不需要對底物進行修飾,并可從底物直接推斷出未知基因的功能。該法的缺點:①對目標基因的結構性和宿主適應性很敏感;②用于誘導的底物必須要進入細胞質,否則無法誘導目的基因的表達;③本可誘導表達的基因由于宿主的改變會無法被誘導表達;④對于無需誘導即可表達或同時受多因素誘導的基因不適用。
由于微生物天然產物開發(fā)技術陳舊,越來越多的已知結構化合物被重復發(fā)現,新的微生物來源天然藥物的開發(fā)也變得越發(fā)困難。但是宏基因組技術突破了純培養(yǎng)的界限,無需特定的微生物來源,成為目前藥物開發(fā)的新方向[13]。
近年來,宏基因組技術已逐漸成為繼 16SrDNA 克隆之后研究微生物系統發(fā)育和功能的又一有力工具,研究獲得的大量基因信息幫助我們對生物種群的結構與進化關系,以及不同生物群落中微生物的多樣性有了新的認識[14]。2000年,Rondon 等[15]利用土壤環(huán)境,選用 BAC 載體構建了兩個大片段 DNA 插入宏基因組文庫(SL1 和 SL2),共獲得了 1.1 Gb 的 DNA 分子,通過對 SL1 文庫 16SrRNA 基因序列分析發(fā)現了低 GC 比例的革蘭陽性菌、Acidobacterium、Cytophagales 和 Proteobacteria 等微生物類群。Venter 等[16]以序列篩選分析為基礎,對馬尾藻海域表面海水的宏基因組進行了 1.6 Gb DNA 序列測定,利用生物信息學軟件分析后進行基因組組裝,鑒定出大量新基因,發(fā)現了 148 種新微生物和 782 種光受體。
加拿大 TerraGen Discovery 公司最先運用穿梭 Cosmid載體,在以鏈霉菌為宿主的宏基因組文庫中從化合物結構水平篩選到了具有抗菌活性的 5 種全新的小分子物質Terragine A、B、C、D、E(圖 2)。Kosan Technology 公司從宏基因組中發(fā)現了阿霉素、紅霉素、四環(huán)素、Rapamycin 和FK506 等一系列天然產物。2002 年,Gillespie 等[17]在構建的土壤宏基因組文庫中,篩選獲得兩種具有廣譜抗菌活性的物質 Turbomycin A 和 B(圖 2)。Banik 和 Brady[18]根據在萬古霉素和替考拉寧樣糖肽基因簇中發(fā)現的保守的氧化偶聯酶 OxyC 設計引物從土壤宏基因組文庫中篩選得到一系列糖肽合成編碼基因簇,通過重組產生了 15 個新的陰離子(硫酸)糖肽類抗生素。從多個海洋宏基因組中發(fā)現的幾百個新聚酮類化合物生物合成途徑對聚酮化合物的結構改造以及開發(fā)更多具有抗菌和抗腫瘤活性的大環(huán)內酯類抗生素有著重大作用[19]。
有研究表明,抗生素抗性基因(ARGs)可隨著各種排泄物排放到各種環(huán)境中,包括河流沉積物、灌溉渠、牛奶加工廠的出水、污水處理池等,并可通過水平轉移到其他生物中,造成二次污染,因而應用宏基因組學也可以直接從環(huán)境樣品中獲得未培養(yǎng)細菌的抗性基因,用于耐藥性研究。2003年,Diaz-Torres 等[20]通過對人體唾液宏基因組文庫的篩選得到一種新的對四環(huán)素具有很好抗性的基因 Tet(37)。2008年,Mori 等[21]通過活性污泥宏基因組文庫篩選獲得兩種不同的博來霉素抗性基因。van Elsas 等[22]從具有抗藥性的土壤中篩選出幾個 40 kb 的具有潛在抗性的基因。
生物催化劑也是宏基因組學研究的重點方向。目前已構建了土壤、海水、污泥、人體口腔和胃腸道等宏基因組文庫,從中篩選到具有不同催化活力的蛋白酶、脂肪酶、聚糖酶、氧化酶、核酸酶、生物素合成酶系等(表 1)。
圖 2 化合物 Turbomycin A、B 和 Terragine A、B、C、D、E 結構式
過去十年,病毒宏基因組學研究的開展幫助人們從多樣的環(huán)境中快速有效地發(fā)現了許多之前未知的新病毒及其基因,成為傳染病預防和診斷的新武器[23]。2009 年建立的人體微生物工程基因計劃(human microbiome project)[24]旨在描繪腸道、口腔、皮膚等人體中的微生物群,其規(guī)模和廣度將遠遠超過人類基因組計劃。據估計,人類宏基因組計劃將發(fā)現超過 100 萬個新基因,這對于研究疾病發(fā)生機制、控制藥物毒性、開發(fā)新藥等都有著積極的意義。
在我國利用宏基因組技術開發(fā)藥物的案例較少,在“十五”期間,對東太平洋深海沉積物進行了采集研究,利用基因大片段提取技術,構建了柯斯質粒等大分子文庫和片段大小為 6 ~ 23 kb的各類質粒、噬菌體庫,篩選獲得 7 個具有較好抗腫瘤活性的宏基因組克隆子,還發(fā)現了一些新的來源于未培養(yǎng)微生物的功能基因。
迄今為止,宏基因組技術是最有效的開發(fā)和利用未培養(yǎng)微生物資源的工具,已有超過 210 種不同宏基因組被測序,這些基因組來自于不同的環(huán)境,例如傳統的土壤資源、海洋資源、一些極端環(huán)境、人類腸道和糞便等[25]。隨著基因組測序、基因工程、蛋白質工程和代謝工程等生物技術的興起,宏基因組學也迎來了更多的挑戰(zhàn)與機遇。
宏基因文庫存儲的僅僅是微生物的基因信息,而并非菌體本身,這一點極大地限制了對微生物遺傳背景的了解和對基因表達的有效調控,可能導致外源宏基因在宿主細胞中不表達或低表達,進而丟失許多環(huán)境微生物的天然產物。此外,宏基因組文庫構建中樣本 DNA 的提取不完整,載體和宿主菌的有限性,以及高通量篩選技術的局限性都是今后宏基因技術著力要解決的缺陷。
表 1 從宏基因組中已發(fā)現的酶類物質
令人欣喜的是,第二代測序技術的出現和大規(guī)模 DNA測序平臺的廣泛使用大大縮減了 DNA 的測序成本,將極大地促進宏基因組學的發(fā)展。例如,有效的生物信息學計算方法、宏基因組數據分析和功能預測軟件的開發(fā)與應用[26]對宏基因組學的發(fā)展都具有積極的影響。此外,與宏基因組的策略相同的宏轉錄組學和宏蛋白質組學的發(fā)展填補了宏基因組的某些不足[27]。宏基因組學提供環(huán)境中總 DNA 的信息,宏轉錄組學提供實時的環(huán)境基因表達信息,宏蛋白質組學可以提供表達產物的功能信息。把這些“組學”聯系起來,有助于從基因到蛋白質的全面研究,極大地豐富人類對自然界的認識。有文章分析,將宏基因組與組合生物合成及納米技術結合,對于開發(fā)微生物來源的天然活性產物會有強大的促進作用[28]。
在新興技術的幫助下,面對 99% 以上不能獲得純培養(yǎng)的廣大微生物資源,宏基因組學不僅是我們獲得各種基因資源的一個有效手段,更是對于新藥研發(fā),人類健康及生態(tài)環(huán)境認識的一個很好的工具,它必將獲得更多的重視。
[1] Daniel R. The metagenomic of soil. Nat Rev Microbiol, 2005, 3(6):470-478.
[2] Olsen GJ, Lane DJ, Giovannoni SJ, et al. Microbial ecology and evolution: a ribosomal RNA approach. Annu Rev Microbiol, 1986, 40:337-365.
[3] Schmidt TM, DeLong EF, Pace NR. Analysis of a marine picoplankton community by 16S rRNA gene cloning and sequencing.J Bacteriol, 1991, 173(14):4371-4378.
[4] Stein JL, Mar sh TL, Wu KY, et al. Characterization of uncultivated prokaryotes: isolation and analysis of a 40-kilobase-pair genome fragment from a planktonic marine archaeon. J Bacteriol, 1996, 178(3):591-599.
[5] Handelsman J, Rondon MR, Brady SF, et al. Molecular biological access to the chemistry of unknown soil microbes: a new frotier for natural products. Chem Biol, 1998, 5(10):245-249.
[6] Rajendhran J, Gunasekaran P. Strategies for accessing soil metagenome for desired applications. Biotechnol Adv, 2008, 26(6):576-590.
[7] Yan B, Hong K, Xu Y, et al. Metagenome cloning — a new approach for novel microbial bioactive compounds discovery. Microbiology,2005, 32(1):113-117. (in Chinese)閻冰, 洪葵, 許云, 等. 宏基因組克隆——微生物活性物質篩選的新途徑. 微生物學通報, 2005, 32(1):113-117.
[8] Grant S, Grant WD, Cowan DA, et al. Identification of eukaryotic open reading frames in metagenomic cDNA libraries made from environmental samples. Appl Environ Microbiol, 2006, 72(1):135-143.
[9] Taupp M, Mewis K, Hallam SJ. The art and design of functional metagenomic screens. Curr Opin Biotechnol, 2011, 22(3):465-472.
[10] Martinez A, Kolvek SJ, Yip CL, et al. Genetically modified bacterial strains and novel bacterial artificial chromosome shuttle vectors for constructing environmental libraries and detecting heterologous natural products in multiple expression hosts. Appl Environ Microbiol,2004, 70(4):2452-2463.
[11] Park SH, Cheong DE, Lee JY, et al. Analyses of the structural organization of unidenti fi ed open reading frames from metagenome.Biochem Biophys Res Commun, 2007, 356(4):961-967.
[12] Scholz MB, Lo CC, Chain PS. Next generation sequencing and bioinformatic bottlenecks: the current state of metagenomic data analysis. Curr Opin Biotechnol, 2012, 23(1):9-15.
[13] Lefevre F, Robe P, Jarrin C, et al. Drugs from hidden bugs: their discovery via untapped resources. Res Microbiol, 2008, 159(3):153-161.
[14] McHardy AC, Rigoutsos I. What’s in the mix: phylogenetic classi fi cation of metagenome sequence samples? Curr Opin Microbiol,2007, 10(5):499-503.
[15] Rondon MR, August PR, Bettermann AD, et al. Cloning the soil metagenome: a strategy for accessing the genetic and functional diversity of uncultured microorganisms. Appl Environ Microb, 2000,66(6):2541-2547.
[16] Venter JC, Remington K, Heidelberg JF, et al. Environmental genome shotgun sequencing of the Sargasso Sea. Science, 2004, 304 (5667):66-74.
[17] Gillespie DE, Brady SF, Bettermann AD, et al. Isolation of antibiotics turbomycin A and B from a metagenomic library of soil microbial DNA. Appl Environ Microbiol, 2002, 68(9):4301-4306.
[18] Banik JJ, Brady SF. Cloning and characterization of new glycopeptide gene clusters found in an environmental DNA megalibrary. Proc Natl Acad Sci U S A, 2008, 105(45):17273-17277.
[19] Hochmuth T, Piel J. Polyketide synthases of bacterial symbionts in sponges--evolution-based applications in natural products research.Phytochemistry, 2009, 70(15-16):1841-1849.
[20] Diaz-Torres ML, McNab R, Spratt DA, et al. Novel tetracycline resistance determinant from the oral metagenome. Antimicrob Agents Chemother, 2003, 47(4):1430-1432.
[21] Mori T, Mizuta S, Suenaga H, et al. Metagenomic screening for bleomycin resistance genes. Appl Environ Microbiol, 2008, 74(21):6803-6805.
[22] van Elsas JD, Speksnijder AJ, van Overbeek LS. A procedure for the metagenomics exploration of disease-suppressive soils. J Microbiol Methods, 2008, 75(3):515-522.
[23] Mokili JL, Rohwer F, Dutilh BE. Metagenomics and future perspectives in virus discovery. Curr Opin Virol, 2012, 2(1):63-77.
[24] NIH HMP Working Group, Peterson J, Garges S, et al. The NIH human microbiome project. Genome Res, 2009, 19(12):2317-2323.
[25] Meyer F, Paarmann D, D'Souza M, et al. The metagenomics RAST server-a public resource for the automatic phylogenetic and functional analysis of metagenomes. BMC Bioinformatics, 2008,9:386.
[26] Wooley JC, Ye Y. Metagenomics: facts and artifacts, and computational challenges. J Comput Sci Technol, 2009, 25(1):71-81.
[27] Simon C, Daniel R. Metagenomic analyses: past and future trends.Appl Environ Microbiol, 2011, 77(4):1153-1161.
[28] Singh BK, Macdonald CA. Drug discovery from uncultivable microorganisms. Drug Discov Today, 2010, 15(78):792-799.