劉巍, 郭海朋, 董鵬生, 燕孟琛, 張德民
1. 寧波大學(xué), 農(nóng)產(chǎn)品質(zhì)量安全危害因子與風(fēng)險(xiǎn)防控國家重點(diǎn)實(shí)驗(yàn)室, 浙江 寧波 315800;
2. 寧波大學(xué)海洋學(xué)院, 浙江 寧波 315800
紅桿菌科(Rhodobacteracea)細(xì)菌中的玫瑰桿菌分支(Roseobacterclade)是海洋環(huán)境(如海水、沉積物、藻類、無脊椎動(dòng)物、脊椎動(dòng)物、生物膜和高鹽微生物墊)中最豐富的異養(yǎng)菌之一。據(jù)統(tǒng)計(jì), 沿海浮游細(xì)菌群落的20%和海水混合層浮游細(xì)菌群落的15%都由玫瑰桿菌組成(Buchan et al, 2005; Choi et al,2006; Kent et al, 2018; Sharpe et al, 2020)。玫瑰桿菌已被證實(shí)具有廣泛的生理生化特征, 如可以通過分解并釋放碳、硫和其他化合物而參與海洋生物化學(xué)循環(huán)(Mou et al, 2008; Reisch et al, 2011)。此外, 玫瑰桿菌分支細(xì)菌在水產(chǎn)養(yǎng)殖中也很常見, 它是蝦腸道和養(yǎng)殖水體中含量最豐富的細(xì)菌之一(Guo et al,2020; Huang et al, 2020), 并且部分玫瑰桿菌具有反硝化作用(Pujalte et al, 2014), 可以降低養(yǎng)殖水體中的硝酸鹽、亞硝酸鹽含量。
別樣玫瑰變色桿菌屬(Aliiroseovarius)細(xì)菌是玫瑰桿菌分支的成員, 為革蘭氏陰性菌, 細(xì)胞呈桿狀,單極生長, 部分具有運(yùn)動(dòng)性(除Aliiroseovarius marinus)。其中,A. crassostreaeCV919-312T(過去被分類為Roseovarius crassostreae)為別樣玫瑰變色桿菌的模式種, 由Boettcher 等(1999)從牡蠣中首次分離獲得, 已被證實(shí)為牡蠣的病原菌, 可以導(dǎo)致幼年牡蠣患病(Kessner, 2015)。該屬菌株還可從近海沉積物(A. sediminilitoris)(Park et al, 2013)、海水(A.marinus、A. pelagivivens)(Jung et al, 2011; Park et al,2015)、海鞘(A. halocynthiae)(Kim et al, 2012)等生境分離出來。目前對該屬菌株的研究大多都集中在分離純化、新種鑒定和生理生化特征等方面(Boettcher et al, 2005; Park et al, 2013), 而對該屬細(xì)菌的基因組信息和生態(tài)功能等研究報(bào)道則較少。
本研究通過對從對蝦腸道中分離出的一株Aliiroseovarius屬細(xì)菌的基因組進(jìn)行測序和注釋, 探究該物種的遺傳進(jìn)化特征。同時(shí)利用比較基因組學(xué)技術(shù), 確定其直系同源基因及特有基因集群, 從基因組學(xué)層面解釋該菌株的環(huán)境適應(yīng)性、脫氮能力等,為開發(fā)和利用玫瑰桿菌資源提供理論支撐。
菌株 Z3 為本課題組從健康凡納濱對蝦(Litopenaeus vannamei)腸道中分離獲得(活體取樣),在海洋肉湯2216(MB, Difco)培養(yǎng)基中37℃恒溫?cái)U(kuò)增培養(yǎng)18h 后, 12000rpm 離心5min 收集細(xì)胞。依據(jù)DNA 試劑盒(Bacteria DNA kit, OMEGA, USA)的說明書提取其基因組DNA, 并用NanoDrop ND-1000分光光度計(jì)(NanoDrop Technologies, Wilmington,DE, USA)對獲得的 DNA 進(jìn)行質(zhì)量把控, 采用Illumina HiSeq PE150 平臺(tái)完成基因組草圖測序(上海美吉生物醫(yī)藥科技有限公司, 上海, 中國)。
將從 Illumina HiSeq 平臺(tái)測序獲得的數(shù)據(jù)經(jīng)CASAVA 軟件(Masella et al, 2012)堿基識(shí)別分析轉(zhuǎn)化為原始測序序列后過濾處理, 去除包含Adapter的序列以及低質(zhì)量數(shù)據(jù), 得到有效數(shù)據(jù)后用SOAPdenovo v2.04 軟件(Luo et al, 2012)完成序列組裝。 再 使 用 CISA 軟 件(http://sb.nhri.org.tw/CISA/en/CISA)進(jìn)行整合, 對組裝結(jié)果進(jìn)行補(bǔ)洞和優(yōu)化。采用Glimmer v3.02 軟件(http://www.cbcb.umd.edu/software/glimmer/)對Z3 基因組進(jìn)行基因結(jié)構(gòu)及蛋白基因的預(yù)測。將預(yù)測到的編碼蛋白質(zhì)的基因(Coding sequence, CDS)分別與直系同源基因簇?cái)?shù)據(jù)庫(Cluster of Orthologous Groups of proteins,COG)(Natale et al, 2000)、京都基因和基因組百科全書數(shù)據(jù)庫(Kyoto Encyclopedia of Genes and Genomes,KEGG)(Kanehisa et al, 2000)進(jìn)行比對, 獲得蛋白功能注釋。
提取基因組中的16S rRNA 基因全長序列, 利用 EzBioCloud(https://www.ezbiocloud.net/)和NCBI(https://blast.ncbi.nlm.nih.gov/Blast.cgi)數(shù)據(jù)庫的核苷酸BLAST 工具對16S rRNA 基因全長序列進(jìn)行比對, 下載相似度最高的14 株模式菌株序列, 使用Mega X 軟件(Kumar et al, 2018)基于最大似然法(1000bootstrap)構(gòu)建系統(tǒng)發(fā)育樹。根據(jù)16S rRNA 基因全長序列比對結(jié)果, 從EzBioCloud 數(shù)據(jù)庫中下載與Z3 基因序列相似度最高的5 個(gè)Aliiroseovarius屬模式菌株以及6 個(gè)其他玫瑰桿菌屬模式菌株的基因組序列及相關(guān)信息。5 株Aliiroseovarius屬模式菌分為別:A. crassostreaeCV919-312T(GCA_0013077 65.1),A. sediminilitorisDSM 29439T(GCA_9001099 55.1),A. marinusA6024T(GCA_004360145.1),A.halocynthiaeMA1-10T(GCA_007004645.1)和A.pelagivivensGYSW-22T(GCA_900302485.1)。根據(jù)前期 Glimmer 預(yù)測的基因結(jié)構(gòu), 利用 Orthofinder(Emms et al, 2019)篩選12 株菌之間的同源基因?;贠rthofinder 輸出的單拷貝直系同源基因, 首先使用Muscle(Edgar, 2004)進(jìn)行多序列比對, 而后使用Gbolcks(Castresana, 2000)提取保守序列(參數(shù):–b4=5, –b5=h), 再將保守序列合并后用 Raxml(Stamatakis, 2014)繪制系統(tǒng)發(fā)育樹(參數(shù):–f=a, –x=123, –p=123, –n=1000, –m=PROTGAMMAAU TO)。為了進(jìn)一步確定Z3 的分類學(xué)地位, 本研究還進(jìn)行了ANI(Average nucleotide identity)(http://jspecies.ribohost.com/jspeciesws/) (Lee et al, 2016)、DDH(DNA-DNA hybridization)(https://ggdc.dsmz.de)(Meier-Kolthoff et al, 2013)和共線性分析(Mauve 軟件)(Darling et al, 2004)。最后, 從Orthofinder 輸出的序列中提取5 株Aliiroseovarius屬菌株和Z3 的核心基因及Z3 的特異性基因, 用CD-hit(Li et al, 2006)(參數(shù): –c=0.9, –n=5)去冗余后, 分別用 COG 和KEGG 數(shù)據(jù)庫進(jìn)行功能注釋。
菌株Z3 經(jīng)測序組裝后, 得到11 個(gè)基因組的框架(S c a ff o l d s), 它們的長度范圍為 1 8 1 3 5 0~528243bp。Z3 的基因組大小為3525503bp, 平均GC含量為59.4%, 包含3509 個(gè)預(yù)測的CDS, 編碼基因總長度3221889bp, 占整個(gè)基因組的91.39%。將Z3的基因組序列提交到NCBI 的GenBank 數(shù)據(jù)庫中(登錄號(hào)為JAFMZK000000000)進(jìn)行比對后, 再將CDS與COG 數(shù)據(jù)庫比對, 對CDS 進(jìn)行同源基因注釋分類, 將基因劃分為24 類, 以英文大寫字母B—Z 代表每一類的代碼(圖1)。其中, 參與氨基酸的運(yùn)輸與代謝(E, Amino acid transport and metabolism)的蛋白質(zhì)最多, 共有 399 個(gè); 其次為一般功能預(yù)測(R,General function prediction)、轉(zhuǎn)錄(K, Transcription)以及翻譯、核糖體結(jié)構(gòu)與生物合成(J, Translation,ribosomal structure and biosynthesis), 基因數(shù)量分別為320、286 和265 個(gè)。通過與KEGG 數(shù)據(jù)庫比對, 從Z3 的基因組中找到代謝通路相關(guān)的基因2070 個(gè)(圖2), 共分為37 個(gè)類型, 可歸為細(xì)胞過程(Cellular processes)、環(huán)境信息處理(Environmental information processing)、基因信息處理(Genetic information processing)、人類疾病(Human diseases)和代謝(Metabolism)5 個(gè)大類。其中, 代謝大類的氨基酸代謝(Amino acid metabolism)、碳水化合物代謝(Carbohydrate metabolism)和環(huán)境信息處理大類的膜運(yùn)輸(Membrane transport)部分被注釋到較多的基因,分別為249、234 和222 個(gè)。
圖1 別樣玫瑰變色桿菌Z3 基因組的COG 功能分類Fig. 1 Gene distribution based on Cluster of Orthologous Groups of proteins (COG) of Aliiroseovarius sp. Z3
圖2 別樣玫瑰變色桿菌Z3 基因組的KEGG 代謝通路Fig. 2 Genetic Kyoto Encyclopedia of Genes and Genomes (KEGG) metabolic pathways of Aliiroseovarius sp. Z3
從Z3 基因組中提取完整的16S rRNA 基因全長序列進(jìn)行比對并構(gòu)建系統(tǒng)發(fā)育樹。序列比對結(jié)果表明, 菌株Z3 與Aliiroseovarius屬中兩個(gè)種的模式株A. crassostreaeCV919-312T和A. sediminilitorisDSM 29439T的 16S rRNA 基因相似度最高, 分別為98.20%和98.06%?;?6S rRNA 基因構(gòu)建的系統(tǒng)發(fā)育樹結(jié)果如圖3 所示, 菌株Z3 與A. crassostreaeCV919-312T聚在一枝。為了進(jìn)一步鑒定Z3, 選取與Z3 16S rRNA 基因相似度最高的5 個(gè)Aliiroseovarius屬模式株的基因組以及其他6 株相近屬模式株的基因組, 提取單拷貝直系同源基因構(gòu)建系統(tǒng)發(fā)育樹(圖4),結(jié)果發(fā)現(xiàn)Aliiroseovariussp. Z3 與A. sediminilitorisDSM 29439T的親緣關(guān)系最近, 被分到同一枝。比較分析Z3 與5 株Aliiroseovarius屬模式株基因組間的ANI 和DDH, 結(jié)果發(fā)現(xiàn)6 株菌兩兩之間的ANI 值范圍為83.61%~86.50%(表1), 其中Z3 與其他5 個(gè)種模式株的ANI 值為84.95%~84.33%, 明顯小于同種之間的ANI 界定值95%(Kim et al, 2014), 表明菌株Z3 可能為Aliiroseovarius屬的一個(gè)新種。此外, Z3與A. sediminilitorisDSM 29439T的DDH 值最高為26.8%(表2), 遠(yuǎn)低于同種分類閾值(70%)(Richter et al, 2009), 進(jìn)一步說明菌株Z3 為Aliiroseovarius屬的新種, 將其命名為Aliiroseovariussp. Z3。
表1 6 株別樣玫瑰變色桿菌屬細(xì)菌平均核苷酸同一性的值Tab. 1 Average nucleotide identity (ANI) values of six Aliiroseovarius spp.
表2 別樣玫瑰變色桿菌Z3 與其他5 株模式株DNADNA 雜交的值Tab. 2 DNA-DNA hybridization (DDH) values between Aliiroseovarius sp. Z3 and other five Aliiroseovarius spp.
圖3 基于最大似然法構(gòu)建的別樣玫瑰變色桿菌Z3 16S rRNA 基因的系統(tǒng)發(fā)育樹Fig. 3 The phylogenetic tree of Aliiroseovarius sp. Z3 16S rRNA gene based on the maximum likelihood method
圖4 基于單拷貝直系同源基因構(gòu)建的系統(tǒng)發(fā)育樹Fig. 4 The phylogenetic tree based on the single copy orthologous gene families
2.3.1 6 株別樣玫瑰變色桿菌的基因組基本特征
Z3 與參考菌株的基因組基本特征如表3 所示,它們在基因組大小、GC 含量等方面十分相近, 基因組大小在 3.13~3.73Mb 之間, GC 含量介于57.1%~59.9%, 表明Z3 符合Aliiroseovarius屬細(xì)菌基因組的基本特征。
表3 Z3 和與其近緣的5 株別樣玫瑰變色桿菌屬模式株的基因組基本特征Tab. 3 Genome features summary of Z3 and other five similar type strains from Aliiroseovarius genus
2.3.2 基因組共線性分析
通過Mauve 軟件分別對Z3 和其他5 株別樣玫瑰變色桿菌的基因組進(jìn)行分析比對, 結(jié)果如圖5 所示。由圖可看出Z3 與A. sediminilitorisDSM 29439T之間的共線性最好, 但Z3 與參考菌株的基因組之間均存在或多或少的插入、缺失、易位和倒位等基因重排現(xiàn)象, 這可能歸結(jié)于它們?yōu)檫m應(yīng)不同生存環(huán)境而產(chǎn)生了基因變化。
圖5 菌株Z3 與其他5 個(gè)別樣玫瑰變色桿菌Aliiroseovarius crassostreae CV919-312T(a)、Aliiroseovarius sediminilitoris DSM 29439T(b)、Aliiroseovarius halocynthiae MA1-10T(c)、Aliiroseovarius marinus A6024T(d)和 Aliiroseovarius pelagivivens GYSW-22T(e)的共線性分析圖中數(shù)值表示基因片段大小Fig. 5 Synteny blocks between Aliiroseovarius sp. Z3 and other five Aliiroseovarius spp., Aliiroseovarius. crassostreae CV919-312T (a), Aliiroseovarius sediminilitoris DSM 29439T (b), Aliiroseovarius. halocynthiae MA1-10T (c), Aliiroseovarius marinus A6024T (d), and Aliiroseovarius pelagivivens GYSW-22T (e). The value in the figure indicates the size of the gene fragment
2.3.3 核心基因和泛基因組分析
核心基因組(Core genome)是指同時(shí)出現(xiàn)在所有被分析的基因組中的一系列同源基因的合集, 副基因組(Accessory genome)被定義為基因組的特異性基因和部分共享基因的合集, 泛基因組(Pan genome)是指所有基因組的全部基因的合集(Inglin et al,2018; Zeb et al, 2020), 核心基因組和泛基因組常被用以評價(jià)相似的物種內(nèi)的基因多樣性(Zhang et al,2018), 本文中核心基因僅指6 個(gè)菌株間的直系同源核心基因。核心基因和泛基因組分析結(jié)果表明,Aliiroseovariussp. Z3 與其他5 株別樣玫瑰變色桿菌的基因組共有5044 個(gè)直系同源基因, 其中核心基因有2005 個(gè)(39.75%)(圖6)。同時(shí), 各菌株存在的特有基因數(shù)分別為548 個(gè)(A. crassostreaeCV919-312T)、274 個(gè)(A. halocynthiaeMA1-10T)、117 個(gè)(A. marinusA6024T)、145 個(gè)(A. pelagivivensGYSW-22T)、182個(gè)(A. sediminilitorisDSM 29439T)和 259 個(gè)(Aliiroseovariussp. Z3), 說明這6 株菌具有較高同源性的同時(shí)也存在一些進(jìn)化上的差異。1013 個(gè)直系同源核心基因經(jīng)COG 注釋后被分到19 個(gè)類別中(表4),其中一些高度保守的生物過程被注釋到較多基因, 如氨基酸的運(yùn)輸與代謝(E, Amino acid transport and metabolism)包含305 個(gè)基因, 無機(jī)離子轉(zhuǎn)運(yùn)與代謝(P, Inorganic ion transport and metabolism)包含235 個(gè)基因, 能量產(chǎn)生與轉(zhuǎn)化(C, Energy production and conversion)包含149 個(gè)基因。為了更全面地了解Z3 基因組中的418 個(gè)特有基因, 本文對其進(jìn)行了COG 和KEGG 功能注釋(表4)。結(jié)果顯示, 其中198個(gè)基因被注釋到18 個(gè)COG 功能類別中, 如有15 個(gè)基因被注釋到碳水化合物轉(zhuǎn)運(yùn)與代謝(G,Carbohydrate transport and metabolism)類別, 12 個(gè)基因被注釋為與無機(jī)離子轉(zhuǎn)運(yùn)和代謝(P, Inorganic ion transport and metabolism)相關(guān)。
表4 基于COG 數(shù)據(jù)庫比對的6 株別樣玫瑰變色桿菌屬細(xì)菌的直系同源核心基因和Z3 的特異性基因Tab. 4 The number of core orthologous gene clusters of six Aliiroseovarius spp. and specific 418 genes in the genome of Aliiroseovarius sp. Z3 based on COG categories analysis
圖6 6 株別樣玫瑰變色桿菌的直系同源基因和特異性基因簇的數(shù)量Fig. 6 The numbers of orthologous and unique gene clusters among six Aliiroseovarius spp.
2.3.4 反硝化代謝通路基因分析
將Aliiroseovariussp. Z3 的CDS 與KEGG 數(shù)據(jù)庫比對, 結(jié)果發(fā)現(xiàn)Z3 擁有大量與碳(C)、氮(N)、磷(P)、硫(S)代謝相關(guān)的基因。值得注意是, 其具有完整的反硝化途徑(Denitrification)的基因(圖7),如硝酸還原酶(napA)、亞硝酸還原酶(nirS)、一氧化氮還原酶(norB、norC)和一氧化二氮還原酶(nosZ), 說明Z3 可以進(jìn)行完整的反硝化作用。其近緣細(xì)菌A. crassostreaeCV919-312T也同樣被報(bào)道過具有反硝化作用(Boettcher et al, 2005)。但6株別樣玫瑰變色桿菌的核心基因組的KEGG 注釋結(jié)果顯示它們都僅具有硝酸還原酶(napA、narG),即均只可將硝酸鹽還原為亞硝酸鹽, 無反硝化作用的相關(guān)基因(圖7), 且除A. crassostreaeCV919-312T外的其余4 株別樣玫瑰變色桿菌也未見具有反硝化能力的報(bào)道。
圖7 反硝化代謝途徑相關(guān)基因虛線框表示Z3 擁有的基因; 數(shù)值表示氮元素的化合價(jià)態(tài)Fig. 7 The gene related to denitrification pathway. The dashed box indicates that Z3 has the gene, and the number indicates the chemical valence of the nitrogen element
全基因組測序技術(shù)由于可以在分子水平上系統(tǒng)地研究菌株的遺傳進(jìn)化信息、與宿主的互作機(jī)制、致病機(jī)理、鑒定分類等, 目前已經(jīng)被廣泛應(yīng)用于微生物的鑒定與分析中(Yu et al, 2017)。本研究從凡納濱對蝦腸道中分離獲得一株具有潛在脫氮功能的Aliiroseovarius屬細(xì)菌, 并對其進(jìn)行了基因組草圖測序和比較基因組學(xué)分析。通過16S rRNA 基因全長序列比對發(fā)現(xiàn), 該菌株與模式菌株A. crassostreaeCV919-312T具有最高的相似度為98.2%, 通過構(gòu)建單拷貝同源基因系統(tǒng)發(fā)育樹發(fā)現(xiàn)其與A.sediminilitorisDSM 29439T聚類最近, 說明菌株Z3為Aliiroseovarius屬細(xì)菌。為了進(jìn)一步鑒定該菌株,通過基因組比對分析發(fā)現(xiàn)菌株Z3 與模式菌株A.sediminilitorisDSM 29439T具有最高的ANI 值為84.95%, 介于6 株Aliiroseovarius屬細(xì)菌兩兩比對的ANI 值之間, 說明其可能為該屬的新種。此外, DDH比對發(fā)現(xiàn), 菌株Z3 與其他5 株親緣關(guān)系較近的菌株的DDH 值低于新種鑒定閾值(Richter et al, 2009),進(jìn)一步說明該菌株為Aliiroseovarius屬的新種, 故將其命名為Aliiroseovariussp. Z3。
硝酸鹽和亞硝酸鹽是養(yǎng)殖水體的主要污染物之一(Xing et al, 2016), 長期暴露于高水平的硝酸鹽、亞硝酸鹽環(huán)境中, 可能會(huì)引起氧化應(yīng)激, 影響水生動(dòng)物的抗氧化系統(tǒng)(Camargo et al, 2005; Sun et al,2014)。反硝化作用可以使硝酸鹽還原為亞硝酸鹽再到氮?dú)? 是水體最主要的脫氮過程, 對水體的氮元素平衡和富營養(yǎng)化控制有重要意義(劉志迎 等,2019)。菌株Z3 基因組具有編碼完整的反硝化途徑的硝酸還原酶(napA)、亞硝酸還原酶(nirS)、一氧化氮還原酶(norB、norC)、一氧化二氮還原酶(nosZ)等基因, 表明Z3 具有將硝酸鹽轉(zhuǎn)化為氮的潛力, 有助于改善養(yǎng)殖水體的水質(zhì)(Philippot, 2002; Graham et al, 2010), 這與A. crassostreaeCV919-312T具有的反硝化作用相一致(Pujalte et al, 2014)。此外, 有研究表明反硝化作用與生物膜形成息息相關(guān), 如Abdelhamed 等(2021)發(fā)現(xiàn)nasA、norB 和nosZ 在細(xì)菌形成生物膜時(shí)高度表達(dá)。本研究發(fā)現(xiàn)Z3 基因組中具有編碼生物膜形成和群體效應(yīng)相關(guān)的基因, 說明菌株Z3 可以通過形成生物膜發(fā)揮反硝化作用。本文通過對菌株Z3 進(jìn)行基因組測序及比較基因組分析,不僅探究了它的分子機(jī)理和作用機(jī)制, 且豐富了Aliiroseovarius屬細(xì)菌的研究, 為玫瑰桿菌分支細(xì)菌的多樣性研究提供了參考。