張棲,王晨,任璐,王洪偉,索化夷*
1(西南大學(xué) 食品科學(xué)學(xué)院,重慶,400715)2(川渝共建特色食品重慶市重點(diǎn)實(shí)驗(yàn)室,重慶,400715)
腐乳是一種源于中國(guó)的傳統(tǒng)發(fā)酵食物,由豆腐經(jīng)特定的微生物如放線菌、毛霉和根霉固態(tài)發(fā)酵制成[1],不僅具有獨(dú)特的風(fēng)味,而且含有多種營(yíng)養(yǎng)成分和功能性成分[2]。腐乳中的風(fēng)味物質(zhì)與脂肪酸和蛋白質(zhì)的降解密切相關(guān),微生物產(chǎn)生的脂肪酶和蛋白酶將脂肪酸和蛋白質(zhì)分解成肽、氨基酸和游離脂肪酸等小分子物質(zhì),大大提高了腐乳的營(yíng)養(yǎng)[3]。根據(jù)腐乳發(fā)酵劑種類(lèi)可以將腐乳分為細(xì)菌發(fā)酵(微球菌、芽孢桿菌和乳酸菌)腐乳、霉菌發(fā)酵(放線毛霉、毛霉和根霉)腐乳及其他發(fā)酵(自然接種)腐乳[4],其中霉菌發(fā)酵腐乳是最普遍的類(lèi)型。在發(fā)酵過(guò)程中,發(fā)酵菌株和其他微生物可以分泌多種酶,在它們的共同作用下將大豆蛋白和碳水化合物水解成氨基酸和小分子糖[5],這些小分子物質(zhì)是腐乳風(fēng)味形成的關(guān)鍵。由于霉菌發(fā)酵可以產(chǎn)生生物活性物質(zhì)、有機(jī)酸、營(yíng)養(yǎng)物質(zhì)、風(fēng)味物質(zhì)和色素,因此它在食品發(fā)酵工業(yè)中越來(lái)越重要。如MARTNEZ等[6]發(fā)現(xiàn)固態(tài)發(fā)酵中根霉產(chǎn)生的小孢子生物催化劑能持續(xù)生產(chǎn)油酸乙酯;MEINI等[7]報(bào)道了黑曲霉和米曲霉固態(tài)發(fā)酵的葡萄渣提取物具有抗氧化和益生特性;此外,HE等[8]將腐乳中9種細(xì)菌和6種真菌鑒定為核心功能微生物群,顯著影響風(fēng)味化合物的產(chǎn)生,尤其是游離氨基酸的產(chǎn)生。然而,真菌除了產(chǎn)生一些有益的生物分子外,也會(huì)產(chǎn)生危害人類(lèi)健康的真菌毒素。真菌毒素是由真菌產(chǎn)生的極其穩(wěn)定的有毒天然代謝產(chǎn)物,在加工和熱處理過(guò)程中不會(huì)分解。因此,食物和動(dòng)物飼料易受到污染,給人類(lèi)和動(dòng)物帶來(lái)廣泛的不利影響[9]。毛霉菌病由毛霉目中普遍存在的絲狀真菌引起,是一種死亡率較高的侵襲性真菌[10]。隨著免疫抑制、糖尿病、鈍性創(chuàng)傷和血液惡性腫瘤等風(fēng)險(xiǎn)因素在人群中越來(lái)越常見(jiàn),感染毛霉菌病的人也逐漸增加[11]。有關(guān)于全球毛霉菌病的研究調(diào)查顯示根霉、毛霉和橫梗霉占報(bào)告病例的80%,但仍然有不少病例與不太常見(jiàn)的毛霉有關(guān),如雅致放射毛霉[12]。放射毛霉是一種自然界中普遍存在的兼性厭氧真菌,以前未被認(rèn)定為侵襲性毛霉菌病的病原體,直到2001年DAVEL等[13]報(bào)道了第一例由雅致放射毛霉引起的上頜竇炎的病例,人們才意識(shí)到雅致放射毛霉也具有致病性。雖然我們未在發(fā)酵腐乳中檢測(cè)到有毒物質(zhì)的產(chǎn)生,但從消費(fèi)者的心理出發(fā),作為中國(guó)商業(yè)腐乳最常用的霉菌之一,雅致放射毛霉的安全性及其產(chǎn)生生物活性物質(zhì)的能力仍然值得我們深入研究。目前已有許多研究將高通量測(cè)序技術(shù)應(yīng)用于腐乳發(fā)酵工業(yè),以研究不同微生物的功能特性與其基因組成的關(guān)系。然而,這些研究主要集中在腐乳發(fā)酵過(guò)程中的微生物多樣性[14-16]。盡管有相關(guān)文獻(xiàn)報(bào)道了雅致放射毛霉的生物活性、致病性和改善發(fā)酵豆制品風(fēng)味的能力,但仍然迫切需要完整的雅致放射毛霉的全基因組和基因功能注釋相關(guān)信息。
本文揭示了雅致放射毛霉CJ-6的全基因組從頭測(cè)序和基因功能注釋信息,并將其基因注釋信息與米曲霉RIB40和總狀毛霉B9645進(jìn)行了比較分析。米曲霉RIB40是在日本傳統(tǒng)發(fā)酵工業(yè)中廣泛使用的真菌菌株,由于米曲霉在食品發(fā)酵工業(yè)中廣泛使用的歷史悠久,美國(guó)食品藥品管理局(Food And Drug Administration,FDA)將其工業(yè)應(yīng)用認(rèn)證為公認(rèn)安全(generally recognized as safe,GRAS)[17]。日本學(xué)者于2005年發(fā)表了米曲霉的全基因組的草圖[18],標(biāo)志著米曲霉基因組學(xué)全面發(fā)展時(shí)代的到來(lái)。總狀毛霉是純菌種發(fā)酵腐乳中最常用的發(fā)酵微生物之一,但總狀毛霉也會(huì)引起人類(lèi)和動(dòng)物疾病[19]。因此,將從NCBI獲得的米曲霉RIB40和總狀毛霉B8645全基因組數(shù)據(jù)與雅致放射毛霉CJ-6基因注釋結(jié)果進(jìn)行比較分析,使我們能夠深入了解雅致放射毛霉CJ-6在腐乳發(fā)酵過(guò)程中各種活性物質(zhì)及毒素的合成和代謝情況,為后續(xù)的深入研究奠定理論基礎(chǔ),以更好地開(kāi)發(fā)其作用并徹底地利用在食品發(fā)酵工業(yè)中。
腐乳毛坯,重慶市蔡家的市集,用無(wú)菌鑷子將腐乳毛坯裝入50 mL無(wú)菌離心管中,放入冷藏箱。
用接種環(huán)挑取樣本的菌絲置于5 mL無(wú)菌超純水中,搖勻后進(jìn)行梯度稀釋至10-6,在孟加拉紅平板培養(yǎng)基上涂布,倒置于30 ℃恒溫培養(yǎng)箱內(nèi)培養(yǎng),按照菌落形態(tài)和孢子顏色進(jìn)行分離純化,重復(fù)幾次后得到純化的菌株CJ-6(圖1)。
圖1 CJ-6菌落形態(tài)Fig.1 Colony morphology of CJ-6
參考CHEN等[20]所述的方法,使用OMEGA Fungal DNA Kit試劑盒(北京索萊寶科技有限公司)提取基因組DNA。
使用真菌通用引物ITS1和ITS4進(jìn)行PCR擴(kuò)增。取1 μL模板DNA、1 μL引物ITSl(5′-TCCGTAGGTGAACCTGCGG-3′)、1 μL引物ITS4(5′-TCCTCCGCTTATTGA ATGC-3′)、12.5 μL 2×TaqPCR Master Mix和9.5 μL滅菌超純水混合得到25 μL PCR體系。擴(kuò)增產(chǎn)物使用1.4%瓊脂糖進(jìn)行凝膠電泳檢測(cè),然后送華大基因測(cè)序。測(cè)序結(jié)果通過(guò)NCBI數(shù)據(jù)庫(kù)中的BLAST程序進(jìn)行同源性比對(duì)分析。
應(yīng)用Illumina PE150測(cè)序平臺(tái)及PacBio測(cè)序平臺(tái)(北京諾禾致源科技股份有限公司)對(duì)未知物種基因組從頭測(cè)序的測(cè)序技術(shù)對(duì)雅致放射毛霉進(jìn)行基因組測(cè)序。對(duì)于Illumina測(cè)序,用Covaris超聲波破碎儀將電泳檢測(cè)合格的DNA樣品打斷成長(zhǎng)度約350 bp的片段,DNA片段純化后與末端修復(fù)混合物結(jié)合,將修復(fù)后的DNA與A-Tailing混合物結(jié)合。然后將Illumina接頭連接到DNA的3′端,再進(jìn)行純化、PCR擴(kuò)增等步驟,完成整個(gè)文庫(kù)的制備。文庫(kù)構(gòu)建后,使用Agilent 2100生物分析儀檢測(cè)插入片段的大小,并通過(guò)實(shí)時(shí)PCR系統(tǒng)對(duì)文庫(kù)的濃度進(jìn)行定量,以確保文庫(kù)的質(zhì)量。合格的文庫(kù)用Illumina平臺(tái)測(cè)序。Pacbio測(cè)序通過(guò)構(gòu)建具有20 kbp插入片段大小的SMRT Bell文庫(kù),使用Qubit確定濃度、Agilent 2100確定插入片段的大小,然后在Pacbio平臺(tái)上測(cè)序來(lái)進(jìn)行。得到的三代測(cè)序數(shù)據(jù)先使用SMRT Link v5.0.1過(guò)濾低質(zhì)量reads,將剩下的reads初步組裝成無(wú)空缺序列(Gap)的重疊群(contigs)。為降低三代測(cè)序的錯(cuò)誤率,首先對(duì)三代數(shù)據(jù)進(jìn)行三輪糾錯(cuò):利用minimap2對(duì)初步組裝的基因組進(jìn)行mapping,然后使用racon(v1.4.13)和比對(duì)結(jié)果對(duì)初步組裝的基因組進(jìn)行位點(diǎn)校正;其次利用二代數(shù)據(jù)對(duì)其進(jìn)行兩輪糾錯(cuò):利用bwa(0.7.8-r455)對(duì)初步組裝的基因組進(jìn)行mapping,然后使用samtools(v1.3.1)和比對(duì)結(jié)果對(duì)初步組裝的基因組進(jìn)行位點(diǎn)校正,最后得到糾錯(cuò)后的高精度Contigs。
基因組預(yù)測(cè)和編碼區(qū)分析由AUGUSTUS和GeneMark完成。使用基因組和RNA-Seq數(shù)據(jù)進(jìn)行基因組的結(jié)構(gòu)注釋,分別使用RepeatMasker(Version open-4.0.5)和Tandem Repeats Finder(TRF, Version 4.07b)預(yù)測(cè)散在重復(fù)序列及串聯(lián)重復(fù)序列。
預(yù)測(cè)的基因蛋白序列通過(guò)Diamond與每個(gè)功能數(shù)據(jù)庫(kù)中已知注釋基因的同源性注釋進(jìn)行比對(duì)。首先在NR(Non-Redundant Protein Database)、Pfam和SwissProtS數(shù)據(jù)庫(kù)(BLASTP,e值≤1e-5)中比較預(yù)測(cè)的基因,然后基于KOG(EuKaryotic Orthologous Groups)數(shù)據(jù)庫(kù)、GO(Gene Ontology)數(shù)據(jù)庫(kù)和KEGG(Kyoto Encyclopedia of Genes and Genomes)進(jìn)行分類(lèi)。
使用Diamond對(duì)基因組進(jìn)行碳水化合物活性酶(carbohydrate-active enZYmes,CAZy)注釋。使用BLAST注釋細(xì)胞色素P450(cytochromeP450,CYP450),CYP450是一類(lèi)以血紅素為輔基的超基因家族蛋白,參與機(jī)體的一系列生理生化反應(yīng)[21]。SignalP和TMHMM用于預(yù)測(cè)蛋白質(zhì)序列和綜合篩選分泌蛋白。此外,為了鑒定雅致放射毛霉的毒力或致病性,使用Diamond軟件注釋PHI(Pathogen Host Interactions)數(shù)據(jù)庫(kù)和DFVF(Database of Fungal Virulence Factors)數(shù)據(jù)庫(kù)。
使用AntiSMASH-4.0.2來(lái)預(yù)測(cè)雅致放射毛霉CJ-6基因組的次級(jí)代謝基因簇以了解其代謝真菌毒素的能力。
經(jīng)過(guò)Genebank中的18S rDNA同源序列比較分析,根據(jù)Blast結(jié)果顯示該菌株與雅致放射毛霉(ActinomucorelegansUAMH 10931)同源性達(dá)到100%(附圖1,https://doi.org/10.13995/j.cnki.11-1802/ts.034416),確定該菌株為雅致放射毛霉,將其命名為雅致放射毛霉CJ-6。
應(yīng)用從頭測(cè)序技術(shù)對(duì)雅致放射毛霉CJ-6進(jìn)行基因組測(cè)序,得到2 460 521 894 bp測(cè)序數(shù)據(jù)量,使用SMRT Link v5.1.0軟件進(jìn)行初步組裝后將組裝結(jié)果進(jìn)行比對(duì)評(píng)估,組裝總共得到27個(gè)contigs,總長(zhǎng)度為36 533 736 bp,其中最大的contig長(zhǎng)度為4 995 973 bp,整個(gè)基因組組裝大小約為36.53 Mbp,總GC含量為36.36%,N50長(zhǎng)度為3 043 051 bp。上述結(jié)果表明雅致放射毛霉CJ-6基因組的組裝質(zhì)量較好。
雅致放射毛霉的全基因組包含多個(gè)功能區(qū),使用AUGUSTUS等多種基因預(yù)測(cè)軟件對(duì)編碼基因進(jìn)行預(yù)測(cè)以識(shí)別其基因功能。從頭基因預(yù)測(cè)結(jié)果顯示雅致放射毛霉CJ-6基因組有8 035個(gè)編碼基因。推定的編碼基因占雅致放射毛霉CJ-6基因組的31.35%,主要分布在200~1 700 bp。應(yīng)用RepeatMasker軟件預(yù)測(cè)到6 933個(gè)散在重復(fù)序列,總長(zhǎng)1 234 984 bp,占基因組全長(zhǎng)的3.380 4%;其中長(zhǎng)末端重復(fù)序列和DNA轉(zhuǎn)座子分別占基因全長(zhǎng)的2.783 2%和0.653 2%。在DNA序列中,TRF預(yù)測(cè)到的串聯(lián)重復(fù)序列為7 725個(gè),占基因全長(zhǎng)的1.232 7%,其中包括3 856個(gè)小衛(wèi)星DNA和1 187個(gè)微衛(wèi)星DNA。最后,基因測(cè)序顯示,非編碼RNA(ncRNA)包含264個(gè)tRNA,長(zhǎng)度為19 642 bp。
雅致放射毛霉CJ-6基因功能分析包括功能注釋、效應(yīng)子和致病性分析。使用不同的數(shù)據(jù)庫(kù)對(duì)雅致放射毛霉CJ-6進(jìn)行功能注釋,編碼基因在各個(gè)數(shù)據(jù)庫(kù)中都有注釋到,在NR數(shù)據(jù)庫(kù)中注釋到的基因最多??偣灿? 217個(gè),其次是GO數(shù)據(jù)庫(kù)(5 843個(gè))、KEGG數(shù)據(jù)庫(kù)(3 856個(gè))、KOG數(shù)據(jù)庫(kù)(2 697個(gè))和CAZy數(shù)據(jù)庫(kù)(174個(gè))。
2.3.1 GO數(shù)據(jù)庫(kù)注釋分析
GO數(shù)據(jù)庫(kù)是基因功能描述的分類(lèi)系統(tǒng)。在這個(gè)數(shù)據(jù)庫(kù)中共注釋到5 843個(gè)基因,注釋結(jié)果由細(xì)胞定位(cellular component)、分子功能(molecular function)和生物過(guò)程(biological process)組成(圖2-a)。GO注釋蛋白質(zhì)分類(lèi)顯示,這些蛋白質(zhì)主要富集在“生物過(guò)程”類(lèi)別的“代謝過(guò)程(metabolic process)”和“細(xì)胞進(jìn)程(cellular process)”,以及“分子功能(molecular function)”類(lèi)別中的“催化活性(catalytic activity)”和“綁定(binding)”。結(jié)果表明雅致放射毛霉CJ-6擁有較為旺盛的初級(jí)和次級(jí)代謝過(guò)程,同時(shí)具有對(duì)外界環(huán)境或本身的酶催化活性。
2.3.2 KOG數(shù)據(jù)庫(kù)注釋分析
KOG數(shù)據(jù)庫(kù)是COG(Clusters of Orthologous Groups)數(shù)據(jù)庫(kù)中真核生物的直系同源數(shù)據(jù)庫(kù),可以預(yù)測(cè)蛋白質(zhì)序列的功能,包括25個(gè)功能類(lèi)別。雅致放射毛霉CJ-6基因組在這個(gè)數(shù)據(jù)庫(kù)中共注釋到2 697個(gè)基因,可分為25個(gè)功能。最豐富的類(lèi)別是“轉(zhuǎn)化、核糖體結(jié)構(gòu)和生物合成”、“翻譯后修飾、蛋白質(zhì)周轉(zhuǎn)、伴侶蛋白”、“僅通用功能預(yù)測(cè)”和“信號(hào)轉(zhuǎn)導(dǎo)機(jī)制”,平均注釋到300個(gè)基因。這說(shuō)明雅致放射毛霉可能存在較復(fù)雜的生理生化代謝機(jī)制。同時(shí),涉及“碳水化合物運(yùn)輸和新陳代謝”、“氨基酸運(yùn)輸和代謝”及“脂質(zhì)運(yùn)輸和代謝”的基因相對(duì)豐富。上述結(jié)果表明,雅致放射毛霉CJ-6可能具有較好的碳水化合物、氨基酸和脂質(zhì)代謝能力,這可能有助于在腐乳發(fā)酵期間產(chǎn)生各種風(fēng)味物質(zhì)(圖2-b)。
2.3.3 KEGG代謝途徑注釋的比較分析
通過(guò)KEGG數(shù)據(jù)庫(kù)注釋能夠幫助我們進(jìn)一步掌握雅致放射毛霉CJ-6具有的代謝途徑。功能注釋結(jié)果包括新陳代謝(metabolism)、遺傳信息處理(genetic information processing)、環(huán)境信息處理(environmental information processing)、細(xì)胞過(guò)程(cellular processes)、生物系統(tǒng)(organismal systems)、人類(lèi)疾病(human diseases)。
在KEGG中共注釋到3 856個(gè)基因,被分為40個(gè)功能類(lèi)別。從主要代謝途徑分析來(lái)看,大多數(shù)注釋的基因?qū)儆谔妓衔锎x(carbohydrate metabolism)和氨基酸代謝(amino acid metabolism)類(lèi)別,此外脂類(lèi)代謝(lipid metabolism)類(lèi)別也注釋到較多基因(圖3-a)。腐乳中風(fēng)味物質(zhì)的形成與氨基酸和油脂的降解密切相關(guān),這也在一定程度上說(shuō)明,雅致放射毛霉CJ-6在傳統(tǒng)腐乳生產(chǎn)過(guò)程中對(duì)腐乳風(fēng)味品質(zhì)的形成具有重要作用。
基于雅致放射毛霉CJ-6的氨基酸代謝對(duì)KEGG途徑進(jìn)行了深入的比較分析。與總狀毛霉B9645(全基因組大小:65.53 Mbp)和米曲霉RIB40(全基因組大小:37.91 Mbp)相比,雅致放射毛霉CJ-6(全基因組大小:36.53 Mbp)與氨基酸代謝相關(guān)的基因較少(圖3-b)。雅致放射毛霉CJ-6的氨基酸代謝KEGG注釋結(jié)果顯示,與支鏈氨基酸中的“異亮氨酸、亮氨酸和纈氨酸降解(Val、Leu and Ile degradation)”相關(guān)的基因最多,共注釋到42個(gè)相關(guān)基因,其次是含硫氨酸中的“半胱氨酸和蛋氨酸代謝(Cys and Met metabolism)”,注釋到39個(gè)基因。從圖3-c可以看出,雅致放射毛霉CJ-6和總狀毛霉B9645基因組中氨基酸代謝相關(guān)的基因分布結(jié)構(gòu)較為相似,支鏈氨基酸“Val、Leu and Ile degradation”和含硫氨酸“Cys and Met metabolism”所占比例均較高。而米曲霉RIB40注釋到較多與芳香族氨基酸“酪氨酸代謝(Tyr metabolism)”相關(guān)的基因。
基于脂質(zhì)代謝(lipid metabolism)的KEGG途徑注釋結(jié)果顯示,與脂質(zhì)代謝相關(guān)的KEGG通路共分為8個(gè)類(lèi)別,分別為脂肪酸降解(fatty acid degradation)、甘油酯代謝(glycerolipid metabolism)、甘油磷脂代謝(glycerophospholipid metabolism)、脂肪酸生物合成(fatty acid biosynthesis)、α-亞麻酸代謝(alpha-linolenic acid metabolism)、不飽和脂肪酸的生物合成(biosynthesis of unsaturated fatty acids)、醚酯代謝(ether lipid metabolism)及花生四烯酸代謝(arachidonic acid metabolism),相關(guān)基因的通路ID(pathway ID)及功能描述詳見(jiàn)附表1(https://doi.org/10.13995/j.cnki.11-1802/ts.034416)。3株霉菌中注釋到的與脂質(zhì)代謝相關(guān)的基因數(shù)量位于前3的代謝途徑均為甘油磷脂代謝(glycerophospholipid metabolism)、脂肪酸降解(fatty acid degradation)和甘油酯代謝(glycerolipid metabolism),其中甘油磷脂代謝途徑注釋到的基因數(shù)量最多,雅致放射毛霉CJ-6基因組中注釋到43個(gè)甘油磷脂代謝基因,米曲霉RIB40和總狀毛霉B9645分別注釋到40和79個(gè)基因(圖4-a)。此外,由圖4-b可以看出雅致放射毛霉CJ-6和總狀毛霉B9645基因組中與脂肪代謝相關(guān)的基因結(jié)構(gòu)分布較為相似,這一點(diǎn)與上述氨基酸代謝相關(guān)的基因分布結(jié)果類(lèi)似,這也在一定程度上說(shuō)明,雅致放射毛霉和總狀毛霉在氨基酸和脂質(zhì)代謝方面可能具有相似性。
附表1 雅致放射毛霉CJ-6基因組脂質(zhì)代謝KEGG通路及相關(guān)基因Table S1 Fat metabolism and degradation pathways and related genes in the genome of A. elegans CJ-6
表1 三株霉菌基因組中效應(yīng)子和致病性基因預(yù)測(cè)Table 1 Prediction of effector and pathogenic genes in the genome of three fungi
a-3株霉菌的脂質(zhì)代謝KEGG通路基因數(shù)量;b-3株霉菌的脂質(zhì)代謝KEGG通路基因占比圖4 脂質(zhì)代謝KEGG通路注釋比較分析Fig.4 Comparative analysis of KEGG pathway annotation of lipid metabolism注:圖4-b:縱坐標(biāo)為各脂質(zhì)代謝通路中所注釋到的基因數(shù)量占各菌株中脂質(zhì)代謝通路總基因數(shù)量的比例,橫坐標(biāo)為脂質(zhì)代謝類(lèi)別。
2.3.4 CAZymes
CAZymes數(shù)據(jù)庫(kù)是一個(gè)酶數(shù)據(jù)庫(kù)資源,根據(jù)其功能將CAZymes分為糖苷水解酶(glycoside hydrolases, GHs)、糖基轉(zhuǎn)移酶(glycosyl transferases, GTs)、多糖裂解酶(polysaccharide lyases, PLs)、糖酯酶(carbohydrate esterases, CEs)和氧化還原酶(auxiliary activities, AAs)五大類(lèi)及一個(gè)碳水化合物結(jié)合結(jié)構(gòu)域(carbohydrate binding domain,CBMs)[22]。
在雅致放射毛霉CJ-6基因組中共預(yù)測(cè)到159個(gè)潛在的碳水化合物活性酶及酶編碼基因,分布在61個(gè)CAZy蛋白家族中,包含69個(gè)GHs、65個(gè)GTs、8個(gè)AAs、15個(gè)CEs和2個(gè)PLs。同時(shí),還預(yù)測(cè)到了11個(gè)蛋白家族中24個(gè)推定的CBM酶編碼基因(圖5-a)。可以看出,3株霉菌均在GHs和GTs類(lèi)別注釋到的基因數(shù)量最多(圖5-a),其中米曲霉RIB40的GHs基因占比達(dá)到54.26%。GH是一種水解糖苷鍵的酶,在生物體內(nèi)糖和糖綴合物的水解和合成中起著不可替代的作用;GT負(fù)責(zé)磷酸激活的糖供體中糖苷鍵的生物合成。從圖5-a還可以看出,雅致放射毛霉CJ-6和總狀毛霉B9645基因組中碳水化合物活性酶的基因結(jié)構(gòu)在整體上較為相似,這可能是雅致放射毛霉和總狀毛霉成為腐乳發(fā)酵常用菌種的原因之一。
a-5種碳水化合物活性酶家族基因總體分布;b-碳水化合物活性酶亞家族基因分布圖5 三株霉菌中碳水化合物活性酶基因注釋分析Fig.5 Annotation analysis of CAZymes genes in three fungi
由圖6可知,雅致放射毛霉注釋到的碳水化合物活性酶基因總數(shù)最少,其中最高有12個(gè)基因?qū)儆贕H18家族,包括幾丁質(zhì)酶(EC3.2.1.14)、溶菌酶(EC3.2.1.17)、內(nèi)-β-N-乙酰氨基葡萄糖酶(EC3.2.1.96)、內(nèi)β肽聚糖水解酶-N-乙酰氨基葡萄糖酶特異性(EC3.2.1.-)、Nod因子水解酶(EC3.2.1.-)等。在GT家族中,GT15和GT49家族均注釋到8個(gè)基因,包含糖脂2-α-甘露糖基轉(zhuǎn)移酶(EC2.4.1.131)、GDP-Man:α-1,2-甘露糖基轉(zhuǎn)移酶(EC2.4.1.-)、β-1,3-N-乙酰氨基葡萄糖基轉(zhuǎn)移酶(EC2.4.1.-)。米曲霉RIB40的CAZymes家族中GH3亞家族基因數(shù)量最高,而總狀毛霉B9645則是GT2亞家族基因數(shù)量最多。3株霉菌具有不同的CAZymes家族基因,雅致放射毛霉CJ-6特有的CAZYmes家族基因包括AA2、AA5、CBM18、CBM19、CBM20、CBM43、CE2、CE6、GH5、GH8、GH13、PL14亞家族(圖5-b)。上述結(jié)果說(shuō)明,雅致放射毛霉、米曲霉和總狀毛霉主要是依賴(lài)GH和GT家族基因來(lái)利用碳源,且3種霉菌利用碳源的能力存在一定差異,這可能與菌株的特性有關(guān)。
a-雅致放射毛霉CJ-6次級(jí)代謝基因簇及基因數(shù)量;b-3株霉菌次級(jí)代謝產(chǎn)物合成基因簇的比較分析圖6 真菌次級(jí)代謝基因簇分析Fig.6 Analysis of secondary metabolic gene clusters in fungi
2.3.5 分泌蛋白和毒力相關(guān)蛋白
使用生物信息學(xué)分析方法,從雅致放射毛霉CJ-6的8 035個(gè)編碼基因中預(yù)測(cè)到276個(gè)分泌蛋白。PHI數(shù)據(jù)庫(kù)是一個(gè)病原體-宿主相互作用的基因數(shù)據(jù)庫(kù),涵蓋許多致病基因。使用Blast序列相似性搜索功能將雅致放射毛霉CJ-6基因組中的全部序列和PHI數(shù)據(jù)庫(kù)進(jìn)行比對(duì),全基因組的8 035個(gè)編碼基因中注釋到與病原體PHI表型突變類(lèi)型相關(guān)的基因數(shù)目有831個(gè)(10.34%),在總狀毛霉B9645和米曲霉RIB40中各預(yù)測(cè)到1 555(12.22%)和1 258個(gè)(15.48%)。細(xì)胞色素P450酶參與各種內(nèi)源性或外源性化合物的代謝,并且通常參與絲狀真菌的各種次級(jí)代謝產(chǎn)物的合成,與真菌的致病性也密切相關(guān)。在細(xì)胞色素P450酶數(shù)據(jù)庫(kù)上進(jìn)行Blast同源性搜索,注釋到雅致放射毛霉CJ-6基因組中與細(xì)胞色素P450酶相關(guān)的45個(gè)基因。DFVF數(shù)據(jù)庫(kù)是一個(gè)已知真菌毒力因子的綜合數(shù)據(jù)庫(kù),收集了來(lái)自85個(gè)屬的228種真菌攜帶的2 058個(gè)致病因子基因。在DFVF數(shù)據(jù)庫(kù)中注釋到411個(gè)雅致放射毛霉CJ-6的編碼基因,其中245個(gè)編碼基因的氨基酸序列能在DFVF數(shù)據(jù)庫(kù)中得到具體的基因和其相對(duì)應(yīng)的功能注釋信息,而在米曲霉RIB40和總狀毛霉B9645中注釋到相對(duì)較多的致病因子基因,分別有459和646個(gè)(表1)。
2.3.6 次級(jí)代謝產(chǎn)物合成基因簇分析
雅致放射毛霉是食品工業(yè)應(yīng)用中的重要微生物,針對(duì)雅致放射毛霉在發(fā)酵過(guò)程中可能存在的安全性隱患,主要分析了雅致放射毛霉真菌毒素相關(guān)的代謝產(chǎn)物合成情況。
在雅致放射毛霉基因組中預(yù)測(cè)到11個(gè)次級(jí)代謝產(chǎn)物合成基因簇(圖6-a)。與米曲霉RIB40相比,雅致放射毛霉CJ-6基因組中僅預(yù)測(cè)到了4種類(lèi)型的次級(jí)代謝基因簇,即Terpene(萜烯類(lèi))、非核糖體肽合成酶(non-ribosomal peptide synthetase, NRPS)、Siderophore(鐵載體)及other,沒(méi)有預(yù)測(cè)到聚酮合成酶(polyketide synthase, PKS)途徑和PKS-NRPS混合代謝途徑,這2種途徑是大部分真菌毒素合成的關(guān)鍵代謝途徑(圖6-b)。雅致放射毛霉CJ-6基因組中預(yù)測(cè)到的次級(jí)代謝產(chǎn)物合成基因簇大多屬于Terpene基因簇(cluster3、cluster4、cluster6、cluster7、cluster8、cluster9、cluster11),其中比對(duì)到41個(gè)基因,也有部分屬于NRPS、Siderophore 和other類(lèi)基因簇,分別為 cluster10、cluster1、cluster2 和 cluster5,在三類(lèi)基因簇中比對(duì)到的基因數(shù)分別為10個(gè)、3個(gè)和19個(gè)(圖6-b)。
功能注釋分析表明,雅致放射毛霉CJ-6具有復(fù)雜的代謝特性,尤其氨基酸和脂肪代謝途徑在腐乳風(fēng)味的形成過(guò)程中不可或缺。有研究表明,作為氨基酸代謝途徑之一的轉(zhuǎn)氨反應(yīng)是微生物將氨基酸轉(zhuǎn)化為風(fēng)味物質(zhì)的關(guān)鍵步驟[23],且支鏈氨基酸(leucine, isoleucine and valine)、含硫氨酸(cysteine and methionine)和芳香族氨基酸(phenylalanine, tyrosine tryptophan)是香氣化合物的主要前體?;诎被岽x的雅致放射毛霉CJ-6 KEGG代謝途徑分析結(jié)果表明,與支鏈氨基酸中的“(Val、Leu and Ile degradation)”相關(guān)的基因最多,其次是含硫氨酸中的“(Cys and Met metabolism)”。支鏈氨基酸可降解生成3-甲基丁醛、2-甲基丁醛、2-甲基乙醛及相應(yīng)的醇,含硫氨酸降解可產(chǎn)生揮發(fā)性物質(zhì)如吲哚、氨、硫化氫等,對(duì)構(gòu)成腐乳的特征風(fēng)味有著重要作用。這可能是總狀毛霉和雅致放射毛霉常用于腐乳發(fā)酵工業(yè)的原因。
脂類(lèi)是腐乳中僅次于蛋白質(zhì)的第二大類(lèi)化合物,同時(shí)脂類(lèi)的分解也在腐乳風(fēng)味形成方面發(fā)揮著重要的作用。其中甘油三酯和磷脂能分解成游離脂肪酸、甘油二酯、甘油一酯及甘油,游離脂肪酸是甲基酮、直鏈醛、內(nèi)酯、酯和S-硫酯的前體,這些風(fēng)味芳香化合物是腐乳風(fēng)味形成的關(guān)鍵物質(zhì)[24]?;谥敬x降解的KEGG途徑分析結(jié)果表明,雅致放射毛霉CJ-6中有較多甘油磷脂和甘油酯代謝基因,這在一定程度上說(shuō)明雅致放射毛霉CJ-6在將脂肪轉(zhuǎn)化為風(fēng)味化合物方面有較高潛力。
次級(jí)代謝產(chǎn)物合成基因簇分析表明,雅致放射毛霉CJ-6基本不具有合成真菌毒素的能力。目前的真菌毒素有400多種,有的毒素?fù)碛型瑯踊蝾?lèi)似的合成途徑和關(guān)鍵基因。合成途徑主要包括PKS、NRPS、PKS-NRPS混合代謝、萜類(lèi)化合物代謝、氨基酸相關(guān)代謝等,分析這些代謝途徑及其關(guān)鍵基因,就有可能在基因水平上了解微生物是否具有合成真菌毒素的潛力。一些目前已知的真菌毒素是由萜烯類(lèi)代謝產(chǎn)生的,如單端孢霉烯族毒素(trichothecenes)。在雅致放射毛霉基因組中注釋到41個(gè)萜烯類(lèi)基因簇的基因,在KEGG代謝途徑中,與萜類(lèi)化合物代謝相關(guān)的基因僅注釋到3個(gè),且分布在不同的代謝途徑中,在萜類(lèi)化合物代謝途徑中并沒(méi)有注釋到相對(duì)完整的代謝途徑基因,可認(rèn)為不具有合成該物質(zhì)的能力。我們?cè)谘胖路派涿笴J-6的基因組中沒(méi)有比對(duì)到細(xì)菌、真菌中已報(bào)道的真菌毒素關(guān)鍵合成酶,說(shuō)明在雅致放射毛霉中基本不存在PKS及PKS-NRPS混合代謝合成的相關(guān)基因及代謝途徑,僅注釋到少量NRPS相關(guān)基因。結(jié)果表明,雅致放射毛霉不具有合成這些真菌毒素的能力,這可能也解釋了為什么在許多雅致放射毛霉發(fā)酵的腐乳中沒(méi)有檢測(cè)到真菌毒素。微生物基因組不僅包含與物種穩(wěn)定遺傳和進(jìn)化多樣性相關(guān)的編碼基因這種功能區(qū)域,同時(shí)也有許多重要的非編碼區(qū)也參與調(diào)控生物體的各個(gè)方面?;诨蛐蛄械姆治鰹槲覀兲剿魑⑸锏亩鄻有?、生存環(huán)境的適應(yīng)性及其復(fù)制、轉(zhuǎn)錄和翻譯提供了詳細(xì)的遺傳信息[25]。
本文利用從頭測(cè)序技術(shù)對(duì)雅致放射毛霉CJ-6進(jìn)行了全基因組測(cè)序、組裝及基因功能注釋,并結(jié)合其他2種已公開(kāi)霉菌(米曲霉RIB40和總狀毛霉B9645)的全基因組數(shù)據(jù)進(jìn)行比較基因組學(xué)分析,以了解該菌株產(chǎn)生毒素的潛在能力,并驗(yàn)證其在腐乳生產(chǎn)工業(yè)中的安全性。我們從基因水平初步分析了雅致放射毛霉CJ-6的代謝途徑和安全性,為進(jìn)一步分析其次級(jí)代謝產(chǎn)物和調(diào)控其在腐乳發(fā)酵中的風(fēng)味形成奠定了理論基礎(chǔ)。然而,僅通過(guò)比較基因組學(xué)分析還不能徹底發(fā)掘雅致放射毛霉在腐乳發(fā)酵中的作用,需要進(jìn)一步的分析如轉(zhuǎn)錄組學(xué)、基因敲除等研究方法來(lái)確定雅致放射毛霉的關(guān)鍵基因,從而明確其代謝機(jī)制,以便我們能將其更徹底地運(yùn)用到腐乳發(fā)酵工業(yè)中。