• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      白酒微生物群落研究技術(shù)現(xiàn)狀與二代測序數(shù)據(jù)分析方略

      2016-08-03 01:24:40汪地強(qiáng)王和玉閆松顯貴州茅臺酒股份有限公司技術(shù)中心貴州仁懷564501
      釀酒科技 2016年7期
      關(guān)鍵詞:白酒

      趙 亮,王 莉,汪地強(qiáng),王和玉,閆松顯(貴州茅臺酒股份有限公司技術(shù)中心,貴州仁懷564501)

      白酒微生物群落研究技術(shù)現(xiàn)狀與二代測序數(shù)據(jù)分析方略

      趙亮,王莉,汪地強(qiáng),王和玉,閆松顯
      (貴州茅臺酒股份有限公司技術(shù)中心,貴州仁懷564501)

      摘要:白酒釀造實質(zhì)上是微生物消長演替、代謝產(chǎn)物積累變化的過程,要搞清白酒本質(zhì),必須從微生物著手。微生物在酒醅發(fā)酵過程中以群體方式發(fā)揮作用,準(zhǔn)確解析微生物群落構(gòu)成及演替模式既是闡明白酒產(chǎn)量、質(zhì)量的前提,也是進(jìn)一步研究微生物功能及代謝的基礎(chǔ)。針對各類微生物群落研究技術(shù)在白酒領(lǐng)域使用現(xiàn)狀,對國內(nèi)外研究報道做系統(tǒng)分析,發(fā)現(xiàn)純培養(yǎng)以及不可培養(yǎng)DGGE/TGGE是目前研究白酒微生物群落的主流技術(shù),而對微生物群落揭示較全面、系統(tǒng)的二代測序技術(shù)使用相對較冷,僅在外文期刊中報道相對較多。其次,通過應(yīng)用現(xiàn)狀成因分析,認(rèn)為大多數(shù)研究者對測序數(shù)據(jù)的理解和分析水平不足是造成目前二代測序使用現(xiàn)狀的主要原因?;诖?,對測序后反饋的重要結(jié)果做系統(tǒng)解釋,并提出5類分析微生物群落的重要多元統(tǒng)計方法以及各類方法分析策略與使用方案,旨在為白酒微生物群落研究者提供可行性高、參考性強(qiáng)的二代測序數(shù)據(jù)分析方略。

      關(guān)鍵詞:白酒; 二代測序; 微生物多樣性; 多元統(tǒng)計方法; 釀酒微生物

      白酒作為我國傳統(tǒng)發(fā)酵食品,歷史悠久,長期受到人民大眾的喜愛。中國傳統(tǒng)白酒,是以富含淀粉質(zhì)的糧谷類為原料,并輔以大曲作糖化發(fā)酵劑,采用固態(tài)、半固態(tài)或液態(tài)發(fā)酵技術(shù),經(jīng)蒸餾、貯存以及勾調(diào)過程釀制而成的含酒精飲料[1],被列為世界著名六大蒸餾酒之一。結(jié)合白酒生產(chǎn)工藝可知,白酒釀造過程實質(zhì)上是相關(guān)微生物經(jīng)歷消長演替,代謝產(chǎn)物變化積累的過程。這些相關(guān)微生物統(tǒng)稱白酒微生物,既包括自然接種的天然微生物,也包括人工選育的純種微生物;既包括糖化菌、發(fā)酵菌等有益微生物,也包括導(dǎo)致苦味和酸敗的有害菌[2]。

      要解析白酒本質(zhì),必須從白酒微生物研究入手。微生物在白酒發(fā)酵中是以群體的方式發(fā)揮作用,因而準(zhǔn)確解析白酒微生物群落既是闡明白酒產(chǎn)量與質(zhì)量的前提,也是進(jìn)一步研究微生物功能及代謝變化的重要基礎(chǔ)。微生物群落研究,亦即微生物生態(tài)研究,主要揭示微生物在被研究環(huán)境(環(huán)境在這里特指微生物群落的棲息場所,如土壤、酒醅、大曲、水體、動植物組織等)內(nèi)的多樣性,以及微生物與環(huán)境、微生物之間相互作用關(guān)系,微生物如何維持在環(huán)境中特有的多樣性水平。據(jù)此,微生物生態(tài)研究目前大致分為兩個領(lǐng)域:①微生物多樣性領(lǐng)域,包括對環(huán)境內(nèi)各微生物組分進(jìn)行系統(tǒng)分類鑒定、定量,以及對微生物群落構(gòu)成多樣化進(jìn)行衡量;②微生物活性領(lǐng)域,包括微生物區(qū)系(適應(yīng)環(huán)境,并可在環(huán)境中正常生長繁殖的主要微生物組成的群落結(jié)構(gòu))研究,對環(huán)境理化特征產(chǎn)生影響或維持環(huán)境內(nèi)特定微生物多樣性水平的主要群落結(jié)構(gòu)研究,同時包括微生物與微生物、微生物與環(huán)境間生態(tài)響應(yīng)關(guān)系的研究[3]。

      微生物群落研究至今,其遺傳信息獲取技術(shù)大體包括[4-6]:①傳統(tǒng)微生物純培養(yǎng)法;②以PCR為基礎(chǔ)的微生物指紋圖譜法:主要包括DGGE/TGGE、AFLP、SSCP、RFLP、RAPD、Q-PCR、T-RFLP;③核酸探針雜交技術(shù):主要包括FISH、生物芯片;④磷脂脂肪酸法(PLFA);⑤Biolog微平板法;⑥宏基因組測序法。白酒微生物群落的信息獲取與分析,同樣依賴上述6類技術(shù)手段。本文將進(jìn)行以下研究:(1)通過文獻(xiàn)搜集統(tǒng)計,分析白酒微生物群落研究技術(shù)現(xiàn)狀;(2)針對近年來逐漸成為微生物群落研究主流的前沿技術(shù)——第二代測序技術(shù)(又稱宏基因組或高通量測序技術(shù)),剖析其在白酒微生物生態(tài)領(lǐng)域的應(yīng)用現(xiàn)狀及前景;(3)針對第二代測序技術(shù)的應(yīng)用,提出研究者如何通過商業(yè)測序公司返回的測序數(shù)據(jù)分析結(jié)果,合理利用、解釋自己的研究內(nèi)容,并根據(jù)國際上分析微生物生態(tài)數(shù)據(jù)較為主流的統(tǒng)計方法,針對白酒微生物群落高通量數(shù)據(jù)的深度挖掘給予相關(guān)建議。

      1 白酒微生物群落研究技術(shù)現(xiàn)狀

      1.1文獻(xiàn)統(tǒng)計

      為盡可能全面獲得白酒微生物群落研究信息,筆者分別以“白酒”“大曲”“酒醅”為搜索關(guān)鍵詞,結(jié)果如圖1所示,從中國學(xué)術(shù)期刊全文數(shù)據(jù)庫(CNKI)篩查到與微生物群落研究內(nèi)容相關(guān)的文獻(xiàn)報道58篇,分別出自13類中文學(xué)術(shù)期刊,其中《釀酒科技》文章刊登量最多,占篩查文獻(xiàn)總數(shù)的50%(29/58)。同樣,筆者以Chinese liquor、Daqu、Fermented grains為搜索關(guān)鍵詞,通過SCI科學(xué)引文索引數(shù)據(jù)庫(Web of Science)篩查到85篇相關(guān)文獻(xiàn),分別出自20類外文學(xué)術(shù)期刊,其中J I Brewing和World J Microb Biot文獻(xiàn)產(chǎn)出量最高,分別占篩查文獻(xiàn)總數(shù)的16.5%(14/85)和12.9%(11/85)。根據(jù)中文、外文篩查文獻(xiàn)總數(shù)顯示,白酒微生物群落研究目前正處于發(fā)展階段,文獻(xiàn)報道量不高,且期刊分布類型較少。此外,外文文獻(xiàn)多數(shù)發(fā)表于影響力(Impact factor)偏低的期刊,微生物學(xué)科權(quán)威性期刊,以及高影響力綜合性期刊幾乎沒有白酒微生物群落研究的報道。根據(jù)我們對環(huán)境微生物領(lǐng)域發(fā)表文章的水平評估發(fā)現(xiàn),期刊影響力越高,文章中涉及的微生物信息獲取方法越先進(jìn),并且后期生物信息分析深度、嚴(yán)密,所得結(jié)論可靠性強(qiáng)。

      圖1 白酒微生物群落研究文章發(fā)表統(tǒng)計

      1.2白酒微生物群落研究技術(shù)概況

      為直觀反映微生物群落研究技術(shù)在白酒領(lǐng)域應(yīng)用現(xiàn)狀,我們對各類技術(shù)方法發(fā)表于圖1中各期刊的頻率做匯總,并以期刊名與技術(shù)方法作響應(yīng)變量,發(fā)表頻率作解釋變量,進(jìn)行對應(yīng)分析(Correspondence analysis,CA)并生成雙標(biāo)圖(圖2)。圖2中各圓代表不同研究技術(shù),圓面積表示此技術(shù)使用頻率,面積越大,使用頻率越高,反之越低;圓與期刊名在圖中距離越近,表示發(fā)表于該期刊文章使用此技術(shù)的相對頻率越高;圓越靠近坐標(biāo)原點,表明此技術(shù)越普及。由圖2可知,國內(nèi)文獻(xiàn)多采用純培養(yǎng)、DGGE、以及Biolog技術(shù)分析白酒微生物群落,特別是純培養(yǎng)技術(shù)的應(yīng)用在國內(nèi)文獻(xiàn)的占比與普及程度最高。相對于此,其他一些技術(shù)如PLFA和PCR-SSCP,分別與中國釀造、四川理工學(xué)院學(xué)報在圖中距離最近,說明兩類技術(shù)僅分別在這兩種期刊文獻(xiàn)中較常使用,在其他期刊文獻(xiàn)中很少或不被使用。國外SCI文獻(xiàn)中,DEEG技術(shù)使用頻率和普及程度最高,二代測序技術(shù)普及程度次之,但使用頻率略低于Q-PCR與純培養(yǎng)技術(shù)。通過整體對照發(fā)現(xiàn),純培養(yǎng)技術(shù)無論在國內(nèi)或國際文獻(xiàn)中使用頻率均高,這與微生物在白酒釀造中實際應(yīng)用有關(guān)。以DGGE、Q-PCR、二代測序和克隆文庫測序為代表的非培養(yǎng)技術(shù),DGGE無論使用率和普及程度在國內(nèi)外文獻(xiàn)中均占一席之地,這可能與DGGE技術(shù)使用成本低廉、群落中不可培養(yǎng)優(yōu)勢微生物分離效果較好有關(guān)。然而,從微生物群落研究現(xiàn)階段發(fā)展來看,二代測序技術(shù)無疑是揭示環(huán)境微生物群落成分及結(jié)構(gòu)最理想手段,但此技術(shù)僅在國際期刊文獻(xiàn)中有一定程度普及,且使用頻率并非最高。針對此現(xiàn)象,我們認(rèn)為潛在原因有兩點:(1)二代測序技術(shù)成本偏高,市場單價隨測序樣本量大小以及測序公司不同基本在每樣400~700元之間浮動,此外,一項研究需要較大樣本量才能滿足此類研究對數(shù)據(jù)統(tǒng)計的嚴(yán)格需求,以致總體研究成本偏高;(2)實驗室經(jīng)費充足,但對二代測序技術(shù)了解不足,面對測序公司返回結(jié)果無力適從,多數(shù)情況僅能以測序公司返回的初級結(jié)果支撐文章論點,導(dǎo)致研究成果無法在權(quán)威性強(qiáng)、高影響力的雜志發(fā)表。本文后續(xù)內(nèi)容將針對潛在原因2,深入探討二代測序反饋結(jié)果中可能涉及到的幾類重要多樣性指數(shù)意義、以及如何借助多元統(tǒng)計分析對反饋數(shù)據(jù)做進(jìn)階挖掘,以獲得準(zhǔn)確度高、生物學(xué)意義充實的研究結(jié)論。

      圖2 對應(yīng)分析雙標(biāo)圖展示不同研究技術(shù)在各期刊文獻(xiàn)使用頻度

      2 二代測序數(shù)據(jù)分析策略

      2.1測序平臺與反饋數(shù)據(jù)簡介

      目前二代測序的主要平臺代表有Illumina公司的Solexa基因組分析儀(Illumina Genome Analyzer)、羅氏公司(Roche)的454測序儀(Roch GS FLX sequencer)和ABI的SOLiD測序儀(ABI SOLiD sequencer)。微生物多樣性分析中,以Illumina及454測序平臺應(yīng)用最為廣泛。各平臺測序原理已有報道做系統(tǒng)探討[7-8],在此不加贅述。測序公司對微生物總DNA樣品完成可變區(qū)PCR擴(kuò)增—建庫—上機(jī)測序—數(shù)據(jù)收集及質(zhì)控—數(shù)據(jù)分析等一系列工作后,將結(jié)果返給客戶。因測序公司不同,返回結(jié)果在形式及細(xì)節(jié)上存在較大區(qū)別,但核心內(nèi)容無外乎4個方面:①序列數(shù)據(jù):包含命名為“rawdata”和“cleandata”2個文件夾,前者存放下機(jī)后原始序列文本,后者存放原始序列經(jīng)質(zhì)量控制后可用序列文本,后續(xù)分析均基于“cleandata”文件內(nèi)容完成;②OTU數(shù)據(jù):主要包含兩類信息,其一是以樣本名為列變量,OTU名(OTU通常命名為Denovoi,i=1,2,3,...,OTU總數(shù)n)為行變量的n×p矩陣,矩陣變量為每個OTU在各樣本中序列數(shù)(reads),矩陣第p列為各行OTU對應(yīng)從界到屬系統(tǒng)分類信息(能鑒定到種的會延伸至種);其二是每個OTU代表序列(以序列長度最長,質(zhì)量最好的序列作為代表序列),通常以fasta格式存放;③多樣性指數(shù):包括α、β兩種多樣性指數(shù),通常以excel表格文件存放;④相對豐度分布表:通常給出從界到屬(L1—L6,能鑒定到種的延伸至種L7)各分類水平下相對豐度表,每個分類水平對應(yīng)一個相對豐度表。除此之外,不同測序公司會基于上述結(jié)果②—④為客戶免費提供某些進(jìn)階分析服務(wù),如組間差異性分析,繪制系統(tǒng)進(jìn)化樹、相對豐度熱圖、相對豐度柱狀堆積圖、面積圖、樣本或組間共享OTU數(shù)目的Venn圖等。

      2.2多樣性指數(shù)

      經(jīng)查閱眾多相關(guān)文獻(xiàn)發(fā)現(xiàn),針對多樣性指數(shù)的生物學(xué)解釋及剖析通常作為首要內(nèi)容位于文段前部,已成為構(gòu)架文章主體不可或缺的內(nèi)容。另外,文章重要結(jié)論的產(chǎn)出和后續(xù)內(nèi)容的延伸均需要此部分內(nèi)容做支撐。因而,筆者需要對多樣性指數(shù)做一重點討論。

      各測序公司在返給客戶的結(jié)果中會提供α、β兩類多樣性指數(shù)[8],α多樣性指數(shù)原意為生境內(nèi)多樣性指數(shù),此處可理解為樣品OTU組成多樣性,如果樣品有分組,組內(nèi)各樣品將整合計算,得出組內(nèi)OTU組成多樣性。β多樣性指數(shù)原意為沿環(huán)境梯度不同生境群落之間物種組成的相異性或物種沿環(huán)境梯度的更替速率,此處可理解為樣品間或組間OTU組成差異度。通常測序公司會利用Mothur[9]http://www.mothur.org/或Qiime[10]http://qiime.org/軟件計算出Shannon-Wiener、Simpson、Chao1、ACE和PD 5種指數(shù)衡量α多樣性。Shannon-Wiener指數(shù)借助信息論原理,用于衡量樣本或組內(nèi)下一條采集序列OTU歸屬不確定程度,不確定程度越高,多樣性水平越高。Simpson指數(shù)表示樣本或組內(nèi)隨機(jī)抽取2條序列屬于不同OTU的概率,概率越大多樣性水平越高;Chao1指數(shù)是利用僅包含1條和2條序列的OTU數(shù)、結(jié)合觀察到的OTU數(shù),估計樣本或組內(nèi)OTU總數(shù);ACE與Chao1類似,也是用于估計樣本或組內(nèi)OTU總數(shù)的指數(shù),但算法與Chao1不同,ACE主要借助稀疏OTU數(shù)結(jié)合觀察到的OTU數(shù)估計OTU總數(shù)。一般默認(rèn)序列數(shù)小于或等于10 的OTU為稀疏OTU,用戶也可根據(jù)分析要求自己定義稀疏OTU序列數(shù)閾值。PD指數(shù)的“PD”取自“Phylogenetic diversity”兩個單詞首字母,意指系統(tǒng)進(jìn)化多樣性指數(shù)。它在估計樣本或組內(nèi)多樣性水平時,重點衡量不同OTU間整體親緣度,PD越高,OTU間整體親緣度越遠(yuǎn)。β多樣性主要利用Bray-Curits和UniFrac兩類距離矩陣[11-12]衡量,距離越大說明多樣性越高。Bray-Curits距離主要衡量樣本間或組間OTU成分差異度,距離越大,差異度越高;UniFrac距離主要衡量樣本間或組間OTU平均親緣度,距離越大,親緣度越遠(yuǎn)。同時,兩類矩陣又分加權(quán)(Weighted)和不加權(quán)(Unweighted)兩種,具體差異見表1。

      表1 兩類距離矩陣算法差異

      2.3數(shù)據(jù)多元統(tǒng)計方法

      使用多元統(tǒng)計處理測序后數(shù)據(jù),旨在挖掘群落間隱藏或預(yù)判的相互關(guān)系和組成模式,以及與這種關(guān)系或模式存在因果聯(lián)系的影響因素。以R[13]https://www.r-project.org/或Canoco[14]軟件分析為例,需要以樣本名作行變量,即每一個樣本代表一個群落,物種名作列變量構(gòu)建一套群落分析表,表中數(shù)值為物種序列讀數(shù)或相對豐度,形式如表2。物種在這里泛指OTU或各種分類名,如在綱水平解析群落,物種名即為不同綱名。若假設(shè)分析群落存在一定分布模式,或群落分布受某些環(huán)境梯度影響,需要再構(gòu)建一套用于解釋群落的環(huán)境變量表,此表行變量為樣本名,且在表中順序必須與群落分析表中行變量順序一致,列變量為分組名及其他環(huán)境變量名,制表形式如表4。這兩套表格的構(gòu)建可完成后續(xù)如聚類、排序、差異性、判別、回歸及相關(guān)性5大類分析。如表4內(nèi)容所示,這些分析可幫助我們?nèi)胬斫忉劸莆⑸锶郝錁?gòu)成、演替、以及與環(huán)境間相互作用規(guī)律。下文將針對表4內(nèi)容,對5大類分析的使用作逐一討論。

      表2 群落分析表表格樣式

      表3 環(huán)境變量表表格樣式

      2.3.1聚類分析

      聚類分析是利用列變量在行變量間變異程度,主要以樹圖形式表示行變量間相似或非相似度水平。如此,越相似的行變量,在圖形中越被聚攏靠近;反之,則相互遠(yuǎn)離。在這種趨勢推動下,行變量將在一定尺度被聚集成多個組群。如表4所示,聚類分析方法眾多,但分析過程與分析結(jié)果的解讀方式基本一致(K-mean clustering除外)。以微生物群落研究最常用的聚類法UPGMA為例,Bokulich等將屬于Chardonnay musts的數(shù)據(jù)集抽離出來,構(gòu)成如表2形式數(shù)據(jù)集,并結(jié)合每個OTU代表序列,構(gòu)建樣本間weighted UniFrac距離,基于此距離利用UPGMA法對樣本聚類,生成聚類圖Fig.1A,后經(jīng)探索分析,發(fā)現(xiàn)聚群模式主要由樣本采集區(qū)域不同而產(chǎn)生。樣本在聚類樹圖中的聚群方式和類群數(shù)目會隨研究者定義的相似度或非相似度尺度的不同而異。至于樣本在何種尺度聚群,研究者需要分析探索,通常聚群方式是否最佳,要看此方式是否能得到最有力的生物學(xué)解釋。如Bokulich等[61]在Fig.1A中確定的聚群方式可被采樣區(qū)域的不同所解釋。聚類分析是針對樣本組群分析中運算最簡單的方法,其缺陷在于研究者無法從中直接獲得樣本最佳組群數(shù)及聚群模式,因而在微生物群落分析中僅充當(dāng)探索性工具使用。

      2.3.2判別分析

      研究者在分析群落數(shù)據(jù)時,通常認(rèn)為樣本可能會因群落成分差異而劃分成多個組群,而這個組群的形成必然與實驗設(shè)計有關(guān)。如取自窖內(nèi)的酒醅樣本分別來源于3個不同發(fā)酵時期,研究者會設(shè)想屬于同一發(fā)酵時期的樣本具有較高微生物群落相似度,以致樣本會形成3個組群,分別對應(yīng)不同發(fā)酵時期。判別分析的作用在于評測這種假設(shè)群的準(zhǔn)確度;同時假設(shè)群一旦成立,分析生成的判別模型可對新樣本做判斷歸類,另外可為研究者找出推動各樣本被歸于各假設(shè)群的重要變量。實際分析時,群落分析表2作解釋變量,表3任一列分組模式,即假設(shè)組作響應(yīng)變量。表4羅列出5種常規(guī)分析使用時各有側(cè)重,DAPC和CAPDA側(cè)重分析假設(shè)組準(zhǔn)確性,CAPDA可專門針對距離或相似度矩陣做判別分析,若行變量(樣本數(shù))過多,計算時間相對較長。Rf同時具備分析假設(shè)組準(zhǔn)確性及找出相對重要物種的作用,且特別適合大數(shù)據(jù)集分析。但要得到準(zhǔn)確率較高的結(jié)果,研究者需要對此方法具備一定實用經(jīng)驗。LDA effect size和CDA側(cè)重尋找相對重要物種,兩類分析適合在樣本量適中或較小的情況下使用。實際分析時,需要根據(jù)自己的研究目的及數(shù)據(jù)特征,從中選取幾種方法配合使用。

      表4 5大類多元統(tǒng)計分析內(nèi)容描述

      2.3.3排序分析

      排序分析是微生物群落研究主流分析方法。樣本間或物種間關(guān)系可能在PCA、CA、NMDS、PCoA、DCA分析中得到一定展示,但促使這種關(guān)系形成的環(huán)境梯度不在此排序分析中直接體現(xiàn),需要利用樣本或物種的重要排序軸(通常為前2個排序軸)得分與相應(yīng)的環(huán)境變量建立聯(lián)系,方可表現(xiàn)物種或樣本分布受環(huán)境梯度的影響趨勢,因而此類排序也被稱為間接梯度排序。與此相對,物種或樣本分布與環(huán)境梯度的關(guān)系可在RDA、db-RDA、CCA、DCCA分析中被直接體現(xiàn),故此類排序又被稱為直接梯度排序。兩類排序具體算法本文不做贅述,研究者可通過表4及圖3了解兩類排序法的區(qū)別及使用策略。幾種直接梯度排序法分析目的及解釋途徑基本相同,至于選取哪種排序法最佳,可利用DCA分析對表2排序。DCA第一梯度軸長小于3,建議使用線性模型排序法RDA或db-RDA;軸長大于4建議使用單峰模型排序法CCA或DCCA;軸長介于3-4,線性模型或單峰模型排序法均可使用。

      續(xù)表4 5大類多元統(tǒng)計分析內(nèi)容描述

      圖3 排序法使用關(guān)系流程

      2.3.4相關(guān)性及回歸分析

      兩類分析既有聯(lián)系又有區(qū)別。解決兩個一元數(shù)值型變量間直線相關(guān)性問題,可使用相關(guān)性分析,Kendall和Spearman秩相關(guān)性分析可針對解決數(shù)值分布非正態(tài)分布或分布模式未知的變量間相關(guān)性問題。一旦使用相關(guān)性分析發(fā)現(xiàn)2個變量間存在高度相關(guān),建議使用線性回歸進(jìn)一步探索一個變量隨另一個變量的變化趨勢。相關(guān)性分析中2個變量不存在因果關(guān)系,即無解釋變量和響應(yīng)變量之分。分析結(jié)果中的R(R∈[-1,1])僅作為衡量2個變量間相關(guān)性程度及方向的參數(shù),即-1≤R<0時,2個變量間呈負(fù)相關(guān),越接近-1,負(fù)相關(guān)程度越大;0<R≤1時,2個變量間呈正相關(guān),越接近1,正相關(guān)程度越大;當(dāng)R=0時,2個變量間無相關(guān)性。相關(guān)性分析不能將R值當(dāng)作回歸分析中的自變量系數(shù),用于1個變量的數(shù)值變化推測另一個變量的數(shù)值變化?;貧w分析相比相關(guān)性分析更復(fù)雜,變量數(shù)值分布模式需要提前預(yù)知。但可解決變量間直線或曲線相關(guān)性問題。用于回歸的變量必須確定自變量與應(yīng)變量,兩類變量均可以是一元或多元變量。若應(yīng)變量為多元變量,建議使用PLS作回歸分析。在做微生物群落分析時,需根據(jù)研究者重點考察的問題對象選擇相應(yīng)分析方案,并建議在具體研究時,兩類分析方法協(xié)同并用。

      2.3.5差異性分析

      顧名思義,此分析用于檢驗屬于不同組的數(shù)量間是否有差異,以及衡量差異程度有多大。對于一元變量差異性分析,可借助均值或中位數(shù)比較各組數(shù)量占有高低。例如同一物種的相對豐度或序列數(shù)在不同組間差異性的比較屬于一元變量差異性分析,分析方法通常使用Anova或npAnova。但筆者發(fā)現(xiàn),多數(shù)微生物群落研究者也許統(tǒng)計知識不足,數(shù)據(jù)列在不符合正態(tài)分布及方差齊性的情況下仍強(qiáng)制套用參數(shù)檢驗Anova作分析,導(dǎo)致結(jié)果很可能出現(xiàn)偏差。微生物群落研究中,所獲數(shù)據(jù)在做具體分析情形下,原始數(shù)列直接符合正態(tài)分布的情況很少,通常需要對原始數(shù)列做對數(shù)或標(biāo)準(zhǔn)化轉(zhuǎn)換,方可使用基于正態(tài)分布的統(tǒng)計方法。然而,多數(shù)情形下,數(shù)據(jù)即使做了轉(zhuǎn)換,仍舊不符合正態(tài)分布。非參數(shù)檢驗法不用考慮數(shù)據(jù)列的分布限制,適用范圍廣,因而此類方法也是被大量國際期刊頻繁使用、報道的原因。筆者建議,在處理龐雜的微生物群落數(shù)據(jù)時,組間差異性分析優(yōu)先使用非參數(shù)檢驗法,然后針對需要重點考察或與預(yù)想偏差較大的結(jié)果,再次使用參數(shù)檢驗法。如果數(shù)列符合參數(shù)檢驗規(guī)則,分析結(jié)果以參數(shù)檢驗為準(zhǔn),這是因為非參數(shù)檢驗雖條件寬松,但包含信息量小,功效相比參數(shù)檢驗略遜色。至于多元變量組間差異性分析,目前微生物群落研究領(lǐng)域主要采用非參數(shù)分析法,如表4所示(Manova除外)。此處需要說明,基于限制排序法的組間差異性分析,可通過對干擾變量的限制隔離出目標(biāo)分組所產(chǎn)的凈效應(yīng)。例如,表2群落來自于不同發(fā)酵時期窖內(nèi)酒醅樣品,并且樣品取自不同窖池、窖內(nèi)不同深度。每個樣品還測得酒精含量、酸度、溫度3種理化參數(shù)。將樣本理化特征以及采樣信息錄入表3,則有3種分組模式(發(fā)酵時期、窖內(nèi)深度、窖池區(qū)別),3種數(shù)值型環(huán)境變量(酒精含量、酸度、溫度),總共6個環(huán)境因子?,F(xiàn)需要求得發(fā)酵時期是否對微生物群落成分有顯著性差異,且發(fā)酵時期單獨產(chǎn)生的差異有多大,則可以在分析時以發(fā)酵時期作解釋變量,另外5種因素作控制變量,以此排除控制變量對微生物群落產(chǎn)生的額外影響,從而獲得發(fā)酵時期的凈效應(yīng)。

      參考文獻(xiàn):

      [1]余乾偉.傳統(tǒng)白酒釀造技術(shù)[M].北京:中國輕工業(yè)出版社,2010.

      [2]王旭亮,王德良,韓興林,等.白酒微生物研究與應(yīng)用現(xiàn)狀[J].釀酒科技,2009(6):88-91.

      [3]Xu J P.Microbial ecology in the age of genomics and metagenomics:concepts,tools,and recent advances[J]. Molecular Ecology,2006,15:1713-1731.

      [4]馮佩英,陸春,朱國興.DGGE/TGGE技術(shù)在微生物基因分類鑒定中的應(yīng)用[J].國外臨床醫(yī)學(xué)生物化學(xué)與檢測學(xué)分冊,2005 (26):95-97.

      [5]王曉丹,謝曉麗,胡寶東,等.現(xiàn)代微生物分類鑒定技術(shù)在白酒釀造中的應(yīng)用[J].中國釀造,2015(34):5-9.

      [6]Smith C J,OsbornAM.Advantages and limitations of quantitative PCR(Q-PCR)-based approaches in microbial ecology[J].Fems Microbiology Ecology,2009,67:6-20.

      [7]杜玲,劉剛,陸健,等.高通量測序技術(shù)的發(fā)展及其在生命科學(xué)中的應(yīng)用[J].中國畜牧獸醫(yī),2014(41):109-115.

      [8]張金屯.數(shù)量生態(tài)學(xué)[M].北京:科學(xué)出版社,2004.

      [9]Schloss P D,Westcott S L,Ryabin T,et al.Introducing mothur: open-source,platform-independent,community-supported software for describing and comparing microbial communities [J].Applied Environmental Microbiology,2009,75(23):7537-7541.

      [10]Caporaso J G,Kuczynski J,Stombaugh J,et al.QIIME allows analysis of high-throughput community sequencing data[J]. Nature Methods,2010,7:335-336.

      [11]Lozupone CA,Knight R.UniFrac:Anew phylogenetic method for comparing microbial communities[J].Applied Environmental Microbiology,2005,71(12):8228-8235.

      [12]Faith D P,Minchin P R,Belbin L.Compositional dissimilarity as a robust measure of ecological distance[J].Vegetatio,1987,69,57-68.

      [13]R Development Core Team.R:ALanguage and Environment for Statistical Computing[M].Vienna:the R Foundation for Statistical Computing,2015.

      [14]Ter Braak C J F,Smilauer P.CANOCO Reference Manual and User's Guide to Canoco for Windows:Software for Canonical Community Ordination[R].Ithaca:Microcomputer Power,1998.

      [15]Hartigan JA,Wong MA.AK-means clustering algorithm[J]. Applied Statistics,1979,28,100-108.

      [16]Kaufman L,Rousseeuw P J.Finding Groups in Data:An Introduction to ClusterAnalysis[M].New York:Wiley,1990.

      [17]Sneath P HA,Sokal R R.Numerical Taxonomy[M].San Francisco:Freeman,1973.

      [18]Saitou N,Nei M.The neighbor-joining method:a new method for reconstructing phylogenetic trees[J].Molecular Biology and Evolution,1987,4:406-425.

      [19]Segata N,Izard J,Waldron L,et al.Metagenomic biomarker discovery and explanation[J].Genome Biology,2011,12(6):R60.

      [20]Jombart T,Devillard S,Balloux F.Discriminant analysis of principal components:a new method for the analysis of genetically structured populations[J].BMC Genetics,2010,11:94.

      [21]LiawA,Weiner M.Classification and regression by Random Forest[J].R News,2002,2(3):18-22.

      [22]Bartlett M S.Further aspects of the theory of multiple regression[J].Proceedings of the Cambridge Philosophical Society,1938,34:33-34.

      [23]Cooley W W,Lohnes P R.Multivariate DataAnalysis[M]. New York:Wiley,1971.

      [24]Gittins R.CanonicalAnalysis:AReview withApplications in Ecology[M].Berlin:Springer,1985.

      [25]Husson F,Le S,Pages J.Exploratory MultivariateAnalysis by Example Using R[M].CRC Press,2010.

      [26]Anderson M J,Willis T J.Canonical analysis of principal coordinates:a useful method of constrained ordination for ecology[J].Ecology,2003,84:511-525.

      [27]Legendre P,Anderson M J.Distance-based redundancy analysis:testing multispecies responses in multifactorial ecological experiments[J].Ecological Monographs,1999,69:1-24.

      [28]Benzecri J P.CorrespondenceAnalysis Handbook[M].New York:Dekker,1992.

      [29]Mardia K V,Kent J T,Bibby J M.MultivariateAnalysis[M]. London:Academic Press,1979.

      [30]Cailliez F.The analytical solution of the additive constant problem[J].Psychometrika,1983,48:305-308.

      [31]Gower J C.Some distance properties of latent root and vector methods used in multivariate analysis[J].Biometrika,1966,53:325-338.

      [32]Gower J C,Legendre P.Metric and Euclidean properties of dissimilarity coefficients[J].Journal of Classification,1986,3:5-48.

      [33]Legendre P,Gallagher E D.Ecologically meaningful transformations for ordination of species data[J].Oecologia,2001,129:271-280.

      [34]Legendre P,Legendre L.Numerical Ecology[M].2nd ed. Amsterdam:Elsevier Science BV,1998.

      [35]Lingoes J C.Some boundary conditions for a monotone analysis of symmetric matrices[J].Psychometrika,1971,36:195-203.

      [36]Minchin P R.An evaluation of relative robustness of techniques for ecological ordinations[J].Vegetatio,1987,69:89-107.

      [37]Hill M O,Gauch H G.Detrended correspondence analysis:an improved ordination technique[J].Vegetatio,1980,42:47-58.

      [38]Oksanen J,Minchin P R.Instability of ordination results under changes in input data order:explanations and remedies [J].Journal of Vegetation Science,1997,8:447-454.

      [39]Legendre P,Legendre L.Numerical Ecology[M].3rd ed.Elsevier,2012.

      [40]Ter Braak C J F.Canonical CorrespondenceAnalysis:a new eigenvector technique for multivariate direct gradient analysis [J].Ecology,1986,67:1167-1179.

      [41]Chambers J M.Linear models[M]//Chambers J M,Hastie T J. Statistical Models in S.Chapman and Hall,1991.

      [42]Wilkinson G N,Rogers C E.Symbolic descriptions of factorial models for analysis of variance[J].Applied Statistics,1973,22:392-399.

      [43]DobsonAJ.An Introduction to Generalized Linear Models [M].London:Chapman and Hall,1990.

      [44]Hastie T J,Pregibon D.Generalized linear models[M]// Chambers J M,Hastie T J.Statistical Models in S.Chapman and Hall,1991.

      [45]McCullagh P,Nelder JA.Generalized Linear Models[M]. London:Chapman and Hall,1989.

      [46]Venables W N,Ripley B D.ModernApplied Statistics with S [M].New York:Springer,2002.

      [47]Laird N M,Ware J H.Random-effects models for longitudinal data[J].Biometrics,1982,38:963-974.

      [48]Lindstrom M J,Bates D M.Newton-Raphson and EM algorithms for linear mixed-effects models for repeatedmeasures data[J].Journal of theAmerican Statistical Association,1988,83:1014-1022.

      [49]Geladi P,Kowlaski B.Partial least squares regression: a tutorial[J].Analytica ChimicaActa,1986,185:1-17.

      [50]Hoskuldsson,A.PLS Regression Methods[J].Journal of Chemometrics,1988,2:211-228.

      [51]Bates D M,Watts D G.Nonlinear RegressionAnalysis and Its Applications[M].Wiley,1988.

      [52]Bates D M,Chambers J M.Nonlinear models[M]//Chambers J M,Hastie T J.Statistical Models in S.Chapman and Hall,1991.

      [53]Best D J,Roberts D E.AlgorithmAS 89:the upper tail probabilities of spearman's rho[J].Applied Statistics,1975,24:377-379.

      [54]Hollander M,Wolfe DA.Nonparametric Statistical Methods [M].New York:John Wiley&Sons,1973:185-194.

      [55]Gittins R.CanonicalAnalysis:AReview withApplications in Ecology[M].Berlin:Springer,1985.

      [56]Clarke K R.Non-parametric multivariate analysis of changes in community structure[J].Australian Journal of Ecology,1993,18:117-143.

      [57]Hand D J,Taylor C C.MultivariateAnalysis of Variance and Repeated Measures[M].Chapman and Hall,1987.

      [58]Mielke PW,Berry K J.Permutation Methods:ADistance FunctionApproach[M].New York:Springer,2001.

      [59]Anderson M J.Anew method for non-parametric multivariate analysis of variance[J].Austral Ecology,2001,26:32-46.

      [60]Anderson M J.Distance-based tests for homogeneity of multivariate dispersions[J].Biometrics,2006,62:245-253.

      [61]Bokulicha NA,Thorngated J H,Richardson P M,et al. Microbial biogeography of wine grapes is conditioned by cultivar,vintage,and climate[J].Proceedings of the National Academy of Sciences of the United States ofAmerica,2013,25:E139-E148.

      優(yōu)先數(shù)字出版時間:2016-04-01;地址:http://www.cnki.net/kcms/detail/52.1051.TS.20160401.1330.003.html。

      中圖分類號:TS262.3;TS261.1;Q93-3

      文獻(xiàn)標(biāo)識碼:A

      文章編號:1001-9286(2016)07-0088-09

      DOI:10.13746/j.njkj.2016048

      收稿日期:2016-02-18

      作者簡介:趙亮(1983-),男,博士,從事環(huán)境微生物多樣性研究,已發(fā)表論文數(shù)篇,E-mail:20064827@qq.com。

      Present Status in Research Technology of Liquor-making Microbial Communities&Next-generation Sequencing Data Analysis

      ZHAO Liang,WANG Li,WANG Diqiang,WANG Heyu and YAN Songxian
      (Technical Center of Maotai Distillery Co.Ltd.,Renhuai,Guizhou 564501,China)

      Abstract:Liquor-making is essentially the process of microbial communities succession and microbial metabolites accumulation and transformation.To reveal the mystery of liquor,we should start from microbial research.Microbes in communities are,in general,advancing the fermentation of grains.The analysis of the composition and the succession of microbes is not only the premise to evaluate the yield and the quality of liquor,but also the basis for exploring the functions and metabolites of microbes.In this paper,aiming at the current application status of microbial research technology in liquor-making field,we found that culture-based approach and culture-independent DGGE/TGGE techniques are mainly applied in microbial community research nowadays,while next-generation sequencing technique is rarely adopted(reported only in foreign journals).Researchers not capable of understanding or manipulating the sequencing data might be the main reason for the poor use of nextgeneration sequencing technique.In view of such problem,systematical and straightforward interpretation of sequencing data were made in this review.Furthermore,five categories of multivariate analysis which could deeply and comprehensively present the microbial information were recommended,and we also provided the strategies and usages of these analytic approaches for reference.

      Key words:Baijiu;next-generation sequencing;microbial diversity;multivariate statistical methods;liquor-making microbes

      猜你喜歡
      白酒
      清香型白酒新國標(biāo)正式實施
      釀酒科技(2023年3期)2024-01-09 15:53:19
      我國現(xiàn)存白酒相關(guān)企業(yè)20.08萬家
      釀酒科技(2022年4期)2022-05-05 12:07:16
      推動白酒行業(yè)生產(chǎn)方式升級(二)
      2018年1—5月中國白酒產(chǎn)量422.8萬千升
      釀酒科技(2018年7期)2018-01-16 22:25:56
      2017年1—9月中國白酒產(chǎn)量增長6%
      釀酒科技(2017年11期)2017-02-03 04:21:50
      2017年一季度中國白酒行業(yè)產(chǎn)量
      釀酒科技(2017年5期)2017-02-02 15:07:57
      太白酒
      陜西畫報(2016年1期)2016-12-01 05:35:28
      電子舌在不同輪次醬香型白酒區(qū)分識別中的應(yīng)用
      中國釀造(2016年12期)2016-03-01 03:08:23
      白酒微量成分含量對白酒質(zhì)量影響的統(tǒng)計分析
      一起自制白酒引起甲醇食物中毒的調(diào)查報告
      西藏科技(2015年6期)2015-09-26 12:12:09
      双牌县| 茌平县| 正蓝旗| 扬州市| 莆田市| 徐闻县| 陆良县| 织金县| 庆城县| 聂拉木县| 杂多县| 元江| 萝北县| 团风县| 连州市| 吴川市| 五常市| 磴口县| 宁晋县| 报价| 临夏市| 泗洪县| 盐边县| 西青区| 陇川县| 凤翔县| 广州市| 河津市| 金坛市| 磐安县| 连平县| 兴山县| 开封县| 馆陶县| 铅山县| 浑源县| 阿拉善左旗| 宜丰县| 铅山县| 武乡县| 建阳市|