基于16S rDNA測序的巢湖流域水體糞便污染溯源

2023-06-21 07:55:32祁釗趙相龍桑金慧何振杰傅丹丹岳振宇宋祥軍

農(nóng)業(yè)環(huán)境科學(xué)學(xué)報 2023年5期

祁釗，趙相龍，桑金慧，何振杰，傅丹丹，岳振宇，宋祥軍*

（1.安徽農(nóng)業(yè)大學(xué)信息與計算機學(xué)院，合肥 230036；2.安徽省動物性食品質(zhì)量與生物安全工程實驗室，合肥 230036）

環(huán)境中的糞便污染是全球范圍內(nèi)日益嚴重的問題，尤其是在河流和溪流中[1]。流域的糞便污染可能存在多種來源，包括污水基礎(chǔ)設(shè)施等點源排污，受上游牲畜、寵物和野生動物排泄物污染的徑流[2]等。糞便污染帶來的高營養(yǎng)和微生物負荷不僅會影響生態(tài)健康，而且糞便病原體通過水媒的傳播還會進一步影響人類健康。對主要水媒傳播病原體的檢測是表征人類健康風(fēng)險的最直接方法，但由于環(huán)境中病原種類繁多（包括病毒、細菌和原生動物），對其進行檢測不僅會浪費大量時間，還會消耗大量經(jīng)濟成本。為解決這一難題，監(jiān)管機構(gòu)使用糞便指示菌（Fecal indicator bacteria，F(xiàn)IB），如大腸桿菌（Escherichia coli）和糞大腸菌群（Fecal coliforms）等來評估糞便污染水平[3]，并以此作為水體微生物風(fēng)險的替代指標[4]。然而，傳統(tǒng)糞便指示菌的水質(zhì)指標檢測雖節(jié)約了時間和成本，卻也存在諸多不足，如無法提供污染源信息、且無法反映水體近期的污染情況[5-6]等，近年來許多污染溯源研究表明，F(xiàn)IB 與環(huán)境病原相關(guān)性不佳[7-8]，故而人們開始探索更加快速、經(jīng)濟的微生物溯源技術(shù)。

微生物來源追蹤（Microbial source tracking，MST）技術(shù)利用人和動物胃腸道中的微生物設(shè)計出具有特異性的標記物，并通過定量聚合酶鏈反應(yīng)（qPCR）等分子技術(shù)檢測與宿主相關(guān)的微生物標記基因，從而識別潛在的糞便污染源[9-10]，但地理差異會顯著影響基于宿主特異性分子標記檢測方法的靈敏度和特異性，這給MST 技術(shù)的實際應(yīng)用帶來了困難。在過去的20 a 中，伴隨著下一代測序（Next generation sequencing，NGS）技術(shù)的快速發(fā)展，研究者對人類、家畜和野生動物腸道微生物組的理解不斷加深[11]。使用NGS 數(shù)據(jù)獲取環(huán)境及糞便來源的獨特的微生物群落圖譜的方法被稱為基于細菌群落的MST（Community-based MST）[12]，主要方法包括基于貝葉斯分類器的Source?Tracker[13]與基于快速期望最大化算法的微生物源追蹤（FEAST）[14]。兩個MST 軟件的運行均需要使用者提供糞便來源文庫（Fecal taxon library，F(xiàn)TL），并基于該文庫中不同的宿主菌群組成對待測樣本中微生物的來源進行預(yù)測[15]，進而評估不同污染源對樣品微生物群落的貢獻度[16]。SourceTracker 源解析程序通過對不同宿主糞便以及環(huán)境水樣16S rRNA 基因?qū)⒉煌S便來源的微生物群落和待分析的水體微生物群落當(dāng)作一個整體，基于貝葉斯算法，識別水樣中不同宿主來源微生物所占比例，解析水樣中糞便污染來源[13]。目前，研究人員已將此方法應(yīng)用在不同區(qū)域以識別水環(huán)境中不同糞便污染來源及其貢獻率，例如，Brown 等[15，17]使用SourceTracker 成功識別出蘇必利爾湖河口糞便污染主要來自污水處理廠排放的廢水（70%）和海鷗糞便（30%），與qPCR 方法所得結(jié)果一致。FEAST是一種新興的計算工具，可用于同時估計多個潛在來源和各種糞便輸入的相對貢獻。相同條件下，F(xiàn)EAST比SourceTracker表現(xiàn)出更強的穩(wěn)定性和更高的運行速度[14]。但目前應(yīng)用FEAST 軟件進行河流水域糞便污染追溯的研究較少，因此其在糞便污染追溯方面的準確性尚需進一步驗證。

在本研究中，研究者提取了所采集樣本的DNA用于16S rDNA 測序，旨在通過對比測序結(jié)果，探索不同采樣地點[家禽與廢水處理廠（WWTP）、河流水體]及不同樣本中（皖江流域地區(qū)野生候鳥、人工養(yǎng)殖的家豬）細菌群落結(jié)構(gòu)的多樣性，以及不同物種糞便微生物組/環(huán)境微生物組的差異。此外，將測得的NGS數(shù)據(jù)比對到本地潛在病原數(shù)據(jù)庫，用以表征不同生境樣本中的潛在病原組成，為后續(xù)污染溯源工作奠定基礎(chǔ)。而后，通過利用不同來源潛在污染物的NGS 數(shù)據(jù)集構(gòu)建FTL 文庫，應(yīng)用基于SourceTracker 與FEAST兩種程序的MST 方法對自然水體樣本進行污染溯源研究，進一步表征水體公共安全風(fēng)險，為巢湖流域水環(huán)境治理提供理論及數(shù)據(jù)支持。

1 材料與方法

1.1 研究區(qū)域概況

巢湖位于安徽省中部，是中國五大淡水湖之一，同時也是中國富營養(yǎng)化水平最高的湖泊之一[18]。巢湖流域水路網(wǎng)絡(luò)密集，總流入量的80%以上來自雙橋河、派河和南淝河等12 條河流。近年來，伴隨巢湖流域人類活動的增加，巢湖受到了嚴重污染（包括工業(yè)、農(nóng)業(yè)和居民生活污水來源），同時逐漸發(fā)展出富營養(yǎng)化現(xiàn)象[19]。

1.2 樣品采集及處理

1.2.1 水體樣本采集

本研究于2021 年10 月采集水體、沉積物樣本共63 個，包括從巢湖流域的杭埠河（HR）、豐樂河（FR）、派河（XR）各采集的水樣（S）3 份，沉積物3 份，在杭埠河采樣點上游有水禽養(yǎng)殖地點（HRD）額外采集的水樣3 份。在巢湖北側(cè)農(nóng)業(yè)面源污染監(jiān)測站（巢湖烔煬鎮(zhèn)西宋村污水處理站）采集的處理站入水口（D）及出水口（E）水樣各6 份，另外還在監(jiān)測站周邊村莊的排污口（C）采集了6 份水樣。另在采集糞便樣本時，在淮北昌農(nóng)收集豬糞便樣本（HB）的采樣點采集了該養(yǎng)殖廠的廢水處理系統(tǒng)進水（ND）以及出水（NC）樣本各3份。水樣用500 mL無菌塑料瓶收集，沉積物樣品使用抓斗取樣器在距水面約100 cm 深度處采集。樣本于冰上儲存，并在6 h 內(nèi)運送至實驗室進行處理。水體樣本使用0.22 μm 聚碳酸酯膜進行過濾，所得濾膜儲存于-80 ℃以供后續(xù)分析。

1.2.2 糞便樣本采集

本研究共收集糞便樣品229 份，畜禽糞便（豬和雞）樣品取自皖江流域內(nèi)規(guī)?；B(yǎng)殖場。本研究一共采集了6 個不同地點的豬糞便樣本，其中包括從太湖縣收集的豬糞便樣本（PA）、金寨縣收集的豬糞便樣本（PI）和岳西縣收集的豬糞便樣本（PL）各5 份，從蚌埠固鎮(zhèn)收集的豬糞便樣本（BG）、淮北昌農(nóng)收集的豬糞便樣本（HB）、宿州褚蘭收集的豬糞便樣本（SC）、徐州昌農(nóng)收集的豬糞便樣本（XZ）各4份，在養(yǎng)殖場采集的豬糞便樣本共31 份。雞糞便樣本采集自皖江流域內(nèi)規(guī)?；B(yǎng)殖場，共分為5 組，編號為C、mC、L、LS 和S，樣本數(shù)量分別為9、6、15、15 份及15 份，共60 份。另有鵝糞（F）5 份。所有糞便采集均使用消毒的50 mL收集管，并儲存于冰盒，8 h內(nèi)送至實驗室處理。

1.2.3 DNA提取及宏基因組測序

水體、糞便和土壤樣本用DNeasy PowerSoil?Pro Kit試劑盒提取DNA，使用通用引物341F（5'-CCTAC?GGGNGGCWGCAG-3' ）和 805R （5'-GACTACH?VGGGTATCTAATCC-3'）PCR 擴增水中細菌的16S rDNA 基因高變區(qū)（V3~V4），PCR 產(chǎn)物經(jīng)2%瓊脂糖凝膠電泳驗證。在整個DNA 提取過程中，使用超純水，以排除假陽性PCR 結(jié)果作為陰性對照的可能性。得到的擴增子（PCR產(chǎn)物）經(jīng)純化后進行濃度檢測，合格后用于測序，擴增子文庫的大小和數(shù)量分別在Agi?lent2100 生物分析儀和Illumina 的文庫定量試劑盒上進行評估。

1.2.4 樣本構(gòu)成

為增加數(shù)據(jù)豐富度及可靠性，除了本研究所采樣本外，還使用其他已公布的巢湖水體數(shù)據(jù)，如Zhang等[20]采集的18份巢湖流域水體樣本：具有農(nóng)業(yè)和生活污染背景（Agricultural and domestic pollution，ADPR）的河流包括雙橋河（CR1）、拓皋河（CR2、CR12）、雞裕河（CR3）、兆河（CR10）和玉溪河（CR11）；工業(yè)和生活污染背景（Industrial and domestic pollution，IDPR）的河流包括南淝河（CR5）、塘西河（CR7）和杭埠河（CR9）；農(nóng)業(yè)污染背景（Agricultural pollution，APR）的河流包括烔煬河（CR4）、十五里河（CR6）和派河（CR8）；還包括湖中的6個采樣點，南淝河口（CL1）、裕溪河（CL6）、兆河（CL3）以及東湖（CL4、CL5）和西湖（CL2）中心的樣本。該系列樣本采用有機玻璃儀器于水下50 cm深度人工采集，每個地點采集3個平行水樣，混合成1個水樣，下游處理與本研究相同。此外，本研究還選取了來自菜子湖與升金湖的白額雁（Anser albifrons）糞便樣本30 份[21]、升金湖的白頭鶴（Grus monacha）糞便樣本16份[22]。以及Pan等[23]采集的來自合肥市的87份人類糞便樣品。這些樣本的下游處理與本研究相同，且測序均為靶向細菌16S rDNA基因V3~V4區(qū)。本研究采集水體、糞便樣本的測序原始數(shù)據(jù)已上傳至NCBI，并可通過PRJNA783993進行獲取。

1.3 數(shù)據(jù)分析

1.3.1 FTL文庫構(gòu)建

已有研究表明，F(xiàn)TL 文庫中是否包含具有明確本地來源的樣本對溯源準確度有較大影響，因此本研究選取巢湖流域北側(cè)農(nóng)業(yè)面源污染監(jiān)測站（巢湖烔陽鎮(zhèn)西宋村污水處理站）及周邊村莊的排污口樣本作為FTL 文庫中本地污染來源的代表樣品。此外，有研究報道，糞便文庫的高組內(nèi)變異度會對SourceTracker的溯源結(jié)果產(chǎn)生顯著影響[24]。基于這項原則，本研究將野生水鳥糞便與污水樣本按原始樣本類型進行了拆分，野生水鳥糞便拆分為白頭鶴（Grus monacha）與小白額雁（Anser albifrons）糞便，而所有污水樣本按處理前后及污水來源進行了區(qū)分，以期最大程度消除糞便文庫的組內(nèi)變異對預(yù)測結(jié)果產(chǎn)生的影響。

1.3.2 基于16S rDNA測序的潛在病原菌豐度評估

通過VFDB 網(wǎng)站（http：//www.mgc.ac.cn/VFs/）以及病理系統(tǒng)資源整合中心（PATRIC）的病原生物數(shù)據(jù)，以及其他研究中的潛在病原數(shù)據(jù)[25-29]，收集了包括159 個屬的潛在病原清單，之后根據(jù)屬名在美國生物安全協(xié)會網(wǎng)站（https：//my.absa.org/tiki-index.php?page=Riskgroups）進行檢索，記錄該屬內(nèi)生物安全等級為二級或三級的物種，于LPSN（The List of Prokary?otic names with Standing in Nomenclature）（https：//www.bacterio.net/）網(wǎng)站下載該物種的參考16Sr RNA序列，如在LPSN 網(wǎng)站無法檢索到該物種，則從NCBI（http：//www.ncbi.nlm.nih.gov/）的GenBank中檢索并下載對應(yīng)的16S rDNA 序列。最終構(gòu)建了包括51 個屬，444 個物種16S rDNA 序列的潛在病原數(shù)據(jù)庫。將聚類所得ASV序列通過BLASTN比對到建立的潛在病原數(shù)據(jù)庫，閾值設(shè)置為相似度≥98%、覆蓋度>99%，潛在病原的相對豐度是通過將鑒定為潛在病原的序列對應(yīng)的ASV豐度值與樣本總ASV豐度的比值來確定。

1.3.3 基于機器學(xué)習(xí)的微生物污染溯源解析

將不同類型水體或沉積物（即目標樣本）設(shè)為Sink，微生物污染源或來源的樣品（即構(gòu)建的FTL 文庫樣本）為Source。分別使用SourceTracker2 以及FEAST 計算來自不同（Source）來源（人類及動物糞便、豬場廢水處理系統(tǒng)進水與出水、污水處理廠的進水和出水、村莊污水口）的微生物群落對匯（Sink）環(huán)境（即巢湖流域的水體、河流沉積物）的潛在貢獻。SourceTracker2與FEAST兩種方法的區(qū)別在于他們是基于不同的算法來探究目標樣本（Sink）中微生物污染源或進行污染來源（Source）的分析。根據(jù)Source樣本和Sink 樣本的群落結(jié)構(gòu)分布，預(yù)測Sink 樣本中來源于各Source 樣本的組成比例。SourceTracker2 與FEAST 的分析使用默認參數(shù)進行。每個溯源軟件進行5 次獨立運行以計算每個潛在源的平均貢獻度及其標準偏差。然后通過相對標準偏差（Relative stan?dard deviation，RSD，D）計算平均貢獻度與標準偏差之間的比率，見公式（1）。

RSD 可以評估多個模型運行的精密程度[30]。式中：S為標準偏差（也可以表示為SD）；n為重復(fù)次數(shù)，xˉ表示平均值。RSD 較高（≥100%）表明預(yù)測結(jié)果的可靠性低。

Wilcoxon 秩和檢驗（Wilcoxon rank sum test）用于推斷兩個獨立樣本所來自的兩個總體分布位置是否有差別，通常在數(shù)據(jù)不是正態(tài)分布時使用。通過Wil?coxon 秩和檢驗可以得到一個正態(tài)隨機變量Z，再用軟件或查正態(tài)分布表得到對應(yīng)的P值。如果P值較?。ū热缧∮诨虻扔诮o定的顯著性水平）則可以拒絕零假設(shè)。如果P值較大則沒有充分的證據(jù)來拒絕零假設(shè)，但不意味著接受零假設(shè)。即在數(shù)據(jù)不是正態(tài)分布時，可以使用Wilcoxon秩和檢驗驗證樣本之間的差異是否顯著。

1.3.4 測序數(shù)據(jù)處理

數(shù)據(jù)分析參考擴增子分析流程EasyAmplicon（https：//github. com/YongxinLiu/Easy Amplicon）完成[21]。使用USEARCH[22]合并雙端序列，去除barcode和引物序列。通過unoise3 去噪獲得單堿基精度ASV，基于SILVA 數(shù)據(jù)庫去除嵌合體序列。根據(jù)SIL?VA 分類器（version2.2，http：//sourceforge.net/projects/rdp-classifier/）（置信閾值0.7）獲取每個ASV 對應(yīng)的物種分類信息以及代表序列。設(shè)置測序深度閾值為30 000，使用vegan 包進行等量重抽樣，通過R（4.0.3）包amplicon（1.11.1）計算Shannon、Simpson 及Chao1指數(shù)。通過R 包vegan（2.5.4）計算樣本Bray-Curtis 距離以進行PCoA 分析。其余圖例均通過OmicStudio tools（https：//www.omicstudio.cn/tool）以及R語言進行繪制。

2 結(jié)果與分析

2.1 測序數(shù)據(jù)初步分析

291 個樣本（包括228 個糞便樣本，63 個水體、沉積物樣本）中，共發(fā)現(xiàn)10 247 548 條原始序列，經(jīng)過序列去冗余，獲得了73 844 條獨特序列，經(jīng)過unoise3 去噪及基于silva 的去嵌合，聚類生成了包括21 062 條序列的ASV 集合，平均每個樣本為412 個ASVs，最低244個ASVs，最高444個ASVs。

2.2 Alpha多樣性分析

為了研究數(shù)據(jù)集樣本的微生物多樣性，計算了Shannon、Simpson 以及Chao1 指數(shù)，總體而言，糞便樣本多樣性指數(shù)水平均低于水體樣本。由圖1 可見，所有樣本中水體沉積物樣本具有最高的ASV 數(shù)量與物種多樣性水平，其次是巢湖水體樣本（Wilcoxon 秩和檢驗，P<0.001），而禽類糞便（包括野生水鳥、鵝與雞）具有最低的ASV數(shù)量與物種多樣性水平（Wilcoxon 秩和檢驗，P<0.01）。

圖1 樣本alpha多樣性指數(shù)（log10轉(zhuǎn)換）Figure 1 Differences in alpha diversity indices in all samples（log10 transformed）

2.3 細菌群落結(jié)構(gòu)

經(jīng)過物種注釋，所有樣本共注釋到31 個門（圖2），分布最廣泛的門包括變形菌門（Proteobacteria）、放線菌門（Actinobacteria）、擬桿菌門（Bacteroidetes）、厚壁菌門（Firmicutes）、疣微菌門（Verrucomicrobia），其中糞便樣本以厚壁菌門為主導(dǎo)（平均相對豐度為55.89%），水體樣本則以變形菌門為主導(dǎo)（平均相對豐度為44.13%）。除野生水鳥外，糞便樣本門水平細菌集中分布于厚壁菌門、變形菌門與擬桿菌門中，這3 個門平均相對豐度之和占總數(shù)的97%以上，而野生水鳥中除這3 種門外，還含有較高相對豐度的放線菌門（平均13.83%）。水體樣本門水平細菌更為多樣，平均相對豐度在1%以上的有13個門。

圖2 細菌群落（組平均）組成Figure 2 Composition of microbial community

在屬水平上，假單胞菌屬（Pseudomonas，19.81%）、八疊球菌屬（Sporosarcina，11.27%）與節(jié)桿菌屬（Arthrobacter，9.45%）是野生水鳥中最主要的屬，大腸埃氏菌-志賀氏菌屬（Escherichia-Shigella，29.46%）是雞糞中最主要的屬，乳桿菌屬（Lactobacil?lus，18.9%）與大腸埃氏菌-志賀氏菌屬（13.64%）在鵝糞中廣泛分布，而人糞中表現(xiàn)出擬桿菌屬（Bacteroi?des，18.09%）與普雷沃氏菌屬_9（Prevotella_9，10.74%）的顯著富集，豬糞中則以不動桿菌屬（Aci?netobacter，23.51%）為主。hgcI_clade在河流水樣（10.23%）與廢水樣本（14.24%）中表現(xiàn)出明顯富集，不動桿菌屬表現(xiàn)出在河水中的顯著富集（10.78%），此外，河流水樣中還發(fā)現(xiàn)了較高豐度的CL500-29_marine_group（5.8%）與藍細菌聚球藻屬（Syn?echococcus，6.96%）。遺憾的是，基于silva 數(shù)據(jù)庫（v123 版本）的注釋結(jié)果，本研究的河流沉積物與巢湖水樣兩組樣本中分別有71.51%與79.47%的拼接后的測試樣本未分類到屬。

2.4 Beta多樣性分析

基于Bray-Curtis 距離對整體數(shù)據(jù)進行了主坐標分析（圖3），將所有數(shù)據(jù)分為糞便與水體兩個組進行聚類分析。水體樣本的beta多樣性分析（圖3a）表明，豬場廢水與污水處理廠廢水樣本表現(xiàn)出較大的組內(nèi)變異，相比之下巢湖水體樣本和沉積物樣本則呈現(xiàn)明顯的聚集趨勢。糞便樣本中，除去各組中少量離群樣本，被分類為同一組的樣本（野生水鳥、雞糞、鵝糞、豬糞與人糞）各自均表現(xiàn)出顯著聚集（圖3b），此外，野生水鳥與豬糞、鵝糞樣本表現(xiàn)出明顯的聚集，說明其群落組成存在一定相似性。

圖3 樣本beta多樣性差異——主坐標分析Figure 3 Principal coordinates analysis（PCoA）of the microbial community in different groups

2.5 樣本中潛在病原的分布

通過將聚類得到的ASV 序列比對到自建病原數(shù)據(jù)庫，對所有樣本中潛在病原進行評估，將與數(shù)據(jù)庫的BLAST（相似度≥97%，覆蓋度>99%）比對匹配上的病原菌按屬水平聚類（圖4）。結(jié)果顯示，所有樣本中共注釋到57 個潛在病原屬，包括145 個潛在病原物種，其中13 個潛在病原屬廣泛分布于所有樣本中，以Pseudescherichia、腸球菌屬（Enterococcus）、鏈球菌屬（Streptococcus）與腸桿菌屬（Enterobacter）為代表（表1）。在所有樣本中，鵝糞、豬場廢水與巢湖水樣本潛在病原總平均相對豐度最高，分別為0.051%、0.016%與0.011%。從潛在病原數(shù)量上來看，含潛在病原屬數(shù)量最多的為野生水鳥、廢水與人糞（分別為48、47、46個屬），值得注意的是，豬場廢水獨有3種潛在病原屬，分別為Alloprevotella、福賽坦氏菌（Tannerella）與密螺旋體屬（Treponema），而人糞獨有一個潛在病原屬，即薩特菌屬（Sutterella）。

表1 所有樣本共有的潛在病原的平均相對豐度（按屬聚類）Table 1 Average relative abundance of potential pathogens common to all samples（clustered at the genus level）

圖4 潛在病原在樣本間的分布（平均相對豐度）Figure 4 Distribution of potential pathogens among all samples（mean relative abundance）

2.6 基于細菌群落的微生物溯源

將不同類型水體或沉積物設(shè)為Sink，構(gòu)建的FTL文庫樣本作為Source，來判別水體/沉積物樣本潛在的污染來源。對于FEAST 以及SourceTracker 兩個溯源軟件，分別進行5 次獨立運行以計算溯源結(jié)果的RSD。兩個溯源軟件對于河流水體污染來源的判定結(jié)果較為一致（圖5）。

圖5 基于NGS數(shù)據(jù)集的微生物溯源分析Figure 5 Microbial source tracking analysis based on NGS dataset

2.7 FEAST與SourceTracker對比分析

就兩個軟件預(yù)測結(jié)果的穩(wěn)定性（RSD）來看（圖6），F(xiàn)EAST的運算結(jié)果表現(xiàn)出比SourceTracker更低的RSD 值，其樣本平均RDS 值多分布于0.25 及0.50 左右，而SourceTracker 預(yù)測值的RSD 計算結(jié)果分布在1.0及以上的偏多。

圖6 溯源軟件5個獨立運行結(jié)果的相對標準偏差Figure 6 Relative standard deviation generated in 5 independent runs of the traceability software

2.8 微生物溯源結(jié)果

FEAST的預(yù)測結(jié)果表明，沉積物樣本的污染來源主要可被劃分為豬場廢水出水、豬場原始廢水以及白頭鶴糞便，而相較FEAST 而言，SourceTracker 對于樣本污染貢獻程度的判定更趨于保守。但綜合二者的結(jié)果來看，F(xiàn)EAST與SourceTracker溯源軟件對于河流水體污染來源的判定結(jié)果一致性較高，均將主要的潛在污染來源歸類為村莊排污口以及污水處理廠排污口樣本，F(xiàn)TL 文庫中小白額雁、人類以及雞糞幾乎在所有樣本中都不能預(yù)測出。對巢湖水污染的預(yù)測結(jié)果中，兩個溯源軟件都判定豬場廢水出水是主要的污染來源。

3 討論

研究表明，畜禽腸道定殖的微生物主要有厚壁菌

門（Firmicutes）、擬桿菌門（Bacteroidetes）、變形菌門（Proteobacteria）和放線菌門（Actinobacteria）等，厚壁菌及其家族成員在畜禽糞便樣品中具有較高的相對豐度。在所有樣本中，水體沉積物樣本具有最高的ASV數(shù)量與物種多樣性水平，而禽類糞便樣本具有最低的ASV 數(shù)量與物種多樣性水平。沉積物作為一個營養(yǎng)豐富的棲息地，為微生物的生長提供了良好條件[31]，例如微藻、浮游植物、硅藻、細菌、浮游動物以促進、競爭或共生的方式生活在沉積物上，使水體沉積物發(fā)展出豐富的生物多樣性[32]。而糞便微生物憑借共生關(guān)系存活于宿主腸道，其群落組成受到微生物間互作及宿主的免疫反應(yīng)等因素影響，并且動物腸道是一個高度厭氧的環(huán)境，對糞便微生物群落施加了特定的選擇壓力，導(dǎo)致糞便微生物群落多樣性低于自然水生環(huán)境。

在不同類型的水樣本中，細菌群落的多樣性存在顯著差異，巢湖水樣的菌群豐度明顯高于其他水樣，這表明與人類活動相關(guān)的較高濃度的有機和無機物可能會降低河流水生細菌群落的物種豐富度，這一結(jié)果與之前的研究結(jié)果一致[33]。對于研究采集的具有農(nóng)業(yè)和生活污染背景的河流水樣而言，物種豐富度和均勻度的降低可能是由于某些物種的高度富集，這些物種很好地適應(yīng)了有機或無機廢水中的特定條件，并且能夠通過使用各種營養(yǎng)物質(zhì)來抵抗或承受環(huán)境波動[34]。值得注意的是，有相關(guān)研究表明，水體中的糞便污染情況可能會受到季節(jié)的影響，不同季節(jié)水體中主要的污染源可能會有所差異[35-36]。此外，在對水體樣本進行beta多樣性差異（主坐標分析）分析時發(fā)現(xiàn)，豬場廢水與污水處理廠廢水樣本表現(xiàn)出較大的組內(nèi)變異，這可能是由于“豬場廢水”與“污水”組同時包含了原始廢水與處理后廢水，而處理過程對細菌群落產(chǎn)生了較大影響，因此導(dǎo)致上述差異。對巢湖水的污染預(yù)測結(jié)果中，兩個溯源軟件都判定豬場廢水出水是主要的污染來源，但FEAST 預(yù)測豬場原始廢水貢獻了平均2.19%的污染，而在SourceTracker 中僅為0.4%。值得注意的是，CL3樣本呈現(xiàn)出與其他巢湖水樣不一致的污染預(yù)測結(jié)果，兩個溯源軟件均預(yù)測其有（23.0±0.5）%的污染來自白頭鶴，Zhang等[19]對該采樣點的分析指出，該點與其他湖水樣本存在明顯差異，其含有較高豐度的厚壁菌門（24.13%），而該菌門在其他湖水樣本中幾乎沒有檢出。兩個溯源軟件一致預(yù)測存在高水平白頭鶴糞便污染的樣本還有CR4（SourceTrack?er-5.61%與FEAST-9.59%），該樣本同樣含有較高的厚壁菌門細菌（47.77%），高豐度厚壁菌門細菌的存在或許是該預(yù)測結(jié)果的主要驅(qū)動因素。另外，F(xiàn)EAST的預(yù)測結(jié)果表明，APR與ADPR背景的河流普遍存在潛在的豬糞污染，污染水平從0.205%（CR3）到4.220%（CR8）。值得注意的是，由于本研究所選污水樣本的群落組成在一定程度上可能與糞便樣本產(chǎn)生交叉，因此溯源軟件對村莊污水處理站以及豬場污水樣本較高污染貢獻度的預(yù)測可能存在一定的誤差，存在一定的假陽性率。

對于FEAST 以及SourceTracker 兩個溯源軟件來說，總體上看，兩個基于細菌群落MST 的溯源軟件對于巢湖水體以及河流沉積物的預(yù)測結(jié)果存在較大差異，相較FEAST 而言，SourceTracker 對于FTL 樣本污染貢獻程度的判定更趨于保守。在FEAST 的預(yù)測結(jié)果中，沉積物樣本的污染來源主要被劃分為豬場廢水出水、白頭鶴糞便以及豬場原始廢水，以FR組樣本為例，F(xiàn)EAST 預(yù)測其污染源平均有18.50%來自豬場廢水、8.98%來自白頭鶴、4.65%來自豬場原始廢水，而SourceTracker 對于FR 組的預(yù)測則僅有5.27%來自豬場廢水出水、0.49%來自白頭鶴、0.81%來自豬場原始廢水。在HR 以及XR 組中，F(xiàn)EAST 預(yù)測存在3.98%~10.30%的豬場廢水出水、3.67%~5.39%的白頭鶴以及1.69%~5.40%的豬場原始廢水污染，而在Source?Tracker 的預(yù)測結(jié)果中，該比例分別降至0.04%~1.54%、0.08%~0.24%與0.18%~0.70%。

綜上所述，盡管基于NGS 的MST 具有眾多優(yōu)勢，但其在研究設(shè)計方面仍然存在較高要求，后續(xù)研究中，存在更少ASV 交叉、地理聯(lián)系更加緊密的FTL 文庫或許能使溯源預(yù)測結(jié)果更加精準。

4 結(jié)論

（1）不同生境樣本中，微生物多樣性存在明顯差異。水樣本的微生物群落多樣性普遍高于人類及動物糞便樣本，其中水體沉積物與湖泊水體樣本微生物多樣性最豐富。樣本/宿主類型是主導(dǎo)細菌群落差異的主要因素，水生環(huán)境樣本中河流沉積物與污水處理廠細菌群落存在一定相似性，糞便樣本中豬糞、野生水鳥與鵝糞存在一定相似性。

（2）變形菌門、放線菌門、擬桿菌門與厚壁菌門在糞便與水體樣本中廣泛存在，但其相對豐度存在差異。糞便樣本以厚壁菌門（平均相對豐度為55.89%）為主，水體樣本則以變形菌門（平均相對豐度為44.13%）為主。與本地病原數(shù)據(jù)庫的比對結(jié)果顯示，以Pseudescherichia、腸球菌屬、鏈球菌屬與腸桿菌屬為代表的13 種潛在病原在水生環(huán)境與糞便樣本中廣泛分布，這些跨生境樣本出現(xiàn)的潛在病原建議在后續(xù)研究與監(jiān)測中給予重點關(guān)注。

（3）溯源分析結(jié)果表明，河水樣本最主要的污染來源是村莊排污口與污水處理廠排污口樣本；沉積物與湖水樣本則預(yù)測出存在豬場排污水與野生水鳥糞便的污染；所有樣本未檢測到來自人糞與雞糞的污染。

（4）以自然水體及河流沉積物作為目標樣本，溯源軟件SourceTracker與FEAST對廣泛污染源（包括野生水鳥、家畜、家禽糞便以及生活與養(yǎng)殖業(yè)污水）的潛在污染貢獻度的預(yù)測結(jié)果總體相似，但相對同一污染源而言，SourceTracker 對污染貢獻比例的判定偏低。總體來看，F(xiàn)EAST的預(yù)測結(jié)果比SourceTracker擁有更低的RSD值，因此，F(xiàn)EAST模型對潛在污染源的預(yù)測結(jié)果更具可信度。在實際調(diào)研中，推薦結(jié)合NGS與傳統(tǒng)污染評估方法，以準確探明污染來源，指導(dǎo)水質(zhì)管理。