賀 莉 , 冉 毅 ,李冰峰
(1. 農(nóng)業(yè)農(nóng)村部沼氣科學研究所, 成都 610041; 2. 農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)生態(tài)與資源保護總站, 北京 100125)
中國是農(nóng)業(yè)大國,畜禽廢棄物年排放量為134億t,農(nóng)作物秸稈年達5億t(干重)[1],給生態(tài)環(huán)境造成巨大壓力。厭氧發(fā)酵是處理畜禽養(yǎng)殖糞污和農(nóng)業(yè)生產(chǎn)廢棄物的重要手段,通過水解、酸化和產(chǎn)甲烷3個階段將廢棄物中的有機質(zhì)轉(zhuǎn)化為清潔能源和植物易于吸收的有機肥。這3個階段中,酸化階段是制約厭氧發(fā)酵系統(tǒng)的關(guān)鍵步驟,尤為重要。一方面,厭氧發(fā)酵產(chǎn)氣量依賴于產(chǎn)甲烷菌持續(xù)不斷將產(chǎn)生的揮發(fā)性脂肪酸濃度(VFAs)轉(zhuǎn)化為甲烷,另一方面,當厭氧反應器中累計VFAs濃度過高時,會抑制產(chǎn)甲烷菌的活躍程度甚至造成厭氧發(fā)酵體系的崩潰,因此定期監(jiān)測厭氧反應器中的VFAs濃度,是掌控厭氧反應器運行狀況的重要手段。目前VFAs的國際通用檢測方法是高效液相色譜法(HPLC)和氣象色譜法(GC)。厭氧發(fā)酵體系背景復雜,采用色譜法檢測前,需要酸化、離心、過濾等預處理手段,尤其是采用GC法測定甲酸時,還需要進行衍生化處理,導致前處理過程復雜,大大增加檢測時長。使用HPLC時,預處理后的上清液中依然混有醇、酸、酯、蛋白質(zhì)和氨基酸等物質(zhì),均需要頻繁更換保護柱,避免造成色譜柱堵塞,檢測成本高;不計預處理時間,HPLC一次檢測時間為25~30 min,耗時費力;尤其是分離丁酸和異丁酸這種同分異構(gòu)體時,最大吸收波長相近,存在色譜峰重疊,常規(guī)C18柱無法進行準確定量,導致VFAs定量不準確。近紅外(near infrared, NIR)光譜結(jié)合化學計量學是一種易于操作、低成本的快速檢測方法,可替代傳統(tǒng)實驗室分析用于定性和定量分析。目前近紅外被廣泛用于食品[2]、農(nóng)產(chǎn)品和藥品的成分鑒定[3],以及特色農(nóng)產(chǎn)品產(chǎn)地辨別[4]。近紅外光譜技術(shù)與厭氧發(fā)酵結(jié)合緊密,被用于有機廢棄物生化產(chǎn)甲烷潛力預測[5],實時監(jiān)控揮發(fā)性脂肪酸含量[6]。目前關(guān)于NIRS法分析沼液中丁酸和異丁酸的分離研究在國內(nèi)尚未見報道。本文利用近紅外光譜儀掃描樣本,建立快速、便捷的近紅外光譜定量分析模型預測樣品中丁酸和異丁酸濃度;對光譜進行波段篩選和算法優(yōu)化,有效提高丁酸和異丁酸模型定量的準確度,為VFAs的準確定量提供技術(shù)支撐。
實驗室用超純水配置丁酸和異丁酸不同的濃度的單標樣品和混合標準溶液樣品27個,其中18個作為訓練集,用于建立近紅外光譜模型;9個作為測試集,用于驗證模型的準確性。
實驗采用Bruker MPA多功能型傅立葉變換近紅外光譜儀,帶漫反射積分球附件。光譜范圍780~2500 nm,掃描次數(shù)64次,分辨率為16 cm-1。在室溫(20℃~22℃)環(huán)境下,將溶液倒入玻璃樣品杯,每個樣品分別裝填3次,分別掃描后取各樣品光譜的均值。
配置的丁酸和異丁酸用于GC建立標準曲線,用外標法對混合樣品中丁酸和異丁酸檢測通過GC定量分析。每個樣品取3個平行樣測定,取平均值。
本研究采用偏最小二乘回歸(Partial Least Square Regression, PLSR)算法對近紅外光譜數(shù)據(jù)建立回歸模型,利用混合樣本的近紅外光譜,實現(xiàn)對其中的丁酸、異丁酸含量的定量分析。PLSR作為經(jīng)典的多元校正方法,已廣泛應用于近紅外光譜的定量分析中[7],其算法的主要思想是在主成分分析的基礎上,不僅對混合物的光譜量測矩陣Y進行正交分解,獲取其主成分T(T = {ti}, i = 1, 2, 3, …, m),同時還將濃度矩陣C也進行分解,得到其主成分R(R = {rj}, j = 1, 2, 3, …, p)。
Y=USVt+E=TVt+E
(1)
C=PGQt+E=RQt+E
(2)
其中E為殘差。最終預測模型利用最小二乘原理,建立矩陣T和R之間的線性關(guān)系:
R=BC
(3)
其中B為回歸系數(shù)矩陣。在本研究中,偏最小二乘回歸的建模與預測過程,均在MATLAB(R2016b, version 9.1.0)中完成。
為準確定量丁酸和異丁酸濃度,配置丁酸和異丁酸比例從10%~90%,根據(jù)實驗室檢測沼液中丁酸和異丁酸的實際樣品濃度,控制混標總濃度為200 mg·L-1。為準確定量配置溶液濃度,分別配置丁酸和異丁酸單標標準曲線,用外標法對配置濃度進行校正。設置序號為1,2,4,5,7,9的樣品為訓練集,通過其濃度測試建立PLSR 模型;將3,6,8的樣品設定為測試集,用于濃度預測。溶液配置濃度比和實驗預測值見表1。
表1 不同混合溶液中丁酸、異丁酸的配比
根據(jù)表1中丁酸和異丁酸的混標,實驗共設計9個樣本,每個樣品進行3次獨立的測試,此最終獲得27份混合樣品,如圖1所示。從圖中可知,不同濃度的混標樣品的平均光譜吸收峰的位置大致相同,集中在4500 nm~8000 nm,不同濃度混標的吸光值迥異。
圖1 27份丁酸、異丁酸混合溶液的近紅外光譜
將平行樣本的光譜進行平均,獲得各平行樣本的平均光譜,隨后將3,6,8號樣本留作獨立測試集,對PLSR模型進行檢驗,其余混合樣本作為訓練集構(gòu)建PLSR模型。對于丁酸與異丁酸,筆者分別建立PLSR模型對其含量進行預測,模型采用前5個PLS潛變量進行回歸建模,實驗設定的丁酸、異丁酸含量與預測結(jié)果的相關(guān)性如圖2和圖3所示。
圖2 訓練集與獨立測試集中丁酸實際含量與預測值比較
圖3 訓練集與獨立測試集中異丁酸的實際含量與預測值比較
從圖2和圖3可以看出,測試集中的丁酸、異丁酸含量的預測值與其實際含量的相關(guān)系數(shù)(R2)均大于0.99,表明模型可以很好的對混合樣本中兩種揮發(fā)酸的含量進行預測。
圖4和圖5顯示了模型的預測誤差,包括均方根誤差(Root Mean Square Error, RMSE)以及平均絕對百分比誤差(Mean Absolute Percentage Error, MAPE)。對于測試集來說,模型在預測丁酸、異丁酸的含量時,RMSE均為3.862%,MAPE小于9%,該預測誤差在厭氧發(fā)酵體系的丁酸、異丁酸含量檢測中,可滿足實際應用的需求。
圖4 訓練集與獨立測試集中模型對于丁酸含量的預測誤差
圖5 訓練集與獨立測試集中模型對于異丁酸含量的預測誤差
近紅外光譜技術(shù)可用于厭氧發(fā)酵體系中丁酸和異丁酸的定量分析研究,具有較好的適用性。外部驗證丁酸和異丁酸濃度與近紅外光譜預測值非常接近,RMSE均為3.862%,MAPE小于9%,具有良好的預測性。下一步將針對總揮發(fā)酸中每一種揮發(fā)酸建立模型,以期早日用于真實樣品的測試,節(jié)省檢測時間,降低檢測費用。