饒芳秋,何翠容,盧 斌,李萬群,蘭小琴,袁松林,耿東晛
(1.宜賓金喜來大觀園酒業(yè)有限責任公司,四川宜賓 644000;2.四川省酒類科研所,四川成都 610017;3.四川省分析測試服務(wù)中心,四川成都 610023)
固態(tài)法白酒窖內(nèi)發(fā)酵是固-液-氣三相協(xié)同作用的復(fù)雜過程,糟醅在發(fā)酵過程中充當著物質(zhì)循環(huán)、能量流動和信息傳遞“三流運轉(zhuǎn)”的載體,其相關(guān)參數(shù)特別是酸度、水分、淀粉是指導(dǎo)白酒生產(chǎn)及改進工藝的關(guān)鍵。白酒行業(yè)采用經(jīng)典的化學(xué)分析法對糟醅酸度、水分、淀粉的檢測費時(檢測一個樣品需4~5 h)、費力、操作繁鎖、復(fù)雜,所得分析結(jié)果時間滯后,無法指導(dǎo)調(diào)整酒醅的配方,不能及時指導(dǎo)生產(chǎn)。近紅外光譜是近20 年來發(fā)展較為迅速的高新分析技術(shù)之一,結(jié)合化學(xué)計量學(xué)方法,可以實現(xiàn)對樣品快速、無損的定性與定量分析,已廣泛應(yīng)用于農(nóng)業(yè)、化工、醫(yī)藥和食品等多個領(lǐng)域。近年來,近紅外光譜分析技術(shù)在白酒行業(yè)廣泛應(yīng)用,實現(xiàn)了快速、準確測定,實時指導(dǎo)生產(chǎn)。李良等基于偏最小二乘法建立了白酒酒醅近紅外分析模型,實現(xiàn)了對酒醅中水分和酸度值的快速檢測;沈小梅等采用近紅外光譜技術(shù)與偏最小二乘法相結(jié)合的手段,建立了酒醅酸度、水分、淀粉的定標模型;余松柏等采用協(xié)同區(qū)間偏最小二乘法對光譜波段進行優(yōu)化選擇,用偏最小二乘法進行建模預(yù)測;盧中明等采用偏最小二乘法建立了酒醅浸取液定量模型,有效擴大了酒醅中還原糖、酸度和酒精度的含量分析范圍。
在已有的近紅外光譜技術(shù)定量分析酒醅關(guān)鍵指標的報道中,所用近紅外光譜儀大多為進口精密儀器,如美國賽默飛的Antaris II、福斯的InfraXact和布魯克的MPA 等。這些近紅外儀器大多基于傅里葉近紅外測量原理,為通用近紅外儀器,雖然波長覆蓋范圍廣(900~2600 nm),分辨率高達1 nm,但存在體積大、價格昂貴、掃描速度慢、使用條件苛刻等不足,無法走出實驗室應(yīng)用于現(xiàn)場檢測,限制了其在白酒企業(yè)特別是中小型企業(yè)的廣泛應(yīng)用。
為解決近紅外光譜技術(shù)用于酒醅分析的儀器成本高、便攜性差及普適性難等問題,行業(yè)科研單位與國產(chǎn)儀器公司共同研制基于微機電系統(tǒng)(MEMS)的近紅外光譜儀SIMC-3120。前期研究基礎(chǔ)表明,酒醅在900~1800 nm光譜范圍內(nèi)測量準確度比通用近紅外光譜儀全光譜(900~2600 nm)范圍的檢測效果更好。因此SIMC-3120 根據(jù)酒醅樣品特點和酒醅吸收光譜特點,作了以下幾點針對性優(yōu)化:(1)采用德州儀器的DMD 數(shù)字MEMS芯片技術(shù)大大簡化了機電系統(tǒng)和光路結(jié)構(gòu);(2)壓縮了測量光譜范圍至950~1650 nm 有效光譜范圍,從硬件端進一步降低了系統(tǒng)復(fù)雜度;(3)采用微機電控制大大提高了光譜掃描速率,通過提高單位時間內(nèi)掃描次數(shù)取平均光譜的方法提高檢測精度;(4)基于掃描速率的提高和MEMS 結(jié)構(gòu),將參比掃描內(nèi)嵌,從而實現(xiàn)每一次光譜掃描前參比掃描;(5)針對酒醅反射特點的基線噪聲處理和樣品盤優(yōu)化,提高了酒醅的測量信噪比。SIMC-3120 便攜式近紅外光譜儀通過硬件和軟件的針對性優(yōu)化,大幅縮減了儀器體積重量和生產(chǎn)成本的同時,在酒醅測量上實現(xiàn)了與進口儀器同等水平的定量分析精度。
本試驗基于近紅外光譜技術(shù)采用多元散射校正(MSC)和偏最小二乘法(PLS)建立酒醅水分、酸度和淀粉的定量分析模型,驗證了SIMC-3120 在酒醅現(xiàn)場檢測中的準確性和實用性,實驗結(jié)果中水分誤差<1.2 %、酸度誤差<0.3 mmol/10 g、淀粉誤差<0.9%,在保證性能的前提下,便攜式與低成本的優(yōu)點為白酒生產(chǎn)車間異常發(fā)酵酒醅的快速篩查和品質(zhì)實時監(jiān)測提供理想手段。
酒醅:取自釀酒車間現(xiàn)場,樣品覆蓋不同生產(chǎn)季節(jié),其中入池酒醅樣品336 個,出池酒醅樣品296個。
儀器設(shè)備:SIMC-3120 便攜式近紅外光譜儀,波長范圍為950~1650 nm,儀器分辨率為12 nm,波長準確性為±0.2 nm,光斑直徑為30 mm。外形尺寸為L35 cm×W25 cm×H30 cm,重量輕,整機重量(不含電池)<5.5 kg。儀器結(jié)構(gòu)及外觀見圖1。
圖1 SIMC-3120便攜式近紅外光譜儀
1.2.1 化學(xué)法
水分、酸度、淀粉檢測采用經(jīng)典的化學(xué)分析方法得到理化值,水分檢測參考國標GB 5009.3—2016 直接干燥法,酸度檢測參考國標GB 5009.239—2016,淀粉檢測參考國標GB 5009.9—2016 酸水解法。選取具有代表性的酒醅樣品,由企業(yè)有經(jīng)驗的化驗員分析,所得數(shù)據(jù)進行建模及驗證。
1.2.2 近紅外光譜法
1.2.2.1 光譜采集
SIMC-3120 近紅外光譜儀開機預(yù)熱30 min,將酒醅混合均勻后裝至樣品池3/4 處,確保樣品壓實、鋪平、不漏光,樣品池底部擦凈后放至儀器測量位置。采用漫反射方法采集酒醅的近紅外光譜,掃描光譜范圍為950~1650 nm,光譜分辨率為12 nm,光斑直徑20 mm,掃描次數(shù)為64 次。先掃描背景,再掃描樣品,每個樣品均采用兩次掃描的平均光譜建模。
1.2.2.2 模型的建立與驗證
實驗采集632 個酒醅樣品的光譜圖,隨機分配譜圖建模集和驗證集,建模集數(shù)據(jù)474 個樣本,驗證集數(shù)據(jù)158 個樣本。采用多元散射校正法(MSC)對光譜進行預(yù)處理,每一條光譜分別與對應(yīng)樣品的化驗值進行匹配形成數(shù)據(jù)集后,通過PLS 建立酒醅酸度、水分、淀粉定量分析模型并通過近紅外光譜建模集自身基本參數(shù)決定系數(shù)(R)和預(yù)測標準偏差(RMSEC)對模型本身進行評價,以確保定量模型的準確性和穩(wěn)定性。用驗證集預(yù)測結(jié)果的決定系數(shù)(R)和預(yù)測標準偏差(RMSEP)對預(yù)測結(jié)果的效果進行評價,以確定儀器及模型算法的整體檢測效果。
利用SIMC-3120 便攜式近紅外光譜儀對酒醅樣品進行光譜掃描,光譜二維和三維掃描結(jié)果如圖2 所示。酒醅樣品在950~1650 nm 波段范圍內(nèi)有較強的特征吸收峰,且具有明顯的規(guī)律性,表明選擇此波段范圍進行模型建立比較適宜。建模采用入窖模型和出窖模型分別對分類后的樣本進行預(yù)測,以提高預(yù)測精度。
圖2 酒醅樣品近紅外光譜圖
2.2.1 模型建立與定性分析
建模集樣本474個,包含223個出窖樣本和251個入窖樣本,其水分、酸度和淀粉的理化值分布如圖3(a)所示。可以看出,入窖和出窖的樣本明顯聚為兩類,且入窖樣本相比出窖樣本水分和酸度較低,淀粉值較高,這是由于出窖樣本中的淀粉被消耗,生成了乙醇、水和有機酸等成分。
驗證集樣本158 個,包含73 個出窖樣本和85個入窖樣本。實驗采用多元散射(MSC)方法對數(shù)據(jù)進行預(yù)處理,偏最小二乘法(PLS)進行建模,用該模型對驗證集158 個樣本進行預(yù)測,圖3(b)所示為158 個樣本的預(yù)測值分布。從圖3 可以看出,預(yù)測結(jié)果也明顯區(qū)分為入窖和出窖兩類,說明模型預(yù)測結(jié)果定性基本準確。
圖3 酒醅樣品建模集理化值與驗證預(yù)測值分布圖
2.2.2 模型定量評價
為了驗證模型本身是否可靠,將建模集474 個樣本建模后的模型內(nèi)預(yù)測值與理化值之間的決定系數(shù)(R)和預(yù)測標準偏差(RMSEC)作為定量模型的評價指標進行分析。R越接近1 表示模型內(nèi)自檢平均準確度越高,線性度越好;RMSEC 越小說明模型自檢的誤差離散度程度越小,表示模型本身性能越強。將驗證集158 個樣本采用模型預(yù)測后的預(yù)測值與理化值之間的決定系數(shù)(R)和預(yù)測標準偏差(RMSEP)作為模型預(yù)測能力的評價指標進行分析。同理,R越接近1 表示數(shù)據(jù)預(yù)測平均準確度越高,線性度越好;RMSEP 越小說明該模型預(yù)測絕對誤差離散度程度越小,預(yù)測精度越高。各項定性指標計算公式如下:
式中:m——建模集樣本數(shù);
n——驗證集樣本數(shù);
X——建模集理化值;
Y——驗證集理化值;
X——建模集預(yù)測值;
Y——驗證集預(yù)測值;
經(jīng)過計算,出入窖酒醅建模集與驗證集的R與RMSE如表1所示,酒醅中水分、酸度和淀粉近紅外模型自身預(yù)測值與化學(xué)法理化值散點分布如圖4—圖6 所示。從表1 和圖4—圖6 可知,建模集和驗證集的R均接近于1,模型預(yù)測平均值基本準確,對酒醅酸度、水分、淀粉指標具有較好的預(yù)測能力。同時,表1 顯示建模集的R與RMSE 均略優(yōu)于驗證集,這是由于建模集對自身結(jié)果進行預(yù)測輕度過擬合導(dǎo)致。
圖4 水分預(yù)測值與理化值散點分布圖
圖5 酸度預(yù)測值與理化值散點分布圖
圖6 淀粉預(yù)測值與理化值散點分布圖
表1 出入窖建模酒醅近紅外光譜模型參數(shù)
對RMSE 指標進行分析,表1 顯示建模集水分在0.6~0.7 之間,酸度在0.17 附近,淀粉值在0.5 附近。誤差結(jié)果顯示,酸度預(yù)測的相對誤差較大,這是由于RMSE 在計算時與計算數(shù)值的絕對大小相關(guān),數(shù)值越小,RMSE 計算結(jié)果越小。在本實驗樣本中,酸度數(shù)值在1~5 之間,水分數(shù)值在45~70 之間,淀粉數(shù)值在8~26 之間,因此結(jié)果顯示水分RMSE較大。RMSE可以作為同一數(shù)值范圍模型的性能比較參數(shù),但不能作為評判誤差大小的絕對評價參數(shù),若測量值數(shù)值普遍偏小則RMSE 相對較小。因此需要從誤差分布進一步評估預(yù)測結(jié)果好壞。
2.2.3 驗證集樣品預(yù)測
為進一步分析驗證集樣本預(yù)測結(jié)果的性能好壞,對驗證集158個樣本中前73個出窖樣本和后85個入窖樣本進行結(jié)果對比、絕對誤差分析和相對誤差分析。
水分指標驗證集樣品預(yù)測結(jié)果如圖7 所示,可以看出,總體入窖水分較低,出窖水分較高,預(yù)測結(jié)果與理化結(jié)果基本吻合。
圖7 驗證集樣品水分預(yù)測結(jié)果與理化值對比圖
對結(jié)果誤差進行統(tǒng)計分析見圖8,水分指標90%以上樣本絕對誤差<1.2%,相對誤差<0.02,且出窖結(jié)果總體略優(yōu)于入窖結(jié)果。
圖8 驗證集樣品水分絕對誤差與相對誤差
酸度指標驗證集樣品預(yù)測結(jié)果如圖9 所示,可以看出,總體上入窖酸度較低,出窖酸度較高,有個別樣本出窖酸度偏低。預(yù)測結(jié)果與理化結(jié)果吻合度較高,有個別樣本誤差相對較大。
圖9 驗證集樣品酸度預(yù)測結(jié)果與理化值對比圖
對結(jié)果誤差進行統(tǒng)計分析,酸度指標90 %以上樣本絕對誤差<0.3 mmol/10 g,相對誤差<0.15,且相對誤差結(jié)果出窖優(yōu)于入窖,但絕對誤差結(jié)果入窖略優(yōu)于出窖,這是由于入窖樣本酸度值總體偏低,絕對誤差相對較小的原因。
圖10 驗證集樣品酸度絕對誤差與相對誤差
淀粉指標驗證集樣品預(yù)測結(jié)果如圖11 所示,可以看出,入窖淀粉較高,出窖淀粉較低,這是發(fā)酵過程中將淀粉轉(zhuǎn)換為了酸和水,預(yù)測結(jié)果與理化結(jié)果基本相符。
圖11 驗證集樣品淀粉預(yù)測結(jié)果與理化值對比圖
對結(jié)果誤差進行統(tǒng)計分析,淀粉指標90 %以上樣本絕對誤差<0.9 %,相對誤差<0.08,絕對誤差大小出入窖基本相同,但由于入窖數(shù)值較高,相對誤差結(jié)果入窖較好。
按照90%樣本計算,水分、酸度和淀粉的絕對誤差可分別控制在1.2%,0.3 mmol/10 g 和0.9%以內(nèi),相對誤差可分別控制在0.02、0.15 和0.08 以內(nèi),均符合生產(chǎn)中對酒醅重要成分檢測的精度要求。綜合來看水分預(yù)測的相對誤差最小,酸度預(yù)測的相對誤差較大,與近紅外方法對含量較高的成分預(yù)測相對準確,對含量較低的成分預(yù)測受噪聲影響誤差相對偏高相一致。這與模型RMSE 指標所表現(xiàn)出來的結(jié)果截然相反,因此用RMSE 指標對不同參數(shù)或不同數(shù)值范圍的結(jié)果進行評價不能反映結(jié)果的總體誤差水平。
圖12 驗證集樣品淀粉絕對誤差與相對誤差
綜上所述,本文基于SIMC-3120 便攜式近紅外光譜儀,在針對酒醅特點進行硬件和軟件優(yōu)化的基礎(chǔ)上,采用多源散射校正(MSC)對光譜進行預(yù)處理,結(jié)合偏最小二乘法(PLS),以低成本方案建立了酒醅水分、酸度和淀粉的定性、定量分析模型,并對樣本進行了預(yù)測和模型分析。實驗結(jié)果顯示,對水分、酸度和淀粉的絕對誤差可以完全控制在1.2 %、0.3 mmol/10 g 和0.9 %以內(nèi),誤差分布結(jié)果與余松柏等相近,水分和淀粉指標略優(yōu)于其結(jié)果,且建模所需樣本數(shù)大大低于其樣本數(shù)。若按平均絕對誤差值計算,水分、酸度和淀粉分別為0.53 %、0.14 mmol/10 g、0.45 %,與沈小梅等提出的固態(tài)酒醅平均絕對差值結(jié)果接近。本文采用的便攜式酒醅近紅外光譜檢測儀形小體輕、價格便宜、使用方便,檢測結(jié)果精度與進口儀器檢測結(jié)果相當,符合生產(chǎn)中對酒醅重要成分檢測的精度要求,能滿足酒醅參數(shù)準確檢測和快速配料的生產(chǎn)實際,可廣泛應(yīng)用于各大、中、小型白酒企業(yè)。并且根據(jù)企業(yè)生產(chǎn)實際,隨著設(shè)備應(yīng)用時間的增加,檢測數(shù)據(jù)量大,數(shù)據(jù)模型不斷校正,與人工檢測的相對誤差將越來越小。