田萬春 張貴宇,3 庹先國 吳昊翰
(1. 四川輕化工大學(xué)人工智能四川省重點(diǎn)實驗室,四川 宜賓 644000;2. 四川輕化工大學(xué)自動化與信息工程學(xué)院,四川 宜賓 644000;3. 西南科技大學(xué)信息工程學(xué)院,四川 綿陽 621010)
中國白酒是世界六大蒸餾酒之一,其特有的固態(tài)發(fā)酵釀造工藝是中國勞動人民的智慧結(jié)晶,是依靠經(jīng)驗的傳統(tǒng)手工釀造技藝?!吧憧堪l(fā)酵,提香靠蒸餾”是固態(tài)法白酒釀造經(jīng)驗之一[1]?!吧憧堪l(fā)酵”是指酒體風(fēng)味物質(zhì)通過糧食發(fā)酵產(chǎn)生,受微生物種類、數(shù)量及當(dāng)?shù)貧夂驐l件等諸多因素影響,發(fā)酵工藝造就了酒的香型?!疤嵯憧空麴s”是指酒體風(fēng)味物質(zhì)的提取主要靠蒸餾,蒸餾工藝直接影響白酒的產(chǎn)量與品質(zhì)。上甑是蒸餾的最重要工藝之一,要求“探汽上甑,薄層加料”[2],即在酒蒸汽前鋒即將逸出酒醅表面時才鋪撒一層薄薄的冷料,從而創(chuàng)造最佳的溶酯條件[3],最大限度地提取風(fēng)味物質(zhì)。傳統(tǒng)釀造生產(chǎn)中,“探汽”全憑釀造師經(jīng)驗把控,如果提前鋪料會導(dǎo)致酒蒸汽不能順利上升,造成“壓汽”現(xiàn)象,不能有效提取風(fēng)味物質(zhì),從而影響白酒品質(zhì);延遲鋪料則會導(dǎo)致酒蒸汽逸出,造成“跑汽”現(xiàn)象,降低產(chǎn)量。
近年來,隨著白酒企業(yè)自動化轉(zhuǎn)型進(jìn)程的推進(jìn),白酒自動化釀造技術(shù)取得了長足發(fā)展,同時也對“探汽上甑”提出了新的要求,大量的專家學(xué)者對“探汽”進(jìn)行了深入研究。楊一帆等[4]通過圖像處理手段分離酒醅圖像中的前景和背景,再檢測蒸汽溢出區(qū)域確定鋪料區(qū)域,但該方法作用于“跑汽”之后,只能做到見汽鋪料,不能做到“探汽上甑”。張家雙等[5-6]將酒醅表面的紅外圖像進(jìn)行二值化處理,通過閾值分割的方法提取鋪料區(qū)域。酒醅紅外圖像描述的是酒醅表面溫度分布情況,其灰度值與酒醅表面溫度值存在映射關(guān)系[7],灰度閾值分割方法本質(zhì)上是設(shè)定溫度閾值分割出高溫區(qū)域。雖然該方法取得了一定成功,但從酒企應(yīng)用情況來看效果不夠理想,容易造成跑汽、壓汽,影響出酒質(zhì)量和產(chǎn)量。
支持向量機(jī)(SVM)是Vapnik等[8]提出的一種基于結(jié)構(gòu)風(fēng)險最小化原則的模式分類方法,在解決非線性、高維度的小樣本分類問題上表現(xiàn)出較好性能。其算法原理是在樣本空間中尋找一個分隔超平面將樣本集分為兩類,樣本間的間隔最大時為最優(yōu)超平面。試驗擬提出一種基于灰度直方圖特征與支持向量機(jī)相結(jié)合的探汽方法,通過從紅外圖像灰度直方圖提取多個特征,并結(jié)合釀造師上甑經(jīng)驗訓(xùn)練SVM模型,獲得較高的探汽效率和準(zhǔn)確率,為實現(xiàn)自動化探汽上甑技術(shù)提供理論依據(jù)。
1.1.1 試驗材料
酒醅:宜賓市云天曲酒廠。
1.1.2 儀器與設(shè)備
紅外熱成像儀:FLIR A310型,美國菲力爾公司;
甑桶(見圖1):ZCLZJ200型,自主設(shè)計。
1. 甑篦 2. 紅外熱成像儀 3. 溫度傳感器 4. 內(nèi)膽 5. 保溫材料 6. 外殼 7. 旋轉(zhuǎn)軸 8. 傳感器信息處理機(jī)構(gòu) 9. 傳感器安裝槽圖1 甑桶結(jié)構(gòu)圖Figure 1 Structure diagram of distilling pot
1.2.1 圖像采集、標(biāo)記 通過紅外熱成像儀采集上甑時甑桶內(nèi)酒醅表面紅外圖像,對應(yīng)釀造師的上甑操作將圖像標(biāo)記為3類。
(1) 等待上甑:紅外圖像表現(xiàn)為無白熱區(qū)域,圖像整體呈灰暗狀態(tài),表明酒蒸汽未到達(dá)表層酒醅。
(2) 補(bǔ)料操作:紅外圖像表現(xiàn)為有少量白熱區(qū)域,表明局部區(qū)域酒蒸汽上升較快,通過補(bǔ)料操作避免“跑汽”現(xiàn)象。
(3) 整層鋪料操作:紅外圖像表現(xiàn)為有大部分白熱區(qū)域,表明酒蒸汽已到達(dá)表層酒醅。
1.2.2 圖像預(yù)處理 采用中值濾波技術(shù)抑制噪聲。
1.2.3 灰度直方圖 將酒醅紅外圖像轉(zhuǎn)換為灰度直方圖,用橫坐標(biāo)表示灰度級,縱坐標(biāo)表示該灰度級上出現(xiàn)像素點(diǎn)的概率[9]。按式(1)計算概率。
(1)
式中:
i——第i級灰度級;
ni——第i級灰度級的像素數(shù);
N——紅外圖像的總像素數(shù);
L——紅外圖像灰度級。
FLIR A310紅外熱成像儀采集的圖像深度為8位,分辨率為640×480,即紅外圖像總像素為307 200,灰度級為256。
1.2.4 特征提取 為了進(jìn)一步降低酒醅紅外圖像的數(shù)據(jù)維度及擬合度,減少探汽模型訓(xùn)練時間、提高探汽準(zhǔn)確度,需進(jìn)一步對灰度直方圖進(jìn)行特征提取,灰度直方圖統(tǒng)計特征如表1所示。
單一特征提取不能有效反映酒醅紅外圖像本質(zhì)特征,因此,提取多個特征訓(xùn)練模型提高探汽準(zhǔn)確性。
1.2.5 分類器設(shè)計 一個超平面只能從樣本集中分隔出一類樣本,因此使用3個SVM分類器組合成探汽分類器,依次從樣本集中分隔出3類紅外圖像?;叶戎狈綀D特征構(gòu)成的樣本集可表示為:
表1 灰度直方圖統(tǒng)計特征Table 1 Statistical features of grayscale histogram
D={(x1,y1),(xi,yi),…,(xn,yn)},
(2)
式中:
(xi,yi)——第i個樣本點(diǎn);
xi——第i張紅外圖像的灰度直方圖特征構(gòu)成的向量,i=1,2,…n;
yi——第i張紅外圖像的分類標(biāo)簽,yi∈{1,2,3}。當(dāng)yi=1時,表示圖像i為等待上甑類;當(dāng)yi=2、 3時,分別表示圖像i為補(bǔ)料操作類和整層鋪料操作類。
在樣本空間中,超平面可描述為:
wTxi+b=0,
(3)
式中:
w——超平面法向量,w=(w1,w2,…,wn);
n——xi的維度;
b——位移項。
w決定了超平面的方向;b決定了超平面與原點(diǎn)之間的距離[10]。
對于線性可分的理想情況,假設(shè)存在超平面P能夠?qū)⒛骋活惣t外圖像從訓(xùn)練樣本集中分隔出來。令ti=+1表示該類紅外圖像,記為正例,ti=-1表示樣本集中剩余的兩類紅外圖像,記為負(fù)例,平行且通過離超平面最近的樣本點(diǎn)的平面P1、P2可定義為:
(4)
距離超平面P最近的訓(xùn)練樣本點(diǎn)使得式(4)中等號成立,被稱為“支持向量”,平面P1、P2到超平面P的距離之和為:
(5)
γ被稱為“間隔”,如圖2所示。
圖2 支持向量與間隔Figure 2 Support vectors and intervals
圖2表示線性可分的理想狀態(tài),通過試驗發(fā)現(xiàn)樣本集中少數(shù)酒醅紅外圖像不能被超平面正確分開,于是引入松弛變量ξi≥0,使函數(shù)間隔加上松弛變量≥1[11]。則約束條件為:
yi(wTxi+b)≥1-ξi。
(6)
若要使間隔γ取得最大值獲得最優(yōu)超平面,則需使‖w‖-1最大化,等價于求取‖w‖2的最小值。對式(6)的松弛變量ξi增加代價函數(shù)[12],則目標(biāo)函數(shù)為:
(7)
式中:
C——懲罰參數(shù),C>0。
懲罰系數(shù)C代表對錯分樣本的懲罰力度,其值越大表示懲罰越重,模型泛化能力越低。聯(lián)立式(6)、(7)可得一個凸二次規(guī)劃問題,利用拉格朗日乘數(shù)法便可得到其對偶問題[13]:
(8)
式中:
αi——拉格朗日乘子向量,αi=(α1,α2,…,αn)T。
由于酒醅紅外圖像樣本呈非線性分布,因此,采用核函數(shù)將樣本點(diǎn)映射到一個更高維度的空間中,使其在高維空間中線性可分[14],以提高探汽準(zhǔn)確性。支持向量機(jī)常用的核函數(shù)有[15]:
多項式核函數(shù):
(9)
式中:
α——調(diào)節(jié)參數(shù);
b——可選常數(shù);
d——最高次項次數(shù)。
高斯核函數(shù):
(10)
式中:
σ——帶寬,控制徑向作用范圍;
高斯核函數(shù)是特征向量xi,xj歐氏距離的單調(diào)函數(shù)。
Sigmoid核函數(shù):
(11)
式中:
β——調(diào)節(jié)參數(shù);
核函數(shù)及其參數(shù)的選取決定了支持向量機(jī)的分類性能,對各個核函數(shù)依次使用網(wǎng)格搜索選取合適的參數(shù)使其達(dá)到最佳探汽效果,如表2所示。
由表2可知,當(dāng)懲罰參數(shù)C=90、σ=0.081時,高斯核函數(shù)分類效果最佳,正確率達(dá)96%,高于其他核函數(shù)分類準(zhǔn)確率,耗時略長,但整體效果最好。因此試驗選擇高斯核函數(shù),優(yōu)選懲罰參數(shù)C=90、σ=0.081。
表2 不同核函數(shù)的分類效果Table 2 Classification effect of different kernel functions
由圖3可知,不同的蒸汽上升情況在紅外圖像上體現(xiàn)出的白熱化程度不同,蒸汽離酒醅表面越近白熱化程度越高。白熱區(qū)域面積大小與上甑操作存在對應(yīng)關(guān)系,面積越大,需鋪撒酒醅量越多。因此,可根據(jù)紅外圖像的白熱程度和白熱區(qū)域面積大小對紅外圖像進(jìn)行分類,實現(xiàn)自動化探汽。
圖3 3類紅外圖像Figure 3 Three types of infrared images
由圖4可知,噪聲得到了有效抑制,避免了圖像特征模糊[16],較好地保留了圖像細(xì)節(jié)和減少了圖像邊界失真。
由圖5可知,3類紅外圖像體現(xiàn)出不同的形態(tài)特征[17]:灰度值分布范圍不同,等待上甑與補(bǔ)料操作的像素灰度值比較集中,整層操作的灰度值則較為分散,離散程度較大;最大概率的灰度值所處灰度級不同,等待上甑的最大概率灰度值所處灰度級最低,整層鋪料操作的最大概率灰度值所處灰度級最高;最大概率值不同,等待上甑的最大概率值最高,整層鋪料操作的最大概率值最低。
由圖5還可知,3類紅外圖像在形態(tài)上具有明顯差異,且在一定程度上降低了酒醅紅外圖像的數(shù)據(jù)維度,但仍不能有效反映酒醅紅外圖像的本質(zhì)特征,直接使用灰度直方圖訓(xùn)練探汽模型不能得到理想的探汽效果。
圖4 中值濾波效果圖Figure 4 Median filtering effect graph
圖5 灰度直方圖Figure 5 Grayscale level histogram
根據(jù)特征公式提取灰度直方圖特征,如表3所示。
由表3可知,蒸汽離酒醅表面越近,紅外圖像白熱化程度越高,其圖像整體越明亮、明暗更分明、紋理更復(fù)雜,平均灰度、標(biāo)準(zhǔn)偏差、信息熵越大;灰度直方圖越不對稱,偏斜度越大,像素值分布越離散,灰度范圍越大;不同類紅外圖像間的特征值差異較大,具有可區(qū)分性;同類紅外圖像間的特征值差異較小,具有可靠性。綜上,灰度直方圖特征能夠反映蒸汽上升情況,且維度較低,適合作為分類器的訓(xùn)練特征。
采用上述方法,共采集776張上甑紅外圖像樣本,依據(jù)釀造師的經(jīng)驗將圖像分為3類:等待上甑圖像,共212張;補(bǔ)料操作圖像,共278張;整層鋪料圖像,共286張。將所有圖像轉(zhuǎn)換為灰度直方圖并提取特征,將67%樣本作為訓(xùn)練集,剩余33%作為測試集,測試結(jié)果如表4所示。
表3 特征列表(部分)Table 3 Feature list (part)
表4 訓(xùn)練與測試結(jié)果Table 4 Training and test results
由表4可知,SVM的平均分類正確率達(dá)96%,具有實用價值。其中等待上甑圖像與整層鋪料操作圖像分類準(zhǔn)確率高,補(bǔ)料操作分類準(zhǔn)確率較低,是由于不同的圖像存在有相同或相似的灰度直方圖。等待上甑圖像無白熱區(qū)域,無論是圖像視覺特征還是灰度直方圖統(tǒng)計特征都與其他圖像差異較大,因此分類正確率最高;補(bǔ)料操作與整層鋪料操作圖像都有白熱區(qū)域,某些圖像的白熱區(qū)域在視覺上表現(xiàn)為面積大小與分布位置不同,視覺效果差異明顯。因而釀造師將其判斷為不同類別,做出不同的上甑操作,而灰度直方圖的差異比較小,導(dǎo)致SVM的分類出現(xiàn)誤差。
由表5可知,支持向量機(jī)的探汽準(zhǔn)確度遠(yuǎn)高于邏輯回歸、線性判別分析等算法[18],因此支持向量機(jī)算法更適合白酒探汽工藝,有助于提高探汽準(zhǔn)確性。
表5 分類模型對比Table 5 Classification model comparison
試驗通過采集酒醅表層的紅外灰度圖像間接獲取溫度分布信息,將探汽問題抽象為圖像分類問題。為了避免前人閾值分割法存在的單一特征分類精度低的缺陷,采用多個特征作為分類依據(jù),同時結(jié)合SVM算法引入人工探汽經(jīng)驗,極大地提高了探汽準(zhǔn)確性和實用性。使用測試數(shù)據(jù)對探汽模型進(jìn)行測試,正確率為96%,達(dá)到“探汽上甑”工藝要求,能滿足生產(chǎn)需求,對白酒上甑工藝實現(xiàn)自動化具有積極促進(jìn)作用。試驗通過灰度直方圖提取特征時,丟失了像素坐標(biāo)信息,使探汽結(jié)果不能直接用于引導(dǎo)上甑機(jī)器人完成鋪料操作,鋪料區(qū)域坐標(biāo)信息的提取將是后續(xù)研究的重點(diǎn)。