邱靖 彭莞云 吳瑞武 張海濤
摘要 由于影響葡萄酒質(zhì)量的指標(biāo)較多,利用主成分分析法,找到了影響葡萄酒質(zhì)量的指標(biāo)總計(jì)17個(gè)。并對(duì)兩組評(píng)酒員的品評(píng)數(shù)據(jù)進(jìn)行了差異性檢驗(yàn),研究表明,第2組評(píng)酒員的評(píng)分?jǐn)?shù)據(jù)更可信。同時(shí),利用QPSO算法優(yōu)化KM算法,建立了葡萄酒分類(lèi)模型。通過(guò)試驗(yàn)分析,該算法相對(duì)其他兩種算法更能搜索到全局最優(yōu)解,并對(duì)葡萄酒樣品進(jìn)行了分級(jí),該算法能處理聚類(lèi)方面的類(lèi)似問(wèn)題。
關(guān)鍵詞 量子粒子群算法;KM算法;葡萄酒酒樣;分級(jí)模型
中圖分類(lèi)號(hào) S126文獻(xiàn)標(biāo)識(shí)碼 A文章編號(hào) 0517-6611(2015)11-285-02
葡萄酒品質(zhì)評(píng)定一般是通過(guò)有資質(zhì)的評(píng)酒員進(jìn)行品評(píng)后對(duì)酒的各項(xiàng)指標(biāo)進(jìn)行打分,對(duì)其求總分后以確定葡萄酒的質(zhì)量。但葡萄酒的品質(zhì)與釀酒葡萄和葡萄酒的理化指標(biāo)及芳香物質(zhì)都有密切的聯(lián)系,因此構(gòu)建一個(gè)有效實(shí)用的葡萄酒分級(jí)模型,使之更客觀有效地對(duì)葡萄酒進(jìn)行分級(jí)有重要意義。不少學(xué)者對(duì)此進(jìn)行了研究,并取得了一定的研究成果,如神經(jīng)網(wǎng)絡(luò)[1]、K均值[2]、Copula函數(shù)[3]及最小二乘支持向量機(jī)[4]等。筆者利用QPSO優(yōu)化KM算法建立分級(jí)模型,以期取得較好的分級(jí)效果。
1算法分析
量子粒子群算法(QPSO)具有較強(qiáng)的全局搜索能力,能夠在整個(gè)可行解空間搜尋最優(yōu)解。KM算法是一種基于劃分的算法,通過(guò)不斷更新迭代聚類(lèi)中心,從而找到較優(yōu)的聚類(lèi)結(jié)果。但QPSO算法與KM算法如何有效地結(jié)合,從而使聚類(lèi)效果好,運(yùn)行速度快,且不陷入局部最優(yōu)解。在利用QPSO算法優(yōu)化KM算法時(shí),主要是找到一個(gè)有機(jī)的結(jié)合點(diǎn),利用局部最優(yōu)位置和全局最優(yōu)位置更新K均值,當(dāng)QPSO陷入局部最優(yōu)時(shí),引入KM算法提高收斂速度和全局搜索性能。
適應(yīng)度函數(shù)為:
F=∑ni=1 ∑mj=1min(xi-cij)2
(1)
式(1)中,n為酒樣個(gè)數(shù),xi為酒樣,xi表示屬于第j類(lèi)酒,cij表示第i個(gè)粒子速度。
具體算法如下:
①初始化種群。種群初始化時(shí),先選n個(gè)酒樣做為聚類(lèi)中心,計(jì)算各類(lèi)聚類(lèi)中心值,種群數(shù)N、最大迭代次數(shù)、初始化粒子速度,粒子群粒子的最好位置pi和全局最好位置pg。②根據(jù)迭代次數(shù),調(diào)整收縮擴(kuò)張系數(shù)。③根據(jù)適應(yīng)度函數(shù),計(jì)算每個(gè)粒子的適應(yīng)度值,比較其適應(yīng)度值與所經(jīng)歷的適應(yīng)度值,判斷是否更新粒子最優(yōu)位置和粒子群最優(yōu)位置。④根據(jù)QPSO進(jìn)化方程調(diào)整粒子速度、局部和全體最優(yōu)位置。⑤根據(jù)聚類(lèi)中心計(jì)算每個(gè)酒樣到中心的距離,并根據(jù)最小距離對(duì)酒樣重新劃分,將每個(gè)酒樣劃分到最近的類(lèi)。⑥按照聚類(lèi)原則重新劃分新的聚類(lèi)中心。⑦判斷是否滿足終止條件,聚類(lèi)中心適應(yīng)度更優(yōu),更新粒子并結(jié)束,否則轉(zhuǎn)到步驟②。⑧輸出全局最優(yōu)聚類(lèi)結(jié)果。
2 試驗(yàn)討論
2.1 數(shù)據(jù)處理
2012高教社杯全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽A題中總計(jì)有紅葡萄酒27個(gè)樣品,白葡萄酒28個(gè),以及評(píng)酒員的評(píng)分?jǐn)?shù)據(jù),各葡萄酒酒樣的理化指標(biāo)及芳香物質(zhì)。
分析釀酒葡萄與葡萄酒的理化指標(biāo)之間的聯(lián)系,由于釀酒葡萄的理化指標(biāo)較多,可以先利用統(tǒng)計(jì)分析中主成分分析將許多相關(guān)的隨機(jī)變量壓縮成少量的綜合指標(biāo),同時(shí)又能反映原來(lái)較多指標(biāo)的信息。按照主成分分析的理論,若前R個(gè)主成分的累計(jì)貢獻(xiàn)率達(dá)到了85%原則,則這R個(gè)主成分能反映足夠的信息。
由表1可知,反映葡萄酒質(zhì)量的主要成分有17個(gè)指標(biāo),分別為總酚、單寧、花色苷、DPPH自由基、蛋白質(zhì)、可溶性固形物、固酸比、VC含量、酒總黃酮、白藜蘆醇、檸檬烯、3-甲基-1-丁醇、丁二酸二乙酯、乙酸乙酯、乙醇、3-甲基-1-丁醇-乙酸酯、苯甲醇。
2.2組別差異性檢驗(yàn)
由于2組評(píng)酒員對(duì)不同酒樣的評(píng)價(jià)結(jié)果不同,因此該問(wèn)題可以轉(zhuǎn)化為多因素?zé)o重復(fù)方差分析。因子包含了組別、評(píng)酒員、酒樣及評(píng)價(jià)結(jié)果,組別用1、2表示,評(píng)酒員用1、2、3、…、20表示,酒樣紅白葡萄酒統(tǒng)一標(biāo)號(hào),紅葡萄酒用1~27表示,白葡萄酒用28~55表示。
利用spss19.0,對(duì)其進(jìn)行無(wú)重復(fù)觀測(cè)值無(wú)交互作用的方差分析,總計(jì)有4個(gè)變量,組別、評(píng)酒員、酒樣及評(píng)價(jià)結(jié)果。分析結(jié)果如表2所示。
評(píng)酒員評(píng)分可信度可以通過(guò)評(píng)酒員對(duì)酒樣評(píng)分的方差評(píng)價(jià),即計(jì)算每組中每個(gè)評(píng)酒員對(duì)每個(gè)評(píng)價(jià)指標(biāo)相對(duì)該組評(píng)酒員對(duì)該指標(biāo)的平均值偏差平方和。方差平方和越大也即越不穩(wěn)定,其評(píng)價(jià)分?jǐn)?shù)可信度低??傮w樣本方差定義如下:
S2=1n×10×9
∑ni=1 ∑10j=1 ∑10k=1 (xijk-xijk)2
(2)
式(2)中,S2為總體樣本方差,i為酒樣數(shù),j為評(píng)酒員,k為酒樣的10個(gè)評(píng)價(jià)指標(biāo),xijk為第j個(gè)評(píng)酒員對(duì)第i個(gè)酒樣的第k個(gè)指標(biāo)的評(píng)分,xijk為10個(gè)評(píng)酒員對(duì)第i個(gè)酒樣的第k個(gè)指標(biāo)的平均值。
利用各評(píng)酒員的評(píng)分?jǐn)?shù)據(jù),算出每組評(píng)酒員的總體偏差平方和,結(jié)果如表4所示。
由表4可知,第2組評(píng)酒員的評(píng)分無(wú)論是紅白葡萄酒為一整體還是紅白葡萄酒各為一整體,其總體樣本偏差平方和均小于第1組評(píng)酒員評(píng)分的總體樣本偏差平方和,所以第2組評(píng)酒員的評(píng)分相對(duì)第1組評(píng)酒員的評(píng)分更穩(wěn)定,因此,其分?jǐn)?shù)更可信。
綜合表3和表4的結(jié)果,說(shuō)明人們?cè)谂卸ㄆ咸丫瀑|(zhì)量時(shí),以第2組評(píng)酒員的評(píng)分結(jié)果判定其質(zhì)量的好壞。
2.3 葡萄酒分級(jí)
根據(jù)利用的QPSO算法優(yōu)化KM算法建立的葡萄酒分級(jí)模型,以及利用主成分分析法得到?jīng)Q定葡萄酒質(zhì)量的理化指標(biāo)和芳香物質(zhì),結(jié)合評(píng)酒員的評(píng)分結(jié)果,對(duì)紅葡萄酒和白葡萄酒酒樣進(jìn)行分級(jí)試驗(yàn)。
紅葡萄酒分級(jí)試驗(yàn),種群個(gè)數(shù)為27,粒子長(zhǎng)度為17(影響葡萄酒質(zhì)量的理化指標(biāo)和芳香物質(zhì)),迭代次數(shù)為500,學(xué)習(xí)率為C1=0.8,C2=1,權(quán)重系數(shù)ω從0.8到0.3線性減少,進(jìn)行100次試驗(yàn)求平均值,算法比較如圖1所示。
從圖1可知,QPSO-K算法的適應(yīng)度值明顯比其他算法的適應(yīng)度值小,且該算法的迭代次數(shù)明顯比其他2種算法的多,說(shuō)明該算法更能在全體解空間搜索全局最優(yōu)解,不易陷入局部極值。利用該算法求葡萄酒分級(jí)結(jié)果如表5所示。
3 結(jié)論
該研究利用QPSO算法優(yōu)化KM算法,建立了葡萄酒分類(lèi)模型。從試驗(yàn)分析看,QPSO-K算法的適應(yīng)度值明顯比其他算法的適應(yīng)度值小,解決了PSO算法易陷入局部極值的缺點(diǎn),并得到了紅葡萄酒和白葡萄酒較好的分級(jí)結(jié)果。說(shuō)明該算法應(yīng)用在葡萄酒分級(jí)問(wèn)題上有效可行,是一種較優(yōu)的聚類(lèi)方法。
參考文獻(xiàn)
[1]
曾祥燕,趙良忠,孫文兵,等.基于PCA和BP神經(jīng)網(wǎng)絡(luò)的葡萄酒品質(zhì)預(yù)測(cè)模型[J].食品與機(jī)械, 2014,30(1):40-44.
[2] 凌佳,言方榮.K均值聚類(lèi)在葡萄酒分級(jí)中的應(yīng)用[J].食品工業(yè)科技, 2013,34(6):104-107.
[3] 凌佳,言方榮.Copula函數(shù)在葡萄酒分級(jí)中的應(yīng)用[J].釀酒科技, 2013,226(4):57-60.
[4] 吳瑞紅,王亞麗,張環(huán)沖,等.一種基于最小二乘支持向量機(jī)的葡萄酒品質(zhì)評(píng)判模型[J].華僑大學(xué)學(xué)報(bào):自然科學(xué)版, 2013,34(1):30-35.
安徽農(nóng)業(yè)科學(xué),Journal of Anhui Agri. Sci.2015,43(11):289-290,294
責(zé)任編輯 李菲菲 責(zé)任校對(duì) 況玲玲