呂孫忠
(溫州大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,浙江 溫州 325035)
葡萄酒因其特殊的營養(yǎng)價值和較好的保健效果,越來越受到廣大消費(fèi)者的歡迎。在此形勢下,葡萄酒認(rèn)證和質(zhì)量評價得到關(guān)注,而它的質(zhì)量鑒別主要靠感官分析和理化指標(biāo)分析[1]的方法來確定。而感官分析常常通過聘請一批有資質(zhì)的評酒員進(jìn)行品評,每個評酒員在對葡萄酒進(jìn)行品嘗后對其分類指標(biāo)打分,然后求和得到其總分,從而確定葡萄酒的質(zhì)量。但由于評分受品酒員的主觀個人的感受和思維影響,難以用精確的數(shù)字來描述,因此造成看起來十分精確的分?jǐn)?shù)卻不能精確地說明葡萄酒質(zhì)量的優(yōu)劣狀態(tài)。分組評分法是目前主流的一種評分法之一,對于每組給出的評分,需要檢驗是否存在顯著性差異,并且選擇合適的評分組,作為葡萄酒最終得分的主要依據(jù)。但評分是精確到個位的,評酒員也說不清楚個位是如何得出的。如果讓評酒員們給出一個定性的評價,如“優(yōu)秀,良好,合格”,這比給出一個分值容易的多,也可以更加客觀地表述葡萄酒的質(zhì)量。
方差分析是英國統(tǒng)計學(xué)家R.A.Fisher于20世紀(jì)20年代提出的一種統(tǒng)計方法,有著非常廣泛的應(yīng)用,肯德爾和諧系數(shù)是檢驗測量結(jié)果信度的方法之一,逆序數(shù)可以解釋評酒員的評價方向差異。本文利用方差分析去評定兩組及兩組以上的評分?jǐn)?shù)據(jù)中是否存在顯著性差異,并利用方差、肯德爾和諧系數(shù)和逆序數(shù)這三個指標(biāo)來選擇較為合理評分組,同時使用模糊綜合評價將各位評酒員的評分轉(zhuǎn)換為定量的分?jǐn)?shù),使成績的評定更加客觀、合理。
當(dāng)對樣本進(jìn)行方差分析檢驗時,樣本應(yīng)該滿足三個基本假設(shè),所有的樣本均來自正態(tài)分布總體,這些總體具有相同的方差,且所有觀測相互獨(dú)立。所以,在進(jìn)行方差分析前,需要對樣本進(jìn)行正態(tài)性檢驗和方差齊性檢驗。方差分析屬于參數(shù)檢驗,常見的有單因素方差分析和多因素方差分析。但是,當(dāng)原始數(shù)據(jù)不滿足正態(tài)性和方差齊性假定時,參數(shù)檢驗可能會給出錯誤報告,此時應(yīng)采用基礎(chǔ)秩的非參數(shù)檢驗,如Kurskal-Wallis[2]非參數(shù)檢驗。
非參數(shù)方差分析:檢驗的假設(shè)是:k個獨(dú)立的樣本來自于相同的總體,當(dāng)假設(shè)成立,并且樣本容量足夠大時,檢驗統(tǒng)計量近似服從自由度為k的分布,即檢驗統(tǒng)計量H近似服從自由度k-1的χ2分布,即
其中,k為樣本數(shù),nj(j=1,2,…k)為第j個樣本的樣本容量,,Ri為第j個樣本的秩和。對于給定的顯著水平,當(dāng)H的觀測值大于或等于(k-1)時,拒絕原假設(shè),表示k個獨(dú)立樣本來自于不同的總體,或者說k個處理間有顯著差異,此時應(yīng)進(jìn)一步作多重比較,分析兩個處理間有顯著的差異。
在一個排列中,如果一對數(shù)的前后位置與大小順序相反,即前面的數(shù)大于后面的數(shù),那么它們就稱為一個逆序。一個排列中逆序的總數(shù)就稱為這個排列的逆序數(shù)。如2431中,21,43,41,31是逆序,逆序數(shù)是4,為偶排列。逆序數(shù)在評價性問題中有著廣泛的應(yīng)用[3],同時它也是檢驗測量結(jié)果信度的方法之一。將一組中每位評酒員所給的平均分按從高到低排序,則一類酒在該組所有評委所打的分從高到低的排名中的秩形成一個排列,計算該排列的逆序數(shù),這個指標(biāo)有效的分析了每位評酒員的評價方向的差異,逆序數(shù)越小,則評分越公平合理。
肯德爾和諧系數(shù)[4]是檢驗測量結(jié)果信度的方法之一,根據(jù)它可以檢驗品酒員評分的可信度。
其中,w為肯德爾和諧系數(shù),k為評酒員人數(shù),l是葡萄酒樣本數(shù),ri是葡萄酒樣品i的評分和。
葡萄酒的感觀評價中,可以由外觀分析、香氣分析和口感分析等n個因素共同決定,記做C1,C2,…,Cn,aij表示Ci和Cj對評分的影響之比,根據(jù)層次分析法[5],可形成對比矩陣,aij的取值見表1。
表1 尺度aij的含義
當(dāng)形成對比矩陣時,需要進(jìn)行一致性檢驗,λ是n階矩陣的特征根,一致性指標(biāo)。RI的取值見表2。若一致性指標(biāo)通過,則可以認(rèn)為對比矩陣A是基本一致的,如果未通過檢驗,則需要重新構(gòu)造對比矩陣。
表2 RI值
求矩陣A的特征分解向量,對特征向量進(jìn)行歸一化處理,則可到評價指標(biāo)的權(quán)向量W=(w1,w2…wn)。
建立模糊綜合評價體系[6-9],將每個評價指標(biāo)Ci的評定分?jǐn)?shù)劃分為m個等級,等級i對應(yīng)分值ci(i=1,2,…m),每個評委的分?jǐn)?shù)按照最近鄰法,劃分等級,即一個評委對Ci的評分為x,重新賦值x,若,當(dāng)i=j時成立,則x=cj。記對評價指標(biāo)Ci給出等級ci(i=1,2,…m)的人數(shù)占總?cè)藬?shù)的比例為bij,其中1≤i≤n,1≤j≤m,得到模糊評價矩陣B:
把模糊評價矩陣B和層次分析法得到的權(quán)重向量W進(jìn)行合成,得到模糊子向量D:
在對向量進(jìn)行歸一化處理,得到模糊評價子向量β=(β1,β2,…βm),其中
總分S為模糊子向量和其對應(yīng)級別分值的積。S=β·c=(β1·c1+β2·c2+…βm·cm),則S為最終評價所得的分?jǐn)?shù)。
2012年全國大學(xué)生數(shù)學(xué)建模競賽A題,以白葡萄酒的為例,本實(shí)驗利用MATLAB[10]求解。首先,需要建立模型說明兩組評酒員的數(shù)據(jù)是否存在差異。在得到兩組評價結(jié)果存在顯著性差異時,還需要進(jìn)一步說明哪一組的分析結(jié)果更加可信。一種簡單而直觀的做法是考察對每組數(shù)據(jù)的偏離程度,但這種做法的數(shù)據(jù)利用率較低,而且大量信息容易被這一指標(biāo)掩蓋,所以,需要引進(jìn)更加理性化的指標(biāo),在利用原始數(shù)據(jù)的基礎(chǔ)之上,進(jìn)行進(jìn)一步分析。最后再利用較為合理的數(shù)據(jù),得到葡萄酒的最終評分。
由于品酒員的打分,常常帶有一定的主觀因素,而在他們的感覺評價中,有不同的準(zhǔn)確度和精確度,因此,需要建立合適的模型,去分析兩組分析結(jié)果是否存在顯著性差異。調(diào)用lillietest函數(shù)對白葡萄酒得分?jǐn)?shù)據(jù)進(jìn)行正態(tài)分布檢驗,兩組數(shù)據(jù)的p值為0.3297和0.3308都大于0.05,說明白酒的兩組得分的在顯著性水平0.05下接受原假設(shè),兩組的得分都服從正態(tài)分布,其概率分布如圖1和圖2所示。再對整體數(shù)據(jù)進(jìn)行方差齊性檢驗,調(diào)用vartestn函數(shù)分別檢驗兩組評委的打分,得到白葡萄酒的p值0.0123<0.05,拒絕假設(shè),則白葡萄酒兩組得分不服從方差相同的正態(tài)分布。
圖1 第一組白酒概率分布圖
圖2 第二組白酒概率分布圖
通過數(shù)據(jù)分析,可以得知兩組品酒員的數(shù)據(jù)不服從方差相同的正太分布,所以引入了非參數(shù)方差分析。調(diào)用kruskalwallis函數(shù)白葡萄酒的p=0.0438,小于0.05,所以有顯著的差異。調(diào)用multcompare函數(shù)進(jìn)行多重比較,得出白葡萄酒的矩陣為:
從矩陣可以看出每個矩陣第三和第五個區(qū)間不含0,說明兩組存在顯著差異,其交互式圖形如圖3所示,可以更加的清晰看出每種酒的評價存在顯著差異。
圖3 交互式圖
樣本方差反映了樣品所得總分與最終結(jié)果的平均偏離程度,也反應(yīng)了評酒員評價尺度的差異,先計算樣本方差。再將一組中每位評酒員所給的平均分按從高到低排序,則一種樣品酒在該組所有評委所打的分從高到低的排名中的秩形成一個排列,計算該排列的逆序數(shù),同時,再根據(jù)k=10,l=28計算肯德爾和諧系數(shù)。當(dāng)選樣本數(shù)大于7時,檢驗統(tǒng)計量為χ2計量,χ2=k*(l-1)*wi,i=1,2。則χ2服從自由度為l的χ2分布,若χ2>χ(l)α,則有100*(1-α)%的準(zhǔn)確率可以斷定10個品酒員的評分存在相關(guān)。各項指標(biāo)的計算結(jié)果見表3。
根據(jù)表3,從方差角度和逆序數(shù)角度分析,第二組的偏離程度較小且評委們評價方向也較為一致,從肯德爾和諧系數(shù)來看,第二組存在相關(guān)的概率大于第一組。綜合三個指標(biāo),則第二組品酒員的評價結(jié)果更為可信。
表3 兩組標(biāo)值
在葡萄酒的評分過程中,應(yīng)制定相應(yīng)能夠進(jìn)行量化表述的一套客觀標(biāo)準(zhǔn)(表4)。
表4 葡萄酒評價標(biāo)準(zhǔn)
對于其中的每一個指標(biāo)Ci的評價級別和對應(yīng)分值見表5。
表5 葡萄酒等級劃分標(biāo)準(zhǔn)
根據(jù)專家經(jīng)驗給出對比矩陣:
通過對矩陣A進(jìn)行一致性檢驗,求得特征根λ為4.03,RI=0.9,一致性指標(biāo)為CI=0.0103,RI=0.9,一致性指標(biāo)=0.0115<0.1,則一致性檢測通過,并求得特征向量,并作歸一化處理得到W=[0.139 0.341 0.404 0.116]。
以白葡萄酒樣品為例,將品酒員所給的評分劃分到對應(yīng)的等級,而這5個等級對應(yīng)的分值分別為95、85、75、65和50,共有十個品酒員對它打分,其中,
1≤i≤4,1≤j≤5,得到模糊評價矩陣為:
模糊子向量D:
做歸一化處理,得到模糊子向量:
則樣品1的最終得分為77.0329。
葡萄酒質(zhì)量評價本身是一個不容易定量描述的問題,在評價中,品酒員受主觀因素的影響較大,且打分過程中容易出現(xiàn)評價指標(biāo)對不同葡萄酒權(quán)重不一致的不穩(wěn)定情況。對于不同組品酒員之間,可以用方差分析,去解釋是否存在顯著性差異,同時,可以借助逆序數(shù)和肯德爾和諧系數(shù)去評定更加合理的一組。而直接處理品酒員們做出定量的分值并不合理,而定性的評價更為合理,所以需要借助于數(shù)學(xué)模型將定量的分值轉(zhuǎn)化為定性的評價。最后,再依據(jù)對評價指標(biāo)使用層次分析法得到權(quán)值與模糊矩陣進(jìn)行運(yùn)算,得到最終的分值。實(shí)驗證明,本文所采用的方法可以將評委做出的定性描述轉(zhuǎn)換為定量的分值,且最后計算得到的分值也更加科學(xué)合理,模型也存在兩個不足。葡萄酒評價標(biāo)準(zhǔn)中可以再添加因素,但一致性檢驗不容易通過;同時,在得到一組數(shù)據(jù)更加合理的情況下,直接舍去了另一組數(shù)據(jù),沒有很全面的對數(shù)據(jù)進(jìn)行利用。
[1]高媛媛,劉強(qiáng)國.基于LIBSVM的葡萄酒品質(zhì)評判模型[J].四川理工學(xué)院學(xué)報:自然科學(xué)版,2010,23(5):530-532.
[2]王 星.非參數(shù)統(tǒng)計[M].北京:清華大學(xué)出版社,2009.
[3]楊 萌,程銘東.排球賽積分方式的公平性評價分析[J].山東體育學(xué)院學(xué)報,2011,27(4):76-78.
[4]徐文彬.教育統(tǒng)計學(xué)[M].南京:南京師范大學(xué)出版社,2007.
[5]Tong Y,Li Y J.The evaluation of enterprise informatization performance based on AHP J[C].//Lan Hua.Proceeding of2007 International Conference on Management Science&Engineering,Harbin Institute of Technology,Harbin,China,August20-22,2007:149-155.
[6]劉浩杰,趙長紅,李存斌.基于AHP和模糊評價的研發(fā)人員績效考核研究[J].華北電力大學(xué)學(xué)報,2012,39(5):105-108.
[7]張道文.汽車4S店銷售服務(wù)顧客滿意度評價模型[J].西華大學(xué)學(xué)報:自然科學(xué)版,2011,30(6):9-12.
[8]曹慶奎,阮俊虎,劉開第.基于隸屬度轉(zhuǎn)換算法的礦業(yè)投資決策模糊評價[J].河北工程大學(xué)學(xué)報:自然科學(xué)版.2010,27(1):92-95.
[9]譚長建.基于模糊綜合評判法的橋梁監(jiān)管評價體系研究[J].四川理工學(xué)院學(xué)報:自然科學(xué)版.2012,25(3):71-75.
[10]史 峰,王 輝,郁 磊,等.Matlab智能算法30個案例分析[M].北京:北京航空航天大學(xué)出版社,2010.