楊 勇,張東升,王艷茹,張亞男
(西北師范大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院,甘肅 蘭州 730070)
1965年,Zadeh[1]提出了模糊集理論,該理論為處理不精確、不確定的數(shù)據(jù)和信息提供了一個(gè)重要工具。Atanassov[2]于1986年對(duì)模糊集進(jìn)行拓展,給出了直覺(jué)模糊集概念,由于它同時(shí)考慮隸屬度、非隸屬度和猶豫度三方面的信息,因此與模糊集相比,直覺(jué)模糊集在處理信息的模糊性和不確定性時(shí)更具有靈活性和實(shí)用性。Gau和Buehrer[3]于1993年定義了Vague集概念,后來(lái)Bustince和Burillo[4]證明了Vague集就是直覺(jué)模糊集。
相似度測(cè)量是度量?jī)蓚€(gè)對(duì)象之間相似程度的一個(gè)重要方法,它在決策分析[5]、模式識(shí)別[6]和醫(yī)療診斷[7]等領(lǐng)域得到廣泛應(yīng)用。1995年Chen[8]將相似度引入Vague集,1999年Hong 和Kim[9]對(duì)Chen的方法進(jìn)行改進(jìn)。2002年Li和Cheng[10]提出了一種測(cè)量?jī)蓚€(gè)直覺(jué)模糊集間相似程度的計(jì)算公式,并將其用在模式識(shí)別中。2011年Ye[11]利用向量的知識(shí)定義了余弦相似度測(cè)量公式,但該公式在某些情況下會(huì)出現(xiàn)不合理現(xiàn)象,為彌補(bǔ)該缺陷,Shi和Ye[12]通過(guò)考慮隸屬度、非隸屬度和猶豫度三方面的信息對(duì)文獻(xiàn)[11]中的公式進(jìn)行改進(jìn),提出余弦相似度測(cè)量公式的另外一種形式。接著2013年Tian[13]給出了基于余切函數(shù)的相似度測(cè)量公式,使計(jì)算過(guò)程更加簡(jiǎn)單化。受文獻(xiàn)[11]和文獻(xiàn)[13]中相似度測(cè)量公式的啟發(fā),本文對(duì)三角相似度測(cè)量進(jìn)一步拓展,提出基于正弦函數(shù)的相似度測(cè)量公式,并應(yīng)用于醫(yī)療診斷和汽車發(fā)動(dòng)機(jī)的設(shè)計(jì)方案決策中。
定義1設(shè)X為論域,其中任意一個(gè)元素用x表示,則在X上的直覺(jué)模糊集A定義為:A={〈x,μA(x),vA(x)〉|x∈X},其中μA(x)和vA(x)分別表示成員隸屬度和非成員隸屬度,即μA(x):X→[0,1],vA(x):X→[0,1],并且需滿足條件0≤μA(x)+vA(x)≤1。此外,πA(x)=1-μA(x)-vA(x),x∈X,表示X中x屬于A的猶豫度或不確定度。
設(shè)A={〈x,μA(x),vA(x)〉|x∈X}和B={〈x,μB(x),vB(x)〉|x∈X}為論域X上的兩個(gè)直覺(jué)模糊集,則:
(1)A?B當(dāng)且僅當(dāng)μA(x)≤μB(x),vA(x)≥vB(x),x∈X。
(2)A=B當(dāng)且僅當(dāng)μA(x)=μB(x),vA(x)=vB(x),x∈X。
定義2設(shè)A={〈x,μA(x),vA(x)〉|x∈X}和B={〈x,μB(x),vB(x)〉|x∈X}為論域X上的兩個(gè)直覺(jué)模糊集,S為一個(gè)映射:IFS(x)×IFS(x)→[0,1],如果它滿足下面4個(gè)條件:
(S1) 0≤S(A,B)≤1;
(S2)S(A,B)=1當(dāng)且僅當(dāng)A=B;
(S3)S(A,B)=S(B,A);
(S4) 若A?B?C,有S(A,C)≤S(A,B),S(A,C)≤S(B,C)。
則稱S(A,B)為直覺(jué)模糊集A和B之間的相似度。
Ye在文獻(xiàn)[11]中利用向量的知識(shí)提出了如下基于余弦函數(shù)的相似度測(cè)量公式:
C1(A,B)=
(1)
通過(guò)研究發(fā)現(xiàn),在該余弦相似度測(cè)量公式中,如果μA(xj)=vA(xj)=0或μB(xj)=vB(xj)=0,則該公式就會(huì)出現(xiàn)分母為零的現(xiàn)象。在這種情況下,該公式就不能用于計(jì)算直覺(jué)模糊集A和B之間的相似度測(cè)量值。另外,如果μA(xj)=kμB(xj),vA(xj)=kvB(xj),其中k≠1,xj∈X(j=1,2,…,n),即A≠B,則用公式(1)來(lái)計(jì)算相似度測(cè)量值,其結(jié)果都等于1。在這種情況下該公式不滿足定義2中的條件(S2)。
為了彌補(bǔ)公式(1)的不足,通過(guò)引入隸屬度、非隸屬度和猶豫度三方面的信息,Shi和Ye在文獻(xiàn)[12]中提出了余弦相似度測(cè)量公式的另外一種形式。
vA(xj)vB(xj)+πA(xj)πB(xj))/
(2)
Tian在文獻(xiàn)[13]中提出了如下直覺(jué)模糊集之間的余切相似度測(cè)量公式:
(3)
在實(shí)際應(yīng)用中,直覺(jué)模糊集中每個(gè)元素的權(quán)重往往是不相同的,因此在文獻(xiàn)[11 - 13]中分別提出了如下直覺(jué)模糊集之間加權(quán)的余弦相似度測(cè)量公式和余切相似度測(cè)量公式:
WC1(A,B)=
(4)
vA(xj)vB(xj)+πA(xj)πB(xj))/
(5)
(6)
設(shè)A和B為論域X={x1,x2,…,xn}上兩個(gè)直覺(jué)模糊集,則分別定義A和B之間的兩個(gè)正弦相似度測(cè)量公式SN1(A,B)和SN2(A,B)如下:
μB(xj)|∨|vA(xj)-vB(xj)|∨|πA(xj)-
(7)
μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-
(8)
證明
(S1)與(S3)顯然成立,下面只證明(S2)和(S4)。
(S2) 設(shè)A和B是論域X={x1,x2,…,xn}上的兩個(gè)直覺(jué)模糊集,若A=B,則有μA(xj)=μB(xj),vA(xj)=vB(xj),πA(xj)=πB(xj),xj∈X,j=1,2,…,n,得|μA(xj)-μB(xj)|=0,|vA(xj)-vB(xj)|=0,|πA(xj)-πB(xj)|=0。故,SNk(A,B)=1,其中k=1,2。
反之,若SNk(A,B)=1,k=1,2,有|μA(xj)-μB(xj)|=0,|vA(xj)-vB(xj)|=0,|πA(xj)-πB(xj)|=0,xj∈X,j=1,2,…,n。所以μA(xj)=μB(xj),vA(xj)=vB(xj),πA(xj)=πB(xj),x∈X。故,A=B。
(S4) 如果A?B?C,有μA(xj)≤μB(xj)≤μC(xj),vA(xj)≥vB(xj)≥vC(xj),xj∈X,j=1,2,…,n??傻茫?/p>
|μA(xj)-μB(xj)|≤|μA(xj)-μC(xj)|
(a)
|μB(xj)-μC(xj)|≤|μA(xj)-μC(xj)|
(b)
|vA(xj)-vB(xj)|≤|vA(xj)-vC(xj)|
(c)
|vB(xj)-vC(xj)|≤|vA(xj)-vC(xj)|
(d)
(1)k=1。
由πA(xj)=1-μA(xj)-vA(xj),πB(xj)=1-μB(xj)-vB(xj),πC(xj)=1-μC(xj)-vC(xj),
可得:
|πA(xj)-πB(xj)|=
|(1-μA(xj)-vA(xj))-(1-μB(xj)-vB(xj))|=
|(μB(xj)-μA(xj))+(vB(xj)-vA(xj))|≤|μB(xj)-μA(xj)|∨|vB(xj)-vA(xj)|
|πA(xj)-πC(xj)|=
|(1-μA(xj)-vA(xj))-(1-μC(xj)-vC(xj))|=
|(μC(xj)-μA(xj))+(vC(xj)-vA(xj))|≤|μC(xj)-μA(xj)|∨|vC(xj)-vA(xj)|
從而,
|μA(xj)-μB(xj)|∨|vA(xj)-vB(xj)|∨|πA(xj)-πB(xj)|=
|μA(xj)-μB(xj)|∨|vA(xj)-vB(xj)|
|μA(xj)-μC(xj)|∨|vA(xj)-vC(xj)|∨|πA(xj)-πC(xj)|=
|μA(xj)-μC(xj)|∨|vA(xj)-vC(xj)|
因此,
|μA(xj)-μB(xj)|∨|vA(xj)-vB(xj)|∨|πA(xj)-πB(xj)|≤
|μA(xj)-μC(xj)|∨|vA(xj)-vC(xj)|∨|πA(xj)-πC(xj)|
同理,
|μB(xj)-μC(xj)|∨|vB(xj)-vC(xj)|∨|πB(xj)-πC(xj)|≤
|μA(xj)-μC(xj)|∨|vA(xj)-vC(xj)|∨|πA(xj)-πC(xj)|
故SN1(A,C)≤SN1(B,C)。
(2)k=2。
由條件可得:
|μA(xj)-μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-πB(xj)|=
μB(xj)-μA(xj)+vA(xj)-vB(xj)+|μB(xj)-μB(xj)+(vB(xj)-vA(xj))|
|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|=
μC(xj)-μA(xj)+vA(xj)-vC(xj)+|(μC(xj)-μA(xj))+(vC(xj)-vA(xj))|
①當(dāng)μB(xj)-μA(xj)≥vB(xj)-vA(xj)時(shí),
|μA(xj)-μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-πB(xj)|=2(μB(xj)-μA(xj))
②當(dāng)μB(xj)-μA(xj)≤vB(xj)-vA(xj)時(shí),
|μA(xj)-μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-πB(xj)|=2(vA(xj)-vB(xj))
③ 當(dāng)μC(xj)-μA(xj)≥vC(xj)-vA(xj)時(shí),
|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|=2(μC(xj)-μA(xj))
④ 當(dāng)μC(xj)-μA(xj)≤vC(xj)-vA(xj)時(shí),
|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|=2(vA(xj)-vC(xj))
由式(a)及①④可得:
vC(xj)-vA(xj)≥μC(xj)-μA(xj)≥
μB(xj)-μA(xj)≥vB(xj)-vA(xj)
由(c)及②③可得:
μC(xj)-μA(xj)≥vC(xj)-vA(xj)≥
vB(xj)-vA(xj)≥μB(xj)-μA(xj)
因此,
|μA(xj)-μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-πB(xj)|≤
|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|
同理,
|μB(xj)-μC(xj)|+|vB(xj)-vC(xj)|+|πA(xj)-πB(xj)|≤
|μA(xj)-μC(xj)|+|vA(xj)-vC(xj)|+|πA(xj)-πC(xj)|
故SN2(A,C)≤SN2(B,C)。
□
加權(quán)正弦相似度測(cè)量公式定義如下:
μB(xj)|∨|vA(xj)-vB(xj)|∨|πA(xj)-
(9)
μB(xj)|+|vA(xj)-vB(xj)|+|πA(xj)-
(10)
當(dāng)論域X中的每一個(gè)元素的權(quán)重相同時(shí),即wj=1/n,j=1,2,…,n,公式(9)和公式(10)就轉(zhuǎn)化為公式(7)和公式(8)。上述兩個(gè)加權(quán)正弦相似度測(cè)量公式滿足定義2中的四個(gè)條件,證明過(guò)程與3.2節(jié)相同。
本節(jié)將通過(guò)幾組數(shù)值例子來(lái)對(duì)本文提出的正弦相似度測(cè)量公式與文獻(xiàn)[11-13]中的相似度測(cè)量公式進(jìn)行比較,通過(guò)對(duì)測(cè)量結(jié)果進(jìn)行分析比較來(lái)說(shuō)明本文所提出的相似度測(cè)量公式的有效性和合理性。直覺(jué)模糊集A和B之間的相似度測(cè)量值如表1所示。
從表1中三角相似度測(cè)量的結(jié)果可以看出,文獻(xiàn)[11]中的余弦相似度測(cè)量公式C1(A,B)在第2組和第3組例子之間進(jìn)行相似度測(cè)量計(jì)算中出現(xiàn)
Table 1 Values of similarity measure between IFSs A and B
分母為零(無(wú)意義)現(xiàn)象,在第1組和第5組例子之間進(jìn)行相似度測(cè)量計(jì)算中出現(xiàn)不合理現(xiàn)象。文獻(xiàn)[13]中的公式CT1(A,B)在第1組和第6組例子之間相似度測(cè)量結(jié)果相同而出現(xiàn)無(wú)法區(qū)分現(xiàn)象。因此,上述現(xiàn)象將會(huì)給決策者在進(jìn)行決策時(shí)帶來(lái)不便。公式C2(A,B)、SN1(A,B)和SN2(A,B)在表1中具有較強(qiáng)的區(qū)分能力,但公式C2(A,B)計(jì)算過(guò)程相對(duì)復(fù)雜,相比之下公式SN1(A,B)和SN2(A,B)在實(shí)際應(yīng)用中更具有優(yōu)越性。
(1)醫(yī)療診斷。
現(xiàn)有診斷集合P={P1,P2,P3,P4}分別表示病毒性發(fā)燒、感冒、瘧疾和胃病問(wèn)題。癥狀集合X={x1(發(fā)燒),x2(頭痛),x3(胃疼),x4(咳嗽)}。經(jīng)專家研究,得到如表2所示數(shù)據(jù)。
Table 2 Standard data of the four symptoms
現(xiàn)有一個(gè)病人,其癥狀的診斷結(jié)果Q為未知。設(shè)w={0.2,0.3,0.4,0.1}為癥狀集合中四個(gè)屬性的權(quán)重集?,F(xiàn)用本文提出的加權(quán)正弦相似度公式進(jìn)行相應(yīng)診斷,并與文獻(xiàn)[11-13]中提出的相似度公式的診斷結(jié)果進(jìn)行對(duì)比,得到如表3所示結(jié)果。
Table 3 Diagnosed results of differentsimilarity measure methods
分析表3中的數(shù)據(jù)可知,對(duì)于加權(quán)余弦相似度公式WC1,W(P1,Q)=W(P2,Q)=0.9910>W(P4,Q)=0.9216>W(P3,Q)=0.9163,出現(xiàn)了兩個(gè)診斷結(jié)果的數(shù)值相等并且都是最大值,導(dǎo)致很難將診斷結(jié)果歸類到P1(病毒性發(fā)燒)還是P2(感冒)。而加權(quán)相似度公式WCT在進(jìn)行病人診斷結(jié)果識(shí)別時(shí)也出現(xiàn)了同樣情況,而使用相似度公式WC2和本文提出的加權(quán)正弦相似度公式WSN1和WSN2則能夠有效地區(qū)分,并把診斷結(jié)果Q歸類到P2,即病人患的疾病是感冒。但是,相似度公式WC2計(jì)算過(guò)程相對(duì)復(fù)雜,所以本文提出的加權(quán)正弦相似度公式在實(shí)際應(yīng)用中更具有優(yōu)越性。
(2)決策應(yīng)用。
本節(jié)將正弦相似度測(cè)量方法用于汽車發(fā)動(dòng)機(jī)設(shè)計(jì)的備選方案選擇決策例子中,通過(guò)實(shí)驗(yàn)的結(jié)果來(lái)表明所提出的相似度測(cè)量公式的合理性。
在汽車發(fā)動(dòng)機(jī)設(shè)計(jì)的初期,設(shè)計(jì)師提出了一組備選方案A={A1,A2,A3,A4},分別代表柴油發(fā)動(dòng)機(jī)、汽油發(fā)動(dòng)機(jī)、純電力電動(dòng)機(jī)和混合動(dòng)力發(fā)動(dòng)機(jī)。設(shè)計(jì)師對(duì)以上四種設(shè)計(jì)方案都是從屬性集X={x1,x2,x3,x4}來(lái)比較,x1:制造成本,x2:能源利用效率,x3:構(gòu)造合理性,x4:制造難易程度。為了評(píng)價(jià)備選方案的優(yōu)劣,專家給出了人們期望的設(shè)計(jì)方案A*,方案中的數(shù)據(jù)由專家給出。四種備選方案在屬性集X上用直覺(jué)模糊集模型分別表示如下:
A1={〈x1,0.9,0.1〉,〈x2,0.88,0.05〉,〈x3,0.9,0.1〉,〈x4,0.5,0.2〉}
A2={〈x1,0.9,0.1〉,〈x2,0.83,0.0〉,〈x3,0.65,0.1〉,〈x4,0.6,0.1〉}
A3={〈x1,0.6,0.1〉,〈x2,0.45,0.3〉,〈x3,0.6,0.1〉,〈x4,0.5,0.2〉}
A4={〈x1,0.5,0.2〉,〈x2,0.6,0.15〉,〈x3,0.55,0.2〉,〈x4,0.9,0.1〉}
A*={〈x1,0.8,0.0〉,〈x2,0.8,0.0〉,〈x3,0.8,0.0〉,〈x4,0.8,0.0〉}
設(shè)w={0.1,0.25,0.25,0.4}為四個(gè)屬性的權(quán)重集,在此用本文提出的公式(9)與公式(10)和公式(4)~公式(6)來(lái)計(jì)算備選方案和專家給出的期望設(shè)計(jì)方案之間的相似測(cè)量值,其相似度測(cè)量結(jié)果如表4所示。從相似度測(cè)量結(jié)果的排列順序可以看出A2是最佳設(shè)計(jì)方案。
目前已有許多基于直覺(jué)模糊集相似度測(cè)量公式被提出,但現(xiàn)有部分公式在處理某些特殊情況時(shí)會(huì)出現(xiàn)不合理現(xiàn)象和計(jì)算過(guò)程相對(duì)復(fù)雜問(wèn)題,實(shí)際運(yùn)用效果較差。本文通過(guò)考慮隸屬度、非隸屬和猶豫度三方面的信息,首次提出兩種基于正弦函數(shù)的相似度測(cè)量公式,證明了其正確性,并通過(guò)與其它相似度計(jì)算公式進(jìn)行比較,表明了其優(yōu)越性。
Table 4 Values of similarity measure betweenIFSs A and A* and ranking orders
[1] Zaded L A.Fuzzy sets[J].Information and Control,1965,8(3):338-353.
[2] Atanassov K T.Intuitionistic fuzzy sets[J].Fuzzy Sets and Systems,1986,20(1):87-96.
[3] Gau W L,Buehrer D J.Vague sets[J].IEEE Transations on Systems,Man, and Cybernetics,1993,23(2):610-614.
[4] Bustince H,Burillo P.Vague sets are intuitionistic fuzzy sets[J].Fuzzy Sets and Systems,1996,79(3):403-405.
[5] Ye J.Similarity measures of intuitionistic fuzzy sets based on cosine function for the decision making of mechanical design schemes[J].Journal of Intelligent & Fuzzy Systems,2015,30(1):151-158.
[6] Chu Jun-feng,Wang Ying-ming.Method of pattern recogintion based on new similarity measure of interval-valued intuitionstic fuzzy set[J].Computer Engineering and Applications,2013,49(9):140-143.(in Chinese)
[7] Szmidt E,Kacprzyk J A.Similarity measure for intuitionistic fuzzy sets and its application in supporting medical diagnostic reasoning[J].Artificial Intelligence and Soft Computing,2004,3070(1):388-393.
[8] Chen S M. Measures of similarity between vague sets[J].Fuzzy Sets and Systems,1995,74(2):217-223.
[9] Hong D H, Kim C.A note on similarity measures between vague sets and between elements [J].Information Sciences,1999,115(1-4):83-96.
[10] Li D,Cheng C.New similarity measures of intuition fuzzy ses and application to pattern recoginition[J].Pattern Recognition Letters,2002,23(1-3):221-225.
[11] Ye J.Cosine similarity measure for intuitionsitc fuzzy sets and their applications[J].Mathematical and Computer Modelling,2011,53(1-2):91-97.
[12] Shi L L,Ye J.Study on fault diagnosis of turbine using an improved cosine similarity measure for vague sets[J].Journal of Applied Sciences,2013,13(10):1781-1786.
[13] Tian M Y.A new fuzzy similarity based on cotangent function for medical diagnosis[J].Advanced Modeling and Optimization,2013,15(2):1781-186.
附中文參考文獻(xiàn):
[6] 楚俊峰,王應(yīng)明.基于新的區(qū)間直覺(jué)模糊集相似性測(cè)度的模式識(shí)別[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(9):140-143.