劉杰,薛占熬
(1.河南科技學(xué)院 信息工程學(xué)院,新鄉(xiāng) 453007;2.河南師范大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,新鄉(xiāng) 453007)
不完備信息系統(tǒng)的梯形模糊數(shù)三支決策模型
劉杰1,薛占熬2*
(1.河南科技學(xué)院 信息工程學(xué)院,新鄉(xiāng) 453007;2.河南師范大學(xué) 計(jì)算機(jī)與信息工程學(xué)院,新鄉(xiāng) 453007)
在不完備信息系統(tǒng)中,結(jié)合Bayes決策過(guò)程,采用文獻(xiàn)[3]中的改進(jìn)的完備容差關(guān)系代替經(jīng)典決策粗糙集模型中的等價(jià)關(guān)系,并將具有一般性和易運(yùn)算的梯形模糊數(shù)引入到?jīng)Q策粗糙集中,提出一種基于不完備信息系統(tǒng)的梯形模糊數(shù)決策粗糙模型,給出該模型的三支決策的方法和規(guī)則提取,并分別討論了悲觀者和樂(lè)觀者的不同決策規(guī)則。最后通過(guò)實(shí)例來(lái)闡明該模型的應(yīng)用過(guò)程。
不完備信息系統(tǒng);完備容差關(guān)系;三支決策;梯形模糊數(shù)
在現(xiàn)實(shí)生活中,由于數(shù)據(jù)測(cè)量的誤差、數(shù)據(jù)獲取的限制等因素,使得在知識(shí)獲取時(shí)面臨的往往是不完備信息系統(tǒng)[1](Incomplete Information Systems,IIS)。不完備信息有兩種語(yǔ)義解釋:一種是遺漏語(yǔ)義,即認(rèn)為未知值暫時(shí)不能得到,但以后總是可以得到的。目前許多學(xué)者在相似關(guān)系[2]、限制容差關(guān)系[3]、完備容差關(guān)系[4-5]等方面的研究均是基于遺漏語(yǔ)義。另一種是缺席語(yǔ)義,即未知值不可能再得到。
三支決策理論[6]是Yao于2010年提出的一種用來(lái)處理不確定性決策的粒計(jì)算方法,并引起了廣泛的關(guān)注。目前針對(duì)三支決策的研究分為三大類:一是對(duì)三支決策理論模型的擴(kuò)展[7-9],二是對(duì)三支決策屬性約簡(jiǎn)等方法論的研究[10],三是三支決策在醫(yī)學(xué)、信息、管理等領(lǐng)域的應(yīng)用[11]。該理論的核心問(wèn)題之一即風(fēng)險(xiǎn)代價(jià)的確定。在已有的研究中損失函數(shù)大都由專家提供,考慮到人們?cè)趯?shí)際決策過(guò)程中損失函數(shù)有可能是遺漏的。針對(duì)不完備信息系統(tǒng),對(duì)決策粗糙集模型做進(jìn)一步的擴(kuò)展是很有必要的。Liu[12]和張?chǎng)蔚萚13]將不完備信息應(yīng)用到區(qū)間決策粗糙集中;李亞鴿等[14]針對(duì)區(qū)間內(nèi)取值機(jī)會(huì)均等對(duì)最終結(jié)果造成過(guò)大的誤差這一問(wèn)題,進(jìn)而采用三角模糊數(shù)來(lái)代替區(qū)間數(shù),提出了在不完備信息系統(tǒng)中損失函數(shù)為三角模糊的決策粗糙集模型,該模型是基于劃分粒度過(guò)細(xì)的相似關(guān)系,它能將比較相似的劃分至不同的相似類中,從而影響最后決策的結(jié)果。況且三角模糊數(shù)作為模糊數(shù)的一種也具有一定的局限性。在此基礎(chǔ)上,結(jié)合梯形模糊數(shù)較三角模糊數(shù)具有一般性、靈活性和易于運(yùn)算等特點(diǎn),將損失函數(shù)設(shè)為梯形模糊數(shù),又考慮到改進(jìn)的完備容差關(guān)系進(jìn)行劃分更合理,故本文提出了一種基于改進(jìn)的完備容差關(guān)系的梯形模糊數(shù)決策粗糙集及其三支決策規(guī)則。首先,分析相似關(guān)系的局限性,說(shuō)明采用改進(jìn)完備容差關(guān)系的原因。其次,考慮用梯形模糊數(shù)來(lái)表示決策粗糙集中損失函數(shù),使損失函數(shù)更具一般性。再次,提出一種基于不完備信息系統(tǒng)的梯形模糊數(shù)決策粗糙集模型,給出了該模型的三支決策規(guī)則和方法。最后通過(guò)實(shí)例來(lái)闡明該模型的應(yīng)用過(guò)程。該研究是對(duì)三支決策模型做了進(jìn)一步的拓展,對(duì)處理不完備信息系統(tǒng)具有一定的實(shí)際意義。
定義2[3]設(shè)不完備信息系統(tǒng)IIS=(U,A,V,f),對(duì)象xi的完備度γ(xi)=|P(xi)|/|A|,式中:P(xi)={a∈A|a(xi)≠*},|·|表示集合“·”的基數(shù),則整個(gè)信息系統(tǒng)S的完備度為:
定義3[3]給定不完備信息系統(tǒng)IIS=(U,A,V,f),則改進(jìn)的完備容差關(guān)系定義為:
NS(x,y)={(x,y)∈U×U|?a∈A,(a(x)=a(y))∨ (a(x)=*)∨(a(y)=*),
其中:P(xi)={a∈A|a(xi)≠*}。
定義4[3]給定不完備信息系統(tǒng)IIS=(U,A,V,f),對(duì)象x的改進(jìn)完備容差類INS(x)定義為:
INS(x)={y|y∈U,NS(x,y)}∪{x}.
(1)
例如對(duì)象x=(2,*,*,*,1)與對(duì)象y=(2,3,4,3,2),其中屬性2,3,4中值域分別為{0,2,3},{1,2,3,4},{1,3,4}。這兩個(gè)對(duì)象采用相似關(guān)系是可區(qū)分的,但實(shí)際上這兩個(gè)對(duì)象相似的可能性較大。若采用文獻(xiàn)[3]中的基于改進(jìn)的完備容差關(guān)系,這兩個(gè)對(duì)象是不可區(qū)分的,這符合我們的要求。故本文采用改進(jìn)的完備容差關(guān)系,對(duì)不完備信息系統(tǒng)的三支決策模型進(jìn)行研究。
若模糊集定義在實(shí)數(shù)R上,則模糊集的隸屬函數(shù)稱為模糊分布。在模糊數(shù)學(xué)中,常見(jiàn)的模糊分布有三角形模糊分布、梯形模糊分布、正態(tài)模糊分布等。區(qū)間值和三角形模糊分布是梯形模糊分布的特例,本文主要介紹梯形模糊數(shù)。
定義5[15]設(shè)論域U上的模糊數(shù)為M,如果M的隸屬函數(shù)μM:U→[0,1] 表示為:
(2)
其中實(shí)數(shù)a,b,c,d滿足0≤a≤b≤c≤d且不同時(shí)滿足a=b=c=d, 將梯形模糊數(shù)記為:M=(a,b,c,d).
特別地,若a
對(duì)于任意兩個(gè)梯形模糊數(shù)M1=(r1,r2,r3,r4),M2=(s1,s2,s3,s4)。 其運(yùn)算規(guī)則如下:
①M(fèi)1+M2=(r1+s1,r2+s2,r3+s3,r4+s4);
②M1-M2=(r1-s1,r2-s2,r3-s3,r4-s4);
③M1×M2=(r1s1,r2s2,r3s3,r4s4);
④M1/M2=(r1/s1,r2/s2,r3/s3,r4/s4)。
一般地,對(duì)于給定的對(duì)象x,令τ(x)為一個(gè)決策規(guī)則,它是到?jīng)Q策行動(dòng)集A的一個(gè)映射函數(shù)(τ(x)∈A),則決策規(guī)則τ(x)下的期望總體風(fēng)險(xiǎn)為:
(3)
對(duì)于每個(gè)對(duì)象x,可以根據(jù)式(3)計(jì)算條件風(fēng)險(xiǎn),從中選出條件風(fēng)險(xiǎn)最小的決策行為作為最佳行動(dòng)方案。
表1 不同狀態(tài)下對(duì)應(yīng)的梯形模糊數(shù)損失值Table 1 Trapezoidal fuzzy numbers loss values of different states
由于在實(shí)際情況中風(fēng)險(xiǎn)函數(shù)往往滿足:
aPP≤aBP aNN≤aBN (4) 根據(jù)貝葉斯決策中最小風(fēng)險(xiǎn)原則,得到如下3條決策規(guī)則。 接受規(guī)則(P): 若R(aP|INS(x))≤R(aB|INS(x))和R(aP|INS(x))≤R(aN|INS(x)),則x∈POS(X)。 延遲規(guī)則(B): 若R(aB|INS(x))≤R(aP|INS(x))和R(aB|INS(x))≤R(aN|INS(x)),則x∈BND(X)。 拒絕規(guī)則(N): 若R(aN|INS(x))≤R(aP|INS(x))和R(aN|INS(x))≤R(aB|INS(x)),則x∈NEG(X)。 (5) 上式中:σ是決策者的風(fēng)險(xiǎn)偏好指數(shù),反映出決策者的樂(lè)觀程度。在式(5)中σ值越大意味著決策者越樂(lè)觀,即悲觀決策者會(huì)高估損失值,而樂(lè)觀決策者則會(huì)低估損失值。特別地,當(dāng)σ=0和σ=1時(shí),ω(a)的值分別代表了悲觀決策者和樂(lè)觀決策者的觀點(diǎn)。 本文選取整數(shù)值排序方法來(lái)研究三角模糊數(shù)決策粗糙集?;谑?5)各期望損失值可分別計(jì)算得到: 其中, 故得到如下3條決策規(guī)則: 接受規(guī)則(P1): 若ω(R(aP|INS(x)))≤ω(R(aB|INS(x)))和ω(R(aP|INS(x)))≤ω(R(aN|INS(x))),則x∈POS(X)。 延遲規(guī)則(B1): 若ω(R(aB|INS(x)))≤ω(R(aP|INS(x)))和ω(R(aB|INS(x)))≤ω(R(aN|INS(x))),則x∈BNG(X)。 拒絕規(guī)則(N1): 若ω(R(aN|INS(x)))≤ω(R(aP|INS(x)))和ω(R(aN|INS(x)))≤ω(R(aB|INS(x))),則x∈NEG(X)。 接受規(guī)則(P2): 延遲規(guī)則(B2): 拒絕規(guī)則(N2): 令: 規(guī)則(P2)-(N2)可重寫為: 特別地,當(dāng)σ=0即悲觀決策者的閾值表達(dá)式為: 當(dāng)σ=1即樂(lè)觀決策者的閾值表達(dá)式為: 決策規(guī)則(P3)、(B3)、(N3)可重寫為: 醫(yī)學(xué)流感診斷決策表IIS=(U,A,V,f),U={x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11}為病人編號(hào),條件屬性集C={a1,a2,a3,a4}表示病人的4種癥狀:發(fā)燒、咳嗽、肌肉痛、頭疼。決策屬性集D={X,-X},其中X表示病人得流感,-X表示病人未得流感。病人的實(shí)際情況含有遺漏值,具體癥狀表現(xiàn)如表2所示。 在表2中,根據(jù)醫(yī)生的經(jīng)驗(yàn),集合為X={x3,x5,x6,x7,x8,x9}時(shí),這些患者得流感的概率相對(duì)較高。 且對(duì)各個(gè)屬性所對(duì)應(yīng)值的大小有如下定義: 發(fā)燒a1:1代表高,2代表較高,3代表正常。 咳嗽a2:1代表是,2代表否。 表2 病人癥狀表現(xiàn)Table 2 Status of the symptom patients 肌肉痛a3:1代表很嚴(yán)重,2代表有點(diǎn)嚴(yán)重,3代表不嚴(yán)重。 頭疼a4:1代表是,2代表否。 其中*代表缺失值。 根據(jù)定義[3]和定義[4]可得: INS(x1)={x1},INS(x2)={x2,x8},INS(x3)={x3,x7,x10},INS(x4)={x4,x5,x11}, INS(x5)={x4,x5,x11},INS(x6)={x6,x7,x10},INS(x7)={x6,x7,x9,x10,x11},INS(x8)={x8,x10}, INS(x9)={x6,x7,x9,x10},INS(x10)={x3,x6,x7,x8,x9,x10},INS(x11)={x4,x5,x7,x11}。 P(X|INS(x1))=0,P(X|INS(x2))=0.5,P(X|INS(x3))=0.667,P(X|INS(x4))=0.333, P(X|INS(x5))=0.333,P(X|INS(x6))=0.667,P(X|INS(x7))=0.4,P(X|INS(x8))=1, P(X|INS(x9))=0.5,P(X|INS(x10))=0.667,P(X|INS(x11))=0.5. 設(shè)損失函數(shù)的梯形分布滿足: 特別地,當(dāng)σ=0即悲觀決策者的閾值表達(dá)式為: ≈0.72 特別地,當(dāng)σ=1即樂(lè)觀決策者的閾值表達(dá)式為: =0.609 POS(X)={x8},NEG(X)={x1},BND(X)={x2,x3,x4,x5,x6,x7,x9,x10,x11}. POS(X)={x3,x6,x8,x10},NEG(X)={x1},BND(X)={x2,x4,x5,x7,x9,x11}. 本文在不完備信息系統(tǒng)中,從決策粗糙集出發(fā),利用梯形模糊數(shù)來(lái)設(shè)定損失函數(shù),采用一種已有的改進(jìn)完備容差關(guān)系來(lái)代替相似關(guān)系進(jìn)行分類。然后,結(jié)合Bayes決策過(guò)程,在不完備信息系統(tǒng)中應(yīng)用梯形模糊數(shù)決策粗糙集模型,提出了一種基于不完備信息系統(tǒng)的梯形模糊數(shù)的決策粗糙集模型。最后,給出了該模型的三支決策規(guī)則和方法,應(yīng)用實(shí)例說(shuō)明決策過(guò)程,并對(duì)該模型進(jìn)行了分析。本研究為在不完備信息系統(tǒng)中的三支決策理論模型拓展提供了一種方法。 [1] Kryszkeiwicz M.Rough Set Approach to Incomplete Information Systems[J].InformationScience,1998,112(1):39-49. [2] Stefamowski J,Tsoukeas A.On the Extension of Rough Sets under Incomplete Information[J].InternationalJournalofIntelligentSystem,2000,16(1):29-38. [3] 王國(guó)胤.Rough集理論在不完備信息系統(tǒng)中的擴(kuò)充[J].計(jì)算機(jī)研究與發(fā)展,2002,39(10):1238-1243. [4] 盛立,楊慧中.基于完備容差關(guān)系的擴(kuò)充粗糙集模型[J].控制與決策,2008,23(3):258-262.DOI:10.13195/j.cd.2008.03.20.shengl.022. [5] 馬希驁,王國(guó)胤,張清華,等.基于改進(jìn)的完備容差關(guān)系的擴(kuò)充粗糙集模型[J].計(jì)算機(jī)應(yīng)用,2010,30(7):1873-1882. [6] Yao Yiyu.Three-way Decisions with Probabilistic Rough Sets[J].InformationSciences,2010,180(3):341-353. [7] Greco S,Matarazzo B,Slowinski R.Parameterized Rough Set Model Using Rough Membership and Bayesian Confirmation Measure[J].InternationalJournalofApproximateReasoning,2008,49:285-300. [8] 薛占熬,劉杰,薛天宇,等.基于覆蓋的Sugeno測(cè)度粗糙集模型及其三支決策[J].計(jì)算機(jī)科學(xué),2016,43(3):285-290. [9] 史進(jìn)玲,張全友,杜根遠(yuǎn).基于風(fēng)險(xiǎn)最小化的多粒度三支決策模型[J].河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,45(2):102-107.DOI:10.16366/j.cnki.1000-2367.2017.02.019. [10] 王宇,楊志榮,楊習(xí)貝.決策粗糙集屬性約簡(jiǎn): 一種局部視角方法[J].南京理工大學(xué)學(xué)報(bào),2016,40(4):444-449.DOI:10.14177/j.cnki.32-1397n.2016.40.04.011. [11] 朱艷輝,田海龍,劉璟,等.基于三支決策的新聞情感關(guān)鍵句識(shí)別方法[J].山西大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,38(4):595-560. [12] Liu Dun,Liang Decui,Wang Changchun.A Novel Three-way Decision Model based on Incomplete Information System[J].Knowledge-basedSystems,2015,91:32-45. [13] 張?chǎng)?李續(xù)武,路艷麗,等.基于不完備區(qū)間值信息系統(tǒng)的決策粗糙集[J].計(jì)算機(jī)應(yīng)用研究,2017,34(1):110-122. [14] 李亞鴿,楊宏志,徐久成.基于不完備信息系統(tǒng)的三角模糊數(shù)決策粗糙集[J].智能系統(tǒng)學(xué)報(bào),2016,11(4):449-458.DOI:10.11992/tis.201606016. [15] 衷錦儀,葉東毅.基于模糊數(shù)風(fēng)險(xiǎn)最小化的拓展決策粗糙集模型[J].計(jì)算機(jī)科學(xué),2014,41(3):50-54. TrapezoidalFuzzyNumberThree-wayDecisionModelforIncompleteInformationSystems LIU Jie1,XUE Zhanao2* (1.DepartmentofInformationEngineering,HenanInstituteofScienceandTechnology,Xinxiang453007,China;2.CollegeofComputerandInformationEngineering,HenanNormalUniversity,Xinxiang453007,China) In the incomplete information systems, combined with the Bayes decision theory, this paper used the complete tolerance relation improved in literature [3] to replace the equivalence relation of classical decision rough sets, and introduced the generalized and easily calculated trapezoidal fuzzy numbers to the decision rough sets. Based on the incomplete information systems, a trapezoidal fuzzy number decision-theoretic rough set model was proposed.And the three-way decision rules were then presented, and the different decision rules for the pessimists and optimists were discussed, respectively. Finally, an example was given to illustrate the application process of the proposed model. incomplete information systems;complete tolerance relation;three-way decision;trapezoidal fuzzy number 10.13451/j.cnki.shanxi.univ(nat.sci.).2017.04.004 2017-06-05; 2017-08-09 國(guó)家自然科學(xué)基金(61273018);新鄉(xiāng)市重點(diǎn)科技攻關(guān)計(jì)劃項(xiàng)目(ZG14020) 劉杰(1989-),女,助教,研究方向?yàn)榇植诩腿Q策基本理論。 *通信作者:薛占熬(XUE Zhanao),E-mail:xuezhanao@163.com TP 181 A 0253-2395(2017)04-0683-073 實(shí)例
4 結(jié)束語(yǔ)