張利亭,馮 濤,李 歡
(河北科技大學 理學院 河北 石家莊 050018)
在日常生活中,有很多客觀或主觀的因素導致信息系統(tǒng)中某些對象的屬性值缺失。或許是人為所致,或許是系統(tǒng)所含缺陷所致,各種因素直接或間接地影響信息系統(tǒng)中所含對象的屬性值的不完整性。在一個信息系統(tǒng)中,如果對象的某些屬性值是未知或部分已知,那么這一信息系統(tǒng)將被定義為不完備信息系統(tǒng)(incomplete information system,IIS)[1]。不完備信息系統(tǒng)中的缺失屬性值有三類:第一類是該屬性值是存在的,但是我們不知道,為此,文獻[2-4]對容差關系、等價關系以及限制容差的關系進行了討論[5];第二類是不能確定屬性值是否存在,為此,文獻[6]提出了一種新的限制相似關系,文獻[7]依據(jù)新建立的非對稱相似關系得到了近似集的概念;第三類是屬性值不存在。在已知的針對不完備信息系統(tǒng)的處理方法中包含數(shù)學統(tǒng)計法、模糊集理論法以及粗糙集理論法三種。在以往的粗糙集理論中,對于上下近似的定義是基于概念之間的相交或者包含關系,而沒有對概念之間相交的程度進行考量,其定義方式不夠細致完善,會影響決策方案的選擇。為了解決這一問題,文獻[8]在經(jīng)典粗糙集理論中引入了具有容錯能力的閾值,用閾值來描述概念之間相交的程度。
為了處理決策粗糙集的方法在決策過程中產(chǎn)生風險損失的問題,文獻[9]引入了損失函數(shù),并將損失函數(shù)與貝葉斯決策理論相結合提出了三支決策理論,給出了三支決策理論模型中正域、負域、邊界域的語義描述。目前針對三支決策的研究分為三大類:第一類是對理論模型的擴展[10-13];第二類是對屬性約簡等方法的研究[14-16];第三類是三支決策在醫(yī)學、信息學和管理學等領域的應用[17-18]。該理論的核心問題之一是三支模型的確定,已有的三支模型方法大多是處理完備信息的,對一些信息不完備的情況,需要對決策粗糙集模型中已存在的模型進行拓展補充。文獻[19-20]在處理不完備信息時引入?yún)^(qū)間數(shù);文獻[21]考慮到區(qū)間內(nèi)概率取值相同會對決策結果產(chǎn)生誤差,進而引入三角模糊數(shù),提出不完備信息系統(tǒng)的三角模糊數(shù)決策粗糙集模型;文獻[22]結合梯形模糊數(shù)比三角模糊數(shù)更具一般性、靈活性和易于計算等特點,提出不完備信息系統(tǒng)的梯形模糊數(shù)三支決策。在此基礎上,考慮到直覺模糊數(shù)同時具有隸屬度與非隸屬度兩方面的信息,能更好地刻畫事物的“非此非彼”的模糊本質(zhì),其在理論方面也有一些擴展[23-24]。
上述研究在處理不完備信息時,將缺失值視為與系統(tǒng)中已知屬性值的類型一樣或者是進行填補。本文將缺失值視為每個屬性上已知屬性值集合的冪集,利用冪集的特點,借助直覺模糊關系引入兩個對象的相似關系和相異關系,得到直覺模糊信息粒,為不完備信息系統(tǒng)的直覺模糊三支決策打下基礎。在此基礎上,與三支決策思想相結合,可以進一步研究直覺模糊決策粗糙集模型的三支決策方法,并針對不同決策者給出不同的決策分析。
定義1[25]設U為給定的論域,則稱A={(x,μA(x),νA(x))|x∈U}為U上的直覺模糊集,其中μA(x)稱為x屬于A的程度,νA(x)稱為x不屬于A的程度,簡稱為隸屬度和非隸屬度。?x∈U,0≤μA(x)+νA(x)≤1,稱πA(x)=1-μA(x)-νA(x)為x屬于A的猶豫度,πA(x)∈[0,1]。
定義2[26]設A、B為U上的任意兩個直覺模糊集,其運算如下:①A?B當且僅當?x∈U,μA(x)≤μB(x)且νA(x)≥νB(x);②A∩B={x,min(μA(x),μB(x)),max(νA(x),νB(x))|x∈U};③A∪B={x,max(μA(x),μB(x)),min(νA(x),νB(x))|x∈U};④AC={(x,νA(x),μA(x))|x∈U}。
定義3[26]設A={(x,μA(x),νA(x))|x∈U}是直覺模糊集,?x∈U,(μA(x),νA(x))是直覺模糊數(shù),簡記為x=(μx,νx)。
基于直覺模糊集的定義和運算,文獻[25]定義了直覺模糊相似度的概念。
定義4[25]稱sim(A,B)為A和B的直覺模糊相似度,若滿足如下條件:①sim(A,B)為直覺模糊數(shù);②sim(A,B)=(1,0)當且僅當A=B;③sim(A,B)=sim(B,A);④ 若A?B?C,則sim(A,C)≤Lsim(A,B)且sim(A,C)≤Lsim(B,C)。
定義5[27]設R為U上的等價關系,?xi,xj∈U,[xi]R={xj|(xi,xj)∈R}稱為xi關于R的等價類。
定義6[28]設U為非空有限論域,R為U上的等價關系,對于?X?U,定義
定義7[28]設(U,R,P)為概率近似空間,對于任意實數(shù)θ、η滿足0≤η<θ≤1,X?U,定義集合X依參數(shù)θ、η的概率上、下近似為
決策理論粗糙集模型[19]利用兩種狀態(tài)集和三種行動集來描述決策過程。狀態(tài)集Ω={X,X},其中X和X分別表示對象屬于X和對象不屬于X。行動集Λ={aP,aB,aN},其中aP表示接受決策,aB表示延遲決策,aN表示拒絕決策??紤]到采取不同的行動會產(chǎn)生不同的損失,表1給出了對應的決策代價損失。其中λPP、λBP、λNP分別表示對象x屬于狀態(tài)X時,采取行動aP、aB、aN下的損失;λPN、λBN、λNN分別表示對象x不屬于狀態(tài)X時,采取行動aP、aB、aN下的損失。因此,采取三種不同行動aP、aB、aN下的期望損失可表示為
表1 決策代價損失
R(aP|[x]R)=λPPP(X|[x]R)+λPNP(X|[x]R),
R(aB|[x]R)=λBPP(X|[x]R)+λBNP(X|[x]R),
R(aN|[x]R)=λNPP(X|[x]R)+λNNP(X|[x]R),
依據(jù)貝葉斯最小風險決策規(guī)則,可以獲得如下決策規(guī)則。
接受規(guī)則(P):若R(aP|[x]R)≤R(aB|[x]R)且R(aP|[x]R)≤R(aN|[x]R),則x∈POS(X);
延遲規(guī)則(B):若R(aB|[x]R)≤R(aP|[x]R)且R(aB|[x]R)≤R(aN|[x]R),則x∈BND(X);
拒絕規(guī)則(N):若R(aN|[x]R)≤R(aP|[x]R)且R(aN|[x]R)≤R(aB|[x]R),則x∈NEG(X)。
定義8[1]令四元組IS=(U,AT,V,f)為信息系統(tǒng),U為非空有限的對象集合;AT為非空有限的屬性集合;V=∪a∈ATVa為屬性值值域,Va為屬性a的值域;f:U×AT→V為信息函數(shù)。對于?a∈AT,x∈U有f(x,a)∈Va。
若f(x,a)=*為未知值,則V=∪a∈ATV′a,V′a=Va∪{*},此時(U,AT,V,f)為不完備信息系統(tǒng)[1]。若有f(x,a)=*,規(guī)定f(x,a)?2Va-{?}。本文不完備信息系統(tǒng)中的“*”被認為是遺漏的。
定義9[29]設U和V為非空有限論域,定義在直積空間U×V上的直覺模糊子集R稱為從U到V之間的二元直覺模糊關系,記為
R(x,y)=(μR(x,y),νR(x,y)),?x∈U,y∈V,
其中:μR:U×V→[0,1],νR:U×V→[0,1]滿足0≤μR(x,y)+νR(x,y)≤1。IFR(U×V)表示U×V上的直覺模糊關系的全體。
定義10[29]R∈IFR(U×U),稱R為相似關系,若R滿足:① 自反性。?x∈U,μR(x,x)=1,νR(x,x)=0。② 對稱性。?(x,y)∈U×U,μR(x,y)=μR(y,x),νR(x,y)=νR(y,x)。
不完備信息系統(tǒng)IIS=(U,AT,V,f)中,?a∈AT,當f(x,a)=f(y,a)時,認為x和y在屬性a下不可區(qū)分。當f(x,a)∩f(y,a)=?時,認為x和y在屬性a下完全可區(qū)分。
定義11令IIS=(U,AT,V,f)為不完備信息系統(tǒng),x和y為論域U中的任意兩個對象,?a∈AT,則x、y關于屬性a的相似度Sa(x,y)和相異度Da(x,y)分別為
定理1令IIS=(U,AT,V,f)為不完備信息系統(tǒng),x和y為論域U中的任意兩個對象,?a∈AT,Sa(x,y)、Da(x,y)分別為對象x、y關于屬性a的相似度和相異度。sima(x,y)=(Sa(x,y),Da(x,y))則為對象x、y關于屬性a的直覺模糊相似度。
性質(zhì)1設IIS=(U,AT,V,f)為不完備信息系統(tǒng),sima(x,y)=(Sa(x,y),Da(x,y)),?a∈AT,則
1)f(x,a)=f(y,a)當且僅當sima(x,y)=(1,0)。
2)f(x,a)≠f(y,a)∧(f(x,a)≠*∧f(y,a)≠*)當且僅當sima(x,y)=(0,1)。
基于定理1,定義了一種新的直覺模糊相似關系來描述論域U中對象x與y的相似度。
定義12設IIS=(U,AT,V,f)為不完備信息系統(tǒng),U={x1,x2,…,xm},AT={a1,a2,…,an}。?x,y∈U,?a∈AT,直覺模糊相似關系SR(x,y)定義為
定義13設U={x1,x2,…,xm},AT={a1,a2,…,an},SR(x,y)是U上的直覺模糊相似關系,?λ1,λ2∈[0,1],0≤λ1+λ2≤1,
1)定義SR的(λ1,λ2)-截關系SR(λ1,λ2)為
2)?x∈U,定義(λ1,λ2)-截直覺模糊相似類為
[x]SR(λ1,λ2)={y∈U|(x,y)∈SR(λ1,λ2)}。
接下來定義直覺模糊關系SR的(λ1,λ2)-截關系的近似和三支決策。
定義14令IIS=(U,AT,V,f)為不完備信息系統(tǒng),SR(λ1,λ2)為直覺模糊相似關系SR的(λ1,λ2)-截關系,?λ1,λ2,p,q∈[0,1]滿足0≤p 由定義14生成的正域、負域、邊界域分別為 正域代表接受決策,負域代表拒絕決策,邊界域代表延遲決策。當p=0,q=1時,此時退化為經(jīng)典粗糙集。 貝葉斯決策過程由兩種狀態(tài)和三種行動組成,設不同狀態(tài)采取不同行動所帶來的損失以直覺模糊值的形式給出,則不同狀態(tài)下對應的直覺模糊損失值如表2所示。 表2 不同狀態(tài)下對應的直覺模糊損失值 實際決策時,不同的決策者對同一件事物進行決策往往會有不同的態(tài)度,有的決策者持樂觀態(tài)度,有的決策者持悲觀態(tài)度,有的決策者保持中立的態(tài)度。通過對表2的分析可得:1-ν(λkl)(k=P,B,N;l=P,N)表示樂觀決策者的損失值,μ(λkl)表示悲觀決策者的損失值,(μ(λkl)+1-ν(λkl))/2則表示中立決策者的損失值。為了把三種決策者的損失值統(tǒng)一到一個模型里,引入風險系數(shù)h來表示不同決策者的風險態(tài)度[30],其中0≤h≤1。于是給出定義15。 定義15[30]設λkl=(μ(λkl),ν(λkl))為決策者在兩種狀態(tài)下采取不同行動的直覺模糊損失值,h為決策者的風險系數(shù),則不同風險態(tài)度的決策者在不同狀態(tài)下采取不同行動的風險損失Eh(λkl)定義為 Eh(λkl)=(1-h)μ(λkl)+h(1-ν(λkl))。 當h為0、0.5、1時,分別代表悲觀型、中立型、樂觀型的決策者。因此,采取三種不同行動aP、aB、aN下的期望損失可表示為 R(ak|[x]SR(λ1,λ2))=Eh(λkP)P(X|[x]SR(λ1,λ2))+Eh(λkN)P(X|[x]SR(λ1,λ2)),k=P,B,N, 式中:[x]SR(λ1,λ2)表示對象x的(λ1,λ2)-截直覺模糊相似類;P(X|[x]SR(λ1,λ2))=1-P(X|[x]SR(λ1,λ2))。 依據(jù)貝葉斯最小風險決策規(guī)則,可以獲得如下決策規(guī)則。 接受規(guī)則(P1):若R(aP|[x]SR(λ1,λ2))≤R(aB|[x]SR(λ1,λ2))且R(aP|[x]SR(λ1,λ2))≤R(aN|[x]SR(λ1,λ2)),則x∈POS(X); 拒絕規(guī)則(N1):若R(aN|[x]SR(λ1,λ2))≤R(aP|[x]SR(λ1,λ2))且R(aN|[x]SR(λ1,λ2))≤R(aB|[x]SR(λ1,λ2)),則x∈NEG(X); 延遲規(guī)則(B1):若x∈U-POS(X)-NEG(X),則x∈BND(X)。 考慮到實際情況,做出一個正確決策產(chǎn)生的損失小于做出錯誤決策產(chǎn)生的損失,故有 其中: 對λ1、λ2和h的取值進行分析,可得在定義13中λ1、λ2的值決定著決策偏好的粒度。λ1值越大、λ2值越小,表示不可區(qū)分關系越強。在定義15中h為決策者的風險系數(shù),風險規(guī)避者討厭高風險并將更高的成本用于錯誤的損失,因此風險規(guī)避者選擇的h值較小。風險愛好者追求高風險、高回報,他們通過錯誤的決策來降低成本,因此風險愛好者選擇的h值較大。 以不完備醫(yī)學流感診斷決策表[21]為例,U={x1,x2,x3,x4,x5,x6,x7,x8,x9,x10}為病人編號;條件屬性集C={a1,a2,a3,a4,a5,a6,a7}表示病人的7種癥狀:體溫、咳嗽、流鼻涕、頭疼、惡心、痰多、肌肉疼痛;決策屬性集D={X,X},其中X表示病人得流感,X表示病人未得流感。根據(jù)醫(yī)生的經(jīng)驗,X={x1,x4,x5,x7,x8}時,這些病人更容易得流感,病人患病的實際情況如表3所示。 表3 病人患病的實際情況 為了方便描述,在表3中根據(jù)醫(yī)生的經(jīng)驗和每個屬性的屬性值有如下定義:對于a1,1、2、3分別代表高、較高、正常; 對于a2、a3、a5、a6,1、2分別代表是、不是;對于a4、a7,1、2、3分別代表很嚴重、有點嚴重、不嚴重;*代表缺失值。 對象U中任意兩位患者xi、xj的直覺模糊相似關系為:SR(xi,xi)=(1,0),i=1,2,…,10。SR(x1,x2)=SR(x2,x5)=SR(x9,x10)=(0.068,0.823),SR(x1,x3)=SR(x5,x7)=SR(x5,x10)=(0.238,0.667),SR(x1,x4)=SR(x1,x9)=SR(x2,x10)=SR(x5,x9)=(0.639,0.252),SR(x1,x5)=SR(x3,x7)=SR(x3,x10)=SR(x7,x10)=(0.381,0.524),SR(x1,x6)=(0.088,0.741),SR(x1,x7)=SR(x3,x5)=(0.667,0.238),SR(x1,x8)=(0.810,0.079),SR(x1,x10)=(0.190,0.746),SR(x2,x3)=SR(x2,x7)=SR(x3,x9)=SR(x7,x9)=(0.354,0.537),SR(x2,x4)=(0.184,0.694),SR(x2,x6)=(0.612,0.239),SR(x2,x8)=(0.116,0.728),SR(x2,x9)=(0.020,0.892),SR(x3,x4)=SR(x4,x5)=SR(x4,x7)=(0.497,0.395),SR(x3,x6)=SR(x6,x10)=(0.517,0.313),SR(x3,x8)=(0.286,0.571),SR(x4,x6)=(0.327,0.525),SR(x4,x8)=SR(x8,x9)=(0.544,0.299),SR(x4,x9)=(0.612,0.265),SR(x4,x10)=(0.211,0.680),SR(x5,x6)=(0.231,0.599),SR(x5,x8)=(0.381,0.508),SR(x6,x7)=(0.374,0.440),SR(x6,x8)=(0.136,0.646),SR(x6,x9)=(0.184,0.668),SR(x7,x8)=(0.714,0.143),SR(x8,x10)=(0.238,0.651)。 假設給定λ1=0.5,λ2=0.5,則直覺模糊相似關系SR(x,y)的(λ1,λ2)-截直覺模糊相似類[xi]SR(λ1,λ2)(i=1,2,…,10)為:[x1]SR(λ1,λ2)=[x8]SR(λ1,λ2)={x1,x4,x7,x8,x9},[x2]SR(λ1,λ2)=[x10]SR(λ1,λ2)={x2,x6,x10},[x3]SR(λ1,λ2)={x3,x5,x6},[x4]SR(λ1,λ2)={x1,x4,x8,x9},[x5]SR(λ1,λ2)={x3,x5,x9},[x6]SR(λ1,λ2)={x2,x3,x6,x10},[x7]SR(λ1,λ2)={x1,x7,x8},[x9]SR(λ1,λ2)={x1,x4,x5,x8,x9}。 條件概率P(X|[xi]SR(λ1,λ2))(i=1,2,…,10)為:P(X|[x1]SR(λ1,λ2))=P(X|[x8]SR(λ1,λ2))=P(X|[x9]SR(λ1,λ2))=0.8,P(X|[x2]SR(λ1,λ2))=P(X|[x6]SR(λ1,λ2))=P(X|[x10]SR(λ1,λ2))=0,P(X|[x3]SR(λ1,λ2))=P(X|[x5]SR(λ1,λ2))=0.33,P(X|[x4]SR(λ1,λ2))=0.75,P(X|[x7]SR(λ1,λ2))=1。 下面討論λ1、λ2取不同值時對應的悲觀、中立、樂觀決策者的決策,結果如表4所示。在表4中,隨著決策偏好粒度(λ1,λ2)的變化,決策者的選擇也會發(fā)生變化。當(λ1,λ2)=(0.5,0.3)時,悲觀、中立、樂觀決策者認為x3需要做進一步診斷;當λ2≤0.2時,悲觀、中立、樂觀決策者認為x3不需要做進一步診斷。當λ2≤0.2時,與文獻[21]中L≥0.8的結果相同。本文方法在粒度較細時,直覺模糊相似關系的截關系中的元素將發(fā)生變化,產(chǎn)生新的決策結果,可以在一定程度上糾正實際經(jīng)驗值產(chǎn)生的誤差。 表4 λ1、λ2取不同值時對應的決策結果 本文在不完備信息系統(tǒng)中,從決策粗糙集出發(fā),利用直覺模糊數(shù)來設定損失函數(shù),采用新定義的直覺模糊相似關系的截關系代替等價關系來進行分類。然后結合貝葉斯決策過程,在不完備信息系統(tǒng)中應用直覺模糊決策粗糙集,提出了一種基于不完備信息系統(tǒng)的直覺模糊數(shù)的決策粗糙集模型,給出了該模型的三支決策規(guī)則和方法。通過一個實例說明決策過程,并對該模型中的參數(shù)進行了分析。本研究為不完備信息系統(tǒng)中三支決策理論模型拓展提供了一種新方法。3 基于不完備信息系統(tǒng)的直覺模糊三支決策
4 實例分析
5 結束語