尹龍軍, 劉 勇
(重慶郵電大學(xué) 理學(xué)院, 重慶 400065)
三支決策是Yao[1-3]在長期研究粗糙集,特別是概率粗糙集和決策粗糙集過程中,總結(jié)和提煉出來的一種符合人類實(shí)際認(rèn)知能力的決策模式.三支決策粗糙集將傳統(tǒng)正域、負(fù)域二支決策語義拓廣成正域、負(fù)域和邊界域3種決策語義[4-7],從而做出接受、拒絕和延遲決策3種決策,很好地對應(yīng)了人類的決策思想.三支決策粗糙集通過引進(jìn)貝葉斯風(fēng)險(xiǎn)理論并計(jì)算最小風(fēng)險(xiǎn)代價確定了正域、負(fù)域和邊界域的劃分,為選取最優(yōu)決策提供了理論依據(jù).計(jì)算過程中基于最小風(fēng)險(xiǎn)代價的概率閾值計(jì)算方法也使得傳統(tǒng)概率粗糙集模型的概率閾值有了理論基礎(chǔ).
近幾年來,三支決策理論已成為國內(nèi)外專家學(xué)者研究的熱點(diǎn).劉盾等[8]對三支決策理論提出了新的研究方法和應(yīng)用領(lǐng)域;杜麗娜等[9]將貝葉斯原理和基于決策粗糙集的三支決策規(guī)則引入到模糊綜合評判中,提出了基于三支決策風(fēng)險(xiǎn)最小化的風(fēng)險(xiǎn)投資評判模型;張里博等[10]采用代價敏感三支決策方法求得相應(yīng)粒度下的最小代價決策.
本文主要在以上研究的基礎(chǔ)上,將被決策者所處的狀態(tài)由X和X的補(bǔ)集2種狀態(tài)推廣為多種狀態(tài),并提出了一種狀態(tài)概率的計(jì)算方法,然后利用狀態(tài)概率和不同狀態(tài)的決策代價計(jì)算出最終做出3種決策的決策代價.
定義1.1[11](上下近似集) 給定知識表達(dá)系統(tǒng)S=〈U,R,V,f〉,對于每一個子集X?U和不分明關(guān)系B、X的上近似集和下近似集分別可以由B的基本集定義如下:
B-(X)={x|(x∈U∧[x]B?X)},
B-(X)={x|(x∈U∧[x]B∩X≠?)},
即當(dāng)且僅當(dāng)[x]B?X,x∈B-(X);當(dāng)且僅當(dāng)[x]B∩X=?,x∈B-(X);集合BNDB(X)=B-(X)B-(X)稱為X的B邊界;POSB(X)=B-(X)稱為X的B正域;NEGB(X)=U-B-(X)稱為X的B負(fù)域.
定義1.2[12]((α,β)-上下近似集) 給定信息表達(dá)系統(tǒng)S=〈U,R,V,f〉,對X?U,令0≤β<α≤1,則概率粗糙集的(α,β)-上下近似集可以表示為:
在概率粗糙集中,(α,β)-上下近似集將論域分為3個部分:
POS(α,β)(X)={x∈U|Pr(X|[x])≥α},
BND(α,β)(X)={x∈U|β NEG(α,β)(X)={x∈U|Pr(X|[x])≤β}. 利用粗糙集的3個論域,可以獲得最直觀、簡單的三支決策模型: 當(dāng)Pr(X|[x])≥α?xí)r,接受;當(dāng)Pr(X|[x])≤β時,拒絕;當(dāng)β 當(dāng)α=1,β=0時,稱為Pawlak粗糙集[13-14],Pawlak粗糙集接受條件比較嚴(yán)苛,而對于拒絕的條件過于寬松,這種模型在容錯率方面很差,完全不考慮實(shí)際應(yīng)用中可能存在錯誤分類.因此產(chǎn)生了0.5-概率粗糙集,這種模型完全基于多數(shù)服從少數(shù)的原則,這種方案往往在實(shí)際應(yīng)用中顯得接受條件過于寬松,相對于Pawlak粗糙集和0.5-概率粗糙集,(α,β)-粗糙集則比較靈活,可以通過適當(dāng)?shù)脑O(shè)定α、β值來控制接受、拒絕和延遲的條件,其決策過程也更為靈活和合理.粗糙集在決策過程中,往往僅考慮閾值形式,當(dāng)Pr(X|[x]R)≥α?xí)r,x∈POS(X);當(dāng)β 通常情況下,α、β的取值由專家給定,并沒有回答如何給定,劉盾等[12]通過詳細(xì)討論α+β>1、α+β=1、α+β<1等條件下的三支決策模型,給出了基于概率粗糙集的三支決策模型. 定義1.3[15-16](三支決策) 設(shè)Ω={X,X}表示2種狀態(tài)集合,分別表示對象屬于集合X和對象屬于集合X的補(bǔ)集.集合A={aP,aB,aN}對應(yīng)3種決策動作:接受、拒絕和延遲.決策過程中往往存在不同的代價損失,設(shè)λPP、λBP和λNP表示當(dāng)一個對象屬于集合X時分別采取行動aP、aB、aN時所付出的代價,λPN、λBN和λNN分別表示當(dāng)一個對象屬于X補(bǔ)集時分別采取行動aP、aB、aN所付出的代價. 因此,對集合[x]中的對象采取3種決策所產(chǎn)生的代價函數(shù)分別為: R(aP|[x])=λPPPr(X|[x])+ λPNPr(X|[x]), R(aB|[x])=λBPPr(X|[x])+ λBNPr(X|[x]), R(aN|[x])=λNPPr(X|[x])+ λNNPr(X|[x]). 根據(jù)最小風(fēng)險(xiǎn)決策規(guī)則: 1) 如果R(aP|[x])≤R(aB|[x])且R(aP|[x])≤R(aN|[x]),則x∈POS(X)選擇行動決策aP; 2) 如果R(aB|[x])≤R(aP|[x])且R(aB|[x])≤R(aN|[x]),則x∈BND(X)選擇行動決策aB; 3) 如果R(aN|[x])≤R(aP|[x])且R(aN|[x])≤R(aB|[x]),則x∈NEG(X)選擇行動決策aN. 由于Pr(X|[x])+Pr(-X|[x])=1,根據(jù)實(shí)際情況,當(dāng)一個對象屬于X時,選擇接受的代價一般不應(yīng)該大于延遲決策和拒絕的代價.同理,當(dāng)一個對象屬于X的補(bǔ)集時,選擇拒絕的代價一般不應(yīng)該大于延遲決策和接受的代價,因此有 0≤λPP≤λBP≤λNP, 0≤λNN≤λBN≤λPN. (*) 目前大多數(shù)的研究中,主要是在狀態(tài)集Ω={X,-X}共2種狀態(tài)下,討論分別做出3種決策A={aP,aB,aN}時的代價,從而做出代價最小的決策.本文主要針對被決策者本身處于多種狀態(tài)下,利用條件概率及決策代價矩陣,結(jié)合參與決策者的可信度(權(quán)重),從而獲得3種決策的代價值,最終選取代價最優(yōu)的決策方案. 2.1多狀態(tài)下三支決策代價表設(shè)狀態(tài)集為Ω={X1,X2,…Xk},決策集為A={aP,aB,aN},對不同狀態(tài)分別采取aP、aB、aN共3種決策會導(dǎo)致不同的損失,記λPi、λBi、λNi(i=1,2,…,k)為[x]的真實(shí)狀態(tài)為Xi時,分別采取aP、aB、aN共3種決策的代價值,見表1. 表 1 多狀態(tài)下三支決策代價函數(shù) 一般來說XiXj=?(i,j=1,2,…,k,i≠j);λPi、λBi、λNi(i=1,2,…,k)一般不具有(*)式的比較關(guān)系. 例1顧客對某企業(yè)員工進(jìn)行評價,評分為1~10分,記為Xi(i=1,2,…,10),企業(yè)根據(jù)顧客的評價對員工進(jìn)行考核,記為(aP,aB,aN)=(優(yōu)秀,合格,不合格).當(dāng)X1=10時,考核決策為優(yōu)秀的代價顯然低于考核決策為合格和不合格,即λP1<λB1<λN1.當(dāng)X3=8時,且決策者傾向于分?jǐn)?shù)較高為優(yōu)秀,在此時考核決策為優(yōu)秀的代價將會比考核決策為合格高,同時考核決策為不合格的代價應(yīng)該高于考核決策為合格,即λP3>λB3,λB3<λN3. 2.2Pr(Xi|[x]R)的獲取以Pr(Xi|[x]R)表示[x]屬于狀態(tài)Xi的概率,一般應(yīng)該滿足 (1) (2) … (3) 3種決策下的代價分別為: (4) (5) (6) 根據(jù)三支決策規(guī)則: 若R(aP|[x]R)≤R(aB|[x]R)且R(aP|[x]R)≤R(aN|[x]R),則實(shí)施決策aP; 若R(aB|[x]R)≤R(aP|[x]R)且R(aB|[x]R)≤R(aN|[x]R),則實(shí)施決策aB; 若R(aN|[x]R)≤R(aP|[x]R)且R(aN|[x]R)≤R(aB|[x]R),則實(shí)施決策aN. 根據(jù)上述的決策模型,以某高校學(xué)生評價教師為例,某班級的學(xué)生(參與決策者)對任課教師(被決策者)做出評價,需要利用學(xué)生(參與決策者)的評價結(jié)果對教師(被決策者)做出優(yōu)秀(aP)、良好(aB)、合格(aN)共3種決策過程.學(xué)生(參與決策者)對教師(被決策者)的評價從狀態(tài)集Ω={X1,X2,X3,X4}={非常滿意,滿意,一般,不滿意}共4個方面進(jìn)行模糊評價,設(shè)決策代價如表2. 表 2 決策代價函數(shù) 選取某一教師的評價結(jié)果為 Vji={(1,0,0,0);(1,0,0,0);(1,0,0,0); (1,0,0,0);(1,0,0,0);(1,0,0,0);(1,0,0,0); (1,0,0,0);(1,0,0,0);(1,0,0,0);(1,0,0,0); (1,0,0,0);(1,0,0,0);(1,0,0,0);(1,0,0,0) (1,0,0,0);(0,1,0,0);(0,1,0,0);(0,1,0,0); (0,1,0,0);(0,1,0,0);(0,1,0,0);(0,1,0,0) (0,1,0,0);(0,1,0,0);(0,1,0,0);(0,0,1,0); (0,0,1,0);(0,0,1,0);(0,0,0,1)}, 即有16人對該教師評價為非常滿意,10人對該教師評價為滿意,3人對該教師評價為一般,1人對該教師評價為不滿意. 設(shè)30個學(xué)生評價的權(quán)重系數(shù)分別為 σj={0.81,0.98,0.95,0.8,0.9,0.81,0.99, 0.91,0.93,0.92,0.96,0.90,0.98,0.90,0.97, 0.83,0.93,0.80,0.97,0.87,0.81,0.98,0.95, 0.92,0.96,0.97,0.87,0.95,0.89,0.84}. 利用(1)~(3)式計(jì)算得到: Pr(X1|[x]R)=0.533 6, Pr(X2|[x]R)=0.336 1, Pr(X3|[x]R)=0.099 4, Pr(X4|[x]R)=0.030 1. 再利用(4)~(6)式得到3種決策的代價值分別為: R(aP|[x]R)=0.337 05, R(aB|[x]R)=0.262 10, R(aN|[x]R)=0.895 47. 由三支決策的原則,故對該教師的最終評價確定為良好代價最小. 從整個決策過程可以看出,雖然對該教師評價為非常滿意和滿意的人數(shù)已經(jīng)超過86%,但由于代價函數(shù)表中λP2和λB1比較高,即認(rèn)為評價狀態(tài)為“滿意”時決策為“優(yōu)秀”的代價和評價狀態(tài)為“非常滿意”時決策為“良好”的代價比較高,即認(rèn)為評價狀態(tài)為“滿意”的情況下更傾向于決策為“良好”,如果決策者認(rèn)為“滿意”更加傾向于“優(yōu)秀”的話,只需要調(diào)低λP2和調(diào)高λB1可以得到不同的決策結(jié)論.該模型在實(shí)際應(yīng)用中可以根據(jù)參與決策者(評價者)的評價偏向?qū)Q策代價進(jìn)行相應(yīng)的調(diào)整,從而獲得最優(yōu)的決策.例如在評價過程中,多數(shù)評價者認(rèn)為“滿意”已經(jīng)是很高的評價了,則只需要將表2的λP2調(diào)低,將λB1調(diào)高即可. 本文將概率粗糙集與三支決策思想相結(jié)合,在X和X的補(bǔ)集2種狀態(tài)下,將三支決策代價的研究推廣到X1,X2,…,Xk多種狀態(tài)下進(jìn)行三支決策的代價研究,并在獲取對象的各狀態(tài)概率時引入決策者權(quán)重,最終利用參與決策者的模糊評價結(jié)果對被評價者(被決策者)做出最優(yōu)決策.現(xiàn)實(shí)生活中,各行各業(yè)都廣泛應(yīng)用顧客滿意度調(diào)查,而在調(diào)查中,往往不是由顧客(參與決策者)直接給出分?jǐn)?shù),而是從不同的方面對被決策者給出模糊的評價.本模型即可以利用大量的模糊評價來計(jì)算三支決策的代價,從而對被評價者(被決策者)做出最優(yōu)的決策. 致謝重慶郵電大學(xué)教改項(xiàng)目(XJG1423)和重慶郵電大學(xué)自然科學(xué)基金(A2011-22)對本文給予了資助,謹(jǐn)致謝意.2 基于粗糙集的多狀態(tài)下的三支決策模型
3 算法實(shí)例
4 結(jié)束語