陶 志,胡樹芹
(中國民航大學(xué)理學(xué)院,天津 300300)
不完備偏好決策系統(tǒng)中一種擴(kuò)展優(yōu)勢關(guān)系模型
陶志,胡樹芹
(中國民航大學(xué)理學(xué)院,天津300300)
針對含有大量偏好信息的不完備信息系統(tǒng),提出一種基于β-先驗概率優(yōu)勢關(guān)系的粗集模型。首先給出β-先驗概率優(yōu)勢關(guān)系模型的定義,其次討論了新模型的一些相關(guān)性質(zhì)及其近似分類質(zhì)量。 β-先驗概率優(yōu)勢關(guān)系模型具有一定的容錯能力,通過設(shè)置參數(shù)值來提高對數(shù)據(jù)預(yù)測、分類的合理性,從而達(dá)到與主觀認(rèn)知相一致的分類效果。實例分析進(jìn)一步驗證了新模型的優(yōu)越性。
粗糙集;多屬性決策;不完備偏好決策系統(tǒng);β-先驗概率優(yōu)勢關(guān)系
多屬性決策問題存在于社會、經(jīng)濟(jì)、管理等各種領(lǐng)域。1982年由波蘭數(shù)學(xué)家Pawlak提出的粗糙集理論[1],為處理多屬性決策問題提供了有力工具。由于決策者主觀偏好的影響以及數(shù)據(jù)缺失等原因,含有偏好信息且信息不完備是實際決策系統(tǒng)的顯著特征。然而,Pawlak提出的經(jīng)典粗糙集理論是基于不可分辨關(guān)系的,只能處理完備信息系統(tǒng),不能很好地解決帶有偏好信息的不完備系統(tǒng)決策問題。針對這一問題,Greco等提出了基于優(yōu)勢關(guān)系的粗集模型[2],它用優(yōu)勢關(guān)系代替不可分辨關(guān)系,將決策者的偏好信息以知識的形式表示出來,因此在帶有偏好信息的多屬性決策分析中得到廣泛應(yīng)用。
為了將帶有偏好信息的完備系統(tǒng)處理方法拓展至不完備系統(tǒng),許多學(xué)者對Greco等人提出的優(yōu)勢關(guān)系進(jìn)行了擴(kuò)充,文獻(xiàn)[3]提出了一種基于先驗概率優(yōu)勢關(guān)系的粗糙決策分析模型,該模型應(yīng)用于同一屬性取值概率相差較大的不完備偏好信息系統(tǒng)時,分類效果較好且較符合實際。但是,基于先驗概率優(yōu)勢關(guān)系的粗糙決策模型也有其不足之處,如在一些實際問題中缺乏對數(shù)據(jù)噪聲的處理能力,由于分類相對較細(xì),所以對數(shù)據(jù)噪聲過于敏感,也增加了問題處理的復(fù)雜度。針對上述問題,本文提出一種新的更為寬松的優(yōu)勢關(guān)系模型,即β-先驗概率優(yōu)勢關(guān)系粗糙集模型,該模型具有一定的容錯能力,且可根據(jù)不同問題的不同要求來調(diào)節(jié)參數(shù)值的大小,從而增加了數(shù)據(jù)分析和處理的魯棒性。
1.1不完備偏好決策系統(tǒng)
設(shè)有一個決策系統(tǒng)S=〈U,A=C∪D,V,f〉,其中:U是非空的對象全集;A是非空的屬性集合;C、D分別表示條件屬性和決策屬性集;V是屬性值集,VC={Vq∶q∈C},VD={Vd∶d∈D}分別是條件屬性值集和決策屬性值集,條件屬性值集Vq和決策屬性值集Vd具有優(yōu)勢關(guān)系。f∶U×A→V是一個信息函數(shù),表示對每一個x∈U,a∈A,f(x,a)∈Va。若存在一個x∈U,a∈C使得f(x,a)=*(“*”表示空值),則稱S是帶有偏好關(guān)系的不完備決策系統(tǒng)(簡稱不完備偏好決策系統(tǒng)),并作如下假設(shè):
1)決策屬性值Vd沒有空值;
2)?x∈U至少存在一個q∈C,使得f(x,q)≠*。
假設(shè)決策屬性d可把U分成有限個決策類,Cl= {Clt,t∈T},T={1,2,…,n},則對象中的任意x∈U屬于且僅屬于一個決策Clt∈Cl,而且假定這種分類是有序的,即對于所有的r,s∈T,如果r>s,則Clr中的對象優(yōu)于Cls中的對象。為了處理滿足上述條件的不完備偏好決策系統(tǒng),需要定義兩種累積集。
定義1設(shè)Clt是一個決策類,定義向上累積集和向下累積集分別為[4]
1.2先驗概率優(yōu)勢關(guān)系
定義2設(shè)不完備偏好決策系統(tǒng)S=〈U,A=C∪D,V,f〉,集合P?C,x,y∈U,P上的先驗概率優(yōu)勢關(guān)系FDOM(P)定義[3]為
其中
其中:Vq={v1,v2,…,vm}表示屬性q的值域;Pq={p1,p2,…,pm}表示值域Vq中各個值出現(xiàn)的概率,m是該屬性的值域大小。此時稱“y先驗概率優(yōu)勢于x”,簡記為
根據(jù)定義2,判斷空值“*”的取值是依據(jù)最大可能準(zhǔn)則,即在值域Vq中取出現(xiàn)概率最大的值,當(dāng)屬性個數(shù)較少且每個屬性取各屬性值的概率相差明顯時,用先驗概率優(yōu)勢關(guān)系進(jìn)行分類較為合理。然而,當(dāng)條件屬性較多時,用該模型來判斷兩對象間的優(yōu)劣關(guān)系就顯得過于嚴(yán)格。如在一次學(xué)生考試中,共考20門課程(這時每門課程代表一個條件屬性),根據(jù)先驗概率優(yōu)勢關(guān)系,得出甲同學(xué)有18門課程考試成績優(yōu)于乙同學(xué),有2門不優(yōu)于乙同學(xué)(可能是數(shù)據(jù)噪聲),那么就由此判斷甲不優(yōu)于乙,這顯然與人們的一般主觀判斷不一致,此時應(yīng)判斷甲同學(xué)比乙同學(xué)優(yōu)秀才更加合理。由此看來,先驗概率優(yōu)勢關(guān)系在數(shù)據(jù)噪聲處理方面略顯不足。為了處理優(yōu)勢關(guān)系中的噪聲問題,一些學(xué)者提出了含偏序關(guān)系的變精度粗集模型[5-6],這些模型是在定義上、下近似集合時引入某一參數(shù),從而增加了模型的容錯能力。本文提出的β-先驗概率優(yōu)勢關(guān)系模型,是在原有優(yōu)勢關(guān)系的定義中直接引入?yún)?shù)值,既達(dá)到變精度的目的又降低了計算復(fù)雜度,從而有利于從認(rèn)為不相關(guān)的數(shù)據(jù)中發(fā)現(xiàn)相關(guān)規(guī)則。
2.1β-先驗概率優(yōu)勢關(guān)系
定義3設(shè)不完備偏好決策系統(tǒng)S=〈U,A=C∪D,V,f〉,集合P?C,x,y∈U,0.5<β≤1,則P上的β-先驗概率優(yōu)勢關(guān)系FDOMβ(P)定義為
從定義3可以看出,β-先驗概率優(yōu)勢關(guān)系的實質(zhì)是對先驗概率優(yōu)勢關(guān)系的一種“軟化”,通過參數(shù)值β來調(diào)節(jié)“軟化”的程度。顯然,β-先驗概率優(yōu)勢關(guān)系滿足自反性,但不一定滿足對稱性和傳遞性。
定義4設(shè)不完備偏好決策系統(tǒng)S=〈U,A=C∪D,V,f〉,P?C,x∈U,0.5<β≤1,則x在P下的β-先驗概率優(yōu)勢集和β-先驗概率劣勢集分別為
定理1設(shè)不完備偏好決策系統(tǒng)S=〈U,A=C∪D,V,f〉,P?A且X?U,0.5<β≤1,則在β-先驗概率優(yōu)勢關(guān)系下有:
類似可證2)亦成立。
證畢。
定理1給出了β-先驗概率優(yōu)勢集和β-先驗概率劣勢集之間的關(guān)系。
定理2設(shè)不完備偏好決策系統(tǒng)S=〈U,A=C∪D,V,f〉,P?C,x∈U,0.5<β≤1,則:
1)如果0.5<β1≤β2≤1,有
此定理表明,“優(yōu)勢”關(guān)系依參數(shù)β具有單調(diào)性。
2.2基于β-先驗概率優(yōu)勢關(guān)系的粗糙近似
定理3設(shè)不完備偏好決策系統(tǒng)S=〈U,A=C∪D,V,f〉,P?A,x∈U,0.5<β≤1,在β-先驗概率優(yōu)勢關(guān)系下有:
證明由定理1和定義5可直接證明。
分類質(zhì)量表示基于β-先驗概率優(yōu)勢關(guān)系的不完備偏好多屬性決策系統(tǒng)中正確分類對象數(shù)占總對象數(shù)的比率,它是系統(tǒng)總體分類精度的一個度量。
某學(xué)校對學(xué)生進(jìn)行綜合測評,如表1所示,每個學(xué)生評價方案的條件屬性集合為P={a1,a2,a3,a4,a5,a6,a7},決策屬性集合為j5i0abt0b,a1、a2、a3、a4、a5、a6、a7分別表示學(xué)生的7門課程,d表示對學(xué)生的綜合評價,a1、a2、a3、a4、a5、a6、a7、d均屬于偏好屬性,其中
VP={優(yōu),良,中,差}
Vd={優(yōu),良,中}
決策屬性d把U分成3個決策類Cl={Cl1,Cl2, Cl3},其中中的決策類表示為Cl1={u3},良的決策類表示為Cl2={u2,u4,u5,u7},優(yōu)的決策類表示為Cl3={u1,u6,u8},于是有
表1 某校學(xué)生綜合測評表Tab.1 Comprehensive evaluation of students in one college
利用基于先驗概率優(yōu)勢關(guān)系的粗糙集模型(即β-先驗概率優(yōu)勢關(guān)系中β=1時)計算為
利用基于β-先驗概率優(yōu)勢關(guān)系的粗糙集模型計算如下:
當(dāng)給定參數(shù)值β=0.8時,有
從上述計算結(jié)果可以看出,根據(jù)先驗概率優(yōu)勢關(guān)系,u8除第6個屬性外其余屬性都優(yōu)于u2,于是根據(jù)先驗概率優(yōu)勢關(guān)系不能判斷u2與u8的優(yōu)劣關(guān)系,而根據(jù)β-先驗概率優(yōu)勢關(guān)系的計算結(jié)果可以判斷u8優(yōu)于u2(β=0.8),這一分類結(jié)果與人們的主觀判斷相一致。類似的對象還有u3與u7、u5與u8等,這充分說明β-先驗概率優(yōu)勢關(guān)系模型能在較寬松的條件下判斷對象的優(yōu)劣關(guān)系。從計算結(jié)果還可以看出,β-先驗概率優(yōu)勢關(guān)系不但有較合理的分類結(jié)果,還能保證較高的近似分類精度和近似分類質(zhì)量。
本文針對不完備偏好決策系統(tǒng)提出的β-先驗概率優(yōu)勢關(guān)系,放寬了原有優(yōu)勢關(guān)系模型的限制,在某種程度上彌補(bǔ)了先驗概率優(yōu)勢關(guān)系模型的“剛性”本質(zhì)所決定的固有的局限性,使得實際決策過程更趨合理。β-先驗概率優(yōu)勢關(guān)系模型具有一定的抗噪音能力(容錯能力),在確保分類精度和分類質(zhì)量的基礎(chǔ)上既增加了數(shù)據(jù)處理的靈活性,又大大降低了計算的復(fù)雜度。下一步工作應(yīng)該是在新提出的β-先驗概率優(yōu)勢關(guān)系的基礎(chǔ)上,進(jìn)一步研究不完備偏好決策系統(tǒng)中屬性約簡和規(guī)則抽取算法,為實際應(yīng)用系統(tǒng)開發(fā)奠定理論和實踐基礎(chǔ)。
[1]PALAWK Z.Rough sets[J].International Journal of Computer and Information Science,1982,11(5):341-356.
[2]GRECO S,MATARAZZO B,SLOWINSKI R.Rough sets theory for multicriteria decision analysis[J].European Journal of Operational Research,2001,129(1):1-47.
[3]陶志,卞文靜.基于先驗概率優(yōu)勢關(guān)系的粗糙決策分析模型[J].中國民航大學(xué)學(xué)報,2013,31(4):60-64.
[4]何亞群,胡壽松.不完全信息的多屬性粗糙決策分析方法[J].系統(tǒng)工程學(xué)報,2004,19(2):117-120.
[5]張先韜.序信息系統(tǒng)中基于變精度粗糙集的發(fā)現(xiàn)[D].重慶:重慶理工大學(xué),2012.
[6]駱公志,黃衛(wèi)東,李震.變精度確定優(yōu)勢關(guān)系粗糙決策分析方法及應(yīng)用[J].統(tǒng)計與決策,2013(8):16-18.
(責(zé)任編輯:楊媛媛)
Extended model based on dominance relation in incomplete preferential decision system
TAO Zhi,HU Shu-qin
(College of Science,CAUC,Tianjin 300300,China)
A rough set model based on β-prior probability dominance relation is proposed to solve some problems in the incomplete information system with lots of preferential information.Firstly,the definition of β-prior probability dominance relation is proposed.Secondly,some related properties and approximation classification quality about the new model are discussed.The new model can improve accuracy of data forecast and classification by setting parameters’values.The classification achieved by the new model is almost as same as the classification judged by subjective cognition.The new model softens the dominance relation in some extent and increases the robustness in data analyzing and disposing.At last,the new model proves its superiority by analyzing an example.
rough set;multiple attribute decision making;incomplete preferential decision system;β-prior probability dominance relation
TP18
:A
:1674-5590(2015)04-0051-05
2014-03-26;
:2014-04-30
國家自然科學(xué)基金項目(60672178);中國民航大學(xué)科研基金項目(2010kys01)
陶志(1963—),男,遼寧沈陽人,教授,博士,研究方向為復(fù)雜系統(tǒng)建模、粗糙集理論及其應(yīng)用等.