• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      不完備鄰域多粒度決策理論粗糙集與三支決策

      2019-05-16 08:30:32徐立新李敬偉
      關(guān)鍵詞:粗糙集代價(jià)鄰域

      劉 丹 徐立新 李敬偉

      (河南工學(xué)院計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 河南 新鄉(xiāng) 453003)

      0 引 言

      粗糙集理論[1]是由波蘭學(xué)者Pawlak提出的一種不確定性數(shù)據(jù)的分析工具,目前已廣泛地運(yùn)用于分類學(xué)習(xí)、模式識(shí)別以及數(shù)據(jù)挖掘等領(lǐng)域[2-4]。同時(shí)粗糙集理論經(jīng)過(guò)幾十年的研究,已在不同的領(lǐng)域和不同背景下進(jìn)行了相關(guān)的改進(jìn)與拓展,諸如概率粗糙集[5-6]、變精度粗糙集[7]、鄰域粗糙集[8-9]和模糊粗糙集[10]等。在這些拓展的粗糙集模型中,概率粗糙集是一種常用的粗糙集模型,它通過(guò)一對(duì)閾值來(lái)對(duì)經(jīng)典粗糙集模型進(jìn)行改進(jìn)[5-6],因而使其具有容忍噪聲數(shù)據(jù)的特性,目前已引起學(xué)者們的廣泛研究[11-12]。Yao等[13]通過(guò)代價(jià)的角度來(lái)對(duì)概率粗糙集模型中的一對(duì)閾值進(jìn)行學(xué)習(xí),提出了決策理論粗糙集模型,并且基于該模型誘導(dǎo)出了一種特殊的決策方式,被稱之為三支決策[14]。三支決策相當(dāng)于對(duì)傳統(tǒng)的二支決策進(jìn)行擴(kuò)展,它通過(guò)最小化代價(jià)的視角進(jìn)行決策,其決策的結(jié)果分為三種情形,分別為接受、延遲和拒絕,這種形式開(kāi)辟了一種嶄新的決策方法,在其他領(lǐng)域獲得了大量的應(yīng)用[15-17]。目前決策理論粗糙集和三支決策已成為粗糙集理論研究的熱點(diǎn)。

      根據(jù)粒計(jì)算[18]的視角,經(jīng)典粗糙集模型以及各類的擴(kuò)展模型都可以稱之為單粒度下的粗糙集模型。然而在現(xiàn)實(shí)的應(yīng)用環(huán)境下,需要通過(guò)多層級(jí)和多視角對(duì)研究對(duì)象進(jìn)行全方位的數(shù)據(jù)挖掘,因此Qian等[19]提出了多粒度粗糙集模型,為粗糙集理論的研究提供了全新的思路。為了在多粒度粗糙集模型中融入代價(jià)學(xué)習(xí),Qian等[20]又提出了基于多粒度的決策理論粗糙集模型,該模型在多粒度數(shù)據(jù)挖掘和三支決策方面都是一種有效的工具。然而現(xiàn)實(shí)的應(yīng)用環(huán)境是復(fù)雜多樣的,例如數(shù)值型數(shù)據(jù)和含缺失值數(shù)據(jù)的存在,使得傳統(tǒng)的多粒度決策理論粗糙集模型面臨著一定的挑戰(zhàn)。近年來(lái),Li等[21]提出基于鄰域關(guān)系的決策理論粗糙集模型,為決策理論粗糙集模型處理數(shù)值型數(shù)據(jù)提供了一種有效的解決方案。而對(duì)于不完備數(shù)據(jù),基于容差關(guān)系的粗糙集理論是一種常用的處理方法[8,22]。本文針對(duì)不完備的數(shù)值型數(shù)據(jù),提出一種鄰域多粒度的決策理論粗糙集模型。首先在不完備數(shù)值型數(shù)據(jù)中建立鄰域容差關(guān)系,然后在其基礎(chǔ)上提出鄰域多粒度決策理論粗糙集模型,包括樂(lè)觀鄰域多粒度決策理論粗糙集和悲觀鄰域多粒度決策理論粗糙集。由于這兩種模型在粗糙逼近刻畫(huà)方面存在過(guò)于寬松和過(guò)于苛刻的局限性[23],因此又提出了一種平均鄰域多粒度決策理論粗糙集,克服了兩種模型的缺點(diǎn),并分析了三種模型之間的相互關(guān)系。

      三支決策建立在決策理論粗糙集模型的基礎(chǔ)上,其中模型中的閾值直接由給定的代價(jià)函數(shù)來(lái)確定[14],通常代價(jià)函數(shù)都是具體的數(shù)值。然而在不完備信息系統(tǒng)中,由于缺失值的存在,信息系統(tǒng)的不確定性將會(huì)進(jìn)一步增大[24],但是在傳統(tǒng)的三支決策模型中,代價(jià)函數(shù)是一個(gè)具體的取值[25]。因此本文在不完備鄰域多粒度決策理論粗糙集模型的基礎(chǔ)上,通過(guò)區(qū)間值的形式來(lái)表示代價(jià)函數(shù),然后通過(guò)一個(gè)參數(shù)來(lái)確定具體的代價(jià)函數(shù)值,從而誘導(dǎo)出對(duì)應(yīng)的三支決策結(jié)果,本文稱之為可變?nèi)Q策,理論分析表明了該方法的正確性。最后本文通過(guò)一個(gè)具體的不完備數(shù)值型信息表的實(shí)例來(lái)分析所提出模型的有效性與優(yōu)越性,同時(shí)對(duì)模型中的有關(guān)參數(shù)進(jìn)行了分析與討論。

      1 基本理論

      1.1 鄰域多粒度粗糙集模型

      通常,粗糙集理論[1]研究的數(shù)據(jù)對(duì)象被稱為信息系統(tǒng),一個(gè)信息系統(tǒng)表示為IS=(U,At,V),這里的U稱為論域,是一個(gè)非空有限對(duì)象集,At為全體屬性集,V為所有屬性的值域。當(dāng)At=C∪D,且C∩D=?,其中C為條件屬性集,D為決策屬性集,那么此信息系統(tǒng)又稱為決策信息系統(tǒng)。當(dāng)信息系統(tǒng)的條件屬性值均為連續(xù)型時(shí),這類信息系統(tǒng)又稱為鄰域信息系統(tǒng)[9]。

      經(jīng)典粗糙集模型是處理不確定數(shù)據(jù)的一種有效工具,它通過(guò)等價(jià)關(guān)系對(duì)論域空間進(jìn)行知識(shí)劃分,從而對(duì)不確定性的目標(biāo)對(duì)象進(jìn)行粗糙逼近[1],目前在機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等領(lǐng)域發(fā)揮著重要的作用[4,8-10,15-16]。在粒計(jì)算視角下,經(jīng)典粗糙集理論相當(dāng)于以一種單粒度的視角對(duì)目標(biāo)概念進(jìn)行分析和描述,為了從多個(gè)視角來(lái)處理和分析問(wèn)題,Qian等[19]提出了多粒度粗糙集模型。為了使多粒度粗糙集模型能夠處理鄰域信息系統(tǒng),Lin等[26]又提出了鄰域多粒度粗糙集模型。

      定義1[9]考慮一個(gè)鄰域信息系統(tǒng)IS=(U,At,V),B?At在論域U上誘導(dǎo)的鄰域關(guān)系定義為:

      NδB={(x,y)∈U×UdB(x,y)≤δ}

      (1)

      在不引起混淆的情形下,下文適當(dāng)略去鄰域半徑δ的標(biāo)記。

      定義2[26]考慮一個(gè)鄰域信息系統(tǒng)IS=(U,At,V),B1,B2,…,Bm?At是一個(gè)包含m個(gè)屬性子集的屬性子集族,它們誘導(dǎo)出的鄰域關(guān)系分別為NB1,NB2,…,NBm。對(duì)于目標(biāo)近似對(duì)象集X?U,基于這m個(gè)鄰域關(guān)系的樂(lè)觀鄰域多粒度粗糙集的下近似和上近似分別定義為:

      X∨…∨nBm(x)?X}

      (2)

      (3)

      (4)

      (5)

      (6)

      定義3[26]考慮鄰域信息系統(tǒng)IS=(U,At,V),B1,B2,…,Bm?At是一個(gè)包含m個(gè)屬性子集的屬性子集族,它們誘導(dǎo)出的鄰域關(guān)系分別為NB1,NB2,…,NBm。對(duì)于目標(biāo)近似對(duì)象集X?U,基于這m個(gè)鄰域關(guān)系的悲觀鄰域多粒度粗糙集的下近似和上近似分別定義為:

      X∧…∧nBm(x)?X}

      (7)

      (8)

      (9)

      (10)

      (11)

      目前鄰域多粒度粗糙集模型已成為多粒度粗糙集領(lǐng)域的一種重要的模型。

      1.2 決策理論粗糙集模型

      Yao等[5,13-14]以代價(jià)的理論為基礎(chǔ),通過(guò)貝葉斯決策過(guò)程來(lái)確定概率粗糙集中的兩個(gè)閾值參數(shù),推導(dǎo)出具有最小代價(jià)化的決策規(guī)則,即三支決策。

      對(duì)于貝葉斯決策方法,定義一個(gè)非空有限狀態(tài)集為Ω={ω1,ω2,…,ωs},一個(gè)非空有限行為集為Γ={a1,a2,…,at},對(duì)于?x∈U,設(shè)對(duì)象x處于狀態(tài)ωj(1≤j≤s)的條件概率為P(ωjx),令λ(aiωj)表示x處于狀態(tài)ωj采取行為ai(1≤i≤t)時(shí)的代價(jià)函數(shù)(損失函數(shù))。對(duì)于對(duì)象x,可以得到它采取行為ai的預(yù)期代價(jià),表示為:

      (12)

      在決策理論粗糙集模型中,所研究的數(shù)據(jù)對(duì)象為信息系統(tǒng),那么對(duì)象的狀態(tài)集可表示為Ω={X,~X},行為集可表示為Γ={aP,aB,aN},其中aP表示對(duì)象被分類到X的正區(qū)域,aB表示對(duì)象被分類到X的邊界域,aN表示對(duì)象被分類到X的負(fù)區(qū)域。由于決策理論粗糙集模型中只包含兩種狀態(tài)和三種行為,因此可以通過(guò)表格的形式去展示出每種狀態(tài)采取每種行為的代價(jià)函數(shù),具體如表1所示。

      表1 所有形式的代價(jià)函數(shù)

      在表1中,λPP、λBP和λNP分別表示對(duì)象x隸屬于X時(shí)分別采取aP、aB和aN時(shí)的代價(jià),λPN、λBN和λNN分別表示對(duì)象x不隸屬于X時(shí)分別采取aP、aB和aN時(shí)的代價(jià),通過(guò)條件概率P(X[x])表示對(duì)象x隸屬于X的程度,這里的[x]表示對(duì)象x的等價(jià)類。因此可以得到對(duì)象x采取三種行為的預(yù)期代價(jià),分別表示為:

      R(aP[x])=λPP·P(X[x])+λPN·P(~X[x])

      (13)

      R(aB[x])=λBP·P(X[x])+λBN·P(~X[x])

      (14)

      R(aN[x])=λNP·P(X[x])+λNN·P(~X[x])

      (15)

      根據(jù)貝葉斯決策方法,可以得到如下三個(gè)最小化代價(jià)的決策規(guī)則:

      (P) 如果R(aP[x])

      R(aP[x])

      (B) 如果R(aB[x])

      R(aB[x])

      (N) 如果R(aN[x])

      R(aN[x])

      由于P(X[x])+P(~X[x])=1,這里Yao等[14]假設(shè)0≤λPP≤λBP≤λNP和0≤λNN≤λBN≤λPN,那么決策規(guī)則(P)、(B)和(N)可以進(jìn)一步表示為:

      (P) 如果P(X[x])≥α且P(X[x])≥γ,那么x∈POS(X);

      (B) 如果P(X[x])<α且P(X[x])<β,那么x∈BUN(X);

      (C) 如果P(X[x])<γ且P(X[x])≤β,那么x∈NEG(X)。

      其中:

      (16)

      (17)

      (18)

      由于0≤β<γ<α≤1,因此:

      (P) 如果P(X[x])≥α,那么x∈POS(X);

      (B) 如果β

      (N) 如果P(X[x])≤β,那么x∈NEG(X)。

      根據(jù)以上推導(dǎo),Yao等給出了決策理論粗糙集模型上下近似的定義。

      定義4[14]對(duì)于信息系統(tǒng)IS=(U,At,V),設(shè)代價(jià)函數(shù)如表1所示,令B?At,那么?X?U關(guān)于B的決策理論粗糙集模型的下近似與上近似分別定義為:

      (19)

      (20)

      同時(shí),X關(guān)于B的決策理論正區(qū)域、邊界域和負(fù)區(qū)域分別定義為:

      (21)

      (22)

      (23)

      2 不完備鄰域多粒度決策理論粗糙集

      Lin等[26]提出的鄰域多粒度粗糙集模型只能適用于完備型的鄰域信息系統(tǒng)?,F(xiàn)實(shí)中包含缺失屬性值的鄰域信息系統(tǒng)大量存在[8],為了解決Lin的鄰域多粒度粗糙集模型的局限性,可以考慮將該模型在不完備鄰域信息系統(tǒng)進(jìn)行拓展。近年來(lái),Li等[21]提出了基于鄰域關(guān)系的決策理論粗糙集模型,因此在此基礎(chǔ)上,本文進(jìn)一步提出不完備鄰域多粒度決策理論粗糙集模型。

      (24)

      (25)

      這里的α,β誘導(dǎo)方式同1.2節(jié)。類似地,X關(guān)于B的鄰域決策理論粗糙集正區(qū)域、邊界域和負(fù)區(qū)域分別定義為:

      (26)

      (27)

      (28)

      Qian等[20]提出了在完備型信息系統(tǒng)中提出了多粒度決策理論粗糙集模型,在Qian的基礎(chǔ)上結(jié)合定義5,提出一種不完備鄰域多粒度決策理論粗糙集模型。

      在提出不完備鄰域多粒度決策理論粗糙集模型前,需要首先確定不完備鄰域信息系統(tǒng)中鄰域的定義,本文這里采用Zhao等[27]提出的鄰域容差關(guān)系。

      定義6[27]稱IIS=(U,At,V)為不完備鄰域信息系統(tǒng),利用“*”表示缺失的屬性值,即*∈V。設(shè)鄰域半徑為δ,定義B?At在論域U上的鄰域容差關(guān)系為:

      NTδB={(x,y)∈U×Ua(x)=*∨

      a(y)=*∨d{a}(x,y)≤δ,?a∈B}

      (29)

      2.1 不完備樂(lè)觀鄰域多粒度決策理論粗糙集模型

      根據(jù)Qian等[20]學(xué)者提出的樂(lè)觀多粒度決策理論粗糙集模型,在本節(jié)中,提出不完備信息系統(tǒng)下的樂(lè)觀鄰域多粒度決策理論粗糙集模型。

      定義7對(duì)于不完備鄰域信息系統(tǒng)IIS=(U,At,V),B1,B2,…,Bm?At是一個(gè)屬性子集族,它們誘導(dǎo)出的鄰域容差關(guān)系分別為NTB1,NTB2,…,NTBm。對(duì)于目標(biāo)近似對(duì)象集X?U,X關(guān)于m個(gè)鄰域容差關(guān)系的樂(lè)觀鄰域多粒度決策理論粗糙集的下近似和上近似分別定義為:

      P(XntB2(x))≥α∨…∨

      P(XntBm(x))≥α}

      (30)

      β∧P(XntB2(x))≤β∧…∧

      P(XntBm(x))≤β}

      (31)

      同時(shí),X關(guān)于m個(gè)鄰域容差關(guān)系的樂(lè)觀鄰域多粒度決策理論粗糙集的正區(qū)域、邊界域和負(fù)區(qū)域分別定義為:

      (32)

      (33)

      (34)

      根據(jù)定義7中關(guān)于樂(lè)觀鄰域多粒度決策理論粗糙集模型的定義以及文獻(xiàn)[19-20],可以得到如下性質(zhì)。

      性質(zhì)1對(duì)于不完備鄰域信息系統(tǒng)IIS=(U,At,V),B1,B2,…,Bm?At是一個(gè)屬性子集族,誘導(dǎo)出的鄰域容差關(guān)系分別為NTB1,NTB2,…,NTBm。對(duì)于?X?U,滿足:

      (35)

      (36)

      性質(zhì)2對(duì)于不完備鄰域信息系統(tǒng)IIS=(U,At,V),B1,B2,…,Bm?At是一個(gè)屬性子集族,誘導(dǎo)出的鄰域容差關(guān)系分別為NTB1,NTB2,…,NTBm。對(duì)于?X?U,滿足:

      (37)

      (38)

      性質(zhì)3對(duì)于不完備鄰域信息系統(tǒng)IIS=(U,At,V),B1,B2,…,Bm?At是一個(gè)屬性子集族,誘導(dǎo)出的鄰域容差關(guān)系分別為NTB1,NTB2,…,NTBm。對(duì)于X1?X2?U,滿足:

      (39)

      (40)

      2.2 不完備悲觀鄰域多粒度決策理論粗糙集模型

      根據(jù)Qian等[20]學(xué)者提出的悲觀多粒度決策理論粗糙集模型,這里同樣提出不完備信息系統(tǒng)下的悲觀鄰域多粒度決策理論粗糙集模型。

      定義8對(duì)于不完備鄰域信息系統(tǒng)IIS=(U,At,V),B1,B2,…,Bm?At是一個(gè)屬性子集族,誘導(dǎo)出的鄰域容差關(guān)系分別為NTB1,NTB2,…,NTBm。對(duì)于目標(biāo)近似對(duì)象集X?U,X關(guān)于m個(gè)鄰域容差關(guān)系的悲觀鄰域多粒度決策理論粗糙集的下近似和上近似分別定義為:

      α∧P(XntB2(x))≥

      α∧…∧P(XntBm(x))≥α}

      (41)

      β∨P(XntB2(x))≤

      β∨…∨P(XntBm(x))≤β}

      (42)

      (43)

      (44)

      (45)

      同樣地,悲觀鄰域多粒度決策理論粗糙集也滿足如下性質(zhì)。

      性質(zhì)4對(duì)于不完備鄰域信息系統(tǒng)IIS=(U,At,V),B1,B2,…,Bm?At是一個(gè)屬性子集族,誘導(dǎo)出的鄰域容差關(guān)系分別為NTB1,NTB2,…,NTBm。對(duì)于?X?U,滿足:

      (46)

      (47)

      性質(zhì)5對(duì)于不完備鄰域信息系統(tǒng)IIS=(U,At,V),B1,B2,…,Bm?At是一個(gè)屬性子集族,誘導(dǎo)出的鄰域容差關(guān)系分別為NTB1,NTB2,…,NTBm。對(duì)于?X?U,滿足:

      (48)

      (49)

      性質(zhì)6對(duì)于不完備鄰域信息系統(tǒng)IIS=(U,At,V),B1,B2,…,Bm?At是一個(gè)屬性子集族,誘導(dǎo)出的鄰域容差關(guān)系分別為NTB1,NTB2,…,NTBm。對(duì)于X1?X2?U,滿足:

      (50)

      (51)

      2.3 不完備平均鄰域多粒度決策理論粗糙集模型

      根據(jù)定義7,在樂(lè)觀鄰域多粒度決策理論粗糙集中,下近似集中的元素只需任意滿足條件概率大于閾值α,而對(duì)于定義8中的悲觀鄰域多粒度決策理論粗糙集,其下近似集的元素必須滿足所有的條件概率大于閾值α,因此,這兩種下近似的定義存在著過(guò)于寬松和過(guò)于嚴(yán)格的缺陷。近年來(lái),學(xué)者們也提出了一些改進(jìn)的方法[20,23]。本節(jié)在文獻(xiàn)[20]的基礎(chǔ)上,提出一種平均鄰域多粒度決策理論粗糙集。

      定義9對(duì)于不完備鄰域信息系統(tǒng)IIS=(U,At,V),B1,B2,…,Bm?At是一個(gè)屬性子集族,誘導(dǎo)出的鄰域容差關(guān)系分別為NTB1,NTB2,…,NTBm。對(duì)于目標(biāo)近似對(duì)象集X?U,X關(guān)于m個(gè)鄰域容差關(guān)系的平均鄰域多粒度決策理論粗糙集的下近似和上近似分別定義為:

      P(XntB2(x))+…+

      P(XntBm(x)))/m≥α}

      (52)

      P(XntB2(x))+…+

      P(XntBm(x)))/m≤β}

      (53)

      (54)

      (55)

      (56)

      平均鄰域多粒度決策理論粗糙集滿足如下性質(zhì)。

      性質(zhì)7對(duì)于不完備鄰域信息系統(tǒng)IIS=(U,At,V),B1,B2,…,Bm?At是一個(gè)屬性子集族,誘導(dǎo)出的鄰域容差關(guān)系分別為NTB1,NTB2,…,NTBm。對(duì)于X1?X2?U,滿足:

      (57)

      (58)

      性質(zhì)8對(duì)于不完備鄰域信息系統(tǒng)IIS=(U,At,V),B1,B2,…,Bm?At是一個(gè)屬性子集族,誘導(dǎo)出的鄰域容差關(guān)系分別為NTB1,NTB2,…,NTBm。對(duì)于?X?U,滿足:

      (59)

      (60)

      (61)

      (62)

      P(XntB1(x))≥α∧…∧P(XntBm(x))≥α,

      那么:

      (P(XntB1(x))+…+P(XntBm(x)))/m≥α,

      所以式(60)成立。

      P(XntB1(x))≤β∧…∧P(XntBm(x))≤β,

      那么:

      (P(XntB1(x))+…+P(XntBm(x)))/m≤β,

      (P(XntB1(x))+…+P(XntBm(x)))/m≤β,

      性質(zhì)4揭示了這三種鄰域多粒度決策理論粗糙集之間的關(guān)系。從中可以看出,樂(lè)觀情形的下近似刻畫(huà)得較為寬松,使得下近似集較大,而平均情形的下近似適當(dāng)限制了樂(lè)觀情形的定義,平均情形的下近似集小于樂(lè)觀的下近似集;悲觀情形下的下近似刻畫(huà)得較為嚴(yán)格,使得下近似集較小,而平均情形的下近似集放寬了悲觀下近似集的定義,使得平均情形的下近似集大于悲觀的下近似集。因此,針對(duì)樂(lè)觀和悲觀兩種模型的局限性,平均情形下的模型有著很大的改進(jìn)。

      決策偏好是一種重要的多屬性決策問(wèn)題。在第2節(jié)中提出了三種鄰域多粒度決策理論粗糙集,這三種模型均通過(guò)閾值α和β來(lái)限制目標(biāo)概念的粗糙近似,因此這里只需要對(duì)閾值的大小進(jìn)行調(diào)整便可以達(dá)到?jīng)Q策的偏好程度。對(duì)于目標(biāo)概念X,如果決策者是X厭惡型,那么可以提高閾值α,從而提高目標(biāo)概念的逼近程度,反之則降低閾值α。同理對(duì)于目標(biāo)概念~X,可以通過(guò)調(diào)整閾值β達(dá)到同樣的效果。而在所提出的模型中,閾值α和β直接由代價(jià)函數(shù)得到,因此對(duì)于決策偏好問(wèn)題,本質(zhì)上可以通過(guò)選擇適當(dāng)?shù)拇鷥r(jià)函數(shù)來(lái)實(shí)現(xiàn),即決策厭惡型可以選擇高的誤分類代價(jià),反之選擇低的誤分類代價(jià)。

      3 可變?nèi)Q策

      第2節(jié)中給出了三種不完備鄰域多粒度決策理論粗糙集模型,每種模型都將論域劃分為三個(gè)互不相交的區(qū)域,即正區(qū)域、邊界域和負(fù)區(qū)域,基于這三個(gè)區(qū)域便可以導(dǎo)出鄰域多粒度決策理論粗糙集模型下的三支決策。

      對(duì)于X?U,設(shè)POS(X)、BUN(X)和NEG(X)分別代表了各種不完備鄰域多粒度決策理論粗糙集模型下的三個(gè)區(qū)域。那么可以導(dǎo)出三種決策規(guī)則:

      根據(jù)Yao提出的三支決策理論,代價(jià)函數(shù)是三支決策誘導(dǎo)的關(guān)鍵,通過(guò)代價(jià)函數(shù),可以計(jì)算出一對(duì)閾值α和β,從而依據(jù)決策理論粗糙集模型對(duì)論域劃分成三個(gè)區(qū)域。目前的決策理論粗糙集模型基于完備信息系統(tǒng)構(gòu)建,代價(jià)函數(shù)是一個(gè)事先給定的數(shù)值,但是在不完備信息系統(tǒng)中,由于缺失值的存在,信息系統(tǒng)的不確定性會(huì)進(jìn)一步增大[24],這種不確定性的增大固然會(huì)產(chǎn)生代價(jià)函數(shù)也出現(xiàn)一定的不確定性[25],而傳統(tǒng)的代價(jià)函數(shù)是以固定值的形式給出,因而并不適用于不完備信息系統(tǒng)。為此,本文不再將代價(jià)函數(shù)設(shè)定為單一的數(shù)值,而是以一種區(qū)間值的形式來(lái)表現(xiàn)代價(jià)函數(shù)的這種不確定性,通過(guò)區(qū)間值的形式可以調(diào)控代價(jià)函數(shù)的大小,進(jìn)而可以建立不同程度的三支決策。本文將這種決策誘導(dǎo)方式命名為可變?nèi)Q策。

      表2 區(qū)間值代價(jià)函數(shù)

      根據(jù)表2,可以得到如下關(guān)系:

      類似于傳統(tǒng)的決策理論粗糙集模型,這里定義?x∈U采取三種行為的預(yù)期代價(jià)為:

      (63)

      (64)

      (65)

      由于代價(jià)函數(shù)是以區(qū)間值的形式表示,因此得到預(yù)期代價(jià)結(jié)果也是一個(gè)區(qū)間值,即預(yù)期的代價(jià)結(jié)果在一個(gè)范圍內(nèi)并不是確定的值。但是在實(shí)際應(yīng)用中,需要得到一個(gè)具體的預(yù)期代價(jià)結(jié)果,因此就需要對(duì)預(yù)期代價(jià)區(qū)間值中取一個(gè)具體的值,為此,這里定義一種區(qū)間值的取值函數(shù)。

      定義10設(shè)區(qū)間值ω=[a,b],定義函數(shù)ξk(ω)=a+k·(b-a),這里的0≤k≤1。

      在定義10中,函數(shù)ξk(ω)通過(guò)k在區(qū)間值[a,b]中進(jìn)行取值,當(dāng)k=0時(shí),ξk(ω)=a,當(dāng)k=1時(shí),ξk(ω)=b,當(dāng)0

      根據(jù)定義10,可以進(jìn)一步得到:

      類似于經(jīng)典決策理論粗糙集模型,有:

      所以:

      同理:

      這里令:

      (66)

      (67)

      (68)

      那么有:

      4 實(shí)例分析

      本節(jié)將通過(guò)一個(gè)具體的實(shí)例來(lái)分析本文所提出的模型。實(shí)例所選取的是一個(gè)大學(xué)生三好學(xué)生評(píng)估表,眾所周知,大學(xué)生的三好學(xué)生的評(píng)估將從思想品德、課程成績(jī)以及社會(huì)實(shí)踐等不同方面對(duì)學(xué)生進(jìn)行綜合評(píng)估,因此這符合了多粒度粗糙集模型實(shí)際應(yīng)用的基本視角,同時(shí)加入三支決策的思想,可以使得問(wèn)題的處理更加科學(xué)合理。

      表3為一個(gè)某專業(yè)12名同學(xué)的思想品德、課程成績(jī)以及社會(huì)實(shí)踐三方面測(cè)評(píng)信息表IIS=(U,At,V),其中的成績(jī)值均為歸一化至[0,1]區(qū)間的結(jié)果。該表中包含6個(gè)屬性,即{a1,a2,b1,b2,c1,c2},并被分為三大類,其中A={a1,a2}表示兩位老師對(duì)每位同學(xué)的思想品德測(cè)評(píng)結(jié)果,由于有的老師對(duì)個(gè)別同學(xué)不熟悉,因此很難給出具體的評(píng)分,所以成績(jī)出現(xiàn)了空缺,表中用“*”表示。B={b1,b2}表示每位同學(xué)期中和期末考試的綜合成績(jī),由于個(gè)別同學(xué)未參加,因此也出現(xiàn)了部分空缺。C={c1,c2}表示兩位老師對(duì)每位同學(xué)的社會(huì)實(shí)踐評(píng)分,同樣存在個(gè)別的空缺。對(duì)于表3中的決策屬性class,其中決策值為1的學(xué)生表示最有可能獲得三好學(xué)生的同學(xué)。

      表3 三好學(xué)生測(cè)評(píng)信息表

      將決策值為1的集合設(shè)為X={u2,u4,u6,u8,u10,u12},本實(shí)例分析的狀態(tài)集為Ω={X,~X},行為集為Γ={aP,aB,aN}。該高校的教務(wù)部門給出的三好學(xué)生測(cè)評(píng)代價(jià)函數(shù)如表4所示,由于有缺失值的存在,因此所示的代價(jià)函數(shù)是一個(gè)區(qū)間形式,便于各專業(yè)選取和調(diào)整。

      表4 三好學(xué)生測(cè)評(píng)代價(jià)函數(shù)

      采用本文所提出的不完備鄰域多粒度決策理論粗糙集對(duì)其進(jìn)行建模,取屬性集A、B和C作為該模型的三個(gè)粒度層次,它們誘導(dǎo)出的鄰域容差關(guān)系分為NTA、NTB和NTC,然后根據(jù)NTA+NTB+NTC三個(gè)粒度針對(duì)X進(jìn)行多粒度決策理論粗糙逼近,得到X的三個(gè)區(qū)域,即正區(qū)域、邊界域和負(fù)區(qū)域。由于本文提出了多粒度決策理論粗糙集的三種具體模型,分別為樂(lè)觀模型、悲觀模型和平均模型,因此對(duì)于樂(lè)觀模型,三個(gè)區(qū)域記為POSO(X)、BUNO(X)和NEGO(X);對(duì)于悲觀模型,三個(gè)區(qū)域記為POSP(X)、BUNP(X)和NEGP(X);對(duì)于平均模型,三個(gè)區(qū)域記為POSM(X)、BUNM(X)和NEGM(X)。由于該模型運(yùn)用的代價(jià)函數(shù)是區(qū)間形式,針對(duì)定義10中的ξk函數(shù),本實(shí)例分析將其中的k值在[0,1]區(qū)間以步長(zhǎng)0.2依次取值,然后根據(jù)對(duì)應(yīng)的代價(jià)函數(shù)分別進(jìn)行實(shí)驗(yàn),依次觀察k對(duì)最終結(jié)果的影響。另外,對(duì)于該模型的鄰域容差關(guān)系,本實(shí)驗(yàn)設(shè)定鄰域半徑為0.1。表5、表6和表7分別為對(duì)象集X關(guān)于NTA+NTB+NTC的樂(lè)觀、悲觀和平均模型取不同k值的三個(gè)區(qū)域結(jié)果。

      表5 樂(lè)觀鄰域多粒度決策理論粗糙集三個(gè)區(qū)域

      表6 悲觀鄰域多粒度決策理論粗糙集三個(gè)區(qū)域

      表7 平均鄰域多粒度決策理論粗糙集三個(gè)區(qū)域

      表5為X在樂(lè)觀鄰域多粒度決策理論粗糙集的三個(gè)區(qū)域,根據(jù)三支決策模型,即POSO(X)中的學(xué)生直接評(píng)定為三好學(xué)生,BUNO(X)中的學(xué)生有待進(jìn)一步進(jìn)行考察,而NEGO(X)中的學(xué)生直接不評(píng)定為三好學(xué)生。觀察表5可以發(fā)現(xiàn),無(wú)論k取何值時(shí),三個(gè)區(qū)域始終都保持不變,即在此評(píng)測(cè)表中,最終的評(píng)測(cè)結(jié)果不隨著代價(jià)的變化而變化。同時(shí)有POSO(X)=X,表明原先可能評(píng)為三好學(xué)生的同學(xué)都評(píng)定為三好學(xué)生,BUNO(X)={u1,u3,u5,u9,u11}表明這些同學(xué)處于待定狀態(tài),而只有NEGO(X)={u7}是直接不評(píng)定為三好學(xué)生。這樣的評(píng)定結(jié)果剛好符合樂(lè)觀鄰域多粒度決策理論粗糙集的“樂(lè)觀”態(tài)度,在表3中,{u2,u4,u6,u8,u10,u12}中的同學(xué)都至少有一個(gè)成績(jī)滿足>0.7,該模型直接判定為三好學(xué)生,其余的大部分都進(jìn)入待定狀態(tài),而只有一個(gè)是直接拒絕。這主要是由于樂(lè)觀模型中,只要有一個(gè)粒度下對(duì)象的鄰域容差類的包含度滿足大于對(duì)應(yīng)閾值,那么該對(duì)象便屬于正區(qū)域中,而所有粒度下對(duì)象的鄰域容差類的包含度滿足小于對(duì)應(yīng)閾值,該對(duì)象才隸屬于負(fù)區(qū)域,這樣使得正區(qū)域的定義比較松弛,而負(fù)區(qū)域的定義比較苛刻,因而出現(xiàn)了表5中的評(píng)定結(jié)果,并且受代價(jià)函數(shù)的變化影響較小。所以對(duì)于不嚴(yán)格的三好學(xué)生評(píng)定,那么該模型是一個(gè)較好的選擇。

      表6為X在悲觀鄰域多粒度決策理論粗糙集的三個(gè)區(qū)域,觀察發(fā)現(xiàn),隨著k取值的變化,三個(gè)區(qū)域始終都保持不變,即在此評(píng)測(cè)表中,最終的評(píng)測(cè)結(jié)果不隨著代價(jià)的變化而變化。對(duì)于評(píng)測(cè)結(jié)果,POSP(X)為空集,即沒(méi)有任何一個(gè)同學(xué)直接評(píng)定為三好學(xué)生。BUNP(X)=X,即原先有較大可能評(píng)定為三好學(xué)生的同學(xué)都進(jìn)入了待定狀態(tài),其余的同學(xué)直接拒絕評(píng)定為三好學(xué)生,這與表5中的結(jié)果相反,體現(xiàn)出了悲觀鄰域多粒度決策理論粗糙集的“悲觀”態(tài)度,{u2,u4,u6,u8,u10,u12}中的同學(xué)雖然都有一個(gè)成績(jī)滿足>0.7,但是也都存在成績(jī)<0.7,從而進(jìn)入待定狀態(tài)。這主要是由于悲觀模型與樂(lè)觀模型的定義相反,正區(qū)域的定義比較苛刻,負(fù)區(qū)域的定義比較松弛,因而出現(xiàn)了表6中的評(píng)定結(jié)果,同樣受代價(jià)函數(shù)的變化影響較小。所以對(duì)于嚴(yán)格的三好學(xué)生評(píng)定,應(yīng)選擇該模型進(jìn)行評(píng)定。

      綜合分析表5、表6和表7的結(jié)果,可以得出,所提出的樂(lè)觀鄰域多粒度決策理論粗糙集和悲觀鄰域多粒度決策理論粗糙集在三個(gè)區(qū)域劃分的嚴(yán)格程度方面,都存在一定的缺陷。而所提出的平均鄰域多粒度決策理論粗糙集對(duì)如上兩個(gè)模型的缺陷都進(jìn)行了一定的改善,同時(shí)針對(duì)不完備數(shù)據(jù)提出的區(qū)間代價(jià)函數(shù),并通過(guò)取不同k值的方式得到了不同程度的三支決策規(guī)則,為本文所提出的模型又增添了一份靈活性。

      在本文所提出的不完備鄰域多粒度決策理論粗糙集模型中,其中鄰域容差關(guān)系是處理數(shù)值型不完備數(shù)據(jù)的關(guān)鍵,其中包含一個(gè)鄰域半徑δ的參數(shù),它的取值不同將會(huì)對(duì)模型的處理結(jié)果產(chǎn)生一定的影響,因此接下來(lái)將探究鄰域半徑δ對(duì)實(shí)例結(jié)果的影響以及如何選取最佳的取值問(wèn)題。

      表3中的評(píng)測(cè)成績(jī)值已歸一化入0~1之間,因此將鄰域半徑在[0.05,0.55]之間以0.05為步長(zhǎng)進(jìn)行取值,k值在[0,1]區(qū)間以0.1為步長(zhǎng)進(jìn)行取值,然后將每一組鄰域半徑和k值的參數(shù)分別賦入模型中,計(jì)算對(duì)象集X的三個(gè)區(qū)域。其結(jié)果如圖1、圖2和圖3所示,圖1表示的是樂(lè)觀模型下不同鄰域半徑和k值的三個(gè)區(qū)域結(jié)果,圖2表示的是悲觀模型下不同鄰域半徑和k值的三個(gè)區(qū)域結(jié)果,圖3表示的是平均模型下不同鄰域半徑和k值的三個(gè)區(qū)域結(jié)果。

      (a)POSO(X)

      (b)BUNO(X)

      (c)NEGO(X)圖1 樂(lè)觀鄰域多粒度決策理論粗糙集模型三個(gè)區(qū)域大小變化

      (a)POSP(X)

      (b)BUNP(X)

      (c)NEGP(X)圖2 悲觀鄰域多粒度決策理論粗糙集模型三個(gè)區(qū)域大小變化

      (a)POSM(X)

      (b)BUNM(X)

      (c)NEGM(X)圖3 平均鄰域多粒度決策理論粗糙集模型三個(gè)區(qū)域大小變化

      在圖1所示的樂(lè)觀鄰域多粒度決策理論粗糙集模型三個(gè)區(qū)域大小變化中,對(duì)于同一個(gè)k值,隨著鄰域半徑的逐漸增大,正區(qū)域POSO(X)是逐漸減小的,當(dāng)δ=0.55時(shí),POSO(X)幾乎為空集;負(fù)區(qū)域NEGO(X)也是逐漸減小的,并且當(dāng)δ≥0.15時(shí),NEGO(X)都為空集;而邊界域BUNO(X)滿足逐漸增大的趨勢(shì),并且最終BUNO(X)=U,這表明過(guò)大的鄰域半徑會(huì)使得所有的同學(xué)都處于進(jìn)一步考察狀態(tài),因此這不符合預(yù)期的評(píng)測(cè)目的。在圖2所示的悲觀鄰域多粒度決策理論粗糙集模型三個(gè)區(qū)域大小變化中,隨著鄰域半徑的逐漸增大,正區(qū)域POSP(X)都為空集,NEGP(X)也是逐漸減小的,邊界域BUNP(X)滿足逐漸增大并且最終滿足BUNP(X)=U,與樂(lè)觀模型中出現(xiàn)了同樣的結(jié)果。圖3所示的平均模型也是滿足同樣的規(guī)律。因此綜合三類模型的實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),選取過(guò)大的鄰域半徑將會(huì)對(duì)最終的判定結(jié)果產(chǎn)生很大的誤差,觀察各圖結(jié)果可以看出最佳的鄰域半徑可選取為0.1~0.2。由于本實(shí)例中信息表的屬性值都?xì)w一化至[0, 1]區(qū)間,因此實(shí)驗(yàn)中得到的最佳鄰域半徑具有一定的一般性,并且文獻(xiàn)[8-9,27]通過(guò)大量實(shí)驗(yàn)也得出的最佳鄰域半徑選取為0.1~0.2,因此本文所提出模型中鄰域半徑應(yīng)選取為0.1~0.2。

      5 結(jié) 語(yǔ)

      針對(duì)數(shù)值型數(shù)據(jù)和包含缺失值數(shù)據(jù)等復(fù)雜的數(shù)據(jù)環(huán)境,本文將多粒度決策理論粗糙集模型在不完備數(shù)值型數(shù)據(jù)下進(jìn)行推廣,提出了樂(lè)觀鄰域多粒度決策理論粗糙集、悲觀鄰域多粒度決策理論粗糙集以及平均鄰域多粒度決策理論粗糙集,并分析了三種模型的相關(guān)性質(zhì)以及相互關(guān)系。同時(shí)針對(duì)不完備信息系統(tǒng)下決策理論粗糙集模型中代價(jià)函數(shù)面臨的局限性,本文提出了一種可變?nèi)Q策,它主要通過(guò)區(qū)間形式來(lái)表示代價(jià)函數(shù),然后通過(guò)選取不同參數(shù)誘導(dǎo)出不同的三支決策結(jié)果,使得這種三支決策誘導(dǎo)方法具備了更好的靈活性,最后的實(shí)例分析表明了所提出模型與方法的實(shí)用性與合理性。本文所提出的模型適用于較為復(fù)雜數(shù)據(jù)環(huán)境下的多粒度分析與決策分析,是針對(duì)靜態(tài)的數(shù)據(jù)建立的,因此接下來(lái)將對(duì)動(dòng)態(tài)數(shù)據(jù)環(huán)境下作進(jìn)一步研究。

      猜你喜歡
      粗糙集代價(jià)鄰域
      基于Pawlak粗糙集模型的集合運(yùn)算關(guān)系
      稀疏圖平方圖的染色數(shù)上界
      基于鄰域競(jìng)賽的多目標(biāo)優(yōu)化算法
      愛(ài)的代價(jià)
      海峽姐妹(2017年12期)2018-01-31 02:12:22
      代價(jià)
      多?;植诩再|(zhì)的幾個(gè)充分條件
      關(guān)于-型鄰域空間
      雙論域粗糙集在故障診斷中的應(yīng)用
      成熟的代價(jià)
      兩個(gè)域上的覆蓋變精度粗糙集模型
      梁河县| 来宾市| 潞西市| 永新县| 普定县| 百色市| 德格县| 尼木县| 凌海市| 太谷县| 专栏| 昌吉市| 西乡县| 延长县| 汉川市| 密山市| 嘉定区| 安泽县| 彭山县| 安福县| 丘北县| 龙口市| 瓦房店市| 尼木县| 湟源县| 平邑县| 宣武区| 金溪县| 会理县| 勃利县| 高密市| 灌阳县| 苗栗县| 井陉县| 大庆市| 南澳县| 和林格尔县| 大宁县| 玉溪市| 九江县| 泗阳县|