李 敏,楊亞鋒,雷 宇,李麗紅
(1.華北理工大學(xué) 理學(xué)院 河北 唐山 063210;2.河北省數(shù)據(jù)科學(xué)與應(yīng)用重點(diǎn)實(shí)驗(yàn)室 河北 唐山 063210;3.唐山市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室 河北 唐山 063210;4.華北理工大學(xué) 電氣工程學(xué)院 河北 唐山 063210)
三支決策是在粗糙集的基礎(chǔ)上提出的,是一種處理不確定性決策的數(shù)學(xué)方法,姚一豫等[1]基于各個(gè)領(lǐng)域中三支決策的共性及特征,提出三支決策理論框架。自提出以來(lái),三支決策備受學(xué)者關(guān)注,從不同角度進(jìn)行深入研究。針對(duì)勾股模糊三支決策概率閾值難以確定的問(wèn)題,文獻(xiàn)[2-3]給出概率閾值確定方法和基于勾股模糊集評(píng)價(jià)的三支決策方法,同時(shí)結(jié)合直覺(jué)模糊集理論提出一種基于直覺(jué)模糊相似度的三支決策方法;薛占熬等[4]通過(guò)研究粒度重要度的構(gòu)造方法,提出一種新的基于粒度重要度的三支決策模型將證據(jù)理論引入三支決策中,分析延遲信任區(qū)間可能包含的可變語(yǔ)義;陳玉金等[5]構(gòu)建基于證據(jù)理論的確定和可變?nèi)Q策模型;岳文琦等[6]在混合決策信息系統(tǒng)中,提出一種模糊效用三支決策模型;張春英等[7]在深入研究PS-粗糙集模型特點(diǎn)的基礎(chǔ)上,提出一種基于PS-粗糙集的動(dòng)態(tài)三支決策算法。此外,三支決策模型在水資源承載力、垃圾郵件過(guò)濾、圖像分割等領(lǐng)域[8-11]得到廣泛的應(yīng)用。
“可拓集”從變換的角度研究對(duì)象具有某種性質(zhì)的程度及其變化,并用關(guān)聯(lián)函數(shù)進(jìn)行定量化描述[12]。隨著可拓學(xué)研究的深入,關(guān)聯(lián)函數(shù)成為重點(diǎn)。文獻(xiàn)[13]對(duì)可拓集無(wú)量綱一維關(guān)聯(lián)函數(shù)進(jìn)行研究,為進(jìn)一步研究多維關(guān)聯(lián)函數(shù)奠定基礎(chǔ)。楊春燕等[14]介紹可拓集中初等關(guān)聯(lián)函數(shù)構(gòu)造的進(jìn)展并進(jìn)一步深入研究。在單評(píng)價(jià)特征基元可拓集基礎(chǔ)上,楊春燕[15]研究了多評(píng)價(jià)特征基元可拓集的構(gòu)造方法及其關(guān)聯(lián)函數(shù)的建立方法,為解決不相容問(wèn)題提供了理論依據(jù)。胡寶清等[16]從實(shí)際出發(fā),研究區(qū)間論域上的可拓集及其關(guān)聯(lián)函數(shù)。還有學(xué)者利用可拓集進(jìn)行可拓評(píng)價(jià),解決實(shí)際問(wèn)題。安永林等[17]為綜合評(píng)價(jià)服役隧道結(jié)構(gòu)健康狀況,利用可拓法進(jìn)行評(píng)估并有針對(duì)地給出不同的策略。李倩倩等[18]以山東半島藍(lán)色經(jīng)濟(jì)區(qū)為研究對(duì)象,基于熵權(quán)可拓模型對(duì)城鎮(zhèn)化發(fā)展水平進(jìn)行評(píng)價(jià)。郭嘉偉等[19]基于熵權(quán)可拓物元模型對(duì)會(huì)寧縣水資源承載力進(jìn)行評(píng)價(jià)。文獻(xiàn)[20-21]將可拓集方法應(yīng)用于水資源承載力的評(píng)價(jià)。
三支決策模型大多以條件概率作為評(píng)價(jià)函數(shù)進(jìn)行決策,而可拓集中關(guān)聯(lián)函數(shù)表示事物具有或不具有某種性質(zhì)的程度,可對(duì)同一域中的元素進(jìn)行優(yōu)劣排序,因此將可拓集應(yīng)用于三支決策,不僅可以實(shí)現(xiàn)域的劃分,同時(shí)能夠挖掘決策優(yōu)化方向,進(jìn)而制定系統(tǒng)狀態(tài)提升策略?;诖?,本文利用可拓關(guān)聯(lián)函數(shù)的方法,定義關(guān)聯(lián)度比,構(gòu)建一種基于關(guān)聯(lián)度比的三支決策模型,并對(duì)哈爾濱市水資源承載力系統(tǒng)給出優(yōu)化方向與建議。
三支決策的提出為決策粗糙集的正域、負(fù)域、邊界域賦予合理的語(yǔ)義解釋?zhuān)謩e對(duì)應(yīng)接受、拒絕和延遲決策,符合人類(lèi)的決策思想。
貝葉斯理論是風(fēng)險(xiǎn)型決策方法之一,其思想是以期望損失最小為決策依據(jù),選擇合適的決策方案[22]。三支決策是基于貝葉斯理論進(jìn)行的決策,規(guī)則如下。
設(shè)狀態(tài)空間Θ={Di,Di},表示對(duì)象x是否屬于集合Di,行動(dòng)集A={aP,aB,aN}表示對(duì)一個(gè)對(duì)象x進(jìn)行分類(lèi)決策時(shí)采取的行動(dòng)。aP、aB、aN分別表示對(duì)象確定屬于、不一定屬于和一定不屬于集合的行動(dòng),不同狀態(tài)下對(duì)應(yīng)不同行動(dòng)的代價(jià)函數(shù)如表1所示。
表1 損失代價(jià)函數(shù)
λPP、λBP、λNP分別表示x本屬于Di而采取行動(dòng)aP、aB、aN時(shí)的損失;λPN、λBN、λNN分別表示x本不屬于Di而采取行動(dòng)aP、aB、aN時(shí)的損失。P(Di|[x])是條件概率,對(duì)于特定x,采取一個(gè)決策行動(dòng)時(shí)的期望代價(jià)為
P)如果T(aP|[x])≤T(aB|[x])且T(aP|[x])≤T(aN|[x])成立,則x∈POS(X),
B)如果T(aB|[x])≤T(aP|[x])且T(aB|[x])≤T(aN|[x])成立,則x∈BND(X),
N)如果T(aN|[x])≤T(aP|[x])且T(aN|[x])≤T(aB|[x])成立,則x∈NEG(X)。
由于P(Di|[x])+P(Di|[x])=1,且λPP≤λBP≤λNP,λNN≤λBN≤λPN,則決策規(guī)則可簡(jiǎn)化為
P)如果P(Di|[x])≥α成立,則x∈POS(X),
B)如果β
N)如果P(Di|[x])≤β成立,則x∈NEG(X),
若x∈POS(X),則表示接受x;若x∈BND(X),則表示對(duì)x延遲決策;若x∈NEG(X),則表示拒絕x。
定義1[23](可拓集合) 設(shè)U為論域,u為U中任一元素,k是U在實(shí)數(shù)R的一個(gè)映射,T(TU,Tk,Tu)是給定的變換,稱(chēng)
(1)
定義2[13](正域?yàn)橛邢迏^(qū)間的關(guān)聯(lián)函數(shù)) 若正域X0=[a,b]為有限區(qū)間,節(jié)域X(X≠R)為實(shí)數(shù)域上任何區(qū)間且X0?X,非端點(diǎn)x0∈X0,記X0和X的公共端點(diǎn)為xv(若無(wú)公共端點(diǎn),則為空),則對(duì)任意實(shí)數(shù)x≠xv,則x關(guān)于X0和X且在X0的非中點(diǎn)x0取得最大值的一般關(guān)聯(lián)函數(shù)為
(2)
其中:D(x,X0,X)為x關(guān)于X0和X的一般位置值。
定義3[13](正域?yàn)闊o(wú)限區(qū)間的關(guān)聯(lián)函數(shù)) 設(shè)無(wú)限區(qū)間X0為正域,節(jié)域X(X≠R)為實(shí)數(shù)域上任何區(qū)間且X0?X,非端點(diǎn)x0∈X0,則對(duì)實(shí)數(shù)域上的任意點(diǎn)x關(guān)于無(wú)限區(qū)間套X0和X且在點(diǎn)x0取最大值的關(guān)聯(lián)函數(shù)為
(3)
其中:D(x,X0,X)為x關(guān)于區(qū)間套X0和R的一般位置值。
三支決策是在概率粗糙集的基礎(chǔ)上提出的,為粗糙集的三個(gè)域提供合理語(yǔ)義解釋?zhuān)Q策中評(píng)價(jià)函數(shù)的選取直接影響決策結(jié)果,因此評(píng)價(jià)函數(shù)的選取至關(guān)重要??赏仃P(guān)聯(lián)度是可拓評(píng)價(jià)與決策的主要工具,其大小關(guān)系著決策的結(jié)果。因此,關(guān)聯(lián)函數(shù)是一種重要而有效的評(píng)價(jià)函數(shù)。由于關(guān)聯(lián)度值大部分為負(fù),而且取絕對(duì)值后大于1,評(píng)價(jià)函數(shù)會(huì)影響決策,因此結(jié)合模糊集中隸屬函數(shù)的思想,定義可拓關(guān)聯(lián)度比如下。
定義4設(shè)Kj(Vi)為評(píng)價(jià)指標(biāo)j關(guān)于等級(jí)i的關(guān)聯(lián)度,則評(píng)價(jià)指標(biāo)j關(guān)于等級(jí)i的關(guān)聯(lián)度比為
(4)
由于關(guān)聯(lián)度比的取值范圍為(0,2),所以需要對(duì)關(guān)聯(lián)度比進(jìn)行歸一化處理。由關(guān)聯(lián)度比的定義可知,指標(biāo)關(guān)于等級(jí)的關(guān)聯(lián)度比和非關(guān)聯(lián)度比的和為1。故歸一化的關(guān)聯(lián)度比適合作為三支決策的評(píng)價(jià)函數(shù)來(lái)進(jìn)行決策。
將表1的代價(jià)函數(shù)作為損失,將關(guān)聯(lián)度比作為評(píng)價(jià)函數(shù)構(gòu)建三支決策模型。
對(duì)于特定對(duì)象j,采取一個(gè)決策行動(dòng)時(shí)的期望代價(jià)為
(5)
(6)
從式(6)可知,代價(jià)目標(biāo)函數(shù)T(aP|j)、T(aB|j)、T(aN|j)的幾何意義是以Pi(Kj)為變量,相關(guān)代價(jià)函數(shù)組合為斜率和截距的線性函數(shù),因此三支分類(lèi)的閾值α、β可以看作是上述三個(gè)代價(jià)目標(biāo)線性函數(shù)之間交集的橫坐標(biāo)Pi(Kj)的取值。顯然α、β可以看作是T(aP|j)與T(aB|j)、T(aB|j)與T(aN|j)交點(diǎn)的Pi(Kj)處取值,T(aP|j)與T(aN|j)的交點(diǎn)記為γ,如圖1所示,圖中的TP、TB、TN分別代表式(6)中的T(aP|j)、T(aB|j)、T(aN|j),T*表示TP、TB、TN中的任意量。
圖1 TP、TB、TN之間的關(guān)系示意圖
根據(jù)貝葉斯風(fēng)險(xiǎn)決策過(guò)程,最小代價(jià)決策規(guī)則如下。
P)如果T(aP|j)≤T(aB|j)且T(aP|j)≤T(aN|j)成立,則j∈POS(X);
B)如果T(aB|j)≤T(aP|j)且T(aB|j)≤T(aN|j)成立,則j∈BND(X);
N)如果T(aN|j)≤T(aP|j)且T(aN|j)≤T(aB|j)成立,則j∈NEG(X)。
由于0≤β<γ<α≤1,則決策規(guī)則可簡(jiǎn)化為
P)如果Pi(Kj)≥α成立,則j∈POS(X);
B)如果β 步驟1確定待評(píng)物元、經(jīng)典域和節(jié)域。將給定數(shù)據(jù)集的指標(biāo)根據(jù)以往研究進(jìn)行分級(jí),并確定每個(gè)等級(jí)具體取值范圍。經(jīng)典域是每個(gè)等級(jí)中每個(gè)指標(biāo)具體取值范圍,節(jié)域表示所有等級(jí)中每個(gè)指標(biāo)的取值范圍,待評(píng)物元表示需要評(píng)價(jià)的物元,根據(jù)分級(jí)確定經(jīng)典域和節(jié)域。 式中:Cj表示c1,c2,…,cn這n個(gè)指標(biāo)的集合;Voj表示(aoj,boj),j=1,2,…,n的集合;而(aoj,boj)為等級(jí)t中樣本關(guān)于第j個(gè)指標(biāo)的取值范圍。 式中:Cj表示c1,c2,…,cn這n個(gè)指標(biāo)的集合;Vpj表示(apj,bpj),j=1,2,…,n的集合,而(apj,bpj)為所有等級(jí)中樣本關(guān)于第j個(gè)指標(biāo)的取值范圍。 建立客史檔案,把握顧客需求。市場(chǎng)營(yíng)銷(xiāo)理論告訴我們,只有真正把握顧客的需求,才能提供令賓客滿意的服務(wù),才能提高酒店的競(jìng)爭(zhēng)力。因此,酒店必須要建立起獨(dú)一無(wú)二的客史檔案。那么酒店該從哪些方面建立客史檔案呢?首先,酒店要從收集顧客資料著手,全程跟蹤,完整準(zhǔn)確的建立常客檔案;其次,要應(yīng)用計(jì)算機(jī)進(jìn)行數(shù)據(jù)技術(shù)開(kāi)發(fā),建立詳盡而細(xì)微的顧客需求檔案,最終建立顧客信息庫(kù)。 式中:Cj表示c1,c2,…,cn這n個(gè)指標(biāo)的集合;Vi表示x*(i,j),j=1,2,…,n的集合;x*(i,j)為待評(píng)樣本i關(guān)于第j個(gè)指標(biāo)的取值。 步驟2根據(jù)關(guān)聯(lián)度公式計(jì)算各指標(biāo)的關(guān)聯(lián)度。 (7) 式中:Kj(xi)表示第i個(gè)樣本、第j個(gè)指標(biāo)的關(guān)聯(lián)度,各個(gè)指標(biāo)值到各評(píng)價(jià)等級(jí)范圍值的距離為 步驟3由可拓關(guān)聯(lián)度比公式(4)計(jì)算每個(gè)指標(biāo)關(guān)于每個(gè)等級(jí)的關(guān)聯(lián)度比,并做歸一化處理。 步驟4由熵權(quán)可拓評(píng)價(jià)法計(jì)算城市所屬等級(jí)。 1)由于各指標(biāo)的計(jì)量單位并不統(tǒng)一,而且正向指標(biāo)和負(fù)向指標(biāo)表示的含義不同,正向指標(biāo)數(shù)值越高越好,負(fù)向指標(biāo)數(shù)值越低越好,因此,對(duì)于正向、負(fù)向指標(biāo)采用不同的運(yùn)算進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理。同時(shí)為使后面計(jì)算的指標(biāo)熵值有意義,即標(biāo)準(zhǔn)化后的指標(biāo)值不為0,故標(biāo)準(zhǔn)化時(shí)后面要加1,取值范圍為[1,2]。 式中:x*(i,j)表示第i個(gè)樣本第j個(gè)評(píng)價(jià)指標(biāo)值;xmax(i,j)=max{x(1,j),x(2,j),…,x(n,j)},即所有樣本中第j個(gè)評(píng)價(jià)指標(biāo)的最大值;xmin(i,j)=min{x(1,j),x(2,j),…,x(n,j)},即所有樣本中第j個(gè)評(píng)價(jià)指標(biāo)的最小值。 3)確定所屬等級(jí)。城市關(guān)于眾指標(biāo)的綜合關(guān)聯(lián)度用公式(8)計(jì)算 (8) 若 (9) 則待評(píng)樣本的等級(jí)為io。式中:Kio(d0)表示待評(píng)樣本的關(guān)聯(lián)度;maxKt(xi)表示待評(píng)樣本關(guān)于所有等級(jí)關(guān)聯(lián)度的最大值。 步驟5結(jié)合數(shù)據(jù)集特點(diǎn),經(jīng)過(guò)多次實(shí)驗(yàn),并根據(jù)不同閾值劃分后每個(gè)域中元素個(gè)數(shù)情況,可得選取閾值α=0.28、β=0.22比較合適,因此選取α=0.28、β=0.22作為閾值。由基于關(guān)聯(lián)度比的三支決策的決策規(guī)則,對(duì)每個(gè)等級(jí)的指標(biāo)進(jìn)行域的劃分,得到基于每個(gè)等級(jí)的三個(gè)域劃分。 步驟6分析域的劃分結(jié)果,對(duì)城市水資源承載力系統(tǒng)給出優(yōu)化方向與建議。 步驟1中確定待評(píng)物元時(shí),用到兩層for循環(huán),一層步長(zhǎng)為指標(biāo)數(shù)n,一層步長(zhǎng)為樣本數(shù)m,最終得到每一待評(píng)樣本關(guān)于所有指標(biāo)的取值,其時(shí)間復(fù)雜度為O(mn);步驟2、3中計(jì)算各指標(biāo)的關(guān)聯(lián)度與關(guān)聯(lián)度比時(shí),也用到步長(zhǎng)分別為m和n的兩層for循環(huán),其時(shí)間復(fù)雜度也均為O(mn);步驟4中仍通過(guò)步長(zhǎng)為m和n的兩層for循環(huán)計(jì)算出正、負(fù)項(xiàng)指標(biāo)及屬性權(quán)重,其時(shí)間復(fù)雜度也為O(mn);因此最終得到的時(shí)間復(fù)雜度為O(mn)。 選取黑龍江省13市水資源承載力數(shù)據(jù),包括水土資源和承載力兩個(gè)指標(biāo)體系,共19個(gè)指標(biāo),利用本文模型對(duì)哈爾濱市水資源承載力進(jìn)行評(píng)價(jià),并給出優(yōu)化建議。 步驟1根據(jù)黑龍江省13市的水資源承載力數(shù)據(jù),結(jié)合以往研究和專(zhuān)家經(jīng)驗(yàn),將指標(biāo)承載力等級(jí)設(shè)定為4級(jí),即Ⅰ(強(qiáng))、Ⅱ(一般)、Ⅲ(弱)、Ⅳ(很弱)。各等級(jí)的經(jīng)典域和節(jié)域?yàn)?/p> 其中:Dt矩陣表示經(jīng)典域矩陣;Dp矩陣表示節(jié)域矩陣。 步驟2由關(guān)聯(lián)度公式(7)及關(guān)聯(lián)度比公式(4)計(jì)算哈爾濱市各指標(biāo)關(guān)于每個(gè)等級(jí)的關(guān)聯(lián)度及關(guān)聯(lián)度比,見(jiàn)表2。 表2 哈爾濱市各指標(biāo)關(guān)于每個(gè)等級(jí)的關(guān)聯(lián)度及關(guān)聯(lián)度比 步驟3由公式(8)~(9)計(jì)算可得,目前哈爾濱市水資源承載力處于Ⅱ級(jí)。 步驟4由決策規(guī)則得每個(gè)等級(jí)指標(biāo)三個(gè)域的劃分為 步驟5給出指標(biāo)優(yōu)化方向與建議。由熵權(quán)可拓評(píng)價(jià)法可知哈爾濱市目前水資源承載力處于Ⅱ級(jí)水平,根據(jù)每個(gè)等級(jí)指標(biāo)三個(gè)域的劃分以及水資源承載力現(xiàn)狀可知,哈爾濱市需要優(yōu)化指標(biāo)有城鎮(zhèn)化率、人口自然增長(zhǎng)率、Remanenko潛在蒸發(fā)量、干燥度、人均生活用水量、GDP總量、人均GDP、GDP增長(zhǎng)率、森林覆蓋率。而在這些指標(biāo)中,城鎮(zhèn)化率、人口自然增長(zhǎng)率的關(guān)聯(lián)度比的值較大,在Ⅰ級(jí)正域中所處層次較高,所以應(yīng)先優(yōu)化這些指標(biāo),這為政府決策和管理提供依據(jù)。 本文將可拓集與三支決策結(jié)合建立基于關(guān)聯(lián)度比的三支決策模型并應(yīng)用于決策哈爾濱市水資源承載力。第一,基于關(guān)聯(lián)度比構(gòu)建三支決策模型,為三個(gè)域的構(gòu)造提供合理的解釋?zhuān)S富三支決策和可拓評(píng)價(jià)理論;第二,模型可以在每一級(jí)上劃分三個(gè)域,定量給出評(píng)級(jí)改變時(shí)各指標(biāo)的變化,并根據(jù)關(guān)聯(lián)度比的值,可以量化同一域中屬性的重要程度,使屬性分出層次,既實(shí)現(xiàn)動(dòng)態(tài)決策,又細(xì)化決策;第三,將模型應(yīng)用于哈爾濱市水資源承載力評(píng)價(jià)中可知,若希望承載力由原來(lái)的Ⅱ級(jí)提升為Ⅰ級(jí),則應(yīng)優(yōu)化城鎮(zhèn)化率、人口自然增長(zhǎng)率等指標(biāo),這為決策與管理提供理論依據(jù)。在閾值變化時(shí),關(guān)于每個(gè)等級(jí)三個(gè)域如何變化,以及建立自適應(yīng)的閾值計(jì)算方法將成為今后研究的重點(diǎn)。2.3 模型步驟
2.4 算法分析
3 案例分析
4 結(jié)論