劉盾,李天瑞,梁德翠,楊新
(1. 西南交通大學(xué) 經(jīng)濟(jì)管理學(xué)院,四川 成都 610031; 2. 西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,四川 成都 610031;3. 電子科技大學(xué) 經(jīng)濟(jì)與管理學(xué)院,四川 成都 610054)
作為粒計(jì)算理論處理不確定問(wèn)題的重要方法之一,三支決策是加拿大學(xué)者Yao[1]在近十年來(lái)提出并發(fā)展起來(lái)的一種處理不確定性決策的粒計(jì)算方法,是一種符合人類認(rèn)知過(guò)程的“三分而治”模型。三支決策的主要思想是:在決策過(guò)程中將整體分為3個(gè)部分或3個(gè)粒,對(duì)于不同的部分或者粒度采取不同的決策行為或處理策略。粗糙集理論是三支決策的一種典型代表,它利用上下近似集將論域分為3個(gè)互不相交的區(qū)域。下近似集生成正域,上近似集的補(bǔ)集生成負(fù)域,正域和負(fù)域誘導(dǎo)確定性規(guī)則;上下近似集的差集形成邊界域,邊界域誘導(dǎo)可能性規(guī)則。進(jìn)一步地,將三支決策思想應(yīng)用到粗糙集理論中,可賦予粗糙集新的語(yǔ)義解釋:從正域里得到的正規(guī)則可以表示接受或贊成某事物;從負(fù)域里獲取的負(fù)規(guī)則可以表示拒絕或反對(duì)某事物;落在邊界域上的規(guī)則具有不確定性,需要進(jìn)一步觀察或思考,此時(shí)需要作出“延遲決策”的判斷??梢钥吹剑植诩碚撝械?個(gè)論域?qū)?yīng)了決策分析中的3種決策結(jié)果(即三支決策),這與人類在處理實(shí)際決策問(wèn)題的方法是一致的。三支決策通過(guò)“分而治之”和自下而上“化繁為簡(jiǎn)”的思想,按照分治法將復(fù)雜問(wèn)題轉(zhuǎn)化為3個(gè)規(guī)模較小的問(wèn)題,從而提高決策效率、減少?zèng)Q策成本、降低決策時(shí)間。通過(guò)對(duì)現(xiàn)有文獻(xiàn)的整理和分析,三支決策的研究主要集中在理論、方法、算法和應(yīng)用4個(gè)層面上。
在理論研究上,胡寶清[2]將幾類有代表性的三支決策模型統(tǒng)一到一個(gè)數(shù)學(xué)理論框架中,研究了三支決策空間問(wèn)題。李小南等[3]提出了一種基于子集評(píng)估的一般性三支決策模型。Yao[4]給出了一種三支決策與認(rèn)知計(jì)算的研究框架。Ciucci等[5]利用一個(gè)圖形來(lái)探討三支決策下的三值邏輯問(wèn)題。Abd El-monsef等[6]將決策粗糙集模型中的等價(jià)關(guān)系擴(kuò)展到廣義二元關(guān)系,提出了一種具有5個(gè)決策劃分區(qū)域的擴(kuò)展決策粗糙集模型。馬衛(wèi)民等[7]和錢宇華等[8]分別討論了多論域和多粒度情形下的三支決策理論模型。Deng等[9]研究了模糊集的決策三支近似,并進(jìn)一步考慮了基于陰影集的三支決策模型。祁建軍等[10]討論了三支決策與概念格的理論模型。張清華等[11]探討了三支決策過(guò)程中,兩類分類錯(cuò)誤相關(guān)問(wèn)題。劉盾等[12]提出了一種4層次決策粗糙集模型。
在方法研究上,李華雄等[13]根據(jù)不同決策者的不同風(fēng)險(xiǎn)偏好,提出一種多視角三支決策模型,并分析了樂(lè)觀、中性和悲觀風(fēng)險(xiǎn)偏好下的決策規(guī)則。Herbert等[14]提出了博弈三支決策模型,其主要思想是:把代價(jià)損失函數(shù)作為博弈矩陣的收益函數(shù),并利用Nash均衡思想來(lái)求解三支決策閾值問(wèn)題。楊曉平等[15]考慮了多個(gè)代理人情形下的決策粗糙集模型,進(jìn)而提出一種多代理三支決策方法。劉盾等[16-18]考慮了當(dāng)損失函數(shù)為幾類典型的不確定性測(cè)度時(shí),相應(yīng)不確定性三支決策閾值的獲取方法;進(jìn)而將區(qū)間性、隨機(jī)性和模糊性3種不確定測(cè)度引入到?jīng)Q策粗糙集中,提出了一系列不確定性三支決策模型。Yao等[19]建立了基于陰影集的不確定性三支決策模型。Li等[20]討論了三支決策中邊界域的不確定性建模問(wèn)題。Zhao等[21]考慮了基于模糊概率測(cè)度的區(qū)間模糊決策粗糙集模型。Zhou[22]討論了一種多分類決策粗糙集模型。Zhang等[23]提出了基于Gini系數(shù)的三支決策模型。梁德翠等[24]考慮了在多人決策環(huán)境下,基于群決策的三支決策問(wèn)題。張楠等[25]從決策理論中的效用函數(shù)出發(fā),討論了基于效用函數(shù)的三支決策模型。Liu等[26]將前景理論引入到三支決策過(guò)程中,研究了行為視角下的群決策三支決策模型。郎廣名等[27]分析了決策粗糙集相應(yīng)決策規(guī)則的沖突問(wèn)題。
在算法研究上,現(xiàn)有研究主要集中在屬性約簡(jiǎn)和規(guī)則獲取兩個(gè)方面。在屬性約簡(jiǎn)方面,Yao等[28]最早研究了決策粗糙集的屬性約簡(jiǎn)理論。他們發(fā)現(xiàn)經(jīng)典代數(shù)粗糙集約簡(jiǎn)理論已不再適用于決策粗糙集模型,并從性質(zhì)保留性和屬性獨(dú)立性2個(gè)方面入手,給出了一種廣義的概率粗糙集約簡(jiǎn)定義。在此基礎(chǔ)上,Zhao等[29]利用信息表中的區(qū)分矩陣,借鑒保持決策屬性不變和決策區(qū)域不變思想,給出了基于決策粗糙集的2種屬性約簡(jiǎn)方法。李華雄等[30]提出決策粗糙集正域約簡(jiǎn)定義和算法,并指出:不同于Pawlak粗糙集模型,決策粗糙集模型中的正域變化具有非單調(diào)性,其大小隨著屬性集的減少可能會(huì)增大。基于這種思想,他們提出一種保持正域最大的啟發(fā)式約簡(jiǎn)算法。賈修一等[31]考慮了由代價(jià)損失函數(shù)引起的決策風(fēng)險(xiǎn)問(wèn)題。他認(rèn)為最優(yōu)約簡(jiǎn)應(yīng)滿足總體決策風(fēng)險(xiǎn)最小原則,并提出了一種基于決策風(fēng)險(xiǎn)最小的屬性約簡(jiǎn)方法。閔帆等[32]提出了基于代價(jià)敏感最小化的屬性約簡(jiǎn)方法。鞠恒榮等[33]將決策風(fēng)險(xiǎn)最小化的思想引入到不完備信息系統(tǒng)中,提出了δ-截集的屬性約簡(jiǎn)方法。馬希驁等[34]探討了在保持決策區(qū)域不變情形下,不同種類的屬性約簡(jiǎn)方法。任睿思等[35]考慮了三支概念格的約簡(jiǎn)理論與方法。張賢勇等[36]從數(shù)據(jù)分析視角對(duì)三層和三支決策約簡(jiǎn)作了系統(tǒng)研究。在規(guī)則獲取方面,閔帆等[32]研究了代價(jià)敏感三支決策與三支推薦問(wèn)題。黃佳進(jìn)等[37]進(jìn)一步考慮了偏序關(guān)系的代價(jià)敏感三支推薦方法。張恒汝等[38]提出了一種基于回歸分析的三支推薦模型。汪敏等[39]將主動(dòng)學(xué)習(xí)理論引入到三支決策中,提出了基于主動(dòng)學(xué)習(xí)的三支決策模型。于洪等[40]探討了三支決策的聚類分析模型和聚類數(shù)的自動(dòng)學(xué)習(xí)算法。劉盾等[41]將Logistic模型引入到?jīng)Q策粗糙集中,討論了基于Logistic回歸的多分類三支決策模型。
在實(shí)際應(yīng)用上,三支決策已經(jīng)在醫(yī)療診斷、石油開(kāi)采、論文審稿、政策制定、環(huán)境管理、文本分類、垃圾郵件過(guò)濾、產(chǎn)品檢驗(yàn)、礦床選擇等領(lǐng)域得到了較好的應(yīng)用[42]。
通過(guò)對(duì)已有文獻(xiàn)分析發(fā)現(xiàn),國(guó)內(nèi)外學(xué)者主要對(duì)三支決策理論模型、數(shù)學(xué)性質(zhì)、算法設(shè)計(jì)、應(yīng)用背景進(jìn)行研究,對(duì)于三支決策系統(tǒng)性整理和總結(jié)的論述還較為少見(jiàn)。本文在現(xiàn)有研究的基礎(chǔ)上,分別從時(shí)間和空間兩個(gè)維度出發(fā),以時(shí)序性和層次性為研究脈絡(luò),提出時(shí)間三支決策和空間三支決策基本模型,并詳細(xì)討論不同模型的建模機(jī)理和應(yīng)用前景。最后,進(jìn)一步對(duì)三支決策的時(shí)空性作了深入探討和分析。
假設(shè) S=(U,R) 為一信息系統(tǒng),其中:U={x1,x2,···,xn} 是 對(duì)象的非空有限集合,稱為論域;R是定義在 U上的一種二元關(guān)系。基于二元關(guān)系R,三支決策通過(guò)函數(shù) f將對(duì)象集 U分為3個(gè)兩兩互不相交的區(qū)域: R1- 域、R2- 域和R3-域,即
式中:R1、R2、R3?U , U=R1∪R2∪R3; R1∩R2=?,R2∩R3=?, R1∩R3=?。其補(bǔ)集的構(gòu)造如下:
對(duì)于3個(gè)區(qū)域 R1、 R2和 R3,分別采取3種不同的策略(行動(dòng)): S1、 S2、 S3。如果僅考慮 R1、 R2和R3是 對(duì)論域 U的一種劃分,則上述模型可看作一個(gè)三分類決策問(wèn)題。特別地,若 R1、 R2和 R3這3個(gè)區(qū)域當(dāng)且僅當(dāng)有1個(gè)區(qū)域?yàn)榭占瘯r(shí),三支決策轉(zhuǎn)化為二支決策問(wèn)題[43];若對(duì)某區(qū)域 Ri進(jìn)行進(jìn)一步劃分,則三支決策將會(huì)轉(zhuǎn)化為一個(gè)多分類問(wèn)題。圖1為三支決策模型的決策示意圖。
圖 1 三支決策模型示意圖Fig. 1 Three-way decision model diagram
在圖1中,二元關(guān)系 R將論域分為3個(gè)區(qū)域,即區(qū)域 R1、 區(qū)域 R2和 區(qū)域 R3,每個(gè)區(qū)域?qū)?yīng)一種策略。對(duì)于區(qū)域 R1的 事件執(zhí)行策略 S1; 對(duì)于區(qū)域 R2的事件執(zhí)行策略 S2;對(duì)于區(qū)域 R3的事件執(zhí)行策略S3。一般地,在很多實(shí)際決策問(wèn)題中,3種策略具有偏好關(guān)系: S1?S2?S3。例如:在論文審稿過(guò)程中,主編可以根據(jù)審稿情況作出接受、修改和拒絕3種選擇;在醫(yī)療診斷過(guò)程中,醫(yī)生可以給出有病、進(jìn)一步檢查和無(wú)病的診斷結(jié)論;在石油開(kāi)采過(guò)程中,勘探人員可以通過(guò)地質(zhì)、地貌、環(huán)境等因素作出開(kāi)采、需進(jìn)一步勘探、不開(kāi)采3種決策方案;在高校學(xué)生管理問(wèn)題中,學(xué)生處根據(jù)學(xué)生成績(jī)作出給獎(jiǎng)學(xué)金、維持現(xiàn)狀和發(fā)警告信3種行動(dòng);在客戶關(guān)系管理領(lǐng)域,市場(chǎng)分析人員會(huì)從顧客以往購(gòu)買行為中給出用戶提升、保留和放棄3種不同的建議。在具有偏序關(guān)系的三支決策問(wèn)題中,決策者可能會(huì)重點(diǎn)關(guān)注某一區(qū)域(如 R1區(qū)域)的決策情形。
此外,三支決策模型在眾多不確定性理論中也有不同的表示方法,文獻(xiàn)[43]通過(guò)結(jié)合區(qū)間集、模糊集、粗糙集、陰影集和偏序集5種不確定性度量來(lái)說(shuō)明三支決策的構(gòu)造過(guò)程。表1給出了不同情形下的三支決策模型。
表 1 不同情形下的三支決策模型Table 1 The three-way decision models under different conditions
以粗糙集為例,對(duì)于某個(gè)概念 X?U ,令R1=POS(X)={x∈U|[x]?X};R2=BND(X)={x∈U|[x]∩X≠?};R3=NEG(X)={x∈U|[x]∩X=?} 。區(qū)域 R1、區(qū)域 R2和 區(qū)域 R3分別對(duì)應(yīng)了正域、邊界域和負(fù)域;相應(yīng)的,策略 S1表 示接受正規(guī)則,策略 S2表示延遲決策,策略 S3表示拒絕負(fù)規(guī)則。圖2給出了三支決策與粗糙集理論的相互轉(zhuǎn)換模型。
圖 2 三支決策與粗糙集理論的轉(zhuǎn)換模型Fig. 2 Transformation model between 3WD and rough sets
對(duì)于三支決策基本模型,提出了一種廣義三支決策和狹義三支決策的模型[43]。廣義三支決策主要從不同的內(nèi)涵和外延去探討不同的決策模型,主要包括三支決策空間、三支決策一般模型、三支決策與認(rèn)知模型、三支決策與形式概念分析、三支決策邏輯、三支決策與商空間等。狹義三支決策側(cè)重對(duì)模型的語(yǔ)義解釋、方法設(shè)計(jì)和實(shí)際應(yīng)用,主要包括三支決策分類與聚類、代價(jià)敏感三支決策、不確定性三支決策、三支推薦、機(jī)器學(xué)習(xí)與三支決策等。進(jìn)一步地,在2009—2018年連續(xù)十屆國(guó)際粗糙集聯(lián)合學(xué)術(shù)會(huì)議(IJCRS),以及2011—2018年連續(xù)八屆中國(guó)粒計(jì)算與知識(shí)發(fā)現(xiàn)學(xué)術(shù)會(huì)議(CGCKD)上都舉辦了與“三支決策與決策粗糙集”相關(guān)的主題研討會(huì)。國(guó)內(nèi)學(xué)者先后出版了4本專著:《三支決策理論與應(yīng)用》[44]、《三支決策與粒計(jì)算》[45]、《三支決策:復(fù)雜問(wèn)題求解方法與實(shí)踐》[46]、《粒計(jì)算、商空間及三支決策的回顧與發(fā)展》[47],介紹了三支決策研究的最新動(dòng)態(tài)。國(guó)際著名SCI 期刊International Journal of Approximate Reasoning、Information Sciences、Knowledge-based Systems和International Journal of Machine Learning and Cybernetics等分別出版多本專輯來(lái)介紹和推動(dòng)三支決策研究領(lǐng)域的發(fā)展。
在很多決策問(wèn)題中,其決策過(guò)程往往呈現(xiàn)出實(shí)時(shí)性、多次性、序貫性的特征。決策者需要考慮過(guò)去(past)、現(xiàn)在(now)和將來(lái)(future),或是昨天(yesterday)、今天(today)和明天(tomorrow)這些時(shí)間維度對(duì)決策結(jié)果的影響。本文首先以北京獲得的2008年奧運(yùn)會(huì)舉辦權(quán)時(shí)的投票過(guò)程作為例子來(lái)闡述基于時(shí)間維度的三支決策思想。
2001年7月13日,國(guó)際奧委會(huì)第112次全會(huì)在俄羅斯莫斯科召開(kāi),與會(huì)全體委員將投票選舉出第29屆夏季奧運(yùn)會(huì)的舉辦城市。有北京、多倫多、伊斯坦布爾、巴黎和大阪5個(gè)候選城市參加選舉,一共118名國(guó)際奧委會(huì)委員進(jìn)行投票。在第一輪投票中,有14名申辦城市委員和時(shí)任主席薩馬蘭奇不參加投票,實(shí)際有104名委員投票,2票棄權(quán),有效票102張。其中,北京獲得44票,多倫多獲得20票,伊斯坦布爾獲得17票,巴黎獲得15票,大阪獲得6票。第一輪投票結(jié)束,北京占據(jù)優(yōu)勢(shì),大阪得票最少被淘汰,其余3個(gè)城市作為待定城市進(jìn)入下一輪競(jìng)選。在接下來(lái)的第二輪投票中,有106名委員(2名日本委員因大阪淘汰獲得投票權(quán))實(shí)際參加投票,1票棄權(quán),有效票105張。最終,北京獲得56票,超半數(shù)票成功獲得舉辦權(quán),多倫多、巴黎、伊斯坦布爾分別獲得22票、18票和9票被淘汰。從投票過(guò)程可以看到,隨著外界環(huán)境和時(shí)間的變化,中選城市(R1域)、候選城市(R2域 )和落選城市(R3域)也會(huì)隨之發(fā)生改變。
此外,Jeffery通過(guò)Savage打雞蛋的故事通俗易懂地描述了三支決策隨時(shí)間變化的序貫決策過(guò)程。故事大意為:孩子們?cè)绮拖氤约咫u蛋,廚房里有6個(gè)雞蛋,丈夫Savage自告奮勇過(guò)來(lái)幫忙。在打雞蛋的過(guò)程中,雞蛋有可能是好雞蛋也可能是壞雞蛋。如果是好雞蛋,把它直接打到碗里和前面雞蛋合并即可;如果是壞雞蛋,所有的雞蛋都會(huì)被扔掉。Savage是一個(gè)決策論愛(ài)好者,他需要設(shè)計(jì)在每打一顆雞蛋時(shí)相應(yīng)的行動(dòng)策略,使得總體決策代價(jià)最小。表2給出了Savage在第i次決策過(guò)程中可能采取的3種策略和后果。
表 2 Savage可能采取的3種策略和后果Table 2 Three strategies and results of Savage’s omelet problem
對(duì)于Savage而言,在他作出每一步?jīng)Q策前,需要預(yù)估下一個(gè)雞蛋是好雞蛋的概率。他可以按照以往的經(jīng)驗(yàn)(先驗(yàn)知識(shí))來(lái)判斷:若有充分把握判定是好雞蛋則直接打到碗里,否則就扔掉。如果沒(méi)有任何先驗(yàn)知識(shí),Savage的最優(yōu)做法是把每個(gè)雞蛋打到另一個(gè)碗里,他將最終付出多洗5個(gè)碗的決策代價(jià)。
基于上面的例子,可以構(gòu)造一種基于時(shí)間維度的三支決策模型。假設(shè) Ω={ω1,ω2}表示事件的2種不同的狀態(tài)(如表2中的好雞蛋和壞雞蛋),S={s1,s2,s3} 表 示3種決策策略。 P(t)(ωi|x)表示第t時(shí)刻對(duì)象x在狀態(tài)ωi的條件概率。 λ(t)(sj|ωi)表示第t時(shí)刻在狀態(tài)ωi的情況下采取sj行動(dòng)的損失或者成本。對(duì)于對(duì)象x而言,假設(shè)采取行動(dòng)sj。如果 P(t)(ωi|x)表示第t時(shí)刻給定的對(duì)象x在真實(shí)狀態(tài)ωi下的概率,那么采取行動(dòng)sj的期望效用可表示為
根據(jù)式(3),對(duì)于每一個(gè)對(duì)象x可以計(jì)算其條件風(fēng)險(xiǎn) R(t)sj|x,從中選出條件風(fēng)險(xiǎn)最小的行動(dòng)。顯然地,在第t時(shí)刻采取s1、s2、s3這3種策略下的期望損失可分別為
根據(jù)貝葉斯決策準(zhǔn)則,需要選擇期望損失最小的行動(dòng)集作為最佳行動(dòng)方案,于是可得到如下三條決策規(guī)則:
1)若 R(t)(s1|x)≤R(t)(s2|x) 和 R(t)(s1|x)≤R(t)(s3|x)同時(shí)成立,則對(duì) x 采取S1策略;
2)若 R(t)(s2|x)≤R(t)(s1|x) 和 R(t)(s2|x)≤R(t)(s3|x)同時(shí)成立,則對(duì) x 采取S2策略;
3)若 R(t)(s3|x)≤R(t)(s1|x) 和 R(t)(s3|x)≤R(t)(s2|x)同時(shí)成立,則對(duì) x 采取S3策略。
由于 P(t)(ω1|x)+P(t)(ω2|x)=1,上述規(guī)則只與概率 P(t)(ωi|x)和 損失函數(shù) λ(t)(sj|ωi)有關(guān)。進(jìn)一步假設(shè):
以狀態(tài) ω1作為基準(zhǔn),將式(3)代入到3條決策規(guī)則中可得:
1) 若 P(t)(ω1|x)≥α(t), 則 x在 ω1下 采取策略 S1;
2) 若 β(t)≤P(t)(ω1|x)≤α(t), 則 x在 ω1下 采取策略 S2;
3) 若 P(t)(ω1|x)≤β(t), 則 x在 ω1下 采取策略 S3。
其中:
特別地,若 α(t)≤β(t),上述三支決策模型將轉(zhuǎn)化為二支決策模型,策略 S2失效,即:
1) 若 P(t)(ω1|x)≥γ(t),則 x在 ω1下 采取策略 S1;
2) 若 P(t)(ω1|x)<γ(t),則 x在 ω1下 采取策略 S3。
類似地,可以推導(dǎo)以狀態(tài) ω2作為基準(zhǔn)的三支決策模型。值得一提的是,基于事件維度的三支決策模型與損失函數(shù) λ(t)(sj|ωi)密切相關(guān)。對(duì)于損失函數(shù)的變化,可考慮前后時(shí)刻關(guān)聯(lián)情形的兩類數(shù)學(xué)模型:第一類是考慮第 t+1時(shí)刻損失函數(shù)λ(t+1)(sj|ωi) 隨 時(shí)間t變化而變化;第二類是考慮第t+1時(shí) 刻 損 失 函 數(shù) λ(t+1)(sj|ωi) 與 前 面 狀 態(tài)λ(1)(sj|ωi),λ(2)(sj|ωi),···,λ(t)(sj|ωi)有關(guān)。
三支決策對(duì)于空間維度的描述主要通過(guò)粒計(jì)算方法來(lái)實(shí)現(xiàn),其核心問(wèn)題主要關(guān)注粒層的構(gòu)建、粒度的刻畫、最優(yōu)粒層和粒度的選取等。下面給出從粒計(jì)算思想解決空間三支決策問(wèn)題的途徑和策略。
首先,Yao[48]從粒、粒層和層次結(jié)構(gòu)出發(fā),提出一種粒計(jì)算的三元論思想,分別從哲學(xué)思想、方法論和計(jì)算模式3個(gè)層面詮釋了粒計(jì)算的結(jié)構(gòu)化思維、結(jié)構(gòu)化問(wèn)題求解和結(jié)構(gòu)化信息處理的統(tǒng)一研究框架。他進(jìn)一步指出:粒計(jì)算哲學(xué)關(guān)注不同粒度層次下的結(jié)構(gòu)化理解和表示,包含還原論、系統(tǒng)論和層次論;粒計(jì)算方法是基于粒結(jié)構(gòu)的結(jié)構(gòu)化問(wèn)題求解,分為自頂向下、自底向上和自中向外3種處理方法;粒計(jì)算的計(jì)算模式是運(yùn)用粒結(jié)構(gòu)來(lái)實(shí)現(xiàn)結(jié)構(gòu)化粒信息處理,具體有Pandemonium架構(gòu)、漸進(jìn)式計(jì)算、序列三支決策等。圖3給出了這種粒計(jì)算三元論的思想,這為空間三支決策理論的構(gòu)建提供了思想指導(dǎo)。
圖 3 粒計(jì)算的三元論Fig. 3 Trialistic theory of granular computing
其次,粒計(jì)算利用粒對(duì)現(xiàn)實(shí)問(wèn)題的抽象、粒層之間的關(guān)系、粒的分解和合成以及粒與粒之間的轉(zhuǎn)換來(lái)描述復(fù)雜決策問(wèn)題,通過(guò)模擬人類思維方式和行為模式來(lái)處理復(fù)雜決策問(wèn)題,借鑒自上而下“分而治之”和自下而上“化繁為簡(jiǎn)”的思想,用滿意近似解替代精確解,來(lái)解決復(fù)雜決策問(wèn)題。正如粒計(jì)算中商空間理論的創(chuàng)始人張鈸院士和張鈴教授的觀點(diǎn)一樣,人類公認(rèn)的一個(gè)特點(diǎn)就是,能從不同的粒度上觀察和分析同一問(wèn)題。人們不僅能在不同粒度的世界上進(jìn)行問(wèn)題求解,而且能夠很快地從一個(gè)粒度世界跳到另一個(gè)粒度世界,往返自如,毫無(wú)困難[47]。在實(shí)際問(wèn)題中,人們常常利用2個(gè)算子,即Zooming-in 算子和Zooming-out算子,通過(guò)粒的細(xì)化和粗化來(lái)描述上述關(guān)系。Zooming-in算子表示為 ω:2U/R→2U,它允許將論域細(xì)化,把一個(gè)粒分解成為多個(gè)粒。Zooming-out 算子表示為 ω-1:2U→2U/R,它允許忽略問(wèn)題的一些細(xì)節(jié)而將論域粗化,將多個(gè)細(xì)微的粒合并成一個(gè)較粗的粒。圖4給出了上述粒的細(xì)化和粗化過(guò)程。
圖 4 粒的粗化和細(xì)化過(guò)程Fig. 4 Granules refining and coarsening process
再者,近幾年來(lái)國(guó)內(nèi)外學(xué)者從模糊集、粗糙集、商空間、機(jī)器學(xué)習(xí)、云計(jì)算等眾多領(lǐng)域提出了一系列粒度表示、粒度計(jì)算、粒度優(yōu)化、粒度選擇的模型與方法,并從粒的“多層次”和“多視角”兩個(gè)維度對(duì)粒度的內(nèi)涵和外延進(jìn)行了深入的分析和探討。其中,具有代表性的研究方法有多粒度分析[49]和多尺度分析[50]等。多粒度分析主要從信息融合視角出發(fā),通過(guò)粒化獲得的信息粒集和多個(gè)粒結(jié)構(gòu)進(jìn)行數(shù)據(jù)分析,并從挖掘的知識(shí)中融合集成有效的決策知識(shí)。多尺度分析主要從信息粒層視角出發(fā),通過(guò)研究不同尺度下決策規(guī)則在某種不確定性測(cè)度的一致性和不變性(如信息表協(xié)調(diào)性一致),來(lái)選取合適的決策粒層和粒度。上述相關(guān)研究從方法和策略層面為空間三支決策理論提供了有力借鑒。
最后,結(jié)合前面分析圖5給出了一種基于粒度分析的空間三支決策一般性模型框圖。
圖 5 空間三支決策一般模型Fig. 5 General model of spatial three-way decisions
在圖5中,對(duì)于每一個(gè)層次的每個(gè)區(qū)域,在其下一層次都會(huì)生成3個(gè)子區(qū)域,并產(chǎn)生對(duì)應(yīng)的3種子策略,直到根據(jù)實(shí)際問(wèn)題搜尋到最優(yōu)的(合適的)粒層或粒度為止。特別地,在粗糙集理論中,由于3個(gè)區(qū)域分別對(duì)應(yīng)了正域、邊界域和負(fù)域,生成的正域和負(fù)域可以直接采取接受或拒絕的策略,在每個(gè)層次里只需考慮邊界域下一層的劃分情況,直到邊界域?qū)ο鬂M足某種終止條件或者等于空集為止。
對(duì)于每一粒層區(qū)域的劃分閾值選取,一種可行的方法為事先確定每一層劃分閾值的取值。假設(shè) αl和 βl為第l層 的兩個(gè)閾值,記 (α,β)l={(α1,β1),(α2,β2),···,(αm,βm)}為m層 的 閾 值 序 列 參 數(shù),且0≤βm≤βm-1≤···≤β1<α1≤···≤αm-1≤αm≤1。如果l是最優(yōu)粒層,則在第l層,3個(gè)區(qū)域的劃分滿足事先給定的終止條件。
在很多實(shí)際決策問(wèn)題中,時(shí)間和空間2種屬性往往是相生相伴、相互依存的。例如:在增量學(xué)習(xí)中,由于時(shí)間變化會(huì)導(dǎo)致外界決策環(huán)境變化,從而導(dǎo)致粒層選擇(空間)的變化。在經(jīng)濟(jì)分析中,面板數(shù)據(jù)包含了不同地區(qū)在不同時(shí)間的變量取值,這需要設(shè)計(jì)相應(yīng)的時(shí)間序列模型去解決空間隨時(shí)間變化的函數(shù)關(guān)系。粒的時(shí)空性表現(xiàn)為:??梢愿鶕?jù)不同的時(shí)間,進(jìn)行不同程度的自由細(xì)化或粗化。通過(guò)粒的細(xì)化或粗化,形成對(duì)不同問(wèn)題粒描述結(jié)構(gòu)的變化,從而對(duì)決策問(wèn)題進(jìn)行不同程度的描述和求解。對(duì)原始粒的細(xì)化越多,則可以從更細(xì)的層次去理解相應(yīng)問(wèn)題,問(wèn)題也能得到更為深入的分析,但消耗的資源或代價(jià)成本也會(huì)增加;反之,粗化的層次越多,對(duì)問(wèn)題的描述和理解就相應(yīng)地越少,這在一定程度上會(huì)影響問(wèn)題分析的細(xì)致程度,但是消耗的資源或代價(jià)成本也會(huì)相應(yīng)地降低。因此,三支決策的時(shí)空模型要綜合考慮目標(biāo)、約束、精度、代價(jià)等不同因素。
數(shù)據(jù)倉(cāng)庫(kù)是體現(xiàn)三支決策時(shí)空觀的一個(gè)典型例子??紤]到數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、隨時(shí)間變化的、集成的且不容易丟失的數(shù)據(jù)集合,人們可以根據(jù)用戶的具體需求來(lái)開(kāi)發(fā)和設(shè)計(jì)相應(yīng)的數(shù)據(jù)倉(cāng)庫(kù),用以支持實(shí)際管理問(wèn)題和決策過(guò)程。在數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)過(guò)程中,決策者選擇不同的時(shí)間維度,采取不同的數(shù)據(jù)粒層作為粒度劃分標(biāo)準(zhǔn),都將直接決定數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)存儲(chǔ)容量和查詢質(zhì)量,并進(jìn)一步影響到?jīng)Q策結(jié)果。例如:在某一時(shí)刻,某公司的管理者若按照國(guó)家、區(qū)域、分區(qū)域和分區(qū)域內(nèi),具體到銷售員層次關(guān)系來(lái)查看公司的銷售情況,他就需要集結(jié)商品維、時(shí)間維、客戶維、銷售事實(shí)表、銷售員工表及其所在國(guó)家、地區(qū)、分區(qū)的數(shù)據(jù)庫(kù)信息。若在另一時(shí)刻,公司決策者認(rèn)為只需要了解各個(gè)地理區(qū)域的銷售情況,而不需要了解每個(gè)銷售人員的具體銷售情況,則只需把地域相關(guān)的表格集結(jié)成為地理維度就足夠了,而沒(méi)有必要把銷售員維作為一個(gè)基本粒度。
數(shù)據(jù)立方體是數(shù)據(jù)倉(cāng)庫(kù)一種重要的表現(xiàn)形式。在數(shù)據(jù)立方體中,在最低抽象層創(chuàng)建的基本粒層對(duì)應(yīng)了感興趣的個(gè)體實(shí)體,如產(chǎn)品銷售額或顧客等;在最低抽象層創(chuàng)建的頂點(diǎn)方體給出一個(gè)匯總值,如所有商品類型、所有分店一年銷售總額等。數(shù)據(jù)立方體利用切片、切塊、旋轉(zhuǎn)、上卷、下鉆5種操作,并通過(guò)聯(lián)機(jī)事務(wù)處理技術(shù)(OLTP)對(duì)實(shí)際需求進(jìn)行數(shù)據(jù)粒度選取與數(shù)據(jù)分析,為數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)者和管理者提供了技術(shù)支持。數(shù)據(jù)立方體思想也賦予了三支決策時(shí)空性研究新的啟發(fā):上卷和下鉆操作分別對(duì)應(yīng)了三支決策粗化和細(xì)化過(guò)程,而切片、切塊和旋轉(zhuǎn)等操作為三支決策和粒計(jì)算提供了一系列新的?;伎纪緩胶蛦?wèn)題解決方法。相對(duì)于三支決策時(shí)間“時(shí)序性”或空間“層次性”研究,三支決策的時(shí)空性更具一般性和代表性。通過(guò)時(shí)間和空間兩個(gè)維度對(duì)決策空間進(jìn)行“三分而治”的劃分策略,對(duì)復(fù)雜性決策和大數(shù)據(jù)分析有很好的借鑒和啟示作用。
本文系統(tǒng)地回顧、梳理和總結(jié)了三支決策近年來(lái)在理論、方法、算法和應(yīng)用的發(fā)展蹤跡,從時(shí)間和空間兩個(gè)維度,對(duì)三支決策的時(shí)空性進(jìn)行深入的探討和分析。本文分別提出了基于時(shí)間和空間視角的三支決策基本模型,并討論了其相應(yīng)的應(yīng)用背景。時(shí)間三支決策模型主要考慮時(shí)間變化下,實(shí)時(shí)性、多次性、序貫性的決策問(wèn)題;空間三支決策模型主要考慮在信息粒化過(guò)程中,最優(yōu)粒層和粒度的選擇問(wèn)題。此外,本文從粒計(jì)算理論出發(fā),探討了粒度分析與三支決策的融合機(jī)理,以及它們?cè)诮鉀Q時(shí)空決策問(wèn)題時(shí)潛在的可行的理論和方法,這為三支決策后續(xù)研究提供了新的思路,并從思想層面上給予人們一種簡(jiǎn)單、直觀的決策認(rèn)知和行為方式。然而,三支決策的研究才剛剛起步,方興未艾,其一般化理論還需進(jìn)一步探索。后續(xù)研究工作:1)三支決策如何在復(fù)雜信息系統(tǒng)和不確定性環(huán)境下進(jìn)行理論建模;2)三支決策如何在大數(shù)據(jù)決策環(huán)境下進(jìn)行快速數(shù)據(jù)分析和增量算法改進(jìn);3)如何將三支決策的時(shí)空性觀點(diǎn)與實(shí)際應(yīng)用背景相結(jié)合,更為有效地處理現(xiàn)實(shí)決策過(guò)程中遇到的具體問(wèn)題。