閆 碩 張?jiān)朴?嚴(yán)斌峰 加雄偉
1中國(guó)聯(lián)合網(wǎng)絡(luò)通信集團(tuán)有限公司100033北京
2北京郵電大學(xué)計(jì)算機(jī)學(xué)院100876北京
3中國(guó)聯(lián)合網(wǎng)絡(luò)通信有限公司研究院100176北京
智能信息的處理,常常涉及數(shù)據(jù)信息的決策問(wèn)題,使數(shù)據(jù)信息與決策問(wèn)題的聯(lián)系成為關(guān)注的課題。數(shù)據(jù)信息的決策過(guò)程往往概括為:在數(shù)據(jù)滿足相關(guān)條件的前提下,數(shù)據(jù)應(yīng)對(duì)結(jié)論的判定。這不僅是數(shù)據(jù)智能處理研究的課題,也在實(shí)際當(dāng)中經(jīng)常涉及。所以針對(duì)數(shù)據(jù)決策的研究具有理論和應(yīng)用方面的意義,由此引出本文的討論,如下的工作將面對(duì)數(shù)據(jù)決策相關(guān)的問(wèn)題。
數(shù)據(jù)決策問(wèn)題與數(shù)據(jù)的性質(zhì)密切相關(guān),決策過(guò)程將根據(jù)數(shù)據(jù)滿足的特性,確定數(shù)據(jù)應(yīng)對(duì)的結(jié)論,由此引出的數(shù)據(jù)決策問(wèn)題必然涉及數(shù)據(jù)特性之間的因果關(guān)系,以及相關(guān)的描述或表示。因此建立數(shù)據(jù)特性的描述方法,構(gòu)成討論的研究環(huán)境,是工作得以展開(kāi)的基礎(chǔ)。
實(shí)際上,數(shù)據(jù)處理涉及的決策系統(tǒng)[1-2]是與決策問(wèn)題密切相關(guān)的結(jié)構(gòu)化表示形式。決策系統(tǒng)匯集了數(shù)據(jù)滿足前提,對(duì)應(yīng)結(jié)論的決策信息。作為數(shù)據(jù)處理的研究課題,決策系統(tǒng)的研究涉及屬性約簡(jiǎn)[3-5]、數(shù)據(jù)關(guān)聯(lián)[6-7]、數(shù)據(jù)推理[8-10]、數(shù)據(jù)合并[11]等課題或方向,并獲得了有意義的成果。不過(guò)這些討論并不直接針對(duì)數(shù)據(jù)決策的因果聯(lián)系,如何對(duì)決策系統(tǒng)記錄的決策信息刻畫(huà)描述,明確決策概念的含義也未在這些討論中涉及。因此由數(shù)據(jù)特性引出的決策問(wèn)題為決策系統(tǒng)的研究預(yù)留了空間,以下針對(duì)的正是這方面的問(wèn)題。
為此,回顧決策系統(tǒng)的結(jié)構(gòu)組成是必要的,即:決策系統(tǒng)匯集了數(shù)據(jù)以及數(shù)據(jù)的各類(lèi)屬性信息,構(gòu)成了相關(guān)對(duì)象的結(jié)構(gòu)化表示。如果把決策系統(tǒng)作為參照的模型,實(shí)施對(duì)樣本的判定,比對(duì)樣本數(shù)據(jù)滿足的性質(zhì),確定其應(yīng)對(duì)的結(jié)論,則決策系統(tǒng)將支撐決策方法的產(chǎn)生,因此對(duì)樣本給予專(zhuān)門(mén)的討論是需要考慮的問(wèn)題。盡管樣本在機(jī)器學(xué)習(xí)[12-13]中頻繁涉及,但因?yàn)閱?wèn)題的不同,樣本在不同的討論中具有自身的形式,存在著一定的差異。所以基于決策系統(tǒng)的比對(duì)判定,對(duì)樣本具有結(jié)構(gòu)上的要求,下面的討論將明確樣本的形式。
決策系統(tǒng)記錄的數(shù)據(jù)和相關(guān)的性質(zhì)將體現(xiàn)條件信息和決策信息組合在一起的因果聯(lián)系。所以與決策系統(tǒng)相關(guān)的樣本必然基于決策系統(tǒng)包含的信息,由此體現(xiàn)決策信息的組合,刻畫(huà)決策判定的含義,應(yīng)對(duì)判定方法的建立。進(jìn)而,為使決策判定清晰簡(jiǎn)化,判定方法將涉及復(fù)雜問(wèn)題的分解處理。下面的討論將圍繞這些方面展開(kāi),由此形成自身的方法體系。
上述的討論表明決策系統(tǒng)由各類(lèi)信息組合而成,搭建了數(shù)據(jù)性質(zhì)之間的因果聯(lián)系,形成了決策問(wèn)題的研究前提。如果把決策系統(tǒng)作為參照的模型,對(duì)給定的樣本實(shí)施決策判定,那么熟悉了解決策系統(tǒng)的構(gòu)成是必需的。
決策系統(tǒng)以數(shù)學(xué)結(jié)構(gòu)的形式匯集了數(shù)據(jù)和數(shù)據(jù)的屬性信息,其通過(guò)判定數(shù)據(jù)的性質(zhì),得到相應(yīng)結(jié)論的結(jié)構(gòu)化表示為決策問(wèn)題智能化處理提供了參照依據(jù)。決策系統(tǒng)以DS=(U,A,V,f)的形式進(jìn)行表示,其中的U、A和V都是集合,f是一函數(shù),其含義解釋如下。
U是一有限集,稱為論域,U中的元素稱為數(shù)據(jù)。
A也是一有限集,其元素稱為屬性,所以A稱為屬性集,滿足A=C∪D及C∩D=?,這里的C和D也都是屬性集,C稱為條件屬性集,其中的元素稱為條件屬性;D稱為決策屬性集,其中的元素稱為決策屬性。
V是一有限集合,由A中屬性取得的值構(gòu)成。V稱為屬性值域,其中的元素稱為屬性值。
f∶U×A→V是從U×A到V的函數(shù),稱為信息函數(shù)。對(duì)于
對(duì)于決策系統(tǒng)DS=(U,A,V,f),考慮屬性a∈A,當(dāng)x∈U時(shí),有
決策系統(tǒng)可以采用表格的形式予以直觀的表示,稱為決策表,如表1所示。
表1 決策系統(tǒng)DS
該決策表表明了決策系統(tǒng)DS=(U,A,V,f)的各個(gè)組成部分,其中論域U={x1,x2,x3,x4,x5}包含5個(gè)數(shù)據(jù);屬性集A=C∪D由條件屬性集C={c1,c2}和決策屬性集D={d1,d2}構(gòu)成;屬性值域V={0,1,2,3}由有限個(gè)數(shù)值構(gòu)成;信息函數(shù)f的取值已在表1中展示,如f(x1,c1)=1,f(x4,c2)=1,f(x4,d2)=0等等,這些函數(shù)表達(dá)式還可表示為c1(x1)=1(=f(x1,c1));c2(x4)=1(=f(x4,c2));d2(x4)=0(=f(x4,d2))等。
在表1的決策系統(tǒng)中,論域U={x1,x2,x3,x4,x5}中僅給出5個(gè)數(shù)據(jù),條件屬性集C={c1,c2}和決策屬性集D={d1,d2}分別給出了兩個(gè)條件屬性c1和c2,及兩個(gè)決策屬性d1和d2。一般情況下,決策系統(tǒng)DS=(U,A,V,f)的論域U往往包含大量的數(shù)據(jù),條件屬性和決策屬性也非個(gè)位數(shù)計(jì)之,決策系統(tǒng)DS=(U,A,V,f)往往構(gòu)成龐大的數(shù)據(jù)庫(kù)系統(tǒng)。巨大的數(shù)據(jù)信息可能會(huì)對(duì)基于決策系統(tǒng)的數(shù)據(jù)處理或問(wèn)題決策造成障礙,特別當(dāng)屬性集A=C∪D中的屬性眾多時(shí),可能使相關(guān)的決策變得含混不清,或使決策無(wú)所適從。
因此給出一種處理方法,使依據(jù)決策系統(tǒng)產(chǎn)生的決策清晰可行,且容易對(duì)決策的結(jié)果進(jìn)行判斷是值得考慮的課題。如下將展開(kāi)這方面的討論,這需要分析決策系統(tǒng)的功能,明確決策系統(tǒng)的作用。為此引入與決策系統(tǒng)相關(guān)的概念,以求討論的嚴(yán)謹(jǐn)分明。
1)條件函數(shù)值:對(duì)于屬性a∈A,若x∈U且a(x)=v,則當(dāng)a是條件屬性函數(shù)時(shí),稱v為條件函數(shù)值。
2)決策函數(shù)值:對(duì)于屬性a∈A,若x∈U且a(x)=v,則當(dāng)a是決策屬性函數(shù)時(shí),稱v為決策函數(shù)值。
3)樣本:在決策系統(tǒng)DS=(U,A,V,f)對(duì)應(yīng)的決策表中,U中數(shù)據(jù)x對(duì)應(yīng)的行稱為決策系統(tǒng)的樣本,簡(jiǎn)稱樣本,并采用向量(x,u1,u2,…,um;v1,v2,…,vn)進(jìn)行表示,其中x是論域U中的數(shù)據(jù),u1,u2,…,um(m≥1)是與x相關(guān)的所有條件函數(shù)值,v1,v2,…,vn(n≥1)是與x相關(guān)的所有決策函數(shù)值,并用分號(hào)“;”把條件函數(shù)值和決策函數(shù)值分開(kāi)。
4)樣本數(shù)據(jù):在樣本(x,u1,u2,…,um;v1,v2,…,vn)中,稱x為樣本數(shù)據(jù),樣本數(shù)據(jù)就是論域U中的數(shù)據(jù)。
5)同型樣本:如果兩個(gè)樣本的條件函數(shù)值的個(gè)數(shù)相同,同時(shí)決策函數(shù)值的個(gè)數(shù)也相同,則稱這兩個(gè)樣本是同型樣本。比如(x,u1,u2,…,um;v1,v2,…,vn)和(y,w1,w2,…,wm;z1,z2,…,zn)是同型樣本。決策系統(tǒng)DS=(U,A,V,f)的任意兩個(gè)樣本都是同型樣本。
6)條件樣本:設(shè)(y,w1,w2,…,wm)是一向量,其中y是與論域U中數(shù)據(jù)同類(lèi)型的數(shù)據(jù),同時(shí)w1,w2,…,wm(m個(gè))是與決策系統(tǒng)DS=(U,A,V,f)中任一樣本(x,u1,u2,…,um;v1,v2,…,vn)的條件函數(shù)值u1,u2,…,um(m個(gè))類(lèi)型和個(gè)數(shù)相同的值,此時(shí)稱(y,w1,w2,…,wm)為決策系統(tǒng)DS=(U,A,V,f)的條件樣本,簡(jiǎn)稱條件樣本,y稱為條件樣本數(shù)據(jù)。顯然決策系統(tǒng)DS=(U,A,V,f)的樣本(x,u1,u2,…,um;v1,v2,…,vn)的子部分(x,u1,u2,…,um)是決策系統(tǒng)的條件樣本。
在表1的決策系統(tǒng)中,x1所在行對(duì)應(yīng)的樣本是(x1,1,2;2,1),其中x1是樣本數(shù)據(jù),數(shù)值1,2是條件函數(shù)值,數(shù)值2,1是決策函數(shù)值,向量(x1,1,2)是條件樣本。
給定向量(y,u1,u2),其中y是與論域U中數(shù)據(jù)同類(lèi)型的數(shù)據(jù),u1和u2是數(shù)值,此時(shí)(y,u1,u2)與表1中決策系統(tǒng)的每一條件樣本可能不同,但由于數(shù)值u1和u2的個(gè)數(shù)與樣本(x1,1,2;2,1)中條件函數(shù)值1,2的個(gè)數(shù)相同,所以(y,u1,u2)是表1中決策系統(tǒng)的條件樣本。
上述分析討論表明,決策系統(tǒng)DS=(U,A,V,f)不僅是集合U,A,V和信息函數(shù)f構(gòu)成的數(shù)學(xué)結(jié)構(gòu),也可看做一系列同型樣本構(gòu)成的結(jié)構(gòu)體系。
決策系統(tǒng)DS=(U,A,V,f)匯集了數(shù)據(jù)滿足條件和對(duì)應(yīng)結(jié)論的信息,從條件到結(jié)論的對(duì)應(yīng)就是決策的過(guò)程。如果從樣本的角度考慮,決策的過(guò)程是根據(jù)樣本的條件函數(shù)值,確定樣本數(shù)據(jù)的性質(zhì),并通過(guò)決策函數(shù)值予以反映。為了直觀,通過(guò)表1的決策系統(tǒng)進(jìn)行討論。
考慮表1的決策系統(tǒng)DS=(U,A,V,f),其各類(lèi)信息可與實(shí)際問(wèn)題聯(lián)系在一起,賦予它們具體的含義。設(shè)論域U={x1,x2,x3,x4,x5}中的數(shù)據(jù)表示5個(gè)學(xué)生,對(duì)于屬性集A={c1,c2}∪{d1,d2},設(shè)定c1表示數(shù)學(xué),c2表示語(yǔ)文,d1表示等級(jí),d2表示獲獎(jiǎng)。因此條件屬性c1和c2,以及決策屬性d1和d2可分別表示學(xué)生xi(i=1,2,3,4,5)在學(xué)校的數(shù)學(xué)和語(yǔ)文成績(jī),以及由此確定的整體學(xué)習(xí)情況和獲獎(jiǎng)信息,并通過(guò)條件函數(shù)值和決策函數(shù)值得到反映。表1中的條件函數(shù)值和決策函數(shù)值與數(shù)據(jù)xi之間的聯(lián)系如下:
如果c1(xi)=k,則表示學(xué)生xi的數(shù)學(xué)成績(jī)是第k等;
如果c2(xi)=k,則表示學(xué)生xi的語(yǔ)文成績(jī)是第k等;
如果d1(xi)=k,則表示學(xué)生xi的整體成績(jī)是第k級(jí);
如果d2(xi)=1,則學(xué)生xi獲得獎(jiǎng)勵(lì),如果d2(xi)=0,則學(xué)生xi不獲得獎(jiǎng)勵(lì)。
于是可對(duì)表1決策系統(tǒng)反映的學(xué)生信息進(jìn)行如下分析??紤]x1所在的行,由于c1(x1)=1并且c2(x1)=2,所以學(xué)生x1的數(shù)學(xué)成績(jī)是第1等,語(yǔ)文成績(jī)是第2等,展示了x1滿足的條件。同時(shí)d1(x1)=2且d2(x1)=1,表明x1的整體成績(jī)是第2級(jí),并且可以獲得獎(jiǎng)勵(lì),確定了對(duì)x1的評(píng)估結(jié)果。這表達(dá)了如此的信息:當(dāng)學(xué)生x1的數(shù)學(xué)和語(yǔ)文成績(jī)一個(gè)是1等,一個(gè)是2等時(shí),則該生的整體成績(jī)是2級(jí),且可以得到獎(jiǎng)勵(lì)。這樣的過(guò)程就是根據(jù)條件做出的決策,體現(xiàn)了學(xué)生x1數(shù)學(xué)和語(yǔ)文成績(jī)與評(píng)判結(jié)果之間的聯(lián)系。學(xué)生x2,x3,x4,x5的情況也可利用表1進(jìn)行評(píng)判。
通過(guò)對(duì)表1各類(lèi)信息與實(shí)際問(wèn)題的聯(lián)系,可幫助對(duì)決策系統(tǒng)包含的決策信息進(jìn)行理解。因此對(duì)于一般的決策系統(tǒng)DS=(U,A,V,f),可依據(jù)上述直觀的解釋?zhuān)瑢?duì)決策系統(tǒng)包含的決策信息給予描述,于是引出如下的概念。
7)設(shè)(y,w1,w2,…,wm)是決策系統(tǒng)DS=(U,A,V,f)的條件樣本,如果存在DS=(U,A,V,f)的樣本(x,u1,u2,…,um;v1,v2,…,vn),使得w1,w2,…,wm分別與u1,u2,…,um對(duì)應(yīng)相等,則稱條件樣本(y,w1,w2,…,wm)與樣本(x,u1,u2,…,um;v1,v2,…,vn)相匹配。
8)如果決策系統(tǒng)DS=(U,A,V,f)的條件樣本(y,w1,w2,…,wm)與決策系統(tǒng)DS=(U,A,V,f)的樣本(x,u1,u2,…,um;v1,v2,…,vn)相匹配,則稱決策函數(shù)值v1,v2,…,vn為條件樣本數(shù)據(jù)y的決策結(jié)論。
9)對(duì)于條件樣本(y,w1,w2,…,wm),把獲得條件樣本數(shù)據(jù)y決策結(jié)論的過(guò)程稱為針對(duì)該條件樣本的決策。
所以決策系統(tǒng)DS=(U,A,V,f)中針對(duì)條件樣本的決策與相匹配的樣本密切相關(guān)。相匹配時(shí),依據(jù)決策系統(tǒng)的決策將形成。不匹配時(shí),則不能依據(jù)決策系統(tǒng)進(jìn)行決策。
把一個(gè)決策系統(tǒng)作為參照模型,對(duì)于任意的條件樣本實(shí)施比對(duì)判定,如果在決策系統(tǒng)中存在與之相匹配的樣本,則該樣本的決策函數(shù)值作為條件樣本數(shù)據(jù)的決策結(jié)論,將確定該數(shù)據(jù)的性質(zhì),從而完成決策的過(guò)程。
在一些情況下,對(duì)于給定的條件樣本,即使在決策系統(tǒng)中存在相匹配的樣本,但在確定條件樣本數(shù)據(jù)的決策結(jié)論時(shí),可能遇到?jīng)Q策結(jié)論選擇上的不確定性。不妨通過(guò)表1的決策系統(tǒng)進(jìn)行討論。
由表1可知,數(shù)據(jù)x3和x4分別對(duì)應(yīng)樣本(x3,3,1;2,0)和(x4,3,1;3,0),其條件函數(shù)值3,1相同,但決策函數(shù)值2,0和3,0不完全相同。于是對(duì)于表1決策系統(tǒng)的條件樣本(y,u1,u2),如果(y,u1,u2)與(x3,3,1;2,0)相匹配,即數(shù)值u1,u2分別與3,1對(duì)應(yīng)相等,則(y,u1,u2)與(x4,3,1;3,0)也相匹配。此時(shí)條件樣本數(shù)據(jù)y的決策結(jié)論遇到選擇2,0還是選擇3,0的問(wèn)題,于是引入如下概念。
10)如果條件樣本數(shù)據(jù)的決策結(jié)論僅有唯一一組,則稱針對(duì)條件樣本的決策在DS=(U,A,V,f)中是確定的。
11)如果條件樣本數(shù)據(jù)的決策結(jié)論存在多組,則稱針對(duì)條件樣本的決策在DS=(U,A,V,f)中是不確定的。
決策的不確定性可通俗的表述為:相同的條件對(duì)應(yīng)不同的結(jié)果。這在實(shí)際中也常常遇到,對(duì)此人們可通過(guò)思維分析,設(shè)法應(yīng)對(duì)處理,不過(guò)也時(shí)常遭遇應(yīng)對(duì)的困難。對(duì)于程序設(shè)計(jì)而言,當(dāng)涉及決策的不確定性問(wèn)題時(shí),如果不能有效地應(yīng)對(duì)處理,計(jì)算機(jī)則無(wú)所適從。
當(dāng)決策系統(tǒng)涉及較多的屬性,特別決策屬性很多時(shí),條件樣本數(shù)據(jù)的決策結(jié)論將涉及很多的決策函數(shù)值。因此如果能夠?qū)Ρ姸嗟臎Q策屬性進(jìn)行分解,分別考慮每一個(gè)決策屬性,使對(duì)較多決策函數(shù)值的考慮分解為對(duì)單一決策函數(shù)值的討論,由此對(duì)決策的確定或不確定性進(jìn)行有效的判定,那么該分解方法對(duì)決策的確定與否具有清晰化的意義。下文將給出具體的方法,使判定得以分解處理。
考慮決策系統(tǒng)DS=(U,A,V,f),其中A=C∪D及C∩D=?。下面的討論主要關(guān)注決策屬性,所以不妨設(shè)D={d1,d2,…,dn}。此時(shí)決策系統(tǒng)DS=(U,A,V,f)具有如下形式:
對(duì)于di∈{d1,d2,…,dn}(i=1,2,…,n),構(gòu)造決策系統(tǒng)如下:
在決策系統(tǒng)DSi=(U,C∪{di},V,fi)中,論域U、條件屬性集C和屬性值域V與決策系統(tǒng)DS=(U,C∪{d1,d2,…,dn},V,f)中的對(duì)應(yīng)部分相同,而決策屬性集{di}中僅包含一個(gè)決策屬性di,此時(shí)DSi中的信息函數(shù)fi由DS中的信息函數(shù)f所確定:使當(dāng)
因此對(duì)于包含n個(gè)決策屬性的決策系統(tǒng)DS=(U,C∪{d1,d2,…,dn},V,f),可以得到n個(gè)子系統(tǒng):
這n個(gè)子系統(tǒng)中的每一個(gè)僅包含一個(gè)決策屬性,形成了對(duì)決策系統(tǒng)DS=(U,C∪{d1,d2,…,dn},V,f)的分解。
由于決策系統(tǒng)DS=(U,C∪{d1,d2,…,dn},V,f)與其子系統(tǒng)DSi=(U,C∪{di},V,f)(i=1,2,…,n)具有相同的條件屬性集C,所以如果(y,w1,w2,…,wm)是決策系統(tǒng)DS=(U,C∪{d1,d2,…,dn},V,f)的條件樣本,則(y,w1,w2,…,wm)也是子系統(tǒng)DSi=(U,C∪{di},V,f)(i=1,2,…,n)的條件樣本。同時(shí)當(dāng)(x,u1,u2,…,um;v1,v2,…,vn)是決策系統(tǒng)DS=(U,C∪{d1,d2,…,dn},V,f)的樣本時(shí),向量(x,u1,u2,…,um;vi)(i=1,2,…,n)是子系統(tǒng)DSn=(U,C∪{di},V,f)的樣本。
進(jìn)而,當(dāng)條件樣本(y,w1,w2,…,wm)與決策系統(tǒng)DS=(U,C∪{d1,d2,…,dn},V,f)的樣本(x,u1,u2,…,um;v1,v2,…,vn)相匹配時(shí),該條件樣本(y,w1,w2,…,wm)與子系統(tǒng)DSi=(U,C∪{di},V,f)的樣本(x,u1,u2,…,um;vi)(i=1,2,…,n)必然相匹配。
于是提出這樣的問(wèn)題:在決策系統(tǒng)DS=(U,A,V,f)中,針對(duì)條件樣本(y,w1,w2,…,wm)的決策,與在子系統(tǒng)DSi=(U,C∪{di},V,f)(i=1,2,…,n)中,針對(duì)條件樣本(y,w1,w2,…,wm)的決策具有怎樣的聯(lián)系?
結(jié)論1:針對(duì)條件樣本(y,w1,w2,…,wm)的決策在決策系統(tǒng)DS=(U,C∪{d1,d2,…,dn},V,f)中是確定的,當(dāng)且僅當(dāng)對(duì)于每一子系統(tǒng)DSi=(U,C∪{di},V,f)(i=1,2,…,n),針對(duì)(y,w1,w2,…,wm)的決策在DSi=(U,C∪{di},V,f)中是確定的。
結(jié)論2:針對(duì)條件樣本(y,w1,w2,…,wm)的決策在決策系統(tǒng)DS=(U,C∪{d1,d2,…,dn},V,f)中是不確定的,當(dāng)且僅當(dāng)存在一子系統(tǒng)DSi=(U,C∪{di},V,f)(1≤i≤n),使針對(duì)(y,w1,w2,…,wm)的決策在子系統(tǒng)DSi=(U,C∪{di},V,f)中是不確定的。
鑒于篇幅,這里不給出這兩個(gè)結(jié)論的證明,僅通過(guò)表1的決策系統(tǒng)給予直觀的驗(yàn)證。
由于表1中的決策系統(tǒng)包含兩個(gè)決策屬性,按照上述的分解方法,該決策系統(tǒng)DS=(U,C∪{d1,d2},V,f)對(duì)應(yīng)分解出兩個(gè)子系統(tǒng)DS1=(U,C∪{d1},V,f)和DS2=(U,C∪{d2},V,f),它們都包含一個(gè)決策屬性,分別是d1和d2。這兩個(gè)子系統(tǒng)分別展示在表2和表3中。
表2 子系統(tǒng)DS1
表3 子系統(tǒng)DS2
現(xiàn)考查條件樣本(y,1,2)。在表1的決策系統(tǒng)DS=(U,C∪{d1,d2},V,f)中,條件樣本(y,1,2)與表1中的樣本(x1,1,2;2,1)和(x2,1,2;2,1)相匹配。由于樣本(x1,1,2;2,1)和(x2,1,2;2,1)的決策函數(shù)值都是2,1,所以條件樣本數(shù)據(jù)y的決策結(jié)論僅有唯一一組(即2,1)。因此針對(duì)條件樣本(y,1,2)的決策在表1的決策系統(tǒng)DS=(U,C∪{d1,d2},V,f)中是確定的。另一方面,條件樣本(y,1,2)與表2子系統(tǒng)中的樣本(x1,1,2;2)和(x2,1,2;2)相匹配,此時(shí)條件樣本數(shù)據(jù)y的決策結(jié)論是2,唯一確定,因此針對(duì)條件樣本(y,1,2)的決策在表2的子系統(tǒng)DS1=(U,C∪{d1},V,f)中是確定的。同樣,條件樣本(y,1,2)與表3子系統(tǒng)中的樣本(x1,1,2;1)和(x2,1,2;1)相匹配,此時(shí)條件樣本數(shù)據(jù)y的決策結(jié)論是1,也唯一確定,因此針對(duì)條件樣本(y,1,2)的決策在表3的子系統(tǒng)DS2=(U,C∪{d2},V,f)中也是確定的。于是針對(duì)條件樣本(y,1,2)的決策在決策系統(tǒng)DS=(U,C∪{d1,d2},V,f)中的確定性與在子系統(tǒng)DS1=(U,C∪{d1},V,f)和DS2=(U,C∪{d2},V,f)中的確定性是相同的,這是對(duì)結(jié)論1的驗(yàn)證。
再考慮條件樣本(y,3,1),它與表2子系統(tǒng)DS1=(U,C∪{d1},V,f)中的樣本(x3,3,1;2)和(x4,3,1;3)相匹配,此時(shí)條件樣本數(shù)據(jù)y的決策結(jié)論涉及兩組,分別是2和3,因此針對(duì)條件樣本(y,3,1)的決策在子系統(tǒng)DS1=(U,C∪{d1},V,f)中是不確定的。另一方面,條件樣本(y,3,1)與表1決策系統(tǒng)DS=(U,C∪{d1,d2},V,f)中的樣本(x3,3,1;2,0)和(x4,3,1;3,0)相匹配,此時(shí)條件樣本數(shù)據(jù)y的決策結(jié)論涉及兩組,分別是2,0和3,0,因此針對(duì)條件樣本(y,3,1)的決策在決策系統(tǒng)DS=(U,C∪{d1,d2},V,f)中是不確定的。該討論表明,針對(duì)條件樣本(y,3,1)的決策在子系統(tǒng)DS1=(U,C∪{d1},V,f)中不確定時(shí),在原決策系統(tǒng)DS=(U,C∪{d1,d2},V,f)中也是不確定的,這是對(duì)結(jié)論2的驗(yàn)證。
結(jié)論1和結(jié)論2表明,在決策系統(tǒng)中針對(duì)條件樣本決策的確定或不確定判定可等價(jià)轉(zhuǎn)換到僅包含一個(gè)決策屬性的子系統(tǒng)中。這種對(duì)決策系統(tǒng)的分解處理是其他討論不曾涉及的方法,達(dá)到了清晰或簡(jiǎn)化判定過(guò)程的目的。
在應(yīng)用方面,文獻(xiàn)[14]、[15]的討論把醫(yī)學(xué)診斷基于數(shù)據(jù)決策的判定,并與決策屬性的分解存在聯(lián)系。
把決策系統(tǒng)分解為一系列僅包含一個(gè)決策屬性的子系統(tǒng),將決策系統(tǒng)中針對(duì)條件樣本的決策等價(jià)地轉(zhuǎn)換到子系統(tǒng)中,是本文建立的方法。由此使以決策函數(shù)值為判定依據(jù)的決策得到了清晰的判定,實(shí)現(xiàn)了決策問(wèn)題分解處理的目的。特別地,當(dāng)針對(duì)條件樣本的決策在決策系統(tǒng)中具有不確定性時(shí),由結(jié)論2,可通過(guò)在一子系統(tǒng)中針對(duì)條件樣本決策的不確定判定得以完成,這顯然簡(jiǎn)化了判定的過(guò)程。
把決策系統(tǒng)作為決策問(wèn)題判定的參照模型,對(duì)條件樣本實(shí)施比對(duì)判定,得到?jīng)Q策結(jié)論,形成確定或不確定決策信息的過(guò)程體現(xiàn)了機(jī)器學(xué)習(xí)的數(shù)據(jù)處理思想,同時(shí)也有別于傳統(tǒng)的機(jī)器學(xué)習(xí)算法。這基于作者對(duì)決策問(wèn)題與機(jī)器學(xué)習(xí)方法的理解,展示了求變的思想。決策的分解處理為決策問(wèn)題的清晰簡(jiǎn)化提供了路徑,是判定方法的核心。
[1]閆林.數(shù)理邏輯基礎(chǔ)與粒計(jì)算[M].北京:科學(xué)出版社,2007
[2]Wang C Z,He Q,Chen D G.A novel method for attribute reduction of covering decision system[J].Information Sciences,2014(254):181-196
[3]Jia X Y,Liao W H,Tang Z M.Minimum cost attribute reduction in decision-theoretic rough set models[J].Information Sciences,2013(219):151-167
[4]Yan L,Yan S.Granular computing and attribute reduction based on a new discernibility function[J].International Journal of Simulation: Systems,Science and Technology,2016,17(33):24.1-24.10
[5]McAllister R A,Angryk R A.Abstracting for dimensionality reduction in text classification[J].International Journal ofintelligent Systems,2013,28(2):115-138
[6]閆碩,閆林.數(shù)據(jù)關(guān)聯(lián)的?;瘶?shù)描述方法[J].模式識(shí)別與人工智能,2015,28(12):1057-1066
[7]Tagarelli A.Exploring dictionary-based semantic relatedness in labeled tree data[J].Information Sciences,2013,220:244-268
[8]Yan S,Yan L,Wu J Z.Rough data-deduction based on the upper approximation[J].Information Sciences,2016,373:308-320
[9]Yan L,Yan S.Granular reasoning and decision system's decomposition[J].Journal of Software,2012,7(3):683-690
[10]She Y H.On the rough consistency measures of logic theories and approximate reasoning in rough logic[J].International Journal of Approximate Reasoning,2014,55(1):486-499
[11]閆林,高偉,閆碩.數(shù)據(jù)合并的結(jié)構(gòu)?;椒ㄅc矩陣計(jì)算[J].計(jì)算機(jī)科學(xué),2017,44(9):261-265
[12]Min F,Hu Q H,Zhu W.Feature selection with test cost constraint[J].International Journal of Approximate Reasoning,2014,55(1):167-179
[13]Ma W J,Xiong W,Luo X D.A model for decision making with missing,imprecise,and uncertain evaluations of multiple criteria[J].International Journal ofintelligent Systems,2013,28(2):152-184
[14]Yao J T,Azam N.Web-based medical decision support systems for three-way medical decision making with game-theoretic rough sets[J].IEEE Transactions on Fuzzy Systems,2015,23:3–15
[15]Pauker S G,Kassirer J P.The threshold approach to clinical decision making[J].New England Journal Medicine,1980,302:1109–1117